Você está na página 1de 408

BIOESTATÍSTICA

Aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 1 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 2 25/06/12 17:20
BIOESTATÍSTICA
Aplicada à Pesquisa Experimental

VOLUME 2

M AU RO J O S É FO N T E L L E S
Doutor em Cirurgia pela Faculdade de Ciências Médicas da Unicamp
Professor das Disciplinas de Anatomia Humana e Bioestatísca da
Universidade do Estado do Pará (UEPA).
Membro Titular do Colégio Brasileiro de Cirurgiões (TCBC).
Membro da Associação Brasileira de Educação Médica (ABEM).
Membro da Associação Brasileira de Médicos Escritores (SOBRAMES).

BIOESTATISTICA_VOL02.indb 3 25/06/12 17:20


Copyright © 2012 Editora Livraria da Física
1a edição

Direção editorial José Roberto Marinho


Editor-assistente Victor Pereira Marinho

Capa Ana Maria Hitomi/Typodesign
Projeto gráfico e diagramação Typodesign

Edição revisada segundo o Novo Acordo Ortográfico da Língua Portuguesa

Dados Internacionais de Catalogação na Publicação (CIP)


(Câmara Brasileira do Livro, SP, Brasil)

Fontelles, Mauro José


Bioestatística aplicada à pesquisa experimental: volume 2/
Mauro José Fontelles. – São Paulo:
Editora Livraria da Física, 2012.

Bibliografia
ISBN 978-85-7861-138-5

1. Bioestatística 2. Pesquisa - Experiências I. Título.

12-01764 CDD-570.15195

Índice para catálogo sistemático


1. Bioetatística e pesquisa experimental:
Ciências biológicas 570.15195

Todos os direitos reservados. Nenhuma parte desta obra poderá ser reproduzida
sejam quais forem os meios empregados sem a permissão da Editora.
Aos infratores aplicam-se as sanções previstas nos artigos 102, 104, 106 e 107
da Lei no 9.610, de 19 de fevereiro de 1998

Editora Livraria da Física


www.livrariadafisica.com.br

BIOESTATISTICA_VOL02.indb 4 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 5 25/06/12 17:20
BIOESTATISTICA_VOL02.indb 6 25/06/12 17:20
À querida esposa Marilda, companheira inseparável, que
por sua dedicação incondicional à família,
propiciou momentos tranquilos para que esta obra
pudesse ser concluída.
Aos filhos Gustavo e Renata.
Orgulhosos admiradores deste autor.
À minha mãe Celina, coração bondoso a perdoar
os longos períodos de ausência do filho, não por falta
de lembranças, mas escrever é preciso.

BIOESTATISTICA_VOL02.indb 7 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 8 25/06/12 17:20
Prefácio

Quando fui gentilmente convidado para fazer o prefácio deste livro, senti-me pres-
tigiado e contente, mas, conhecendo na sua plenitude o que pretendia a referida obra,
confesso que sofri. Uma vez que sempre enfrentei, de frente, as dificuldades da vida, e,
se era este, um grande desafio, dispus-me a enfrentá-lo.
A história deste livro teve início há muitos anos atrás, quando o Professor Mauro
Fontelles veio até nós, na Universidade Estadual de Campinas, para realizar, sob minha
orientação, suas teses de Mestrado e Doutorado, as quais foram concluídas e defendidas
com raro brilhantismo. Como seu orientador, pude, de perto, acompanhar o interesse e
a necessidade deste Professor em adquirir, em curto prazo, todo o aprendizado relativo
à Bioestatística, o qual era exigido para os seus estudos, nas suas teses. A época, além
de ter demonstrado ser um médico detentor de vasto conhecimento clínico, a par de
suas excelentes qualidades como exímio cirurgião e pesquisador de mão cheia, dedi-
cou-se com muito afinco, adquirindo vasta experiência sobre o assunto, tornando-se,
consequentemente, um especialista na área, o que lhe conferiu uma grande vanta-
gem sobre os estaticistas disponíveis. Com este cabedal, soube muito bem aplicar seus
conhecimentos, quando, então, passou a oferecer uma análise crítica mais apurada
e minuciosa em seus trabalhos de pesquisa. Assim, ao apreciarmos o vasto conteúdo
desta obra, temos a certeza que será de grande valia para estudantes, professores e
pesquisadores, pois, talvez nenhuma outra área do saber tenha expandido tanto seus
horizontes quanto a Bioestatística, a qual tem sido amplamente empregada no campo
da pesquisa e, em decorrência desta grande expansão e do intercâmbio com outras

BIOESTATISTICA_VOL02.indb 9 25/06/12 17:20


áreas de conhecimento, vem contribuindo de forma decisiva para tornar a rotina do
pesquisador, através de leitura de livros como este que ora temos a rara oportunidade
de apreciar, um trabalho mais produtivo e interessante.
Desta forma, o valor altamente relevante desta obra é esclarecer dúvidas e apre-
sentar soluções que a pesquisa nos impõe, de modo a abrir um novo caminho que permita
sua aplicação direta em estudos de campo ou laboratoriais, sejam clínicos ou experi-
mentais. Nesta atividade, ocorre um fato notório: quando os trabalhos de pesquisa são
concluídos e, na ânsia de comunicar os seus resultados em congressos ou publicações,
existe sempre a necessidade de divulgar estes achados com uma precisão estatística que
permita avaliações mais acuradas e análises justas dentro da metodologia científica.
Atualmente, em grande parte das publicações, a Bioestatística à disposição é muitas
vezes aplicada por profissional não médico, o que, no entendimento do pesquisador,
torna-a frequentemente confusa ou não expressa a grandeza da avaliação clínica ou
experimental, daí a necessidade de respaldo de algo mais profundo, sendo esta a carac-
terística do livro em questão, o qual, dentro do espírito crítico do autor, passa a oferecer
uma ótica diferente para o entendimento desta importante ferramenta de pesquisa.
Portanto, trata a presente obra, de um livro muito bem planejado e bastante didá-
tico, pois aborda os aspectos da Bioestatística mais utilizados em projetos de pesquisa
na área das Ciências da Saúde. Destarte, um de seus objetivos é fornecer ao pesquisador
iniciante e alunos dos cursos de graduação e pós-graduação, um texto direto e de fácil
compreensão, tornando o aprendizado desta importante ciência uma tarefa mais sim-
ples e de maior aplicação. Assim, o lançamento deste livro é a coroação dos esforços do
autor para a aplicação prática da parte dos interessados pelo tema, sobre o qual tenho
a certeza que alcançará todos os seus objetivos, de modo a contribuir para a formação
dos profissionais dos cursos de graduação e como fonte de complementação de conheci-
mento das áreas da saúde e de outros profissionais de áreas correlatas, sendo, portanto,
motivo de júbilo e muito orgulho para o autor, pois contribui de forma inegável para
todos que se interessam pelo assunto por ele abordado.
A todos e a todas, fica aqui o convite para que a leitura deste livro seja um
estímulo à ação consciente que traduza o conhecimento, em resposta às necessidades
acadêmicas do nosso país.

Dr. Mario Mantovani (in memorian).


Professor Titular do Departamento de Cirurgia da Unicamp.

BIOESTATISTICA_VOL02.indb 10 25/06/12 17:20


SUMÁRIO

VOLUME 2

Parte III – TESTES DE HIPÓTESE PARAMÉTRICOS.................................................. 17


11. Teste t de Student ................................................................................................ 19
11.1. A distribuição t de Student .......................................................................... 19
11.2. O teste t de Student .................................................................................... 27
11.2.1. Teste t para amostras independentes com variâncias iguais ............... 29
11.2.2. Teste t para amostras independentes com variâncias desiguais .......... 35
11.2.3. Teste t para amostras pareadas (emparelhadas) ................................ 38
12. Correlação e regressão linear simples ................................................................... 45
12.1. Correlação linear simples ............................................................................. 46
12.1.1. Diagrama de dispersão ...................................................................... 48
12.1.2. Coeficiente de correlação produto-momento (r) ................................. 50
12.1.3. Teste de hipótese para correlação ...................................................... 54
12.1.4. Coeficiente de determinação (r2) ......................................................... 56
12.2. Regressão linear simples ............................................................................. 57
12.2.1. Determinação da reta de regressão .................................................... 59
12.2.2. Teste de hipótese para regressão linear .............................................. 62
12.2.3. Análise de resíduos ............................................................................ 66
13. Testes de aderência ............................................................................................. 73
13.1. Teste Kolmogorov-Smirnov (teste D) ............................................................ 75
13.2. Teste de Shapiro-Wilk (teste W) ................................................................... 78

Parte IV – TESTES DE HIPÓTESE NÃO-PARAMÉTRICOS........................................... 83


14. Distribuição qui-quadrado .................................................................................... 85
14.1. Tabelas de contingência .............................................................................. 86
14.2. A distribuição qui-quadrado ......................................................................... 89
14.3. Teste do qui-quadrado ................................................................................ 91
14.3.1. Teste do qui-quadrado da independência ........................................... 95

BIOESTATISTICA_VOL02.indb 11 25/06/12 17:20


14.3.2. Teste do qui-quadrado da homogeneidade ........................................ 97
14.3.3. Teste do qui-quadrado de aderência (ajustamento) ............................. 101
14.4. Teste do qui-quadrado de McNemar ............................................................ 108
14.5. Teste exato de Fisher ................................................................................... 117
15. Probabilidade e medidas de associação ............................................................... 121
15.1. Teoria da probabilidade ................................................................................ 122
15.1.1. Operações com probabilidades .......................................................... 124
15.2. Medidas de associação ............................................................................... 126
15.2.1. Razão de risco (RR) ........................................................................... 129
15.2.2. Razão de chances (odds ratio) ........................................................... 131
15.2.3. Risco atribuível (RA) ........................................................................... 134
15.2.4. Porcentagem de Risco Atribuível (RA%) ............................................. 135
15.2.5. Risco Atribuível na População (RAP) ................................................... 136
15.2.6. Porcentagem de Risco Atribuível na População (RAP) ........................ 136
16. Testes de rastreamento diagnóstico ..................................................................... 139
16.1. Bases para os testes de rastreamento diagnóstico ...................................... 140
16.2. Indicadores de um teste diagnóstico ............................................................ 144
16.2.1. Sensibilidade e especificidade ............................................................ 144
16.2.2 Curva ROC ......................................................................................... 150
16.2.3. Acurácia e prevalência ....................................................................... 154
16.3. Valores preditivos ........................................................................................ 155
16.4. Razão de probabilidades (verossimilhança) .................................................. 157
16.5. Combinações de múltiplos testes diagnósticos ............................................ 159
16.5.1. Testes em paralelo ............................................................................. 161
16.5.2. Testes em série .................................................................................. 163
16.6. Teorema de Bayes ....................................................................................... 166
17. Inferência para variáveis ordinais .......................................................................... 171
17.1. Teste U de Wilcoxon-Mann-Whitney ............................................................ 172
17.2. Teste T de Wilcoxon .................................................................................... 178
17.3.Coeficiente de correlação de Spearman ........................................................ 183
17.4. Teste de concordância kappa ...................................................................... 189
17.5. Teste paramétrico versus não-paramétrico ................................................... 192

Parte V – ANALISE MULTIVARIADA............................................................................. 195


18. Análise conceitual multivariada ............................................................................. 197
18.1. Bases conceituais da estatística multivariada ............................................... 198
18.2. Objetivos da estatística multivariada ............................................................. 200
18.3. A escolha do teste estatístico ...................................................................... 201
19. Análise de Variância (ANOVA) ............................................................................... 205
19.1. Base conceitual da ANOVA (Teste F) ............................................................ 207

BIOESTATISTICA_VOL02.indb 12 25/06/12 17:20


19.2. Tipos de ANOVA ......................................................................................... 209
19.2.1. Requisitos para uso da ANOVA .......................................................... 212
19.3. ANOVA de um critério .................................................................................. 213
19.4. Testes de comparações múltiplas ................................................................ 216
19.4.1. Teste Tukey (HSD) .............................................................................. 216
19.4.2. Teste de Student-Newman-Keuls (SNK) ............................................. 222
19.4.3. Teste de Bonferroni ............................................................................ 224
19.5. ANOVA de múltiplos critérios ....................................................................... 225
20. Análise de variância não-paramétrica ................................................................... 231
20.1. Teste de Kruskal-Wallis ................................................................................ 232
20.1.1. Teste de Dunn (Teste Q) ..................................................................... 237
20.2. Teste de Friedman ....................................................................................... 240
21. Regressão múltipla ............................................................................................... 245
21.1. Regressão linear múltipla ............................................................................. 245
21.1.1. Construção do modelo....................................................................... 248
21.2. Regressão logística simples e múltipla ......................................................... 256
22. Análise de sobrevida ............................................................................................ 267
22.1. Método atuarial ........................................................................................... 269
22.2. Método de Kaplan-Meier ............................................................................. 273
22.3. Testes de significância estatística ................................................................. 277
22.3.1. Teste do logrank ................................................................................ 277
22.3.2. Estatística do qui-quadrado de Mantel-Haenszel ................................ 282
23. Experimentos fatoriais .......................................................................................... 287
23.1. Noções básicas sobre experimentos fatoriais ............................................... 288
23.2. Experimento fatorial 22 ................................................................................ 296
23.3. Experimento fatorial no MINITAB .................................................................. 305
23.4. Análise de superfície de resposta ................................................................. 323

Tabelas ................................................................................................................... 335


Referências bibliográficas .............................................................................. 397
Índice remissivo ................................................................................................... 403

BIOESTATISTICA_VOL02.indb 13 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 14 25/06/12 17:20
Vo l u m e I I

BIOESTATISTICA_VOL02.indb 15 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 16 25/06/12 17:20
parte 3

Testes de Hipóteses
paramétricos

“Não interessa quem disse isso ou aquilo,


a natureza não dá a menor bola para a autoridade.
O único modo de aprender algo sobre
os fenômenos naturais é mediante experimentos
cuidadosos”.

Galileu Galilei (1564-1642)

BIOESTATISTICA_VOL02.indb 17 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 18 25/06/12 17:20
11
Teste t de Student

11.1 A DISTRIBUIÇÃO t DE STUDENT

A distribuição t foi desenvolvida pelo matemático inglês William Gosset1,


pesquisador da empresa de cerveja irlandesa Guinness, que, em 1908, publi-
cou seu trabalho com o pseudônimo de Student, trabalho este posteriormente
aperfeiçoado por Sir Ronald Fisher2, em 1926.
Semelhante à distribuição z, a t de Student é uma distribuição teórica de
probabilidades, que tem sua aplicação direcionada para a inferência estatís-
tica que trabalha com médias de pequenas amostras, quando o desvio padrão
da população (σ) não é conhecido. O fundamento da distribuição t de Student
tem por base o princípio no qual, em um teste de hipótese, geralmente a média
da população tomada como referência (µ0) é conhecida, mas se desconhece o
desvio padrão populacional (σ) e, portanto, não se conhece, também, o erro
padrão, situação esta que impede o teste de hipótese. Neste caso, a solução é
considerar que a variação da amostra é semelhante à da população e, então,

1. William Sealy Gosset (1876-1937) – Químico e matemático inglês conhecido pelo pseudônimo
de Student, ficou famoso pelo seu trabalho no desenvolvimento da distribuição t de Student.
2. Sir Ronald Aylmer Fisher (1890-1962) – Estatístico e biólogo inglês, criador das fundações
para a ciência estatística moderna.

BIOESTATISTICA_VOL02.indb 19 25/06/12 17:20


substituir o desvio padrão da população (σ) pelo desvio padrão amostral (s),
para que se possa obter o erro padrão estimado (EP) para a média, o qual é
dado pela fórmula:

σ s
σX = , onde: EP =
n n

A restrição desta substituição é que ela é verdadeira somente para grandes


amostras aleatórias, não sendo verdade para pequenas amostras. Assim, a fim
de resolver esta questão, William Gosset propôs que, quando em um teste de
hipótese, desvio padrão populacional (σ) é desconhecido, o valor crítico obtido
na curva normal z deve ser substituído pelo valor crítico da distribuição por ele
idealizada, a distribuição t de Student, o qual é calculado por:

x −µ x −µ
z= , onde substituindo σ por s , temos: t =
σ s
n n

Assim, como o desvio padrão populacional (σ) é substituído pelo des-


vio padrão da amostra (s), se tomarmos uma série infinita de valores de t,
o histograma da distribuição mostrará uma forma semelhante à curva nor-
mal gaussiana, com média igual a zero, porém com o pico ligeiramente mais
achatado e com as caudas mais elevadas. Ou seja, a distribuição t de Student
é platicúrtica em relação à curva normal. A Figura 11.1 mostra a relação entre
as duas curvas.
Observe que as deformações das duas curvas são diferentes, e que os pon-
tos de inflexão não são coincidentes. Como consequência desta diferença, os
valores que correspondem ao ponto crítico o qual delimita a área bilateral de
significância de 0,05 também não são coincidentes, ficando o da distribuição t
de Student ligeiramente mais afastado de µ0 quando comparado ao ponto crí-
tico da distribuição normal, aumentando, portanto, a probabilidade do erro
tipo I em um teste de hipótese. Para solucionar esta diferença, William Gosset
calculou novos valores críticos e criou uma nova tabela para a distribuição t,
cujos valores são maiores que os da distribuição normal z, em razão da subs-

20 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 20 25/06/12 17:20


 

Fig. 11.1 – Comparação entre a distribuição normal e a distribuição t de Student


para uma amostra com n = 30. Notar a diferença dos valores críticos que delimitam a região
de significância de 0,05, bilateral

tituição, na fórmula, do desvio padrão populacional (σ) pelo desvio padrão


da amostra (s).
Outra diferença importante entre as duas distribuições é que, na distribui-
ção normal z, o tamanho da amostra não interfere no cálculo do valor crítico,
ao passo que, na distribuição t de Student, a diferença entre σ e s depende do
tamanho da amostra. É por essa razão que os valores críticos, na distribuição t,
são calculados não somente com base no nível de significância (α) estipulado
na pesquisa, mas, também, com base no tamanho da amostra, o qual é determi-
nado em graus de liberdade (gl), cujo valor é igual a n – 1. Assim, o valor de
t deve sempre ser indicado pela notação tα;gl. Por exemplo: se tomarmos uma
amostra com n = 30 e considerarmos um nível α = 0,05, bicaudal, o valor crítico
na distribuição normal gaussiana será z = 1,96, enquanto, na distribuição t, esse
valor passa para t0,05;29 = 2,045(gl = 30 – 1 = 29), como mostrado na Figura 11.1.
Note que, para o exemplo acima citado, se for utilizada a distribuição t
para verificar se a diferença entre as médias pode ser considerada como esta-
tisticamente significativa, é necessário que ela seja igual ou maior que 2,045
erros padrão. Se fosse considerada a distribuição normal, esse valor deveria
ser igual ou maior que 1,96 erros padrão. Ou seja, ao utilizar a distribuição t, o
pesquisador necessita, no teste de hipótese, de um valor crítico maior para que
a hipótese nula seja rejeitada. Na prática, à medida que o tamanho da amostra

Teste t de Student 21

BIOESTATISTICA_VOL02.indb 21 25/06/12 17:20


aumenta, a diferença entre as duas distribuições diminui, sendo consideradas
iguais para valores de n > 30.
Em outras palavras: caso o desvio padrão populacional seja desconhecido,
o pesquisador pode estimá-lo pela utilização do desvio padrão amostral, desde
que a inferência estatística seja feita pela aplicação do teste t de Student e que
a distribuição de frequência dos valores de x da amostra siga o padrão da dis-
tribuição normal. Caso contrário, o pesquisador deverá converter os dados
para valores z ou utilizar testes não-paramétricos. De qualquer forma, caso o
pesquisador tenha alguma dúvida quanto ao padrão de normalidade dos seus
dados, ele deverá utilizar o histograma ou aplicar um teste de aderência, tal
como o teste de Smirnov-Kolmogorov ou o teste do qui-quadrado de ade-
rência, os quais serão discutidos em outro capítulo deste livro. A Figura 11.2
mostra o algoritmo para a aplicação da distribuição t de Student.

Início    

Pelo  teorema  do  limite  


Sim   central,  pode-­‐se  
N  >  30  
utilizar  a  distribuição  t  
de  Student.  
Não  

Converter  os  dados*   * Fórmulas para


A  população  tem   Não   ou  utilizar  testes  não-­‐ converter os dados
distribuição  normal?  
paramétricos.   para uma distribuição
Sim   normal
(1) x’ = log x
Utilizar  a  distribuição   (2) x’ =
O  desvio  padrão  da   Sim  
população  é   normal   (3) x’ = 1/x
conhecido?   (4) x’ = x2
(1, 2, 3) Indicadas
Não  
para curvas com
inclinação à direita.
Utilizar  a  distribuição  t  
(4) Indicada para
de  Student  com  o  
curvas inclinadas à
desvio  padrão  da  
amostra.   esquerda.

Fig. 11.2 – Algoritmo de decisão para a utilização do teste t de Student

22 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 22 25/06/12 17:20


Propriedades da distribuição t de student
• A média é igual a zero;
• Diferente da curva normal padronizada, a distribuição t não é descrita
como uma distribuição única, mas por uma “família” de distribuições, pois,
para cada grau de liberdade da amostra, há uma curva t diferente;
• As curvas têm a forma de sino e são simétricas em torno da média, porém
são mais achatadas (platicúrticas) em relação à curva normal padronizada;
• Quanto maior o tamanho da amostra, mais a distribuição t se aproxima da
distribuição normal padronizada, pois, quando n tende para ∞, o desvio
padrão da amostra (s) tenderá para σ. Para n > 30, a distribuição t é consi-
derada, na prática, igual à distribuição normal3;
• É a distribuição indicada para se fazer inferência com duas médias amos-
trais e cálculo da estimativa dos intervalos de confiança para a média
populacional, independentemente do tamanho da amostra, desde que os
valores sejam normalmente distribuídos e σ desconhecido.

Embora tradicionalmente o teste t seja utilizado para fazer inferências


entre as médias conhecidas de duas amostras, a distribuição t pode ser útil
quando se quer comparar a média de uma amostra com a média populacio-
nal, mesmo que σ seja desconhecido, como também é útil para a estimação da
média populacional através do intervalo de confiança, a partir da média amos-
tral. Essas determinações serão mostradas a seguir.

Teste de hipótese entre a média amostral e a média da


população (σ desconhecido)
Em algumas situações, o pesquisador precisa comparar uma média amos-
tral com uma média populacional já bem estabelecida. Isto acontece quando
uma amostra obtida de uma população-base é tratada com um procedimento
diferente daquele inerente à própria população. Neste caso, a média x A obtida
das observações da amostra selecionada, apresentará um desvio em relação
à média µ0 da população-base, por sorte que, o pesquisador está interessado

3. Quando o tamanho da amostra de dois grupos comparados é maior que 120, a diferença entre
as duas distribuições é desprezível. Por esse motivo, na tabela da distribuição t de Student, os
valores críticos são calculados até 120 graus de liberdade.

Teste t de Student 23

BIOESTATISTICA_VOL02.indb 23 25/06/12 17:20


em saber se esta diferença observada entre a média amostral e a média popu-
lacional ( x A − µ0 ) é, de fato, real, isto é, se ocorreu em razão da modificação do
procedimento ou se ela é decorrente do erro aleatório, da variação decorrente
do processo de amostragem.
Por exemplo: um pesquisador deseja saber se o uso de contraceptivos orais
tem efeito sobre a temperatura corporal basal4 (TCB) de mulheres na faixa etária
de 18 a 25 anos. Para tal finalidade, ele seleciona uma amostra de 20 mulheres
que usam contraceptivos orais, e encontra uma temperatura média x A = 36,7 C
o

, com desvio s A = 0,5 C . Ele deseja comparar esses dados com aqueles da popu-
o

lação de mulheres na mesma faixa etária, mas que não usam contraceptivos orais,
para a quais a temperatura corporal basal média (µ0) é admitida ser igual a 36,3
o
C. Considerando que os dados sejam normalmente distribuídos, existe diferença
estatisticamente significativa entre a TCB de mulheres com uso de contracepti-
vos e a TCB de mulheres da população, na mesma faixa etária?

• Passo 1 – Formular as hipóteses estatísticas:


H 0 : x A = µ0 = 36,3 e H A : x A ≠ µ0 = 36,3
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%)
• Passo 3 – Determinar o valor crítico do teste:
gl = n − 1 = 20 − 1 = 19 ∴ t 0,05;19 = 2,093
• Passo 4 – Calcular o valor do teste:

x A − µ0 36,7 − 36,3 −0, 4


t calc = = = = −4 , 44
s 0 ,5 0,09
n 20

• Passo 5 – Regra de decisão:

Se |t calc | < t 0,05;19 , aceita-se H 0 .

Se |t calc | ≥ t 0,05;19 , rejeita-se H 0 .

Como |t calc | = 4 , 44 > t 0,05;19 = 2,093, rejeita-se H 0 .

4. Temperatura do corpo medida imediatamente após a pessoa acordar, antes que qualquer
atividade física seja realizada.

24 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 24 25/06/12 17:20


• Passo 6 – Conclusão:
A média da temperatura corporal basal (TCB) das mulheres em uso de
contraceptivos orais é significativamente maior do que a média da tempe-
ratura corporal basal das mulheres que não usam este tipo de anovulatório.

Determinação do intervalo de confiança para a média


populacional
O intervalo de confiança em torno da média x é calculado para que se possa
fazer uma estimativa da verdadeira média µ populacional, pois, na maioria dos
casos, esta nunca é verdadeiramente conhecida. Como já foi demonstrada no
capítulo 10 desta obra, a estimativa de um parâmetro pode ser pontual e inter-
valar. Na estimação pontual da média, o pesquisador admite que o valor da
média populacional seja igual ao valor da média amostral (µ = x ) . Isto é uma
idéia errônea, pois sabemos que, na prática, raramente a média amostral coin-
cide com a média populacional. Por outro lado, na estimativa intervalar, um
intervalo é calculado em torno da média amostral x , no interior do qual se
acredita que esteja contida a verdadeira média µ da população, com um nível
de confiança 1- α preestabelecido.
Assim, para construir um intervalo de confiança (IC) de uma média popu-
lacional, pode-se empregar tanto o valor z quanto a distribuição t. No primeiro
caso, o intervalo é calculado quando o desvio padrão σ é conhecido. No segundo
caso, o intervalo pode ser calculado para pequenas amostras, especialmente
quando somente o desvio padrão amostral (s) é conhecido. Quando o desvio
padrão σ é conhecido, os intervalos de confiança de 95% e 99% são calculados
pelas fórmulas:

σ σ
IC 95%(µ ) = x ± 1, 96 e IC 99%(µ ) = x ± 2,58
n n

Os valores 1,96 e 2,58 foram obtidos na tabela dos valores z da distribuição


normal. No caso da primeira fórmula, existem 95% de chance de que o verda-
deiro valor de µ esteja situado no intervalo entre x −1, 96σ / n e x + σ / n .
Da mesma forma, há uma chance igual a 5% de que o intervalo não contenha
esta média.

Teste t de Student 25

BIOESTATISTICA_VOL02.indb 25 25/06/12 17:20


Porém, quando σ é desconhecido, a solução é estimar µ a partir do desvio
padrão da amostra (s). Para calcular este intervalo, utiliza-se a distribuição t
com n – 1 graus de liberdade, em vez do valor z, cujas fórmulas para 95% e 99%
de confiança são dadas por:

s s
IC 95%(µ ) = x ± t 0,05;gl e IC 99%(µ ) = x ± t 0,01;gl
n n

Exemplo: Selecionou-se uma amostra de 10 indivíduos cujas estaturas, em


centímetros, estão expressas no quadro abaixo. Qual o intervalo de confiança
de 95% para a média populacional?
178 180 185 176 186
Estatura (cm):
183 179 182 178 184

• Dados: n = 10, x = 181,10 cm e s = 3,38 cm

• Cálculo do erro padrão

t 0,05;gl = t 0,05;9 =2,262

s 3,38 3,38
EP = = = = 1,07 cm
N 10 3,16

Então, t 0,05;gl × EP = 2,262 × 1,07 = 2,42 cm

• Cálculo do intervalo de confiança de 95% (IC95%)

IC 95%(µ ) = x ± t 0,05;gl EP

IC 95%(µ ) = 181,10 ± 2, 42

IC 95%(µ ) = 181,10 − 2, 42 = 178,68 (limite inferior)

= 181,10 + 2, 42 = 183,52 (limite superior)

IC 95%(µ ) = 178,68 cm < µ < 183,52 cm

26 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 26 25/06/12 17:20


• Interpretação do resultado: a verdadeira média das estaturas dos indiví-
duos da população, da qual a amostra foi retirada, está situada no intervalo
compreendido entre 178,68 cm e 183,52 cm, com 95% de certeza.
Em outras palavras, o nível de confiança indica que, se o procedimento
for repetido para um grande número de médias amostrais retiradas da mesma
população, espera-se que 95% dos intervalos de confiança resultantes conte-
nham o verdadeiro valor da média populacional µ.

11.2 O TESTE t DE STUDENT

O teste t de Student, que pode ser unicaudal ou bicaudal, é um dos testes


mais utilizados em estatística inferencial para dados paramétricos, devendo ser
usado quando o objetivo do pesquisador é comparar as médias de duas amostras
retiradas de diferentes populações, cujos parâmetros populacionais, tal como a
média e o desvio padrão, não sejam conhecidos. Para tal finalidade, é importante
que as duas populações sejam independentes, e que as amostras selecionadas
sejam diferentes entre si apenas em relação ao fator a ser estudado, devendo as
demais características dos indivíduos das amostras, tais como a idade, sexo, esta-
tura etc, apresentarem-se o mais semelhante possível, de maneira que qualquer
diferença, encontrada no resultado da comparação entre os grupos, possa ser
atribuída exclusivamente à influência da diferença do fator em estudo.

Fórmula para calcular o valor t


Os valores críticos de t são calculados dividindo-se a diferença entre as
médias observadas dos grupos estudados pelo erro padrão da diferença (EPD)
entre as médias dos dois grupos.

Diferença entre as médias x A − x B σ σ2


t= = , onde: Erro padrão = =
Erro padrão da difereença EPD n n

Por definição, EPD é igual à raiz quadrada da soma das variâncias das
populações estudadas, divididas pelo respectivo tamanho da população.
Porém, como as variâncias das populações são geralmente desconhecidas, as

Teste t de Student 27

BIOESTATISTICA_VOL02.indb 27 25/06/12 17:20


variâncias das amostras (s2) podem ser utilizadas na fórmula, desde que o total
das duas amostras seja maior que 30 ou que seus valores estejam normalmente
distribuídos. Assim temos:

σ2A σB2 s A2 s B2
EPD(µ A − µB ) = + , onde: EPD( x A − x B ) = +
NA NB nA − 1 nB − 1

Como o teste t é utilizado pra estimar a hipótese de nulidade (H0), ou seja,


que não há diferença entre as duas médias ( x A = x B ) , pressupõe-se, então, que
a variabilidade é igual nas duas populações, isto é, que as variâncias são iguais
( σ2A = σ2B ) . Deste modo, uma estimativa conjunta das variâncias ( s 02 ) das
duas populações deve ser obtida pela média ponderada das variâncias amos-
trais. A fórmula para calcular s 02 é a seguinte:

s 02 =
( nA − 1) s A2 + (nB − 1) s B2 2
, onde s A = Variância da primeira amostra.
nA + nB − 2
s B2 = Variânciia da segunda amostra.
nA = Tamanho da primeira amostra.
nB = Tamanho da segunda amostra.

No teste t de Student é preferível que as amostras comparadas tenham o


mesmo tamanho n, o que, geralmente, não é possível. Assim, quando se deseja
fazer comparações entre amostras de tamanho diferentes, é necessário que
sejam atribuídas ponderações para cada uma das diferentes amostras, de tal
2
sorte que essas ponderações possam ajustar o valor de s 0 . Desta forma, o EPD
passa a ser determinado pela seguinte fórmula:

 1 1 
EPD( x A − x B ) = s 02  + 
n 
 A nB 

Então, quando o teste t de Student é utilizado para verificar a hipótese de


nulidade em uma pesquisa envolvendo duas amostras provenientes de diferen-
tes populações, a equação tem a seguinte fórmula geral:

28 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 28 25/06/12 17:20


x A − xB
t= , para gl = nA + nB − 2
 1 1 
s 02  + 
n 
 A nB 

11.2.1 Teste t para amostras independentes com


variâncias iguais
Este tipo de teste t deve ser utilizado para comparar dois subconjuntos
de uma população, os quais foram selecionados de forma independente e
aleatória, podendo apresentar tamanhos iguais ou desiguais. No entanto,
existem duas condições que devem ser satisfeitas para que ele possa
ser utilizado:

• Que as duas amostras apresentem distribuição normal, ou aproximada-


mente normal, quando individualmente analisadas. Esta condição garante
que a diferença entre as médias amostrais também seja normalmente dis-
tribuída. Por outro lado, se o teste é bicaudal e os tamanhos das amostras
são iguais, ou quase iguais, o teste pode ser aplicado mesmo que as amos-
tras apresentem-se bastante desviadas do padrão de normalidade. Caso as
amostras não tenham distribuição normal, deve-se tentar transformar os
dados, como demonstrado na Figura 11.2, ou utilizar o teste não-paramé-
trico de Mann-Whitney;

• Que as amostras sejam homocedásticas, ou seja, que haja homogeneidade


de suas variâncias. Isto é, que as variâncias dos subconjuntos testados
sejam iguais, e, portanto, oriundas da mesma população. A homocedasti-
cidade é importante porque ela garante que, se o tratamento A diferir do
tratamento B, o seu efeito altera os valores uniformemente, de tal modo que
a dispersão dos dados permaneça a mesma. Caso esta condição de igual-
dade das variâncias seja duvidosa, o pesquisador deve realizar o teste de
homogeneidade antes de aplicar o teste t, como será mostrado adiante. A
seguir, demonstraremos, pela aplicação de um exemplo, os passos para a
realização do teste t para amostras independentes.

Teste t de Student 29

BIOESTATISTICA_VOL02.indb 29 25/06/12 17:20


Exemplo: Um pesquisador deseja saber se a concentração de lipídios da
espécie de peixe mapará (Hypophthalmus edentatus) é influenciada por dois
diferentes métodos de medição: Soxhlet e Bligh Dyer. Para tal intento, ele sele-
cionou 10 amostras medidas pelo método Soxhlet e 12 amostras medidas pelo
método Bligh Dyer. Para um nível de significância de 0,05, existe diferença esta-
tisticamente significativa entre os dois métodos? Os resultados estão expressos
na Tabela 11.1.

Tabela 11.1 – Valores da concentração de lipídios da espécie de peixe mapará,


medidos por dois diferentes métodos

Métodos utilizados
Amostra Soxhlet
Bligh Dyer (g/100g)
(g/100g)
01 14,8 15,8
02 15,2 16,7
03 16,8 15,9
04 15,9 17,2
05 16,9 16,2
06 15,2 15,3
07 16,5 15,1
08 15,4 15,7
09 17,2 16,6
10 16,9 17,1
11 – 15,5
12 – 16,7

Média x S = 16,08 x B = 16,15

Desvio padrão s S = 0,88 s B = 0,70

Dados fictícios

• Passo 1 – Formular as hipóteses estatísticas:


H0 : x S = x B e H A : x S ≠ x B

• Passo 2 – Escolher o nível de significância (nível alfa):


α = 0,05 (5%) bilateral

30 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 30 25/06/12 17:20


• Passo 3 – Determinar o valor crítico do teste:
gl = nS + nB − 2 = 10 + 12 − 2 = 20 ∴ t 0,05;20 = 2,086

• Passo 4 – Calcular o valor do teste:

xS − xB (nS − 1)s S2 + (nB − 1)s B2


t calc = ∴ s 02 =
 1 1  nS + nB − 2
s 02  + 
n n 
 S B 

(10 − 1)(0,88)2 + (12 − 1)(0,70)2


s 02 = = 0,62
10 + 12 − 2

16,08 − 16,15 −0,070


t calc = = = −0,207
 1 1  0,337
0,62 + 
 10 12 

• Passo 5 – Regra de decisão:

Se |t calc | < t 0 ,05;20 , aceita - se H0 .


Se |t calc | ≥ t 0 ,05;20 , rejeita - se H0 .
Como |t calc | = 0,207 < t 0 ,05;20 = 2,086, aceita - se H0 .

• Passo 6 – Conclusão:
As médias das duas amostras não diferem significativamente, e isto evi-
dencia que os dois métodos não diferem quanto à determinação das con-
centrações de lipídios na espécie de peixe mapará (Hypophthalmus edenta-
tus), pois t calc = −0,207; gl = 20; P = 0,8378 .

Teste de homogeneidade para duas variâncias


Na literatura especializada, podemos encontrar vários tipos de testes de
homogeneidade para variâncias, cada um com sua particularidade de apli-
cação, dentre os quais citamos o teste F, o teste de Levene e o teste do qui-

Teste t de Student 31

BIOESTATISTICA_VOL02.indb 31 25/06/12 17:20


-quadrado da homogeneidade. Estes testes consistem em determinar se duas
ou mais amostras têm características parecidas, isto é, eles consistem em
métodos para avaliar se a variabilidade das amostras pode ser considerada
desprezível quando comparada à variabilidade resultante do procedimento
a ser testado. Como citado anteriormente, quando houver dúvidas quanto à
homogeneidade das amostras, o pesquisador deverá aplicar um teste para
determinar a homogeneidade das variâncias, pois isto garante um melhor de-
sempenho para os testes paramétricos, uma vez que estes exigem que as va-
riâncias das amostras envolvidas na análise sejam homogêneas, porém, não
necessariamente idênticas. A seguir, mostraremos a aplicação do teste F e do
teste de homogeneidade de Cochran.

Teste F para variâncias iguais


O teste F foi desenvolvido por Ronald Aylmer Fisher (1890-1962), daí a
sua denominação, sendo, também, utilizado para comparar as variâncias de
mais de dois grupos de estudo, quando é conhecido como análise de variância
(ANOVA). Este teste é calculado dividindo-se a maior variância pela menor,
para, então, obter-se a razão crítica, a qual é comparada com o valor crítico
da distribuição F (ver tabela para distribuição F), conforme o nível de signi-
ficância (nível alfa) preestabelecido pelo pesquisador. Assim, o raciocínio é o
seguinte: caso as variâncias sejam iguais, a razão entre elas será 1, ou, se ligei-
ramente diferentes, será aproximadamente 1. Por outro lado, caso a razão
entre as variâncias seja significativamente maior que 1, pode-se concluir que
as variâncias são desiguais. Porém, quanto maior que 1 o valor F precisa ser
para que as variâncias sejam consideradas desiguais mais do que se poderia
esperar apenas por acaso? Para responder a esta questão, compara-se o valor
calculado para a razão crítica, com o valor crítico tabelado da distribuição
F, o qual é determinado segundo o nível de significância e os graus de liber-
dade. Se o resultado calculado para o teste F for menor que o valor crítico da
tabela, não se rejeita a hipótese nula das variâncias iguais; caso o valor F seja
maior que o valor da tabela, a hipótese nula deve ser rejeitada, afirmando-se,
então, que a diferença entre as variâncias é estatisticamente diferente. No
primeiro caso, o teste t de Student pode ser empregado, pois as variâncias
das amostras são homogêneas; no segundo caso, a abordagem deve ser reali-

32 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 32 25/06/12 17:20


zada pela aplicação do teste t de Student para variâncias desiguais (teste t’), o
qual é calculado mediante a redução dos graus de liberdade pela aplicação da
fórmula de correção de Welch-Satterthwaite (1946), como mostrado mais
adiante, ou, então, aplicar um teste não-paramétrico. Assim, para calcular o
valor F, temos:

2
s Maior
Fcalc =
2
s Menor

Note que, por convenção, o numerador é representado pela maior das duas
variâncias, porém, não necessariamente a da maior amostra. Isso permite que o
valor calculado de F seja sempre um valor igual ou maior que 1.
A determinação do valor crítico na tabela da distribuição F depende do
nível de significância (valor α) estipulado pelo pesquisador e do número de
graus de liberdade(n – 1) de cada amostra, sendo dado por:

Fα;g l , onde: gln = Graus de liberdade da variância do numerador.


N ;glD
gld = Graus de liberdade da variância do denominador.

Tomando-se como base os dados do exemplo anterior (exemplo 2), a se-


guir mostraremos a sequência de passos para a aplicação do teste F. Lembre-se,
porém, que este teste de homogeneidade deve ser aplicado antes da realização
do teste t de Student.

• Passo 1 – Formular as hipóteses estatísticas:


s S2 s S2
H 0 : s S2 = s B2 ou H 0 : = 1 e H A : s S2 ≠ s B2 ou H A : >1
s B2 s B2

• Passo 2 – Escolher o nível de significância (nível alfa):

α = 0,05 (5%) bilateral

Teste t de Student 33

BIOESTATISTICA_VOL02.indb 33 25/06/12 17:20


• Passo 3 – Determinar o valor crítico do teste:

gl N = ns − 1 = 10 − 1 = 9

gl D = nB − 1 = 12 − 1 = 11 ∴ F0,05;9;11 = 3,59

• Passo 4 – Calcular o valor do teste:


2
s Maior (0,88)2
Fcalc = = = 1,58
2
s Menor (0,70)2

• Passo 5 – Regra de decisão:


Se |Fcalc | < F0,05;9;11 , aceita-se H 0 .
Se |Fcalc | < F0,05;9;11 , aceita-se H 0 .

Se |Fcalc | ≥ F0,05;9;11 , rejeita-se H 0 .


Se |Fcalc | ≥ F0,05;9;11 , rejeita-se H 0 .

Como |Fcalc | = 1,58 < F0,05;9;11 = 3,059, aceita-se H 0 .


Como |Fcalc | = 1,58 < F0,05;9;11 = 3,059, aceita-se H 0 .

• Passo 6 – Conclusão:
Como o valor do teste (Fcalc) é menor que o valor crítico tabelado (F0,05;9;11),
aceita-se H0, pois não há evidências que as variâncias das amostras sejam
diferentes. Neste caso, o teste t de Student pode ser aplicado para verifi-
car se há diferença estatisticamente entre os métodos Soxhlet e Bligh Dyer
para determinação da concentração de lipídios na espécie de peixe mapará
(Hypophthalmus edentatus).

Note que nem sempre é necessária a aplicação de um teste de homogenei-


dade, pois, na maioria das vezes, o bom senso mostra se existe ou não igualdade
entre as variâncias. Por exemplo, valores de variância muito próximos indicam
que elas são homogêneas; por outro lado, valores bastante discrepantes mos-
tram que as variâncias são desiguais. Na prática, o teste é necessário quando a
diferença entre os valores das variâncias não é pequeno o suficiente para que
se possa afirmar com segurança que elas sejam iguais, como no exemplo citado,
cujos valores são s S = 0,7744 e s B = 0, 4900 .
2 2

34 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 34 25/06/12 17:20


Teste de Cochran para variâncias iguais
Simples e de fácil aplicação, o teste de Cochran é utilizado para verificar a
homogeneidade das variâncias de um grupo de amostras. É calculado determi-
nando-se, inicialmente, as variâncias envolvidas no experimento, para, então,
dividir a maior delas pela soma de todas as outras. O resultado da divisão é
então comparado com os valores críticos de uma tabela estatística apropriada,
que leva em conta o número de variâncias envolvidas (k) e o número de graus
de liberdade (gl) utilizado nos cálculos, número esse que deve ser o mesmo
para todas as variâncias, pois a tabela é construída dessa forma. A fórmula do
teste de Cochran é dada por:

max s i2
C=
n
∑ si2
i =1

Lembre que o tamanho deve ser igual para todas as amostras, e um valor
calculado maior que o valor crítico tabelado indica que as variâncias são
significativamente diferentes, o que nega a hipótese de igualdade (ou de homo-
geneidade) das variâncias envolvidas no experimento.

11.2.2 Teste t’ para amostras independentes com


variâncias desiguais
Se após aplicar o teste de homogeneidade, o pesquisador verificar que as
variâncias das amostras não são homogêneas, o teste t de Student tradicional
não deve ser utilizado. Neste caso, deve-se utilizar uma das soluções propos-
tas pela estatística, sendo a de mais fácil utilização aquela que corrige os graus
de liberdade do teste t pela aplicação da fórmula de Welch-Satterthwaite.
Em estatística, essa comparação entre as médias de duas amostras quando
s A2 ≠ s B2 , é conhecida como o “problema de Behrens-Fisher”5.

5. Problema da estimação do intervalo e da aplicação do teste de hipótese sobre a diferença entre


as médias de duas amostras independentes, retiradas de populações normalmente distribuídas,
porém com variâncias desiguais. W. V. Behrens, em 1929, e Sir Ronald Aylmer Fisher, em 1935,
propuseram a solução para o problema.

Teste t de Student 35

BIOESTATISTICA_VOL02.indb 35 25/06/12 17:20


Assim, as diferenças entre a aplicação da fórmula tradicional e a fórmula
corrigida são:
• Na fórmula corrigida, utilizam-se as variâncias observadas nas duas amos-
2
tras, em vez de uma estimativa comum para as variâncias (s 0 ) , como na fór-
mula tradicional. Com isto, a fórmula corrigida é escrita da seguinte maneira.

x A − xB
,
t calc =
s A2 s B2
+
nA nB

• Para encontrar a razão crítica na tabela da distribuição t de Student, o cál-


culo do número de graus de liberdade deve ser modificado. Na fórmula
tradicional, ele é dado por (nA + nB – 2). Na fórmula corrigida, o número
de graus de liberdade (gl’) deve ser determinado pela equação de Welch-
-Satterthwaite, cuja fórmula é:
2
 s2 s2 
 A+ B
 nA nB 
gl , =  
2 2
 s2   s2 
 A  B
 nA   nB 
  + 
nA − 1 nB − 1

A fim de mostrar a aplicação da fórmula do teste t’ para amostras indepen-


dentes com variâncias desiguais, utilizaremos o exemplo a seguir.

Exemplo: dois pesquisadores compararam o ganho de peso diário de


ratos Wistar (Rattus norvegicus), com a utilização de dois diferentes tipos
de dieta. Para tal finalidade, dois grupos de 10 animais foram selecionados.
Para o grupo CA, foi administrada dieta contendo proteína do leite (caseína),
durante um período de 14 dias. Para o grupo SO, dieta contendo proteína
de soja, por igual período de tempo. As concentrações protéicas e as quan-
tidades diárias ofertadas foram iguais para ambas as dietas. Os dados estão
expressos na Tabela 11.2.

36 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 36 25/06/12 17:20


Tabela 11.2 – Valores do ganho de peso diário de ratos submetidos a dois diferentes
tipos de dieta

Grupos estudados
Animal Grupo CA Grupo SO
(g/dia) (g/dia)
01 13,1 10,8
02 15,2 10,7
03 15,8 9,9
04 13,9 10,2
05 12,9 9,6
06 15,2 10,3
07 15,5 9,1
08 15,4 10,1
09 16,2 10,6
10 15,9 10,1

Média xCA = 14 , 91 x SO = 10,14

Desvio padrão sCA = 1,180 s SO = 0,519

Dados fictícios

• Passo 1 – Formular as hipóteses estatísticas:


H 0 : xCA = x SO e H A : xCA ≠ x SO

• Passo 2 – Escolher o nível de significância (nível alfa):


α = 0,05 (5%) bilateral

• Passo 3 – Verificar a homogeneidade das variâncias para escolher o teste:

2
s Maior (1,180)2
Fcalc = = = 5,17 Valor crítico (Ftabelado ) = F0,05;9;9 = 4 ,03
2
s Menor (0,519)2

Como Fcalc = 5,17 > Ftabelado = 4 ,03 as variâncias são estatisticamente di-
ferentes (heterocedásticas), então, a escolha adequada é o teste t’ para
variâncias desiguais.

Teste t de Student 37

BIOESTATISTICA_VOL02.indb 37 25/06/12 17:20


• Passo 4 – Determinar o valor crítico do teste t’:

2
 s2 s2 
 CA + SO 
 nCA nSO  (0.139 + 0,027)2
gl , =   = =
0,0276
= 12
2 2 2 2 0,0023
 s2   s2  0.139 0,027
+
 CA   SO  9 9
 nCA   nSO 
  + 
nCA − 1 nSO − 1

Como gl’ = 12, então, o valor crítico será: t 0,05;12 = 2,179 .


,

• Passo 5 – Calcular o valor do teste:

xCA − x SO 14 , 91 − 10,14 4 ,770


,
t calc = = = = 11,72
2
sCA 2
s SO 0,139 + 0,027 0, 407
+
nCA nSO

• Passo 6 – Regra de decisão:

,
Se |t calc | < t 0, ,05;12 , aceita-se H 0 .

,
Se |t calc | ≥ t 0, ,05;12 , rejeita-se H 0 .

,
Como |t calc | = 11,72 > t 0, ,05;12 = 2,179, rejeita-se H 0 .

• Passo 7 – Conclusão:
As médias dos ganhos de peso diário dos dois grupos de animais diferem
significativamente entre si, o que evidencia que a dieta à base de proteína
do leite é mais eficaz quando comparada à dieta à base de proteína de soja,
pois t calc = 11,72; gl = 12; P < 0,001 .

11.2.3 Teste t para amostras pareadas (emparelhadas)


O teste t pareado é o ideal para ser aplicado quando se deseja detec-
tar pequenas diferenças em grupos cujos indivíduos são muito heterogêneos,

38 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 38 25/06/12 17:20


sendo, portanto, para estes casos, considerado um teste mais robusto que o t
de Student tradicional. Contudo, ao contrário do teste t para amostras inde-
pendentes, que compara as médias e variâncias de duas diferentes amostras,
o teste t pareado compara as diferenças entre duas situações distintas de uma
mesma amostra (ou população). Essa comparação geralmente é feita para
que se possa verificar se ocorreu, em decorrência da aplicação de um pro-
cedimento experimental, uma mudança significativa nos valores da variável
estudada. Como exemplo, para verificar se houve uma redução nos níveis da
pressão sanguínea sistólica após administração de uma nova droga para tra-
tamento da hipertensão arterial, o pesquisador precisa medir os valores da
pressão arterial dos indivíduos, antes e depois da administração da droga, e,
então, compará-los, na tentativa de detectar alguma possível alteração. Nesse
caso, o melhor teste a ser empregado é o t pareado, pois qualquer mudança
nos valores da pressão arterial detectada pelo teste, pode ser atribuída à
intervenção.
A técnica de pareamento tradicional é aquela em que apenas uma amos-
tra é randomicamente selecionada, e cada indivíduo é o seu próprio controle,
tal como mostrado no exemplo anteriormente citado, sendo esta a técnica que
proporciona melhor sensibilidade ao teste estatístico. Uma outra maneira de
emparelhar a amostra é selecionar, dois a dois, os participantes da pesquisa,
isto é, aos pares, sendo um deles aleatoriamente designado ao grupo tra-
tamento, e o outro, para o grupo controle. Neste processo, os sujeitos que
compõem cada um dos pares selecionados devem ser o mais semelhante pos-
sível, especialmente no que tange às características que possam influenciar
no resultado da pesquisa, tais como a idade, sexo, raça, estatura, tempo de
doença etc.

Fórmula para calcular o teste t pareado


Os valores do teste t pareado não são calculados com os dados originais
das observações (x) obtidas de cada uma das duas amostras ou nos momentos
antes e depois da intervenção, mas com as diferenças (d) entre as observa-
ções de cada par. Este teste considera como hipótese nula (H0) aquela em que
a média das diferenças ( d ) é igual a 0 (µd = 0), isto é, quando não há diferença
entre os valores medidos antes (xA) e depois (xD) da intervenção, o que seria

Teste t de Student 39

BIOESTATISTICA_VOL02.indb 39 25/06/12 17:20


esperado caso a intervenção não apresentasse qualquer efeito nos indivíduos
da amostra. A fórmula é dada por:

d d
tp = = , onde: d = Σd / n
EPd sd
sd= Erro padrão da média das diferenças.
n n - Número de pares ou de repetições (não o
número total de indivíduos ou observações).
Obs.: A média das diferenças também pode ser
dada por: d = x A − x B

( ∑di )2
∑(di − d ) 2 ∑ di2 −
n
sd = = , onde: n − 1 = Graus de liberdade
n −1 n −1

Interpretação para o teste t pareado – Para a realização do teste t pare-


ado, calcula-se a diferença, em termos de desvio padrão, entre valor calculado
de d e µd = 0. O valor encontrado é então comparado o com valor crítico da
tabela da distribuição t de Student, conforme o nível de significância prees-
tabelecido (nível alfa) e com n – 1 graus de liberdade, tal como foi feito para
os outros testes. A diferença será considerada estatisticamente significativa
quando o valor de tP calculado for maior que o valor crítico da tabela. Neste
caso, conclui-se que há diferença entre os grupos pareados estudados ou que
há diferença entre as médias das medidas antes e depois da intervenção. Caso
contrário, conclui-se que a diferença não é significante, ou seja, que ela é decor-
rente do erro aleatório, do acaso.
Para efeito de ilustração, tomaremos como exemplo um teste t com parea-
mento do tipo “antes e depois”.
Exemplo: a fim de testar a eficácia de uma nova droga para tratamento da
hipercolesterolemia, um pesquisador selecionou, aleatoriamente, um grupo de 10
pacientes hipercolesterolêmicos, entre aqueles atendidos no ambulatório de um
determinado hospital público. Para efeito de comparação, os valores do colesterol
total plasmático foram medidos antes e depois da administração da droga por um
período de duas semanas. Os dados estão expressos na Tabela 11.3, abaixo.

40 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 40 25/06/12 17:20


Tabela 11.3 – Valores do colesterol total plasmático antes e depois da administração da droga
por um período de duas semanas
Dosagem do colesterol total (mg/dL)
Paciente d = xA – xD d2
Antes (xA) Depois (xD)
01 248 202 46 2.116
02 257 183 74 5.476
03 264 176 88 7.744
04 252 198 54 2.916
05 278 168 110 12.100
06 246 187 59 3.481
07 271 182 89 7.921
08 268 194 74 5.476
09 246 198 48 2.304
10 254 204 50 2.500
Total x A = 258, 40 x D = 189,20 692 52.034
Dados fictícios

• Passo 1 – Formular as hipóteses estatísticas:


H 0 :µd = 0 e H A :µd ≠ 0

• Passo 2 – Escolher o nível de significância (nível alfa):


α = 0,05 (5%) bilateral

• Passo 3 – Determinar o valor crítico do teste t:

gl = n − 1 = 10 − 1 = 9 ∴ t 0,05;9 = 2,262

• Passo 4 – Calcular o valor do teste:

(∑di )2 (692)2
d ∑di2 − n
52.034 −
10 = 21, 47
tP = , onde: sd = =
sd n −1 10 − 1
n

69,2 69,2
tP = = = 10.191
21, 47 6,79
10

Teste t de Student 41

BIOESTATISTICA_VOL02.indb 41 25/06/12 17:20


• Passo 5 – Regra de decisão:
Se |t P | < t 0,05;9 , aceita-se H 0 .

Se |t P | ≥ t 0,05;9 , rejeita-se H 0 .

Como |t P | = 10,191 > t 0,05;9 = 2,262, rejeita-se H 0 .

• Passo 6 – Conclusão:
As médias dos valores do colesterol total plasmático, medidas antes e
depois da administração da nova droga, diferem significativamente en-
tre si, o que evidencia ter a droga se mostrado eficaz em reduzir os valo-
res do colesterol total plasmático no grupo de pacientes estudados, pois
t P = 10,191; gl = 9; P < 0,0001 .

Determinação do intervalo de confiança para a média de


amostras pareadas
O intervalo de confiança para a média de amostras pareadas é dado pela
seguinte fórmula:

IC 95%( δ) = d ± t 0,05;gl EP , onde: EP = sd / n

δ - Diferença.
d - Média das diferenças.
sd - Desvio padrão das diferenças.

Para calcular o intervalo de confiança de 95%, utilizaremos os dados do


exemplo anterior.

• Dados: n = 10 d = 69,2 mg/dL sd = 21, 47 mg/dL


• Cálculo do erro padrão

t 0 ,05; gl = t 0 ,05;9 = 2,262

sd 21, 47 21, 47
EP = = = = 6,80 mg / dL
N 10 3,16

Então, t 0 ,05; gl × EP = 2,262 × 6,80 = 15,38 mg / dL

42 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 42 25/06/12 17:20


• Cálculo do intervalo de confiança de 95% (IC95%)

IC 95%( δ) = d ± t 0,05;gl EP

IC 95%( δ) = 69,2 ± 15,38


IC 95%( δ) = 69,2 − 15,38 = 53,82 (limite inferior)
= 69,2 + 15,38 = 84 ,58 (limite superior)
C 95%( δ) = 53,82 mg/dL < d < 84 ,58 mg/dL
IC

• Interpretação do resultado: a verdadeira média das diferenças dos va-


lores do colesterol total plasmático dos indivíduos da população da qual a
amostra foi retirada, está situada no intervalo compreendido entre 53,82
mg/dL e 84,58 mg/dL, com 95% de certeza.

Assim, ao aplicar o teste t de Student, lembre-se sempre que as observações


de cada grupo devem seguir a distribuição normal. Para pequenas amostras, o
não cumprimento dessa regra resulta em valores P menores do que deveriam ser,
o que pode levar o pesquisador a rejeitar a hipótese nula e afirmar que há uma
diferença real entre as médias comparadas, quando, na verdade, esta diferença
não existe (erro tipo I). De igual maneira, os intervalos de confiança são mais
estreitos, o que também pode levar a conclusões erradas. Nestes casos, o teste
não-paramétrico da soma de postos de Wilcoxon deve ser a escolha. O Quadro
11.1 mostra as opções de teste para comparar as médias de duas amostras.

Quadro 11.1 – Opção de testes para comparação entre as médias de duas amostras

Tipo de dados Tipo de distribuição Teste apropriado

• Normal com variâncias iguais - Teste t de Student tradicional.


- Teste t com variâncias desiguais
Não-pareados • Normal com variâncias diferentes
(Welch-Satterthwaite).
• Não-gaussiana - Teste de Mann-Whitney.
• Normal das diferenças - Teste t pareado.
Pareados
• Não-gaussiana - Teste de Wilcoxon.

Teste t de Student 43

BIOESTATISTICA_VOL02.indb 43 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 44 25/06/12 17:20
12
Correlação e Regressão
Linear Simples

Em certos delineamentos, muitas vezes, um pesquisador se depara


com situações em que ele precisa avaliar o comportamento simultâneo de
duas variáveis quantitativas normalmente distribuídas, coletadas em uma
mesma amostra, no sentido de tentar estabelecer uma relação (ou associação)
entre elas. Da mesma forma, além de estabelecer uma relação, o pesquisa-
dor geralmente deseja fazer previsões a respeito do comportamento de uma
delas em relação à outra, assim como quantificar o quanto de alteração de
uma é determina pela alteração da outra. Por exemplo: se um pesquisador
deseja estudar a relação entre a idade (em anos) e os valores da pressão
arterial sistólica (em mmHg), provavelmente ele estará interessado em
saber se, de fato, essas duas variáveis estão associadas, isto é, se elas estão
correlacionadas. Da mesma maneira, ele desejará saber se à medida
que aumentam os valores da idade, os valores da pressão arterial sistólica
aumentam ou diminuem concomitantemente. Caso isto ocorra, o quanto
de aumento ou diminuição nos valores da pressão arterial sistólica é
explicado pela variação dos valores da idade. Em estatística, as respostas
a todas essas questões devem ser examinadas pelo estudo da correlação
e da regressão linear, as quais serão mostradas neste capítulo.

Correlação e Regressão Linear Simples 45

BIOESTATISTICA_VOL02.indb 45 25/06/12 17:20


Assim, em qualquer uma dessas análises, seja de correlação ou de
regressão, uma das duas variáveis é considerada a variável independente
(variável preditora), a qual, por convenção, é representada por x, enquanto
que a outra, a variável dependente (variável-resposta), é representada
por y. Em geral, a variável preditora é a variável explicativa, que é capaz de
modificar o comportamento da variável-resposta. Por outro lado, é impor-
tante saber a diferença entre as análises de correlação e regressão linear,
diferença esta que toma como base o objetivo da análise. Na correlação
linear, o investigador apenas está interessado em estabelecer e medir o
grau de uma associação entre as duas variáveis x e y, assim como verificar
se ela é positiva ou negativa, ao passo que, na regressão linear, ele tenta
quantificar o efeito de uma sobre a outra, além de estabelecer uma equação
matemática que possa prever o valor da variável-resposta a partir dos valo-
res da variável preditora.
Portanto, para melhor entendimento, iniciaremos a discussão pela análise
de correlação linear.

12.1 CORRELAÇÃO LINEAR SIMPLES

Define-se como correlação linear simples a relação entre duas variá-


veis quantitativas normalmente distribuídas, sendo os dados da amostra
representados por pares ordenados (x, y), onde x é a variável independente
(preditora) e y é a variável-resposta. Portanto, é interessante notar que,
neste tipo de análise, as informações devem ser coletadas aos pares e de uma
mesma amostra, de tal maneira que seja pertinente o estabelecimento de uma
associação entre as variáveis.
Assim que os dados quantitativos de um determinado estudo são coletados,
a maneira mais fácil de organizá-los, é dispô-los em uma tabela de distribui-
ção de frequência e calcular os parâmetros de interesse para análise, tal como
mostrado no Tabela 12.1, a qual relaciona as medidas das pressões arteriais
sistólica e diastólica em 12 pacientes.

46 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 46 25/06/12 17:20


Tabela 12.1 – Valores das pressões arteriais sistólica e diastólica de 12 pacientes
Valores da pressão arterial
Paciente (mmHg)
Sistólica (x) Diastólica (y)
01 108 65
02 125 74
03 100 64
04 108 68
05 112 72
06 102 66
07 112 68
08 122 70
09 116 70
10 116 70
11 120 72
12 108 70
x ±s 112,41±7,71 69,08±2,99

Deste modo, ao fazer a análise dos dados, o pesquisador pode estar inte-
ressado em responder a algumas questões importantes, tais como:
• Existe ou não uma relação entre as variáveis estudadas?
• Se a relação existe, ela é positiva ou negativa?
• Caso exista, qual a força desta associação?
• Ela é real, verdadeira, ou ocorreu por acaso?
Porém, ao analisar a tabela de distribuição de frequência, verifica-se que
ela não se presta para uma análise mais acurada no que tange ao estabeleci-
mento de uma correlação entre os valores das variáveis estudadas, e, portanto,
não responde às questões anteriormente formuladas, posto que, é praticamente
impossível estabelecer qualquer tipo de associação entre os dados coletados.
Assim, no sentido de responder às questões relativas à associação entre as
duas variáveis, os dados devem ser agora dispostos em um gráfico chamado de
diagrama de dispersão e, posteriormente, submetidos a uma análise estatís-
tica, o coeficiente de correlação, os quais serão mostrados a seguir.

Correlação e Regressão Linear Simples 47

BIOESTATISTICA_VOL02.indb 47 25/06/12 17:20


12.1.1 Diagrama de dispersão
O diagrama de dispersão é um gráfico cartesiano de pontos (diagrama de
pontos), onde cada ponto representa, concomitantemente, os valores das duas
variáveis x e y, coletadas a partir de cada indivíduo da amostra. A Figura 12.1
mostra o diagrama de dispersão para o exemplo anteriormente citado.

Fig. 12.1 – Diagrama de dispersão dos valores da pressão arterial de 12 indivíduos


 

Observando-se o diagrama, algumas informações podem ser, de pronto,


verificadas. Por exemplo:
• Os pontos estão distribuídos tomando uma mesma direção, ao longo de
uma reta imaginária que vai da esquerda para a direita e de baixo para
cima. Esta distribuição mostra que existe uma relação, mesmo imperfeita,
entre as duas variáveis estudadas (x e y). Esta informação responde à pri-
meira questão formulada, entretanto, visualmente, não se pode afirmar o
quão forte é a força desta relação, como, da mesma maneira, não se pode
dizer se ela ocorreu ou não por acaso. Essas questões somente serão res-
pondidas pelo cálculo do coeficiente de correlação e pela aplicação do
teste de hipótese para calcular a probabilidade de a correlação ter ocorri-
do por acaso, os quais serão mostrados mais adiante.
• Pode-se observar, também, à medida que aumentam os valores de x, os va-
lores de y aumentam concomitantemente, demonstrando existir uma cor-

48 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 48 25/06/12 17:20


relação linear positiva entre as variáveis estudadas. Porém, somente com
esta informação, não se podem fazer previsões para valores de y a partir
de outros valores de x. Isto somente é possível pela aplicação da regressão
linear, a qual será demonstrada item 12.2 deste capítulo.

A Figura 12.2 mostra exemplos de diagrama de dispersão com outras pos-


síveis associações entre as variáveis.
 

Correlação  
Correlação linear linear  
positiva Correlação  llinear
Correlação inear  nnegativa
egativa  
positiva  
 

Sem
Sem  ccorrelação
orrelação   Correlação
Correlação  nnão-linear
ão-­‐linear  

Fig. 12.2 – Diagramas de dispersão mostrando quatro diferentes tipos de correlação

Correlação e Regressão Linear Simples 49

BIOESTATISTICA_VOL02.indb 49 25/06/12 17:20


12.1.2 Coeficiente de correlação produto-momento (r)
Como podemos verificar, a interpretação da correlação a partir do dia-
grama de dispersão é uma avaliação puramente subjetiva e pouco precisa,
o que torna necessária uma maneira mais consistente de analisá-la. Para
tanto, a aplicação do coeficiente de correlação produto-momento (r), também
conhecido como coeficiente de correlação de Pearson, por ter sido inicial-
mente proposto por Karl Pearson em 1896, é o método mais utilizado para
avaliar esta correlação. Esse coeficiente, que é uma medida da associação
entre duas variáveis quantitativas, mostra o grau de dependência linear entre
elas, com a grande vantagem de ser representado por um número adimensio-
nal, independentemente da unidade de medida das duas variáveis analisadas,
podendo ser calculado pela seguinte equação:

r=
cov xy
, onde: Cov xy =
∑(x − x )( y − y )
sx ⋅s y n −1

Sendo Covxy igual à soma das covariâncias das variáveis x e y.

Deste modo, define-se como covariância entre duas variáveis aleatórias


x e y, o somatório do produto dos desvios das observações em relação à média
da variável x e os mesmos desvios das observações em relação à média da
variável y. Portanto, a fórmula mais simplificada para calcular r é dada pela
seguinte equação:

∑xi ∑ yi
∑xi yi − n
r= , onde: n = número de pares de dados..
 2  2
 (∑ x i )  (∑ y i ) 
∑ x i −  ∑ y i −
2 2
n n 
   

Assim, tomando-se os dados do exemplo anterior, temos:

50 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 50 25/06/12 17:20


Tabela 12.2 – Valores das pressões arteriais sistólica e diastólica de 12 pacientes

Valores da pressão arterial (mmHg)


Paciente
Sistólica (x) Diastólica (y) x.y x2 y2
01 108 65 7.020 11.664 4.225
02 125 74 9.250 15.625 5.476
03 100 64 6.400 10.000 4.096
04 108 68 7.344 11.664 4.624
05 112 72 8.064 12.544 5.184
06 102 66 6.732 10.404 4.356
07 112 68 7.616 12.544 4.624
08 122 70 8.540 14.884 4.900
09 116 70 8.120 13.456 4.900
10 116 70 8.120 13.456 4.900
11 120 72 8.640 14.400 5.184
12 108 70 7.560 11.664 4.900
Σ 1.349 829 93.406 152.305 57.369

(1.349 x 829)
93.406 −
r= 12
 (1.349)2   (829)2 
152.305 −  57.369 − 
 12   12 

93.406 − 93.193, 42
r=
(152.305 − 151.650,08)(57.369 − 57.270,08)

212,58 212,58
r= = = 0,8352
(654.92)(98, 92) 254.53

Interpretação do valor r
• Valor r – O coeficiente de correlação indica a intensidade da relação line-
ar entre as duas variáveis estudadas. Este valor pode variar de – 1 a + 1
(– 1≤ r ≤ +1). Valor de r = 0 indica uma ausência total de correlação entre as
variáveis, indicando que elas não estão associadas, enquanto o valor de r = |1|,
indica uma relação linear perfeita, chamada de relação determinística.

Correlação e Regressão Linear Simples 51

BIOESTATISTICA_VOL02.indb 51 25/06/12 17:20


• O sinal da correlação – Uma correlação positiva indica uma relação direta
entre as duas variáveis, isto é, quando os valores da variável x aumentam,
os valores da variável y aumentam concomitantemente ou quando os valo-
res da variável x diminuem, os valores da variável y diminuem na mesma
proporção. Ao contrário, uma correlação negativa indica uma relação do
tipo inversa, ou seja, quando os valores da variável x aumentam, os valores
da variável y diminuem (ou vice-versa). Valores máximos positivos e nega-
tivos (r = +1 ou r = –1) são obtidos quando todos os pontos do diagrama
estão dispostos em uma reta inclinada (Figura 12.3 A e B), ao passo que
valores intermediários são obtidos quando os pontos do diagrama apre-
sentam uma distribuição elíptica, inclinada, sendo mais estreita quanto
maior for a correlação (Figura 12.3 C). Entretanto, se a elipse for paralela a
um dos eixos do gráfico, ou se todos os pontos estão dispostos ao longo de
uma reta horizontal, a correlação é nula (Figura 12.3 D).

Correlação linear perfeita Correlação linear perfeita Correlação linear Ausência de correlação
positiva negativa intermediária

Fig. 12.3 – Diagramas de dispersão mostrando quatro diferentes valores de r

• De qualquer maneira, pelo simples fato de duas variáveis apresentarem uma


forte correlação entre si, não é, necessariamente, uma indicação de que haja
uma relação de causa e efeito entre elas, uma vez que o coeficiente de corre-
lação mede a existência de uma associação, não de uma relação de causa e
efeito entre as variáveis. Portanto, se o valor de r for diferente de zero, uma
das quatro situações abaixo descritas deve ser considerada pelo pesquisador:
• A variável x influencia o comportamento da variável y – São os valo-
res da variável x que determinam as variações na variável y, isto é, qual-

52 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 52 25/06/12 17:20


quer alteração em x causa modificações no comportamento da variável y.
Por exemplo, considere os dados do exemplo citado. É razoável concluir
que os valores da pressão arterial sistólica influenciam positivamente
nos valores da pressão arterial diastólica. Neste caso, a pressão arterial
sistólica é a variável preditora, enquanto que a pressão arterial diastólica
é a variável-resposta.
• A variável y influencia o comportamento da variável x - São os valores
da variável y que determinam as variações na variável x, isto é, qualquer
alteração em y causa modificações no comportamento da variável x. Para o
exemplo dado, seria a pressão arterial diastólica que determinaria o com-
portamento da pressão sistólica.
• As variáveis não são correlacionadas – Neste caso, qualquer relação
entre as variáveis estudadas se deve exclusivamente ao acaso, à pura
coincidência, sem qualquer significado clínico, mesmo que o diagrama
de dispersão mostre, em relação aos pontos do gráfico, uma distribuição
típica de uma correlação perfeita, pois, nesse caso, o coeficiente apenas
demonstra que as duas variáveis estão variando concomitantemente,
sem que isto indique que uma influencia a outra. Neste caso, os valores
das pressões sistólica e diastólica não apresentam qualquer relação de
causa e efeito.
• As variáveis x e y são influenciadas por uma terceira variável – No
fenômeno observado, pode haver a influência de uma terceira variável,
desconhecida ou não considerada na análise, cuja ação modifica, simulta-
neamente, o comportamento tanto da variável x quanto da variável y. Ou,
talvez, várias outras variáveis estejam afetando o comportamento de x e y.
Desta maneira, pode ser que, para o exemplo em questão, a resistência vas-
cular periférica e/ou o volume de sangue circulante estejam modificando,
de maneira semelhante, o comportamento das pressões arteriais sistólica
e diastólica, simultaneamente.

Assim, afirmar qual das condições acima descritas é aquela válida para o
estudo, pode ser uma tarefa bastante difícil. Porém, uma vez que tenha sido
determinada a correlação entre as duas variáveis, pode-se, agora, mensurar a
intensidade da mesma, com base na seguinte tabela:

Correlação e Regressão Linear Simples 53

BIOESTATISTICA_VOL02.indb 53 25/06/12 17:20


Tabela 12.3 – Avaliação do grau de intensidade da correlação entre duas variáveis x e y

Valor de |r| Intensidade da correlação

0 Sem correlação

0 – 0,3 Fraca

0,3 0,6 Média

0,6 0,9 Forte

0,9 1 Muito forte

1 Perfeita

12.1.3 Teste de hipótese para correlação


Sempre que um coeficiente de correlação r é calculado, é preciso verificar
se a associação entre as duas variáveis analisadas é real, isto é, se ela é verda-
deira ou se ocorreu somente em razão do erro amostral aleatório, em razão do
acaso. Ou seja, se ela, de fato, pode ser inferida ou não para a população de onde
a amostra foi retirada. Para tal objetivo, é necessária a aplicação de um teste de
hipótese, para o qual se usa o mesmo raciocínio aplicado nos testes de hipótese
para médias.
O raciocínio do teste é o seguinte: o verdadeiro coeficiente de corre-
lação populacional ρ1 (lê-se rô) somente poderia ser calculado caso todos
os possíveis pares x e y, da população, pudessem ser obtidos. Como isto
geralmente não é possível, a inferência para a população é feita a partir do
coeficiente de correlação amostral r, o qual representa uma estimativa por
ponto de ρ. Assim, temos que o coeficiente ρ é um parâmetro geralmente
desconhecido, para o qual os valores podem variar de –1 a +1, sendo a rela-
ção linear considerada direta quando ρ for positivo, e inversa quando ρ for
negativo. O valor de ρ será zero quando as duas variáveis não forem linear-
mente correlacionadas.
Para realizar o teste de hipótese, supõe-se, inicialmente, que ρ = 0, isto
é, não existe correlação entre as variáveis x e y. Se isto for verdade, para um
conjunto de várias amostras aleatórias, os valores de r obtidos devem ser, na

1. ρ = ro (lê-se rô) – Letra r minúscula, no alfabeto grego.

54 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 54 25/06/12 17:20


sua maioria, próximos de zero, com somente alguns poucos valores mais afas-
tados do centro da distribuição. Caso contrário, se ρ ≠ 0, espera-se que a maior
parte dos valores de r esteja bastante afastada de zero, além do que seria de
se esperar somente por acaso. Assim, para avaliar a significância estatística do
coeficiente de correlação r, testa-se a hipótese nula (H0) que ρ = 0, utilizando-se
a distribuição t com n – 22 graus de liberdade, sendo n o número de pares das
observações de x e y. O valor de tcalc é dado pela seguinte fórmula:

r −ρ r
t calc = = , onde: ρ = 0 (por supossição)
EPr 1−r2
n −2
Portanto, se o valor de tcalc for menor que o valor crítico de t tabelado, para
um nível de significância predeterminado e n – 2 graus de liberdade, a correla-
ção não apresenta significância estatística e, portanto, H0 não deve ser rejeitado.
Por outro lado, quando tcalc for maior que o valor de t tabelado, rejeita-se H0 e a
correlação é dita estatisticamente significativa. A seguir, utilizando-se os dados
do exemplo da Tabela 12.2, mostraremos as etapas para o teste de hipótese
para correlação.

• Passo 1 – Formular as hipóteses estatísticas:


H 0 :ρ = 0 e H A :ρ ≠ 0
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%) bilateral
• Passo 3 – Determinar o valor crítico do teste t:
gl = n − 2 = 12 − 2 = 10 ∴ t 0,05;10 = 2,228

• Passo 4 – Calcular o valor do teste t para r = 0,8352:

r 0,8352 0,8352
t calc = = = = 4 ,80
1−r2 1 − (0,8352)2 0,1740
n −2 12 − 2

2. Considera-se n – 2 graus de liberdade, porque um grau de liberdade é perdido para cada


variável.

Correlação e Regressão Linear Simples 55

BIOESTATISTICA_VOL02.indb 55 25/06/12 17:20


• Passo 5 – Regra de decisão:

Se |t calc | < t 0,05;10 , aceita-se H 0 .

Se |t calc | ≥ t 0,05;10 , rejeita-se H 0 .

Como |t calc | = 4,80 > t 0,05;10 = 2,228, rejeita-se H 0 .

• Passo 6 – Conclusão:
Existe, portanto, uma forte evidência que as variáveis “pressão arterial
sistólica” e “pressão arterial diastólica” estejam diretamente relacionadas,
isto é, que existe uma correlação linear significante entre elas, na popula-
ção de onde a amostra foi retirada, pois t calc = 4 ,80; gl = 10; P = 0,0007 .

12.1.4 Coeficiente de determinação (r2)


O coeficiente de determinação r2 é uma boa maneira de medir a associação
linear entre duas variáveis quantitativas, pois ele representa a proporção da
variabilidade de uma variável, no caso a variável y, que é explicada pela variabi-
lidade da outra variável, no caso, a variável x. Este coeficiente oscila entre 0 e 1,
assim, quanto maior for o valor de r2, maior será a dependência de uma variável
em relação a outra, isto é, melhor será o ajuste da reta em relação aos dados
coletados. Assim, para os dados do exemplo anterior, temos:

r = 0,8352 ∴ r 2 = 0,6976 ou r 2 ≅ 70%

Com base no valor de r2, pode-se concluir que 70% da variação da pres-
são arterial diastólica podem ser explicados pelos valores da pressão arterial
sistólica. Com base neste raciocínio, os 30% restantes da variação da pressão
arterial diastólica devem ser explicados por outros fatores, além da pressão
arterial sistólica, os quais não foram incluídos nos estudos, tais como o volume
sistólico ou a frequência cardíaca, por exemplo.
Note que, antes de realizar o cálculo do coeficiente de correlação (r),
para, então, calcular o coeficiente de determinação (r2), o pesquisador pre-
cisará definir qual das duas variáveis será a variável preditora (x) e qual será

56 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 56 25/06/12 17:20


a variável resposta (y). Essa escolha deve ser feita a fim de que a pesquisa
apresente uma lógica de raciocínio para o coeficiente de determinação,
embora os valores de r, r 2 e valor P não sofram alteração, independen-
temente de qual das variáveis seja x ou y. Por exemplo, se o pesquisador
estiver correlacionando a idade com a estatura de crianças, a idade deverá
ser considerada a variável preditora x, ao passo que a estatura, a variável
resposta y, uma vez que, em crianças, será sempre a idade a influenciar na
estatura e não o contrário, pois não faz sentido que variações da estatura
modifiquem a idade da criança. Note, também, que, em algumas situações,
a definição de qual das variáveis será x e qual será y não tem importân-
cia para o raciocínio do coeficiente de determinação, uma vez que elas se
influenciam mutuamente, como é o caso de um experimento que correla-
cione pressão e temperatura, por exemplo. Do mesmo modo, pode ocorrer
que variáveis não apresentem qualquer relação de causa e efeito entre elas,
sendo a correlação, apenas uma coincidência.

12.2 REGRESSÃO LINEAR SIMPLES

Após a verificação de que a correlação entre duas variáveis é significa-


tiva, o próximo passo é determinar a equação da linha que melhor modela
os dados. Este procedimento, que em estatística é chamado de regressão
linear, pode ser definido como a tentativa de se estabelecer uma equação
matemática simples que descreva a relação entre duas variáveis aleatórias
quantitativas, normalmente distribuídas, sendo uma delas, a variável inde-
pendente x, e a outra, a variável dependente y. O termo foi introduzido por
sir Francis Galton3, em 1886, em trabalho por ele publicado, que tentou
explicar a variação das estaturas dos filhos em relação às estaturas dos pais,
quando, então, descreveu o fenômeno conhecido como “regressão em dire-
ção à média”. Na prática, na regressão linear simples, o pesquisador cria um
modelo matemático com o objetivo de descrever o comportamento da vari-

3. Francis Galton (1822-1911) – Estatístico, matemático e meteorologista inglês, foi o criador do


conceito estatístico de correlação e regressão em direção à média. Aplicou métodos estatísticos
para o estudo das diferenças e herança humanas de inteligência, e fundou a psicometria e a
psicologia diferencial.

Correlação e Regressão Linear Simples 57

BIOESTATISTICA_VOL02.indb 57 25/06/12 17:20


ável resposta y (dependente) em função das variações da variável preditora
x (independente), na tentativa de utilizar uma delas para fazer previsões a
respeito da outra.
Matematicamente, o procedimento da regressão linear consiste em cal-
cular uma reta que, no diagrama de dispersão, melhor represente todos os
pontos do gráfico, de tal maneira que a relação existente entre as duas variáveis
possa ser expressa por meio de uma equação de regressão, cujos coeficientes
reflitam a intensidade desta relação. Ou seja, neste procedimento, o objetivo é
buscar a equação matemática de uma reta (daí o termo “linear”) na qual a vari-
ável resposta y possa ser expressa como uma função da variável preditora x.
Assim, a linha reta calculada por essa equação, chamada de linha de regressão
ou linha de melhor ajuste, pode ser usada a fim de predizer o valor de y para
um dado valor de x. A equação da reta é dada por:

y = a + bx

Onde: y = Valor da variável resposta (dependente).


x = Valor da variável preditora (independente).
 a = Coeficiente linear (corresponde ao ponto onde a reta intercepta
o eixo y, isto é, onde x = 0).
b = Coeficiente angular ou coeficiente de regressão (mostra a incli-
nação da reta, isto é, a variação de y para cada acréscimo de uma
unidade em x).

A Figura 12.4, abaixo, mostra a reta de melhor ajuste para os valores das
variáveis pressão arterial sistólica e diastólica. Note que no diagrama, um
conjunto de linhas pode ser desenhado através de um conjunto de pontos,
porém a linha de regressão é determinada de modo a obedecer a critérios
específicos, pois ela representa os valores médios esperados de y para distin-
tos valores de x. Isto é, a reta contém os valores esperados para y à medida
que os valores de x aumentam. Portanto, o diagrama contém os valores obser-
vados, ao passo que a reta contém os valores que se esperariam encontrar se
a correlação fosse perfeita, com r =1.

58 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 58 25/06/12 17:20


 

Fig. 12.4 – Diagrama de dispersão dos valores da pressão arterial de 12 indivíduos

Note, também, que, em um experimento, todos os pontos observados difi-


cilmente se posicionarão exatamente sobre uma linha reta perfeita, embora,
se a correlação existe (r ≠ 0), eles sempre tenderão para o alinhamento, sendo
estes “desalinhamentos” atribuídos ao acaso, ao desvio aleatório. Assim, para
cada ponto observado de x, di representa a diferença (desalinhamento) entre o
valor observado e o valor esperado de y, sendo estas diferenças chamadas de
erros ou resíduos, os quais podem ser positivos, negativos ou iguais a zero.
Quando o ponto está acima da linha de regressão, d > 0; quando está abaixo da
linha, d < 0; e quando o valor y observado é igual ao valor y esperado, o ponto
coincide com a linha de regressão, sendo, portanto, d = 0. Com base neste racio-
cínio, a linha de regressão é aquela que melhor se ajusta aos valores observados
de y, ou seja, é a reta para a qual a soma dos quadrados dos resíduos (Σd2) é
mínimo. A este processo dá-se o nome de método de mínimos quadrados.

12.2.1 Determinação da reta de regressão


A verdadeira reta de regressão para uma dada população somente seria
obtida caso todos os valores de x e y fossem conhecidos. Porém, como normal-
mente isso é impossível de ser feito, o mais comum é que a regressão entre
as variáveis estudadas seja calculada tomando-se uma amostra n de pontos,
aleatoriamente coletados, da população e, a partir desses pontos, determi-

Correlação e Regressão Linear Simples 59

BIOESTATISTICA_VOL02.indb 59 25/06/12 17:20


nar os valores do coeficiente linear (a) e do coeficiente angular (b), de tal
maneira que a reta encontrada possa ser ajustada aos pontos do diagrama de
dispersão. Assim, como explicado no item anterior, os valores dos parâmetros
a e b são calculados de modo que a soma dos quadrados dos desvios dos valo-
res y observados e a reta seja mínima. As fórmulas são as seguintes:

(∑ x i )(∑ y i )
∑xi yi − n ∑(x i − x )( y i − y )
b= =
(∑ x i )
2
∑( x i − x )
∑ x i2 − n

a = y − bx
Onde: x = Média dos valores de x .
y = Média dos valores de y .

Assim, tomando-se os dados do exemplo anterior, temos:

Tabela 12.4 – Valores das pressões arteriais sistólica e diastólica de 12 pacientes


Valores da pressão arterial (mmHg)
Paciente
Sistólica (x) Diastólica (y) x.y x2 y2

01 108 65 7.020 11.664 4.225


02 125 74 9.250 15.625 5.476
03 100 64 6.400 10.000 4.096
04 108 68 7.344 11.664 4.624
05 112 72 8.064 12.544 5.184
06 102 66 6.732 10.404 4.356
07 112 68 7.616 12.544 4.624
08 122 70 8.540 14.884 4.900
09 116 70 8.120 13.456 4.900
10 116 70 8.120 13.456 4.900
11 120 72 8.640 14.400 5.184
12 108 70 7.560 11.664 4.900
Σ 1.349 829 93.406 152.305 57.369

60 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 60 25/06/12 17:20


(∑ x i )(∑ y i )
∑xi yi −
(1.349)(8829)
93.406 −
b= n = 12
(∑ x i )
2
(1.349)2
152.305 −
∑ x i2 −
n
12

93.406 − 93.193, 41 212,59


b= = = 0,32
152.305 − 151.650.08 654 , 92

a = y − bx = 69,08 − 0,32 × 112, 41 = 69,08 − 35, 97 = 33,11

Portanto, após calcular os valores estimados para a = 0,32 e b = 33,11, é


possível, agora, determinar o traçado da reta de regressão. Para isso, utiliza-se
a equação de regressão, na qual, para cada um dos valores de x, pode-se calcular
o respectivo valor de y. Assim, a reta estimada para a regressão linear é dada por:

ŷ = a + bx

Onde ŷ representa o valor estimado de y para um específico valor de x.

Deste modo, a equação da reta estimada para os dados da Tabela 12.4 é


dada por yˆ = 33,11 + 0,32x . Assim, para um valor de x igual a 116 mmHg, temos:

yˆ = 33,11 + 0,32 × 116 ∴ yˆ = 33,11 + 37,12 = 70,23 mm


mHg .

Desta forma, para se desenhar a reta de regressão estimada, sobre o


gráfico de dispersão, utiliza-se a fórmula de regressão com valores calcula-
dos de a e b. Para tal finalidade, dois valores extremos observados de x são
escolhidos, de tal maneira que erros no traçado possam ser minimizados. A
seguir, calculam-se os correspondentes valores esperados para ( yˆ ) . Como
exemplo, temos:

Para x = 100 mmHg , yˆ = 33,11 + 0,32 × 100 = 65,11 mmHg.

Para x = 125 mmHg , yˆ = 33,11 + 0,32 × 125 = 73,11 mmHg.

Correlação e Regressão Linear Simples 61

BIOESTATISTICA_VOL02.indb 61 25/06/12 17:20


Isto feito, e de posse dos pares ordenados (100; 65,11) e (125; 73,11),
marcam-se os pontos no gráfico e traça-se a reta que une esses pontos.
A Figura 12.4 mostra os pontos observados no experimento e a reta ajus-
tada. Note que, no gráfico, os pontos não estão posicionados sobre a reta de
ajustamento, mas um pouco afastados em relação a ela. Isto indica que os
valores observados de y não são iguais aos valores esperados ( yˆ ) . A Tabela
12.5 mostra os valores observados e esperados de y, para cada um dos
valores de x.

Tabela 12.5 – Valores das pressões arteriais sistólica e diastólica de 12 pacientes


Valores da pressão arterial (mmHg)
Paciente
Sistólica (x) Diastólica (y) Diastólica (ŷ)
01 108 65 67,67
02 125 74 73,11
03 100 64 65,11
04 108 68 67,67
05 112 72 68,95
06 102 66 65,75
07 112 68 68,95
08 122 70 72,15
09 116 70 70,23
10 116 70 70,23
11 120 72 71,51
12 108 70 67,67

No dia-a-dia da pesquisa, a reta de ajuste é traçada pelos programas de


estatística para computadores.

12.2.2 Teste de hipótese para a regressão linear


Para que se possa utilizar a reta de regressão a fim de fazer previ-
sões para y, com base em valores determinados de x, deve-se realizar um
teste de hipótese com o objetivo de verificar se a regressão de x sobre y
é verdadeira, isto é, se a dependência de y em relação a x é real, se não
ocorreu por acaso, em razão do erro aleatório. Assim, como a dependência
de y em relação a x é dada pelo coeficiente de regressão (b), o qual geral-
mente é calculado com base em uma amostra, o teste de hipótese serve

62 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 62 25/06/12 17:20


para verificar se existe uma diferença estatisticamente significativa entre
o coeficiente calculado b e o verdadeiro coeficiente da população (B) de
onde a amostra foi retirada.
O teste segue o mesmo raciocínio utilizado para a correlação linear: o
verdadeiro valor do coeficiente de regressão populacional B somente
poderia ser calculado caso todos os possíveis valores de x e y, da população,
pudessem ser conhecidos. Como isto geralmente não é possível, a inferên-
cia para a população é feita a partir do coeficiente de regressão amostral b,
o qual representa uma estimativa por ponto de B. Para realizar o teste de
hipótese, supõe-se, inicialmente, que B = 0, isto é, não existe dependência de
y em relação à x. Se isto for verdade, para um conjunto de várias amostras
aleatórias, os valores de b obtidos devem ser, na sua maioria, próximos de
zero, com somente alguns poucos valores mais afastados. Caso contrário, se B
≠ 0, espera-se que a maior parte dos valores de b esteja bastante afastada de
zero, além do que seria de se esperar somente por acaso. Assim, para avaliar a
significância estatística do coeficiente de regressão b, testa-se a hipótese nula
(H0) que B = 0, utilizando-se a distribuição t com n – 2 graus de liberdade,
sendo n o número de pares das observações de x e y. O valor de tcalc é dado
pela seguinte fórmula:

b −B b b
t calc = = = , onde B = 0 (por suposição)
EPb EPb
∑( y − yˆ )2
(n − 2)∑( x − x )2

O EPb também pode ser calculado pela seguinte fórmula:

EPb =
∑ y 2 − a∑ y − b∑ xy
 (∑ x )2 
(n − 2) ∑ x 2 − 
 n 
 

Portanto, se o valor de tcalc for menor que o valor crítico de t tabelado,


para um nível de significância predeterminado e n – 2 graus de liberdade,
a regressão não apresenta significância estatística e, portanto, H0 não deve

Correlação e Regressão Linear Simples 63

BIOESTATISTICA_VOL02.indb 63 25/06/12 17:20


ser rejeitado. Por outro lado, quando tcalc for maior que o valor de t tabelado,
rejeita-se H0 e a regressão é dita estatisticamente significativa. A seguir, utili-
zando-se os dados do exemplo da Tabela 12.4, mostraremos as etapas para o
teste de hipótese para regressão.

• Passo 1 – Formular as hipóteses estatísticas:


H0 : B = 0 e H A : B ≠ 0

• Passo 2 – Escolher o nível de significância (nível alfa):

α = 0,05 (5%) bilateral

• Passo 3 – Determinar o valor crítico do teste t:

gl = n − 2 = 12 − 2 = 10 ∴ t 0,05;10 = 2,228

• Passo 4 – Calcular o valor do teste t para b = 0,32:

EPb =
∑ y 2 − a∑ y − b∑ xy = 57.369 − (33,11x829) − (0,32x93.406)
 (∑ x )2  1.3492
(n − 2) ∑ x 2 −  (12 − 2)(152.305 −
 n  12
 

30,89
= = 0,0048 = 0,069
6.549,20

b 0,32
t calc = = = 4 ,63
EPb 0,069

• Passo 5 – Regra de decisão:

Se |t calc | < t 0,05;10 , aceita-se H 0 .

Se |t calc | ≥ t 0,05;10 , rejeita-se H 0 .

Como |t calc | = 4,63 > t 0,05;10 = 2,228, rejeita-se H 0 .

64 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 64 25/06/12 17:20


• Passo 6 – Conclusão:
Existe, portanto, na população de onde a amostra foi retirada, uma depen-
dência positiva da pressão arterial diastólica em relação à pressão arterial
sistólica. Isto é, para cada acréscimo de um mmHg no valor da pressão arterial
sistólica, espera-se que a pressão arterial diastólica aumente em 0,32 mmHg,
pois t calc = 4 ,63; gl = 10; P = 0,0007 .

Condições para o uso da regressão linear


Antes que o investigador decida utilizar a reta de regressão para fazer infe-
rências sobre as variáveis analisadas, ele deve observar os seguintes pontos
(pressuposições):
• Condição de normalidade – Ao menos, a variável dependente y deve
apresentar-se normalmente distribuída ou aproximadamente normal.
Como os valores da variável independente são geralmente escolhidos pelo
pesquisador, esta condição de normalidade não é exigida para x, diferente-
mente da análise de correlação, em que as duas variáveis devem apresen-
tar distribuição normal.
• Homocedasticidade – A variação da variável dependente y deve ser a
mesma para cada valor da variável independente x. Caso esta condição não
seja cumprida, deve-se tentar transformar os dados.
• Linearidade – O diagrama de dispersão deve apresentar os pontos dis-
tribuídos com uma tendência linear, de modo que indique a existência
de uma correlação entre as variáveis. Caso os pontos do diagrama se
apresentem de maneira muito dispersa, a equação não será uma reta, de-
vendo, o pesquisador, tentar transformar os dados de maneira que possa
obtê-la.
• Aleatoriedade – Os valores das variáveis devem ser obtidos ao acaso na
população, sendo, portanto, independentes.

De qualquer forma, mesmo que os requisitos acima citados tenham sido


cumpridos, alguns cuidados devem ser observados:
• Se não há correlação estatisticamente significativa, não se deve utilizar a
equação de regressão para fazer predições;
• Ao utilizar a equação de regressão para fazer predições, o pesquisador

Correlação e Regressão Linear Simples 65

BIOESTATISTICA_VOL02.indb 65 25/06/12 17:20


deve-se manter no âmbito dos dados amostrais, pois não é correto utilizar
a equação para fazer predições sobre uma população diferente daquela de
onde os dados foram coletados;
• Para uma determinada população, a equação de regressão baseada em
dados do passado não é necessariamente válida para dados do presente,
pois as características da população podem ter mudado com o passar do
tempo;
• Para calcular os coeficientes da equação de regressão, devem ser utilizados
os dados individualmente coletados, de cada uma das variáveis estudadas.
Não utilizar médias nem valores outliers, pois eles podem distorcer a cor-
relação e, também, os coeficientes da regressão.

12.2.3 Análise de resíduos (ε)


Uma outra maneira de avaliar a regressão linear é pela aplicação do
método gráfico da análise de resíduos, os quais são definidos como erros
observados, isto é, eles correspondem às diferenças entre os valores observa-
dos de y e os valores ŷ previstos pela equação de regressão.

ε = ( y − yˆ )

Para aplicação do método, desenha-se um gráfico de dispersão, no qual


os valores dos resíduos são colocados no eixo vertical e os valores de ŷ no
eixo horizontal. Traça-se, na altura do resíduo zero, uma linha horizontal
paralela ao eixo x. Os pontos do diagrama devem apresentar uma distribui-
ção equilibrada acima e abaixo da reta horizontal, de maneira semelhante
a uma faixa horizontal. A Figura 12.5 mostra o teste gráfico para validar as
pressuposições da regressão linear dos valores das pressões arteriais do
exemplo anterior.
Caso o gráfico de resíduos mostre uma distribuição em forma de curva, isto
indica falta de linearidade dos pontos do diagrama de dispersão. Do mesmo
modo, se o gráfico de resíduos apresentar uma distribuição de seus pontos, em
forma de um megafone (cone deitado), isto indica falta de homocedasticidade
entre os valores de x e y.

66 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 66 25/06/12 17:20


Fig. 12.5 – Teste gráfico da análise de resíduos para a regressão linear dos valores da pressão
arterial de 12 indivíduos

Aplicação da regressão linear simples


A análise de regressão linear simples tem ampla aplicação na pesquisa
experimental, além de ser um dos métodos estatísticos mais utilizados quando
se deseja estudar a relação entre duas variáveis quantitativas normalmente
distribuídas. Para ilustrar sua aplicação, mostraremos dois exemplos de aná-
lise de regressão em modelos experimentais. O primeiro exemplo mostra uma
análise isolada, ao passo que, no segundo exemplo, o objetivo é comparar dois
conjuntos de dados para verificar se existem diferenças entre eles.

Exemplo 1: Um pesquisador estudou a relação entre o comprimento total


e o peso da espécie de peixe bagre (Arius passany). Para tal, selecionou uma
amostra de 20 exemplares adultos da espécie. Os dados e os gráficos da corre-
lação estão representados abaixo. Existe associação entre o comprimento e o
peso na espécie estudada?

Comprimento
710 715 770 790 730 800 780 705 740 775 870 710 725 860 760 820 720 770 785 860
(cm)

Peso (kg) 3,70 3,35 3,65 5,10 4,00 5,00 4,70 3,35 3,55 4,10 5,70 3,55 3,85 5,50 4,20 5,90 3,05 4,20 4,85 5,55

Correlação e Regressão Linear Simples 67

BIOESTATISTICA_VOL02.indb 67 25/06/12 17:20


 

Fig. 12.7 – Diagrama de dispersão da regressão linear e da análise de resíduos da correlação


entre o comprimento e o peso da espécie bagre (Arius passany)

Análise da regressão:
• Coeficiente de correlação (r = 0,9180) – Indica que existe correlação li-
near fortemente positiva entre o comprimento total e o peso da espécie
de peixe avaliada. Isto é, a variação do peso está diretamente associada à
variação do comprimento do corpo.
• Coeficiente de determinação (r2 = 0,8428) – Mostra que, em média,
84,28% da variação do peso da espécie bagre é explicada pela variação do
comprimento total do corpo. Isto é, 84,28% do peso corporal dependem

68 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 68 25/06/12 17:20


diretamente do comprimento do corpo. Os 15,72% restantes do peso do
corpo são explicados por outros fatores não estudados na pesquisa, tais
como a circunferência abdominal, o comprimento das nadadeiras etc.
• Valor P < 0,0001 – Indica que a regressão linear não ocorreu ao acaso,
existindo, portanto, na espécie estudada, uma dependência verdadeira en-
tre as variáveis “peso” e “comprimento total do corpo”, ou seja, existe re-
gressão do peso sobre o comprimento do corpo.
• Equação de regressão ( yˆ = −7,55 + 0,01x ) – Pela análise do coeficiente
de regressão da equação (b = 0,01), pode-se concluir que, para cada acrés-
cimo de 1,0 cm no comprimento total do corpo, espera-se que ocorra, em
média, um aumento de 10 g no peso do peixe. A equação pode ser utilizada
para se fazer predições sobre o peso em relação ao comprimento total do
corpo, para a espécie estudada.
• Análise de resíduos – O gráfico mostra os pontos com uma distribuição
equilibrada acima e abaixo da reta horizontal. Isto indica que as pressupo-
sições para a homocedasticidade e linearidade dos dados foram cumpridas.
• Conclusão – Há evidências para se afirmar que existe associação entre o
comprimento total e o peso na espécie estudada?

Exemplo 2: Um pesquisador desejava estudar o valor biológico da proteína


da soja e compará-lo com a proteína do leite (caseína), tomada como valor de
referência. Para tal finalidade, selecionou duas amostras de 10 de ratos adultos,
da espécie Wistar (Rattus norvegicus). Ambos os grupos receberam dietas de
composição idênticas, exceto para o tipo de proteína. Para o grupo CA, foi admi-
nistrada dieta contendo a proteína do leite (caseína), durante um período de
14 dias. Para o grupo SO, dieta contendo a proteína de soja, por igual período de
tempo. Os valores médios da ingestão de proteína e do ganho de peso, diários,
foram registrados para avaliação da correlação nos grupos estudados. Os dados
e os gráficos estão representados a seguir. O valor biológico da proteína da soja
difere daquele da proteína do leite?

Grupo Consumo protéico (g) 14,31 13,63 14,89 14,60 13,42 16,25 14,59 16,35 13,50 15,75
CA Ganho de peso (g) 54,93 50,53 55,03 51,13 51,73 60,33 56,43 61,33 52,33 52,73
Grupo Consumo protéico (g) 9,70 8,52 11,73 8,64 9,30 10,14 9,92 11,44 8,49 11,34
SO Ganho de peso (g) 55,10 50,82 57,32 51,12 51,74 57,84 56,18 58,20 52,34 52,20

Correlação e Regressão Linear Simples 69

BIOESTATISTICA_VOL02.indb 69 25/06/12 17:20


 

Fig. 12.8 – Diagrama de dispersão da regressão linear e da análise de resíduos da correlação


entre a ingestão de caseína e o ganho de peso de ratos Wistar

Fig. 12.9 – Diagrama de dispersão da regressão linear e da análise de resíduos da correlação


entre a ingestão de proteína da soja e o ganho de peso de ratos Wistar

Análise das regressões:


• Coeficientes de correlação (r = 0,7839 e r = 0,6827) – Comparando os
dois coeficientes, verifica-se que tanto a proteína do leite quanto a prote-
ína da soja apresentaram uma forte correlação com o ganho de peso dos
animais.
• Coeficientes de determinação (r2 = 0,6145 e r2 = 0,4661) – Mostram que,
para o primeiro grupo, a ingestão da caseína explica, na média, 61,45% da
variação de peso dos animais, ao passo que, no segundo grupo, a proteí-

70 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 70 25/06/12 17:20


na da soja é responsável somente por 46,61% desta variação. Tomando-se
como base este raciocínio, pode-se concluir que, no experimento, a pro-
teína do leite mostrou-se mais efetiva em aumentar o peso dos animais
quando comparada à proteína da soja.
• Valores P (0,0073 e 0,0295) – Indica que, em ambas as dietas, a regressão
linear não ocorreu ao acaso, e que existe, portanto, uma dependência ver-
dadeira entre as dietas estudadas e o ganho de peso dos animais, ou seja,
existe regressão do ganho de peso sobre o consumo de proteína.
• Equações de regressão ( yˆ = 14 ,74 + 2,70x e yˆ = 38,13 + 1,63x ) – Pela
análise dos coeficientes de regressão das equações (b1 = 2,70 e b2 = 1,63),
pode-se concluir que, para o primeiro grupo, para cada acréscimo de 1,0
g na ingestão de caseína, espera-se que ocorra, em média, um aumento
de 2,70 g/dia no peso dos animais, ao passo que, para o segundo grupo,
para cada acréscimo de 1,0 g na ingestão da proteína da soja, espera-se
que ocorra, em média, um aumento de peso de 1,63 g/dia. Esta compa-
ração mostra que a caseína produz um ganho de peso diário maior que a
proteína da soja, embora o teste de comparação dos coeficientes de regres-
são não tenha mostrado diferença estatisticamente significativa, pois valor
P = 0,2826 (calculado pelo programa BioEstat).
• Análises de resíduos – Os gráficos mostram, nos dois casos, que os pontos
apresentam uma distribuição equilibrada, acima e abaixo da reta horizon-
tal. Isto indica que as pressuposições para a homocedasticidade e lineari-
dade dos dados foram cumpridas
• Conclusão – Não há evidências para se afirmar que o valor biológico da pro-
teína da soja difere daquele da proteína do leite, pois os coeficientes de re-
gressão não mostraram diferença estatisticamente significativa (P = 0,2826).

Correlação e Regressão Linear Simples 71

BIOESTATISTICA_VOL02.indb 71 25/06/12 17:20


72 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 72 25/06/12 17:20


13
Testes de Aderência

Os testes de hipóteses para inferências estatísticas univariadas são aqueles


que correlacionam um parâmetro amostral com o mesmo parâmetro da popu-
lação estudada. Geralmente, esta correlação ocorre pela comparação dos valo-
res dos dados amostrais com os valores que se esperaria obter em uma distri-
buição teórica, sendo, por este motivo, denominados de testes de aderência,
os quais pertencem a uma classe de teste de hipótese cuja função é verificar
se a distribuição de frequência dos dados da amostra estudada segue a forma
da curva de uma distribuição hipotética. Na prática, como qualquer teste de
hipótese, eles têm o objetivo de verificar se existe uma diferença estatistica-
mente significativa entre os dados observados e aqueles que se esperaria obter
através de uma distribuição teórica, casos esses dados tenham sido obtidos da
mesma população hipotética.
Por exemplo, um pesquisador que deseja comparar os dados de duas
amostras, supõe que estes dados apresentem uma distribuição normal, pois
isto permite que ele possa escolher a maioria das técnicas de inferência es-
tatística conhecidas. Para avaliar se sua suposição está correta, ele deve es-
colher, dentre os diversos existentes, um teste de aderência, para verificar
se a distribuição dos seus dados amostrais “adere”, isto é, segue o modelo da
distribuição normal.

BIOESTATISTICA_VOL02.indb 73 25/06/12 17:20


Isso é sempre possível, porque uma variável aleatória, seja ela a estatura
ou a idade de um determinado grupo de indivíduos, por exemplo, sempre as-
sume um tipo de distribuição de frequência específica dentre as diversas das
muitas distribuições teóricas citadas na literatura. Essas distribuições são mo-
delos que procuram representar o comportamento de um determinado even-
to em função da frequência de sua ocorrência, sendo, portanto, distribuições
de probabilidades, nas quais, para um determinado evento, podemos prever a
probabilidade de sua ocorrência. Em outras palavras, podemos inferir com que
probabilidade determinado evento pode ocorrer novamente. Assim, quando
um pesquisador assume que um determinado grupo de dados se distribui con-
forme um modelo probabilístico, isso permite que ele realize estimativas sem
precisar da totalidade das informações da população de onde os dados foram
retirados. Porém, muito frequentemente, surge uma dúvida: como estimar se a
distribuição de um conjunto de dados segue um determinado modelo teórico?
Para que possa responder à sua pergunta, o pesquisador deverá aplicar um
teste de aderência, muitas vezes chamados de Testes de Bondade de Ajuste
(goodness of fit test), uma vez que estes testes tentam verificar se os dados
amostrais se ajustam bem ou não a uma distribuição teórica.
Por sua vez, é interessante notar que existem testes de aderência que ser-
vem para avaliar hipóteses mais gerais sobre a distribuição dos dados, enquan-
to que outros são específicos para determinados modelos teóricos. Assim, na
área das ciências biológicas e da saúde, os testes de aderência mais utilizados
são: o teste de Kolmogorov-Smirnov1 e o teste do qui-quadrado da aderên-
cia, sendo o primeiro, o teste não-paramétrico mais apropriado para quando se
trabalha com dados ordinais, e ideal para variáveis contínuas, e o segundo, ide-
al para variáveis dicotômicas. Outros testes, tais como o de Anderson-Darling
e o de Shapiro-Wilk, também podem ser utilizados e constituem uma alterna-
tiva para os testes de Kolmogorov-Smirnov e do qui-quadrado, pois apresen-
tam, como vantagem, maior sensibilidade, sendo o de Shapiro-Wilk o teste de
normalidade preferido em razão de ser mais poderoso para amostras menores

1. 
Andrei Nikolaevich Kolmogorov (1903-1987) - Matemático russo, autor das principais
descobertas científicas do século XX nas áreas de probabilidade e estatística. Vladimir
Ivanovich Smirnov (1887-1974) – Matemático russo, autor de significativas contibuições para
matemática pura e aplicada, assim como para a história da matemática.

74 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 74 25/06/12 17:20


ou iguais a 50, enquanto que o teste de Anderson-Darling tem mais poder para
amostras maiores de 50.
Assim, para qualquer tipo de teste de aderência, o princípio básico é que,
para uma dada amostra de tamanho n, observada a partir de uma variável
aleatória x, o objetivo é testar a hipótese nula (H0) de que x segue uma dis-
tribuição teórica, contra a hipótese alternativa (H1), na qual x não segue a
distribuição. Portanto, neste capítulo, abordaremos os testes de Kolmogorov-
-Smirnov e o teste de Shapiro-Wilk, ao passo que, para melhor compreensão,
o teste do qui-quadrado da aderência será discutido no capítulo que trata dos
testes não-paramétricos.

13.1 TESTE DE KOLMOGOROV-SMIRNOV (TESTE D)

Teste de aderência não-paramétrico, com base em amostras finitas, utili-


zado para determinar se duas distribuições de probabilidade subjacentes dife-
rem uma da outra, ou se uma distribuição de probabilidade observada difere
de uma distribuição teórica. É uma prova aplicada para testar a hipótese de que
um conjunto de dados amostrais provém ou não de uma determinada distribui-
ção. Neste caso, a comparação é feita para se verificar o grau de concordância
entre a distribuição acumulada de um conjunto de valores de uma amostra ale-
atória e a distribuição teórica esperada.
Neste teste, de execução simples quando comparado ao qui-quadrado, cal-
cula-se o módulo da maior diferença (Dmáx) entre a função de distribuição nor-
mal acumulada esperada (Fesp)2 e a função da distribuição da frequência relativa
observada acumulada e ajustada (Fobs) dos valores amostrais observados. Para
tal, é necessário, inicialmente, que os valores observados sejam normalizados. A
seguir, esta diferença é comparada com o desvio máximo tabelado (Dt), o qual é
encontrado na tabela dos valores críticos da distribuição Kolmogorov-Smirnov.
Caso a diferença máxima calculada seja maior que o desvio máximo tabelado,
rejeita-se H0 e afirma-se que não há concordância entre os valores observados e
esperados. Isto é, conclui-se que os dados amostrais não seguem a distribuição

2. É convenção usar um F maiúsculo para a função de distribuição acumulada.

Teste de Aderência 75

BIOESTATISTICA_VOL02.indb 75 25/06/12 17:20


teórica esperada, para um determinado nível de significância. Caso contrário, se
a diferença máxima calculada for menor que o desvio máximo tabelado, se aceita
H0 e conclui-se que os dados seguem a distribuição teórica esperada.
Na prática, a maneira mais fácil de executar o teste de Kolmogorov-Smir-
nov é construir uma tabela de distribuição de frequências (Tabela 13.1), na
qual serão colocados todos os dados calculados. A fórmula para realizar o teste
é a seguinte:

1 (i − 0,5)
Dmáx = m á x| Fesp ( x ) − Fobs ( x )| + , sendo: Fobs ( x ) =
2n n

Para n ≤ 100 o desvio máximo tabelado (Dt) é obtido diretamente da tabela.


Para n > 100, o valor Dt é calculado pela seguinte equação:

 1 
− ln  
Dt =  2α  , onde: ln = Logaritmo natural.
2n
α = Nível de significância estabelecido.
n = Tamanho da amostra.

Exemplo: Em um estudo para avaliar a função hormonal da glândula pa-


ratireóide, um pesquisador dosou o cálcio sérico em uma amostra aleatória de
oito pacientes atendidos no ambulatório de um hospital público. Os valores
estão expressos no quadro abaixo. Estes resultados têm distribuição normal,
sabendo-se que na população, em geral, os valores do cálcio sérico apresentam-
-se normalmente distribuídos, com média igual a 9,4 mg/dL e desvio padrão de
0,8 mg/dL?

Cálcio sérico (mg/dL) 8,8 9,7 9,2 9,3 8,6 9,1 8,9 8,4

• Passo 1 – Formular as hipóteses estatísticas:


H 0 : Fesp ( x ) = Fobs ( x ) e H A : Fesp ( x ) ≠ Fobs ( x )
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%) bilateral
• Passo 3 – Determinar o valor crítico do teste:
D0.05;8 = 0, 4570

76 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 76 25/06/12 17:20


• Passo 4 – Calcular o valor do teste:

Tabela 13.1 – Valores da dosagem do cálcio, em mg/dL, de oito pacientes

xi − x (i − 05)
i xi zi = Fesp ( x ) Fobs ( x ) = | Fesp ( x ) − Fobs ( x )|
s n

1 8,4 – 1,5 0,0668 0,0625 0,0043

2 8,6 –1 0,1587 0,1875 0,0288

3 8,8 – 0,5 0,3085 0,3125 0,0040

4 8,9 – 0,25 0,4013 0,4375 0,0362

5 9,1 0,25 0,5987 0,5625 0,0362

6 9,2 0,5 0,6915 0,6875 0,0040

7 9,3 0,75 0,7734 0,8125 0,0391

8 9,7 1,75 0,9599 0,9375 0,0224


x = 9, 0
s = 0, 4

Quando o valor de zi for negativo, deve-se subtrair o valor tabelado (da


tabela da distribuição normal) do valor 0,5. Assim, para zi = – 1,5 o valor
tabelado é 0,4332. Então, Fesp ( x 1 ) = 0,5 − 0, 4332 = 0,0668.
Quando o valor de zi for positivo, deve-se somar 0,5 ao valor tabelado (da
tabela da distribuição normal). Assim, para z8 = 1,75 o valor tabelado é
0,4599. Então, Fesp ( x 8 ) = 0,5 + 0, 4599 = 0, 9599.

1
Dmax = 0,0391 + = 0,1016
16

• Passo 5 – Regra de decisão:

Se Dmáx < D0,05;8 , aceita-se H 0 .

Se Dmáx ≥ D0,05;8 , rejeita-se H 0 .

Como Dmáx = 0,1016 < D0,05;8 = 0, 4570, aceita-se H 0 .

Teste de Aderência 77

BIOESTATISTICA_VOL02.indb 77 25/06/12 17:20


• Passo 6 – Conclusão:
Como o valor calculado para Dmáx é menor que o valor crítico tabelado Dt,
se aceita H0 e conclui-se que os valores do cálcio sérico da amostra seguem
a distribuição normal.

A Figura 13.1 mostra a relação entre as duas curvas de função dos valores
esperados e observados. Observar que as diferenças entre elas são pequenas, o
que mostra que ambas possuem distribuição normal.
 

Fig. – Relação entre as curvas dos valores esperados e observados

13.2 TESTE DE SHAPIRO-WILK (TESTE W)

Publicado em 1965 por Samuel Shapiro3 e Martin Wilk4, é um teste utili-


zado para verificar se os dados seguem a distribuição normal, sendo o mais
indicado quando o tamanho da amostra é menor que 50. Igualmente ao teste
de Kolmogorov-Smirnov, o teste de Shapiro-Wilk considera como hipótese nula
(H0), aquela em que a amostra foi retirada de uma população normalmente

3. Samuel Harvey Shapiro (1907-1987) – Estatístico russo que emigrou para os Estados Unidos,
estudou na Universidade de Illinois, onde foi governador em 1960 e 1964.
4. Martin Bradbury Wilk (1922) – Engenheiro químico e estatístico canadense que, juntamente
com Samuel Shapiro, desenvolveu o teste de aderência Shapiro-Wilk.

78 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 78 25/06/12 17:20


distribuída, sendo obtido pela divisão entre o quadrado da combinação linear
apropriada dos valores ordenados da amostra e a variância simétrica estimada.
É dado pela equação:

N /2
b2 n
Wcalc = , onde: b = ∑ aN −i +1 .( x N −i +1 − x i ) e SQD = ∑( x − x )2
SQD i =1 i =1

SQD = Soma dos quadrados dos desvios.

m ΤV −1
Constante a determinada por: (a1 ,...,an ) =
(m ΤV −1V −1m )1/2
Sendo: m os valores esperados da estatística de ordem da normal padrão
para uma amostra de tamanho n.
 m = (m1,…, mn)T onde m = n/2 se n é par e m = (n – 1)/2 se n for
ímpar.
V - Matriz de covariância correspondente.

Obs.: Os coeficientes aN-i+1 podem ser obtidos diretamente da tabela para o tes-
te W de normalidade de Shapiro-Wilk, no final deste livro.

Assim, se o valor de Wcalc for menor que o valor crítico Wt obtido na tabela
dos valores críticos para o teste de Shapiro-Wilk, em função do tamanho da
amostra (n) e do nível de significância preestabelecido, rejeita-se a hipótese
H0 e conclui-se que os dados não seguem a distribuição normal; caso contrá-
rio, aceita-se H0.

Exemplo: Com o objetivo de estudar o comportamento da pressão arterial


após a prática de atividades físicas, um pesquisador mediu os valores da pres-
são arterial diastólica de 10 indivíduos frequentadores de uma academia. Os
dados estão dispostos no quadro abaixo. Os valores da pressão arterial diastó-
lica apresentam-se normalmente distribuídos?

Pressão arterial (mmHg) 80 100 90 70 80 100 90 70 90 100

Teste de Aderência 79

BIOESTATISTICA_VOL02.indb 79 25/06/12 17:20


• Passo 1 – Formular as hipóteses estatísticas:
H0: A amostra provém de uma população normal.
HA: A amostra não provém de uma população normal.
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%) bilateral
• Passo 3 – Determinar o valor crítico do teste:
W0,05;10 = 0,8420
• Passo 4 – Calcular o valor do teste:
Ordenar as observações – 70 70 80 80 90 90 90 100 100 100
Calcular b2 (utilizar tabela de distribuição).

Tabela 13.2 – Valores da dosagem do cálcio, em mg/dL, de oito pacientes


i N-i+1 aN-i+1 xN-i+1 xi aN-i+1(xN-i+1-xi)
1 10 0,5739 100 70 17.2170
2 9 0,3291 100 70 9.8730
3 8 0,2141 100 80 4.2820
4 7 0,1224 90 80 1.2240
5 6 0,0399 90 90 0.0000
Σ = 32, 5960

Então: b 2 = (32,5960)2 = 1.062,50

n
Calcular: SQD = ∑( x − x )2 =1.210,00
i =1

b2 1.062,50
Wcalc = = = 0,8781
SQD 1.210,00

• Passo 5 – Regra de decisão:

Se Wcalc < W0,05;10 , rejeita-se H 0 .

Se Wcalc ≥ W0,05;10 , aceita-se H 0 .

Como Wcalc = 0,8781 > W0,05;10 = 0,8420, aceita-se H 0 .

80 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 80 25/06/12 17:20


• Passo 6 – Conclusão:
Como o valor calculado para Wcalc é maior que o valor crítico tabelado W0,05;10,
aceita-se H0 e conclui-se que os valores da pressão arterial diastólica dos
indivíduos da amostra seguem a distribuição normal, pois Wcalc = 0,8781;
P = 0,1527 .

Teste de Aderência 81

BIOESTATISTICA_VOL02.indb 81 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 82 25/06/12 17:20
parte 4

Testes de Hipóteses
NÃO-paramétricos

“Uma distinção importante entre ciência e religião


é que, em ciência, as hipóteses
precisam ser comprovadas experimentalmente”.

Marcelo Gleiser (1959 - )


Autor do livro “Poeira das Estrelas”.

BIOESTATISTICA_VOL02.indb 83 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 84 25/06/12 17:20
14
Distribuição Qui-Quadrado

Em um processo de análise bivariada, além do estudo com variáveis


contínuas, para as quais o teste mais utilizado é o t de Student, muitas vezes
o pesquisador se depara com testes de hipóteses que utilizam variáveis não-
-paramétricas do tipo nominal ou dicotômica, como por exemplo, quando
quer comparar variáveis qualitativas arranjadas em duas ou mais categorias
bem definidas, tal como doença ou cura, sobrevida ou morte, hipertenso ou
normotenso. Nestes casos, em que cada indivíduo do estudo é classificado
em somente uma das categorias, as frequências relativas ou absolutas po-
2
dem ser analisadas pela aplicação da distribuição qui-quadrado (χ ), sendo
o teste do qui-quadrado, o teste de probabilidade exata de Fisher e o
teste do qui-quadrado de McNemar os mais utilizados na análise dados
não-paramétricos na área das ciências da saúde, os quais serão objetos de
estudo neste capítulo.
Embora de grande versatilidade e de fácil interpretação, a aplicação de
cada um destes testes requer a utilização da tabela de contingência, na
qual serão colocados os valores observados das variáveis estudadas. Isto
permite que os grupos em estudo possam ser comparados, de tal maneira
que se possa verificar a existência ou não de associação entre eles, além de

BIOESTATISTICA_VOL02.indb 85 25/06/12 17:20


tornar os cálculos mais simples e mais fáceis de interpretar. Assim, antes de
iniciarmos a discussão sobre cada um destes testes, é necessário que o lei-
tor se familiarize com o uso da tabela de contingência, que descreveremos
a seguir.

14.1 TABELAS DE CONTINGÊNCIA

Também conhecidas como tabelas de dupla entrada, as tabelas de


contingência são amplamente utilizadas para registrar e analisar o rela-
cionamento entre duas ou mais variáveis qualitativas do tipo categóricas
dicotômicas, de tal modo que se possam comparar as frequências das cate-
gorias de uma das variáveis em relação às categorias da outra. Neste tipo de
tabela, além dos testes de hipótese que serão aqui descritos, outros testes
também podem ser executados, tais como o cálculo da razão de risco (risk
ratio) e da razão de chance (odds ratio), assim como várias outras análises
de interesse frequentemente utilizadas em estatística, dentre as quais se
destacam as análises de sensibilidade e de especificidade para os testes de
rastreamento de diagnóstico. Sua denominação advém do fato de que ela é
utilizada para determinar se a distribuição de uma variável é dependente
(contingente) da outra, cujo objetivo é testar a hipótese nula de que as vari-
áveis são independentes.
Uma tabela clássica é constituída por duas linhas (l) e duas colunas (c),
as quais formam, pelas suas intersecções, quatro células ou caselas que, por
convenção, são designadas pelas letras a, b, c, e d. Na prática, as caselas for-
mam uma matriz 2 x 2 e, na tabela, os dados podem ser registrados, tomando-
-se por base as linhas ou as colunas, daí o termo “tabela de dupla entrada”.
Tradicionalmente, nas linhas, são registrados os valores referentes aos gru-
pos que serão comparados, ao passo que, nas colunas, são registrados os va-
lores referentes ao desfecho estudado. A Tabela 14.1 mostra um exemplo de
uma tabela de contingência padrão.

86 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 86 25/06/12 17:20


Tabela 14.1 – Tabela de contingência 2 x 2 padrão
Desfecho
Total
Presente Ausente
Presente a b a+b
Fator de risco
Ausente c d c+d
Total a+c b+d a+b+c+d
a - Indivíduos com fator de risco e com a doença
b - Indivíduos com fator de risco, sem a doença
c - Indivíduos sem o fator de risco, mas com a doença
d - Indivíduos sem fator de risco e sem a doença
a + b - Todos os Indivíduos com fator de risco
c + d - Todos os Indivíduos sem fator de risco
a + c - Todos os Indivíduos com a doença
b + d - Todos os Indivíduos sem a doença
a + b + c + d - Todos os indivíduos do estudo

Note que utilização da tabela é muito versátil e, como foi referido anterior-
mente, serve para vários propósitos, além do teste do qui-quadrado. Visualizar
a distribuição dos dados e montar a tabela de contingência é o primeiro desafio
para um pesquisador menos experiente, pois o que se coloca nas linhas e nas
colunas depende do estudo que será realizado. Por exemplo, na Tabela 14.1,
somente dois grupos são comparados, sendo um deles o grupo constituído pe-
los indivíduos expostos a um dado fator de risco, enquanto que o outro grupo é
constituído por indivíduos não-expostos ao mesmo fator. No exemplo em tela,
a variável preditora é um fator de risco, mas poderia ser uma intervenção te-
rapêutica, um fator de proteção, tal como uma vacina, ou outra característica
qualquer que pudesse ser testada em um experimento. Tradicionalmente, os
valores dos grupos testados são distribuídos nas linhas da tabela e, a ordem
de alocação, seja na primeira ou na segunda linha, não altera o valor do teste.
Por outro lado, os valores para o desfecho esperado no estudo devem ser
alocados, tomando-se como referência as colunas da tabela. Os indivíduos que,
ao final do estudo, apresentam o desfecho esperado devem ser colocados na
primeira coluna, ao passo que o grupo de pacientes cujo desfecho não foi ob-

Distribuição Qui-Quadrado 87

BIOESTATISTICA_VOL02.indb 87 25/06/12 17:20


servado, deve ocupar a segunda coluna. Esta disposição, apesar de também não
influenciar no resultado do teste, pode facilitar a interpretação dos resultados
do mesmo. Do mesmo modo, o desfecho pode ser qualquer evento esperado re-
lacionado à variável preditora, tal como a evolução de uma doença, o resultado
de um tratamento etc. Na margem lateral direita da tabela, serão colocados os
totais das linhas, e na margem inferior, os totais das colunas; no canto inferior
direito, o total dos indivíduos participantes do estudo. Este valor é muito im-
portante, pois ele deve corresponder ao somatório das linhas que, obrigatoria-
mente, é igual ao somatório das colunas. A Tabela 14.2 mostra, para o exemplo
a seguir, a distribuição dos dados em um estudo caso-controle que compara
dois grupos segundo suas exposições ao fator de risco tabagismo.

Exemplo: Em um estudo caso-controle, dois grupos de pacientes foram


acompanhados quanto à incidência de câncer do pulmão associado ao tabagis-
mo. No grupo de fumantes, constituído por 100 indivíduos, a incidência de cân-
cer ocorreu em 28 pacientes, enquanto que, no grupo controle (não-fumantes),
constituído por 200 pacientes, a incidência foi igual a 16 casos. Qual a distribui-
ção na tabela de contingência?

Tabela 14.2 – Tabela de contingência para um estudo do tipo caso-controle


Desfecho
Câncer sim Câncer não Total
Tabagismo sim 28 (28%) 72 (72%) 100 (100%)
Fator de risco
Tabagismo não 16 (8%) 184 (92%) 200 (100%)
Total 44 (14,7%) 256 (85,3%) 300 (100%)

Observe que, na tabela, além do valor absoluto de cada uma das caselas,
podem ser colocadas as porcentagens dos valores observados em cada um dos
grupos comparados no estudo. Isto facilita o entendimento, pois simplifica a
comparação em relação às incidências nos diferentes grupos. Do mesmo modo,
deve-se colocar a soma das porcentagens (100%) nos totais marginais de cada
categoria, para que fique claro ao leitor, em relação a que total a porcentagem
foi calculada. Na margem inferior, colocam-se as porcentagens relacionadas ao

88 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 88 25/06/12 17:20


desfecho, que, igualmente, deve somar 100%. Observe também que, na tabela,
a incidência de câncer parece ter sido maior no grupo de pacientes sujeitos ao
fator de risco tabagismo, porém são necessários testes estatísticos para que
essas conclusões iniciais possam ser confirmadas. Esses testes, assim como os
métodos para calcular as porcentagens, serão discutidos mais adiante.
Note, ainda, que a tabela de dupla entrada pode ser expandida para que
três ou mais grupos possam ser simultaneamente comparados em relação a
um mesmo tipo de desfecho. Neste caso, criam-se matrizes l x c, de tal modo
que o total das células da tabela pode ser descrito como 3 x 3, 4 x 4 etc., sendo
o modelo mais empregado a matriz 2 x 2. A Tabela 14.3 mostra um exemplo de
uma tabela do tipo 4 x 2.

Tabela 14.3 – Tabela de contingência 4 x 2


Desfecho
Fumante Não-fumante Total
20 a 30 anos 18 32 50
31 a 40 anos 15 35 50
Faixa etária
41 a 50 anos 17 33 50
51 a 60 anos 15 35 50
Total 65 135 200

14.2 A DISTRIBUIÇÃO QUI-QUADRADO (χ2)

Desenvolvida por Karl Pearson, em 1899, a distribuição do qui-quadrado é,


sem dúvida, a mais apropriada para ser utilizada quando o objetivo é comparar
variáveis qualitativas distribuídas em duas ou mais categorias. A distribuição
é geralmente empregada para verificar, mediante a aplicação do teste do qui-
-quadrado (χ ), se existe diferença estatisticamente significante entre os valo-
2

res da frequência observada (O) de um determinado evento e a frequência com


que ele é esperado (E), segundo uma determinada teoria. Isto é, a distribuição
do qui-quadrado fornece a probabilidade com que as diferenças entre os valo-
res observados e esperados ocorreriam somente em razão do acaso.

Distribuição Qui-Quadrado 89

BIOESTATISTICA_VOL02.indb 89 25/06/12 17:20


Essa distribuição corresponde a uma “família” de curvas cuja forma varia
de acordo com o nível de significância (nível α) estipulado para o teste e com o
número de grupos comparados. Porém, na prática, é geralmente representada
por uma curva assimétrica, inclinada à direita, cuja assimetria diminui à me-
dida que aumenta o número de categorias comparadas, as quais determinam
os graus de liberdade (gl) do teste. A curva começa sempre no valor zero e
apresenta somente valores positivos, sendo a média da distribuição igual ao
número de graus de liberdade, o qual é calculado, para o teste do qui-quadrado
da independência, pela equação gl = (l -1)(c -1). A Figura 14.1 mostra a forma
da curva da distribuição do χ considerando gl = 1.
2

χ2

Fig. 14.1 – Forma geral da curva da distribuição χ para gl = 1, com região de significância
2

α =0,05

Assim, à medida que aumentam os graus de liberdade, a média é desloca-


da para a direita, aumentando, também, o desvio padrão da distribuição, de
forma que a curva se torna cada vez mais simétrica. Deste modo, à medida que
os graus de liberdade ficam muito grandes, a distribuição do qui-quadrado as-
sume a forma semelhante à distribuição normal gaussiana, de tal forma que a
região de significância ou de rejeição da hipótese nula é sempre unilateral e
deslocada para a cauda direita da curva, uma vez que valores do χ próximos de
2

zero, por indicarem diferenças pequenas entre os valores observados e espera-


dos, caem na zona de aceitação, não interessando, portanto, para a rejeição da
hipótese de nulidade. O valor crítico para o teste deve ser procurado na tabela

90 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 90 25/06/12 17:20


da distribuição qui-quadrado, considerando-se o número de graus de liberdade
e o nível alfa preestabelecido no delineamento.
Portanto, para utilizar a distribuição do qui-quadrado para o teste de
hipótese, o valor do teste é calculado e comparado com o valor crítico encon-
trado na tabela. Como o valor calculado depende das diferenças entre os valo-
res observados e esperados (O – E), o χ será igual a zero quando não houver
2

diferença entre os grupos comparados, crescendo à medida que aumentam as


discrepâncias entre eles. Com base neste raciocínio, diferenças muito grandes
são pouco prováveis de acontecer somente por acaso. Assim, se o valor calcula-
do ( χcalc ) for maior que o valor crítico tabelado ( χα;gl ), a hipótese nula a qual
2 2

afirma que as frequências dos valores observados são iguais às frequências dos
valores esperados (O = E) deverá ser rejeitada. Caso contrário, a hipótese nula
deverá ser aceita.

14.3 TESTE DO QUI-QUADRADO (χ2)

Teste não-paramétrico, geralmente empregado para comparar as caracte-


rísticas entre duas ou mais populações, no intuito de verificar se a frequência
ou proporção com que um determinado evento observado em uma delas se
desvia significativamente da frequência ou proporção com que o mesmo even-
to ocorre nas demais. Na prática, o teste do qui-quadrado é um modelo estatís-
tico que compara o comportamento de uma variável dependente com base no
conhecimento de uma ou mais variáveis independentes, mediante a aplicação
de um processo de comparação das contagens observadas (O) com as conta-
gens esperadas (E). Isto é, se as contagens observadas para o evento se ajus-
tam às contagens esperadas para o mesmo evento, com base em um modelo
predefinido, no qual a hipótese nula (H0) é aquela que afirma que as variáveis
comparadas são independentes. Em outras palavras, o teste compara os valores
observados com os valores esperados, para verificar o quanto das diferenças
entre eles pode ser atribuído ao acaso, em razão do erro aleatório decorrente
do processo de amostragem. O valor do χ é calculado pela seguinte equação:
2

(O − E )2
χcalc
2
=∑
E

Distribuição Qui-Quadrado 91

BIOESTATISTICA_VOL02.indb 91 25/06/12 17:20


Observe que, para calcular o valor do χ , é necessário calcular as diferenças
2

entre as frequências dos valores observados (O) e as frequências dos valores


esperados (E), o que implica, a princípio, que os valores esperados sejam calcu-
lados. Observe, também, que as diferenças são elevadas ao quadrado, para que
a soma não seja igual a zero. Cada diferença (O – E)2 deve ser dividida pelo valor
esperado (E) para ajustar, na tabela de contingência, as ponderações entre os
valores observados e esperados nos diferentes grupos comparados. Para mos-
trar a maneira como é calculado o valor do χ , utilizaremos o exemplo a seguir.
2

Exemplo: Objetivando testar uma nova droga para o tratamento da AIDS,


um investigador realizou um estudo experimental para o qual selecionou, ale-
atoriamente, 300 pacientes. Para 240 dos pacientes selecionados, foi adminis-
trada a droga A, ao passo que para os outros 60 pacientes, foi administrada a
droga B. A taxa de mortalidade em dois anos foi de 88 e 12 pacientes, para a
droga A e B, respectivamente. Qual o valor do χ para o estudo em questão?
2

Tabela 14.4 – Tabela de contingência para um estudo experimental com 300 pacientes
Mortalidade
Total
Sim Não
A 88 152 240
Droga
B 12 48 60
Total 100 200 300

• Cálculo das contagens esperadas – Para cada casela da tabela de con-


tingência, a contagem esperada (El,c) é dada pela seguinte equação:

Total da linha
E l ,c = × Total da co
oluna
Total do estudo

Assim, para cada casela, temos os seguintes valores esperados:

240 × 100 240 × 200


E1,1 = = 80 E1,2 = = 160
300 300

60 × 100 60 × 200
E 2,1 = = 20 E 2,2 = = 40
300 300

92 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 92 25/06/12 17:20


• Cálculo das percentagens – Para cada casela da tabela de contingência, a
percentagem (Pl,c) deve ser calculada, de tal maneira que se possam com-
parar as frequências relativas dos desfechos estudados. A percentagem é
calculada pela seguinte equação:

Total da casela
Pl ,c = × 100
Total da linha

Assim, para cada casela, temos as seguintes percentagens:

88 × 100 152 × 100


P1,1 = = 36,7% P1,2 = = 63,3%
240 240

12 × 100 48 × 100
P2,1 = = 20,0% P2,2 = = 80,0%
60 60

• Cálculo do qui-quadrado

(88 − 80)2 (152 − 160)2 (12 − 20)2 (48 − 40)2


χcalc
2
= + + + = 0,8 + 0, 4 + 3,2 + 1,6 = 6,0
80 160 20 40

A Tabela 14.5 mostra as frequências dos valores observados e esperados


para o estudo em questão.

Tabela 14.5 – Valores do cálculo do χ2 para um estudo experimental com 300 indivíduos
Caselas O E O-E (O – E)2 (O – E)2/E
a 88 80 8 64 0,8
b 152 160 -8 64 0,4
c 12 20 -8 64 3,2
d 48 40 8 64 1,6

Σ 300 300 0,0 256 χcalc


2
= 6,0

É interessante notar que o teste do qui-quadrado (χ ) é usado para avaliar


2

a relação entre duas ou mais variáveis qualitativas, sem que seja preciso a
suposição de normalidade das mesmas para que se possa analisar o grau

Distribuição Qui-Quadrado 93

BIOESTATISTICA_VOL02.indb 93 25/06/12 17:20


de associação entre elas. De qualquer maneira, o qui-quadrado pode ser
empregado em três diferentes tipos de análise estatística, as quais definem
o tipo de teste e que passaremos a descrever a seguir.
• Teste do qui-quadrado da independência – Ou teste de associação, é uti-
lizado para verificar se duas variáveis qualitativas apresentam associação
estatística entre si.
• Teste do qui-quadrado da homogeneidade – Serve para comparar duas
ou mais populações com relação a uma determinada variável categórica.
• Teste do qui-quadrado de aderência – Também chamado de teste de
ajustamento, é utilizado para verificar se uma distribuição de um conjunto
de dados amostrais ajusta-se a uma determinada distribuição teórica es-
perada.

Para que o leitor possa entender a lógica do teste do qui-quadrado e saiba


diferenciar um teste de independência de um teste de homogeneidade, traba-
lharemos com o exemplo a seguir: suponhamos que uma fazenda de piscicul-
tura queira analisar se existe diferença estatisticamente significativa entre as
taxas de crescimento de três diferentes espécies de peixe, quando mantidas
juntas em um mesmo tipo de lago artificial, por um período de seis meses. Nes-
te experimento, o melhor tipo de teste seria uma análise paramétrica do tipo
análise de variância (ANOVA), mas, por questões práticas, suponhamos, tam-
bém, que os pesos das espécies foram categorizados em baixo, médio e alto, e
que uma amostra de 600 peixes seria necessária para a análise. Neste caso, a
fazenda poderá conduzir a pesquisa com base em dois tipos de delineamento,
conforme seus objetivos:
Delineamento tipo 1 – O pesquisador poderá selecionar uma amostra ale-
atória de 600 peixes e verificar em que casela da tabela de contingência cada
um dos peixes estará alocado. Note que o único valor fixo será o total geral igual
a 600 peixes, enquanto que os valores totais das colunas e das linhas (totais
marginais) variarão livremente conforme a aleatoriedade. Neste caso, estare-
mos falando de um teste do qui-quadrado da independência.
Delineamento tipo 2 – Neste delineamento, o pesquisador selecionará
uma amostra aleatória de 200 peixes de cada uma das três diferentes espécies.
Note que os totais das linhas serão fixos, ao passo que os totais das colunas

94 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 94 25/06/12 17:20


variarão conforme os valores aleatórios das caselas. Neste caso, estaremos fa-
lando de um teste do qui-quadrado da homogeneidade.
Assim, quando os totais das linhas e das colunas variam livremente, o teste
de associação é chamado qui-quadrado da independência, e quando um dos
totais marginais, seja das linhas ou das colunas, é fixado, o teste é dito qui-
-quadrado da homogeneidade.

14.3.1 Teste do qui-quadrado da independência


Este tipo de teste é utilizado para verificar se existe uma correlação entre
as duas variáveis categóricas a serem comparadas. Aqui, a hipótese a ser tes-
tada é que as duas variáveis são estatisticamente independentes. Para tal, os
indivíduos selecionados para compor a amostra são alocados em uma tabela
de contingência conforme as categorias das duas variáveis analisadas, sendo
as caselas preenchidas pelas frequências observadas. Como relatado anterior-
mente, neste tipo de teste, o total da amostra é o único valor fixado pelo pesqui-
sador, e a hipótese de nulidade é aquela que afirma que não há associação entre
as variáveis estudadas. Isto é, que a variáveis são independentes. O exemplo a
seguir mostra a aplicação do teste do qui-quadrado da independência.

Exemplo: Uma indústria de panificação queria testar a qualidade da con-


servação de seus produtos com a utilização de três diferentes tipos de emba-
lagem, após um período 20 dias de prateleira. O critério utilizado para compa-
ração foi a formação ou não de fungos no interior da embalagem. Para tal, os
investigadores estudaram uma amostra de 300 unidades de um determinado
produto, colhida aleatoriamente em três diferentes supermercados da região.
Os dados estão relacionados na Tabela 14.6. Existe associação entre o tipo de
embalagem e a presença de fungo no produto após um período de 20 dias?

Tabela 14.6 – Presença de fungo conforme o tipo de embalagem


Presença de Tipo de embalagem
Total
fungo Tipo A Tipo B Tipo C
Sim 48 (34,5%) 42 (43,3%) 28 (43,8%) 118 (39,3%)
Não 91 (65,5%) 55 (56,7%) 36 (56,2%) 182 (60,7%)
Total 139 (100%) 97 (100%) 64 (100%) 300

Distribuição Qui-Quadrado 95

BIOESTATISTICA_VOL02.indb 95 25/06/12 17:20


• Passo 1 – Formular as hipóteses estatísticas:
H 0 :O = E (as variáveis são independentes, isto é, não existe associação en-
tre o tipo de embalagem e a presença de fungo).
H A :O ≠ E (existe associação entre as variáveis estudadas, isto é, a presen-
ça de fungo depende do tipo de embalagem utilizada).
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%)
• Passo 3 – Determinar o valor crítico do teste:

gl(l - 1)(c - 1)= (2 - 1)(3 - 1)= 2

χ20,05;2 = 5,99

• Passo 4 – Calcular o valor do teste:


Caselas O E O-E (O – E)2 (O – E)2/E
a 48 54,67 -6,67 44,49 0,81
b 42 38,15 3,85 14,82 0,39
c 28 25,17 2,83 8,01 0,32
d 91 84,33 6,67 44,49 0,53
e 55 58,85 -3,85 14,82 0,25
f 36 38,83 -2,83 8,01 0,21

Σ 300 300 0,0 134,64 χcalc


2
= 2,51

Então: χcalc
2
= 2,51

• Passo 5 – Regra de decisão:

Se χcalc
2
< χ20,05;2 , aceita-se H 0 .

Se χcalc
2
≥ χ20,05;2 , rejeita-se H 0 .

Como χcalc
2
= 2,51 < χ20,05;2 = 5, 99, aceita-se H 0 .

• Passo 6 – Conclusão:
Como o valor calculado para χcalc é menor que o valor crítico tabelado
2

χ20,05;2 , aceita-se H0 e conclui-se que as variáveis são independentes, isto

96 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 96 25/06/12 17:21


é, não existe associação entre o tipo de embalagem e a presença de fungo,
pois χcalc
2
= 2,51; P = 0,285 .

14.3.2 Teste do qui-quadrado da homogeneidade


Também chamado de teste qui-quadrado de comparação, este tipo de teste é
utilizado quando se deseja comparar as proporções de uma variável qualitativa em
duas ou mais populações. Os dados devem ser introduzidos em uma tabela de con-
tingência, onde as linhas contêm as amostras a ser comparadas e as colunas, as dife-
rentes categorias da variável estudada. Neste teste, o pesquisador fixa, a priori, os ta-
manhos das amostras, isto é, o total das linhas, ao passo que os valores das categorias
são aleatórios. Neste caso, a hipótese nula a ser testada é aquela em que a proporção
de indivíduos em cada categoria é igual nas diferentes populações estudadas. Isto é,
que as populações não diferem entre si em relação à variável estudada. O exemplo a
seguir mostra a aplicação do teste do qui-quadrado da homogeneidade.

Exemplo: Em uma localidade, uma rede de supermercados queria ve-


rificar o padrão de vendas para um determinado produto, segundo o poder
aquisitivo da população dos bairros onde suas lojas estão instaladas. Para
tal finalidade, três lojas foram selecionadas, sendo cada uma delas localizada
em um bairro classificado como de classe A, B e C. O produto em análise es-
tava sendo vendido em três diferentes tamanhos de embalagem, classificados
como pequeno, médio e grande. Para realizar o estudo, uma amostra de 100
consumidores do produto foi aleatoriamente selecionada em cada uma das
três lojas da rede. Os dados estão dispostos na Tabela 14.7. Existe diferença
estatisticamente significativa no padrão de vendas do produto conforme o
poder aquisitivo da população e o tamanho da embalagem?

Tabela 14.7 – Padrão de venda do produto conforme o tamanho da embalagem e o poder


aquisitivo da população
Tamanho da embalagem
Bairro Total
Grande Médio Pequeno
Classe A 12 (11,5%) 29 (34,9%) 59 (52,2%) 100
Classe B 28 (26,9%) 34 (40,9%) 38 (33,6%) 100
Classe C 64 (61,6%) 20 (24,2%) 16 (14,2%) 100
Total 104 (100%) 83 (100%) 113 (100%) 300

Distribuição Qui-Quadrado 97

BIOESTATISTICA_VOL02.indb 97 25/06/12 17:21


Note que, neste tipo de teste, a variável “tamanho da embalagem” não é
uma variável dicotômica, que aceita dois níveis de resposta, como observado
na tabela do exemplo anterior. Aqui, o que se deseja, realmente, é comparar as
proporções (P) de venda para cada tamanho de embalagem conforme a classe
econômica do bairro onde a loja está localizada, sendo a hipótese nula (H0)
aquela que pressupõe não existir diferença nas proporções observadas, isto
que PclasseA = PclasseB = PclasseC. Neste caso, o teste do qui-quadrado da homogenei-
dade compara as proporções das três amostras simultaneamente, sem que haja
necessidade de dicotomizar os dados, evitando-se, com isso, que as informa-
ções sejam perdidas. Assim, temos:

• Passo 1 – Formular as hipóteses estatísticas:


H 0 :O = E (não existe diferença no padrão das vendas relativas
aos tamanhos das embalagens e as classes dos bairros analisados).
H A :O ≠ E (o padrão das vendas relativas aos tamanhos das em
balagens está relacionado às classes dos bairros analisados).
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%)
• Passo 3 – Determinar o valor crítico do teste:

gl(l - 1)(c - 1)= (3 - 1)(3 - 1)= 4

χ20,05;4 = 9,49

• Passo 4 – Calcular o valor do teste:


Caselas O E O-E (O – E)2 (O – E)2/E
a 12 34,67 -22,67 513,93 14,82
b 29 27,67 1,33 1,77 0,06
c 59 37,66 21,34 455,40 12,09
d 28 34,67 -6,67 44,49 1,28
e 34 27,67 6,33 40,07 1,45
f 38 37,66 0,34 0,12 0,00
g 64 34,67 29,33 860,25 24,81
h 20 27,67 -7,67 58,83 2,13
i 16 37,66 -21,66 469,16 12,46
Σ 300 300 0,0 2.444,00 χ2calc = 69,11

98 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 98 25/06/12 17:21


Então: χcalc = 69,11
2

• Passo 5 – Regra de decisão:

Se χ2calc < χ20,05;4 , aceita-se H 0 .

Se χ2calc ≥ χ20,05;4 , rejeita-se H 0 .

Como χ2calc = 69,11 > χ20,05;4 = 9, 49, rejeita-se H 0 .


• Passo 6 – Conclusão:
Como o valor calculado para χcalc é maior que o valor crítico tabelado
2

χ20,05;4 , rejeita-se H e conclui-se que as frequências observadas diferem


0
significativamente das frequências esperadas, isto é, existe diferença esta-
tisticamente significativa para o padrão de consumo entre as três classes
de bairros analisadas, com o bairro classe A apresentando preferência pela
embalagem de tamanho pequeno; o bairro classe B, pela embalagem de
tamanho médio, e o bairro classe C, pela embalagem de tamanho grande,
pois χcalc = 69,11; P < 0,0001 .
2

Análise de resíduos padronizados (tabelas l x c)


No teste do qui-quadrado, assim como em qualquer outro tipo de teste de
hipótese, a determinação do valor P é fundamental para que se possa verificar a
significância estatística. Porém, no teste do qui-quadrado, em particular, não se
pode concluir como se dá a relação, uma vez que ele testa apenas a hipótese ge-
ral de que as variáveis estudadas sejam independentes. Assim, em tabelas l x c,
uma interpretação mais robusta dos resultados deve ser realizada pela análise
de resíduos, a qual mostra como as diversas caselas da tabela contribuem para
o valor final do qui-quadrado calculado ( χcalc ). É, portanto, uma ferramenta
2

estatística útil para a elaboração de uma análise mais detalhada de cada uma
das variáveis consideradas no estudo.
A análise é feita em três etapas sucessivas:
• Cálculo do resíduo padronizado (R p) – O qual é dado pela seguinte
equação:

Distribuição Qui-Quadrado 99

BIOESTATISTICA_VOL02.indb 99 25/06/12 17:21


O −E
Rp =
E

• Cálculo do resíduo ajustado (Raj) – Corresponde a cada resíduo padroni-


zado, corrigido pela equação a seguir:

Rp
Raj = , onde: TC = Total da coluna.
 TC   TL  TL = Total da linha.
1 −  1 − 
 TG   TG  TG = Total geral.

• Comparação dos valores calculados – Os valores calculados para Raj são,


então, comparados com o valor crítico da distribuição normal, segundo o
nível de significância previamente estabelecido para o teste. Por exemplo:
para um nível de significância estabelecido em 0,05, o valor crítico será zα =
1,96. Assim, se em uma dada casela o valor de Raj for maior do que zα = + 1,96
ou menor que zα = – 1,96, conclui-se que o valor observado (O) desvia-se sig-
nificativamente do valor esperado (E), para mais ou para menos, conforme o
sinal. Desconsiderando o sinal, quanto maior for o valor do Raj em relação ao
valor zα, maior será o desvio em relação ao valor esperado E, mostrando que,
naquela casela, a variação entre os grupos foi estatisticamente significativa.

A Tabela 14.8 mostra, entre os parênteses, os valores dos resíduos padro-


nizados para o exemplo anterior da Tabela 14.7. O cálculo será mostrado para
a casela a.

Tabela 14.8 – Resíduos padronizados para o padrão de venda do produto conforme o tamanho
da embalagem e o poder aquisitivo da população
Bairro Tamanho da embalagem Total
Grande Médio Pequeno
Classe A 12 (– 5,83) 29 (0,36) 59 (5,39) 100
Classe B 28 (–1,71) 34 (1,73) 38 (0,08) 100
Classe C 64 (7,54) 20 (– 2,09) 16 (– 5,47) 100
Total 104 83 113 300

100 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 100 25/06/12 17:21


O −E 12 − 34 ,67
E 34 ,67 −3,85
Raj 1,1 = = = = −5,83
 TC   TL   104   100  0,66
1 −  1 −  1 −  1 − 
 TG   TG   300   300 

Observando-se o valor do resíduo ajustado da casela a (Raj = – 5,83), con-


clui-se que o número de vendas da embalagem grande, na classe A, foi signifi-
cativamente menor do que o esperado se as variáveis fossem independentes,
indicando existir uma associação positiva entre a classe do bairro e o tamanho
da embalagem vendida. Por outro lado, quando consideramos a casela g (Raj =
7,54), verificamos que a venda da embalagem de tamanho grande, na classe C,
foi significativamente maior do que o esperado. Porém, na casela f (Raj = 0,08),
a venda de embalagem de tamanho pequeno, na classe B, não foi significativa-
mente maior do que o valor esperado, pois Raj < zα.

14.3.3 Teste do qui-quadrado de aderência


(ajustamento)
Também chamado de teste de ajustamento, o teste do qui-quadrado de
aderência é utilizado para verificar se uma distribuição de frequências obser-
vadas (O) de um conjunto de dados amostrais ajusta-se a uma determinada
distribuição de valores esperados (E), segundo uma determinada teoria. Ou
seja, este teste verifica se um conjunto de dados observados se adequa a um
determinado modelo probabilístico, e a hipótese de nulidade (H0) a ser testada
é aquela que afirma que a distribuição da variável de interesse comporta-se
conforme a distribuição teórica adotada. Portanto, se o modelo probabilístico
testado for compatível com a distribuição amostral, as frequências observadas
não irão diferir significativamente das frequências esperadas.
Para tornar o entendimento mais fácil ao leitor, inicialmente, utilizaremos
o arremesso de dados como exemplo, sendo este o mais característico para o
modelo. Assim, temos: um jogador deseja verificar se um dado é honesto. Para
tal intento, ele arremessa o dado 600 vezes e anota os resultados observados.
Se o dado é honesto, os valores observados para cada face não serão estatisti-
camente diferentes dos valores esperados (E = 100).

Distribuição Qui-Quadrado 101

BIOESTATISTICA_VOL02.indb 101 25/06/12 17:21


Valor da face 1 2 3 4 5 6 Total

Frequência Observada 88 103 96 101 104 108 600

Frequência esperada 100 100 100 100 100 100 600

• Passo 1 – Formular as hipóteses estatísticas:


H 0 : Pi = 1 / 6 (i = 1, 2, 3, ...) - A distribuição de frequência observada é
igual à distribuição de frequência esperada.
H A : ao menos uma probabilidade Pi ≠ 1 / 6.
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%)
• Passo 3 – Determinar o valor crítico do teste:
gl(l - 1)(c - 1)= (2 - 1)(6 - 1)= 5

χ20,05;5 = 11,07

• Passo 4 – Calcular o valor do teste:

(88−100)2 (103−100)2 (96−100)2 (101−100)2 (104−100)2 (108−100)2


χcalc
2
= + + + + +
100 100 100 100 100 100

250
χcalc
2
c
= =2,5
100

• Passo 5 – Regra de decisão:

Se χcalc
2
< χ20,05;5 , aceita-se H 0 .

Se χcalc
2
≥ χ20,05;5 , rejeita-se H 0 .

Como χcalc
2
= 2,50 < χ20,05;5 = 11,07, aceita-se H 0 .

• Passo 6 – Conclusão:
2
Como o valor calculado para χcalc é menor que o valor crítico tabelado
χ20,05;4 , aceita-se H e conclui-se que a distribuição de frequência dos va-
0

102 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 102 25/06/12 17:21


lores observados não difere da distribuição esperada, isto é, as diferenças
foram casuais. Portanto, não há razão para discordar que o dado seja ho-
nesto, pois χcalc
2
= 2,50; P = 0,776 .

A seguir, mostraremos outro exemplo relacionado à área da pesquisa.

Exemplo: Uma escola pública queria verificar o padrão racial dos seus alu-
nos e compará-lo com o padrão normal da população. Para uma amostra alea-
tória de 400 alunos, os resultados obtidos foram os seguintes: Brancos = 128;
Negros = 62; Pardos = 186; Outros = 24. Os resultados obtidos concordam com
o padrão racial determinado para a cidade estudada (Brancos = 51,5%; Negros
= 5,6%; Pardos = 40,4%; e Outros = 2,5%)?

• Passo 1 – Formular as hipóteses estatísticas:

H 0 :O = E (B=128; N=62; P=186; O=24)

H A :O ≠ E (B=206,0; N=22,4; P=161,6; O=10,0)

• Passo 2 – Escolher o nível de significância (nível alfa):


α = 0,05 (5%)
• Passo 3 – Determinar o valor crítico do teste:

gl(l - 1)(c - 1) = (2 - 1)(4 - 1) = 3

χ02,05;3 = 7,81
• Passo 4 – Calcular o valor do teste:
Categoria O E O-E (O – E)2 (O – E)2/E

Brancos 128 206,0 -78.0 6084.0 29.53

Negros 62 22.4 39.6 1568.1 70.01

Pardos 186 161.6 24.4 595.3 3.68

Outros 24 10,0 14.0 196.0 19.60

Σ 400 400 0,0 8.443,52 χcalc


2
= 122,82

Distribuição Qui-Quadrado 103

BIOESTATISTICA_VOL02.indb 103 25/06/12 17:21


• Passo 5 – Regra de decisão:
2
Se χcalc < χ20,05;3 , aceita-se H 0 .

Se χcalc
2
≥ χ20,05;3 , rejeita-se H 0 .

Como χcalc
2
= 122,82 > χ20,05;3 = 7,81, rejeita-se H 0 .

• Passo 6 – Conclusão:
2
Como o valor calculado para χcalc é maior que o valor crítico tabelado
χ20,05;4 , rejeita-se H e conclui-se que a distribuição de frequência dos
0
valores observados difere significativamente da distribuição esperada.
Portanto, o padrão racial dos alunos da escola é diferente daquele encon-
trado na população, pois χ2calc = 122,82; P < 0,0001 .

Correção de continuidade (correção de Yates)


Originalmente descrita por Frank Yates1 em 1934, a correção de continui-
dade deve ser aplicada nos casos em que o teste do qui-quadrado for realizado
em tabelas de contingência com apenas um grau de liberdade (gl = 1) e com
amostras menores que 40 (n < 40). Esta correção é efetuada subtraindo-se 0,5
do valor absoluto da diferença entre os valores observados e esperados, antes
de calcular o quadrado desta diferença. Deste modo, a fórmula para obtenção
do χ corrigido é a seguinte:
2

(|O − E | −0,5)2
χYates
2
=∑
E

Com aplicação da correção de Yates, o teste do qui-quadrado fica mais


robusto, pois a fórmula reduz o tamanho do valor calculado, o que, de cer-
ta maneira, reduz a chance de encontrar uma diferença estatisticamente
significativa. Assim, tomando-se a tabela de cálculo do exemplo anterior,

1. Frank Yates (1902-1994) – Matemático e estatístico inglês que introduziu a correção de


continuidade para o teste do qui-quadrado.

104 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 104 25/06/12 17:21


podemos verificar o novo valor do qui-quadrado calculado com a correção
de Yates, mesmo sabendo-se que, neste caso, não seria necessário aplicar a
correção, pois n > 40. Note que, com a correção, o valor do teste passa de
122,82 para 119,17.

Categoria O E O–E (|O – E| – 0,5) (|O – E| – 0,5)2/E

Brancos 128 206,0 -78.0 77,50 29,16

Negros 62 22.4 39.6 39,10 68,25

Pardos 186 161.6 24.4 23,90 3,53

Outros 24 10,0 14.0 13,50 18,23

Σ 400 400 0,0 154 χ2calc = 119,17


Fórmula alternativa em tabela 2 x 2
Quando o objetivo for a análise de dados em tabela de contingência 2 x 2,
a fórmula para calcular o valor do χ pode ser simplificada de modo a torná-la
2

mais facilmente aplicável, desde que se tenha certeza que nenhum dos valores
esperados é menor que cinco (E < 5). Para o cálculo com a correção de Yates,
acrescenta-se ao numerador da fórmula, o valor n/2, sendo n o número de su-
jeitos participantes do estudo, conforme mostrado abaixo:
2
 n
n | ad − bc | − 
n(ad − bc )2  2
χ2 = e χYates
2
=
(a + b )(c + d )(a + c )(b + d ) (a + b )(c + d )(a + c )(b + d )

Exemplo: Em um estudo de coorte, um pesquisador investigou 40 pa-


cientes com ferida penetrante no tórax, atendidos em um hospital público,
com o objetivo de avaliar a associação entre o fator de risco “hemotórax coa-
gulado” e a ocorrência de infecção do espaço pleural, pós-drenagem torácica
fechada. Os pacientes foram divididos em dois grupos: com hemotórax coa-
gulado e sem hemotórax. Os pacientes foram acompanhados por um perío-
do de 30 dias, e as ocorrências de infecção pós-operatória foram registradas
conforme a Tabela 14.9, a seguir:

Distribuição Qui-Quadrado 105

BIOESTATISTICA_VOL02.indb 105 25/06/12 17:21


Tabela 14.9 – Presença de infecção do espaço pleural pós-drenagem pleural fechada
com e sem hemotórax coagulado
Infecção do espaço pleural
Grupos de pacientes Total
Sim Não
Com hemotórax coagulado 13 07 20

Sem hemotórax coagulado 06 14 20

Total 19 21 40

• Resolução sem a correção de Yates

n(ad − bc )2 40(13 × 14 − 7 × 6)2 784.000


χ2 = = = = 4 , 91
(a + b )(c + d )(a + c )(b + d ) 20 × 20 × 19 × 21 159.600

• Resolução com a correção de Yates


2
 n
n | ad − bc | −  40
40(|13 × 14 − 7 × 6| − )2
 2 2 = 576.000 = 3,61
χYates
2
= =
(a + b )(c + d )(a + c )(b + d ) 20 × 20 × 19 × 21 159.600

Observe que, no exemplo acima, para α = 0,05 e gl = 1, o valor crítico


tabelado é χ0,05;1 = 3,84 . Assim, se for considerado o valor do qui-quadrado
2

não corrigido ( χ2 = 4 , 91 ), pode-se verificar que a hipótese nula deve ser


rejeitada, pois χ = 4 , 91 > χ0,05;1 = 3,84 . Ou seja, que existe uma associação
2 2

positiva entre o fator de risco estudado e a incidência de infecção do espa-


ço pleural, concluindo-se, então, que os pacientes com hemotórax coagulado
apresentam uma incidência maior de complicação pós-operatória (13/20
ou 65%). Por outro lado, se considerarmos o valor do qui-quadrado com a
correção de Yates ( χYates = 3,61 ), a hipótese nula não deve ser rejeitada, pois
2

χYates
2
= 3,61 < χ20,05;1 = 3,84 . Isto é, que não há relação entre o fator de risco he-
motórax coagulado e a incidência de infecção do espaço pleural em pacientes
submetidos à drenagem pleural fechada.
Note, também, que, neste caso, pode-se usar o teste χ , uma vez que, na
2

tabela de contingência, nenhum dos valores esperados é menor que cinco

106 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 106 25/06/12 17:21


(E < 5), sendo a melhor opção a fórmula corrigida, pois n = 40. Os requisitos
para a utilização do teste do qui-quadrado são apresentados a seguir.

Requisitos para usar o teste do qui-quadrado


A aplicação do teste do qui-quadrado exige, da parte do pesquisador, que
alguns cuidados sejam observados, em especial referentes ao tamanho das
amostras e aos valores esperados em cada uma das caselas da tabela de contin-
gência. Estes cuidados decorrem do fato da distribuição teórica do χ2 se apre-
sentar como um método aproximado, baseado na distribuição z, e quando o
número de graus de liberdade for igual a 1 (gl = 1), a distribuição dos valores
observados ( χcalc
2
) difere da distribuição teórica, de tal modo que a correção
de continuidade deve ser introduzida ao teste para melhor aproximar as duas
distribuições. Assim, de modo geral, as condições para uso do teste do qui-qua-
drado são as seguintes:

• O teste deve ser realizado com frequências observadas e expressadas em va-


lores absolutos, isto é, em número de casos. Porém, caso o qui-quadrado seja
calculado com os valores das caselas expressados em percentuais, o valor
final do teste deve ser corrigido. Para isto, basta multiplicar o valor calculado
pelo tamanho amostral (n) dividido por 100. Para facilitar o entendimento,
vamos considerar o seguinte exemplo: um jogador deseja verificar se uma
moeda é honesta. Para tanto, ele executa 60 arremessos e obtém 27 (45%)
caras e 33 (55%) coroas. Os cálculos do qui-quadrado de aderência, com
valores absolutos e, em percentagem, são mostrados a seguir.

Cálculo com valores absolutos Cálculo com valores em percentagem

(45 − 50)2 (55 − 50)2


χ2 = + = 1, 0
(27 − 30)2 (33 − 30)2 50 50
χ2 = + = 0,60
30 30 60
χ2 = 1,0 x = 0,60
100

• Em tabelas de contingência do tipo 2 x 2, deve-se sempre utilizar a corre-


ção de Yates se n < 40. Porém, se em alguma casela o valor esperado for

Distribuição Qui-Quadrado 107

BIOESTATISTICA_VOL02.indb 107 25/06/12 17:21


menor que 5 (E < 5), o teste do qui-quadrado deverá ser substituído pelo
teste exato de Fisher.
• Em tabelas de contingência do tipo 2 x c, o qui-quadrado pode ser calcula-
do se em todas as caselas o valor esperado for maior ou igual a 1 (E ≥ 1).
• Em tabelas de contingência do tipo l x c, o teste do qui-quadrado pode ser
calculado com segurança se a média dos valores esperados for ≥ 6 para
testes com nível de significância α = 0,05, e ≥ 10 para testes com α = 0,01.
A média dos valores esperados pode ser obtida dividindo-se o total de in-
divíduos do estudo pelo número de caselas da tabela.

Existem algumas outras exigências relacionadas à aplicação do teste do qui-


-quadrado de aderência (ajustamento). Porém, na prática do dia-a-dia da pesqui-
sa, a utilização de programas computacionais mais sofisticados torna mais simples
a obtenção exata dos valores do qui-quadrado para amostras com pequenos valo-
res esperados, o que, de certa forma, tem facilitado a atuação do pesquisador.
É interessante notar que, no teste do qui-quadrado, o que de fato interessa
são os valores esperados (E) e não os valores observados (O). Assim, se tomar-
mos a fórmula utilizada para calcular o teste, podemos observar que valores
pequenos de E, no denominador de um dos termos da equação, faz com que
este termo se torne muito grande, o que, por sua vez, aumenta o valor do qui-
-quadrado, e isto pode levar a erros falso-positivos, pois o valor calculado ten-
derá a cair na zona de rejeição da hipótese nula. Essa questão, frequentemente
mal interpretada, tem levado alguns pesquisadores a pensar que o teste não
pode ser calculado quando em alguma das caselas da tabela ocorra um valor
observado muito pequeno ou igual a zero.

14.4 TESTE DO QUI-QUADRADO DE McNEMAR


2
( χMcNemar )

Em algumas situações de pesquisa, o investigador pode estar interessado


em testar dois diferentes procedimentos em um mesmo grupo de sujeitos para
saber o quanto as medidas da primeira intervenção concordam com as medi-
das da segunda, ou, ainda, pode estar interessado em comparar dois grupos pa-

108 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 108 25/06/12 17:21


reados em um estudo do tipo caso-controle (análise pareada). Outras vezes,
porém, o que se deseja conhecer é se houve alguma mudança entre as medidas
antes e depois de uma dada intervenção aplicada no mesmo grupo de sujeitos
(análise tipo antes e depois). Em ambos os casos, se as variáveis estudadas
são dicotômicas, nominais ou ordinais, e as amostras a serem comparadas são
dependentes entre si, o teste a ser empregado é o teste não-paramétrico de
McNemar, o qual é a alternativa para o teste do qui-quadrado da independên-
cia. Aqui, é válido enfatizar que ocorre dependência entre as amostras quando
cada indivíduo é controle de si mesmo ou quando é realizado um pareamento
indivíduo a indivíduo entre os sujeitos de duas amostras.
Assim, com base no raciocínio explicitado acima, podemos distinguir três
situações práticas para as quais o teste de McNemar é a melhor opção:

• Teste de McNemar para comparar dois tipos de tratamento – É uti-


lizado a fim de avaliar o grau de discordância de dois diferentes tipos de
tratamento instituídos para o mesmo grupo de indivíduos. Ou seja, o quan-
to as medidas de uma intervenção concordam com as medidas da outra.
• Teste de McNemar para comparação tipo antes e depois – É o teste
não-paramétrico apropriado para comparar as medidas coletadas em um
mesmo grupo de indivíduos, antes e depois de uma determinada interven-
ção a que foram submetidos, com o objetivo de detectar se ocorreu alguma
mudança em razão da intervenção instituída.
• Teste de McNemar para comparar grupos pareados – É utilizado para
comparar dois diferentes grupos de pacientes, cujas amostras foram pa-
readas indivíduo a indivíduo, com base em alguma característica da po-
pulação, tal como a idade, sexo, raça etc. Este tipo de teste de McNemar é
frequentemente utilizado em estudos do tipo caso-controle, nos quais os
grupos são comparados para verificar a importância de um determinado
fator de risco.

Na prática, o teste de McNemar é uma modificação do teste do qui-quadra-


do com 1 grau de liberdade, pois só existem duas categorias a serem estudadas,
sendo, portanto, um teste de ajustamento que compara as frequências obser-
vadas (O) com as frequências esperadas (E), supondo a igualdade das medidas

Distribuição Qui-Quadrado 109

BIOESTATISTICA_VOL02.indb 109 25/06/12 17:21


em ambas as medições. Tal como no teste do qui-quadrado da independência,
os dados devem ser colocados em tabelas de contingência 2 x 2, com a diferen-
ça que, no teste de McNemar, os resultados devem ser analisados par a par, com
os dados organizados quanto à concordância ou discordância dentro do par,
conforme o exemplo mostrado na Tabela 14.10, que abrange os três tipos de
aplicações para o teste. Note que a organização da tabela difere daquela usada
para o teste do qui-quadrado da independência.

Tabela 14.10 – Tabela-padrão 2 x 2 para o teste de McNemar


Tratamento B
Medidas Depois
Grupo Controle
Sim Não Total
Tratamento A Sim a (+ +) b (+ −) a+b
Medidas Antes
Grupo Caso Não c (− +) d (− −) c+d
Total a+c b+d a+b+c+d
a - Indivíduos que responderam aos tratamentos A e B
b - Indivíduos que responderam somente ao tratamento A
c - Indivíduos que responderam somente ao tratamento B
d - Indivíduos que não responderam aos tratamentos A e B
a e d - Pares concordantes
b e c - Pares discordantes

De cálculo fácil e rápido, este teste foi introduzido na estatística por Quinn
McNemar2, em 1947, e tem como hipótese nula (H0) a ser testada, a afirmativa
a qual considera que as proporções dos valores medidos nos dois momentos
temporais não diferem entre si. Caso a hipótese nula seja negada, a hipótese
alternativa (HA) é que as proporções pareadas sejam diferentes. A fórmula para
calcular o valor do teste é dada pela seguinte equação:

( )
2
|b − c | −1
χMcNemar =
2
b +c

2. Quinn McNemar (1900-1986) – Matemático e estatístico americano que ficou conhecido


por seus trabalhos sobre coeficiente de inteligência e pela publicação do livro Psychological
Statistics, em 1949.

110 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 110 25/06/12 17:21


Por se tratar de um teste com 1 grau de liberdade, a correção de con-
tinuidade de Yates é introduzida na fórmula em razão das mesmas exigên-
cias aplicadas para o teste do qui-quadrado de aderência. A correção é
feita subtraindo-se 1 do valor absoluto do numerador antes de o elevar ao
quadrado. Observe, também, que a fórmula considera apenas as caselas b
e c da tabela 2 x 2, isto é, as caselas onde houve discordância entre dois
momentos temporais avaliados, uma vez que os valores das caselas a e d
não se alteram, e, portanto, não fornecem informações que permitam uma
decisão a respeito se houve ou não alguma mudança em razão da interven-
ção instituída. Assim, se a hipótese nula (H0) é verdadeira, espera-se que o
número de pares discordantes da casela b (+ −) seja igual ou muito próximo
ao número de pares discordantes da casela c (− +). Por outro lado, se hou-
ver uma diferença significativa entre os pares discordantes, além do que se
esperaria ocorrer por puro acaso, em razão do erro amostral aleatório, a
hipótese nula será rejeitada e a hipótese alternativa (HA) será tomada como
verdadeira.
Por conseguinte, para que a hipótese nula possa ser testada, o valor calcu-
lado para o χMcNemar é comparado ao valor crítico da tabela do qui-quadrado,
2

segundo o nível de significância α estabelecido para o teste. Se o valor calculado


para o χMcNemar for menor que o valor crítico tabelado ( χ0,05;1 ), a hipótese nula
2 2

será verdadeira. Caso contrário, rejeita-se H0 e conclui-se que há diferença es-


tatisticamente significante entre os pares discordantes.
A seguir, mostraremos um exemplo para cada uma das três situações de
aplicação do teste do qui-quadrado de McNemar.

Comparação entre dois tipos de tratamentos


Exemplo: Uma indústria alimentícia conduziu um estudo no sentido de
avaliar a intenção de compra de um determinado produto elaborado com
duas diferentes formulações. Para tal experimento, selecionou-se, aleatoria-
mente, 80 clientes de uma rede de supermercados, aos quais foram oferecidos
os dois produtos em estudo, em ordem previamente escolhida por sorteio,
de modo a evitar qualquer efeito indutivo na preferência dos clientes. Cada
provador deveria manifestar sua intenção de compra respondendo “sim” ou
“não”. Os dados estão relacionados na Tabela 14.11.

Distribuição Qui-Quadrado 111

BIOESTATISTICA_VOL02.indb 111 25/06/12 17:21


Tabela 14.11 – Resultado da preferência de clientes quanto à intenção de compras para um
produto elaborado com duas diferentes formulações
Formulação B
Sim Não Total
Sim 22 10 32
Formulação A
Não 27 21 48
Total 49 31 80
a - Comprariam ambos os produtos A e B
b - Comprariam o produto A e não comprariam B
c - Comprariam o produto B e não comprariam A
d - Não comprariam ambos os produtos A e B

• Passo 1 – Formular as hipóteses estatísticas:


H0: Não há discordância nos resultados das opções pelos produtos A e B.
HA: Há discordância nos resultados das opções pelos produtos A e B.
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%)
• Passo 3 – Determinar o valor crítico do teste:

gl(l - 1)(c - 1) = (2 - 1)(2 - 1) = 1

χ0,05;1
2
= 3,84
• Passo 4 – Calcular o valor do teste:

(|b − c | −1) = (|10 − 27 | −1)


2 2
256
χ2McNemar = = = 6, 92
b +c 10 + 27 37

• Passo 5 – Regra de decisão:



Se χ2McNemar < χ20,05;1 , aceita-se H 0 .

Se χ2McNemar ≥ χ20,05;1 , rejeita-se H 0 .

Como χ2McNemar = 6,92 > χ20,05;1 = 3,84 , rejeita-se H 0 .

112 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 112 25/06/12 17:21


• Passo 6 – Conclusão:
Como o valor calculado para χMcNemar é maior que o valor crítico tabelado
2

χ20,05;1 , rejeita-se H e conclui-se existir discordância quanto às opções de


0
compra para os dois produtos oferecidos, pois χ2McNemar = 6, 92; P = 0,008 .
O produto com a formulação B foi mais aceito do que o produto com a for-
mulação A, uma vez que, considerando as 37 vezes em que apenas um dos
produtos foi escolhido, em 27 (72,9%) a opção foi pelo produto B e somente
10 (27,1%) dos clientes optaram pelo produto A.

Comparação tipo antes e depois


Exemplo: Com o objetivo de testar sua divisão de marketing, uma loja
de departamentos selecionou, aleatoriamente, 90 clientes e solicitou que os
mesmos manifestassem sua intenção de compra de determinado produto,
antes e depois que lhes fosse exibido um folheto publicitário sobre o referido
produto. Cada cliente deveria manifestar sua intenção de compra respon-
dendo “sim” ou “não”, antes e depois de analisar o folheto. Os dados estão
relacionados na Tabela 14.12.

Tabela 14.12 – Resultado da intenção de compra de clientes, antes e depois


de uma campanha publicitária

Intenção depois
Sim Não Total
Sim 26 12 38
Intenção antes
Não 27 25 52
Total 53 37 90
a – Comprariam antes e depois
b – Comprariam antes e não comprariam depois
c – Comprariam depois e não comprariam antes
d – Não comprariam nem antes nem depois

• Passo 1 – Formular as hipóteses estatísticas:


H0: Não há discordância nos resultados das opções antes e depois.
HA: Há discordância nos resultados das opções antes e depois.

Distribuição Qui-Quadrado 113

BIOESTATISTICA_VOL02.indb 113 25/06/12 17:21


• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,01 (1%)
• Passo 3 – Determinar o valor crítico do teste:

gl(l - 1)(c - 1) = (2 - 1)(2 - 1) = 1

χ0,01;1
2
= 6,63
• Passo 4 – Calcular o valor do teste:

(|b − c | −1) = (|12 − 27 | −1)


2 2
196
χ2McNemar = = = 5,02
b +c 12 + 27 39

• Passo 5 – Regra de decisão:



Se χ2McNemar < χ20,01;1 , aceita-se H 0 .

Se χ2McNemar ≥ χ20,01;1 , rejeita-se H 0 .

Como χ2McNemar = 5,02 < χ20,01;1 = 6,63, aceita-se H 0 .

• Passo 6 – Conclusão:
Como o valor calculado para χMcNemar é menor que o valor crítico tabela-
2

do χ0,01;1 , não se rejeita H0 e conclui-se que não existe discordância quan-


2

to à intenção de compra antes e depois da campanha publicitária, pois


χ2McNemar = 5,02; P = 0,025 . Isto é, não há evidência suficiente para se afir-
mar que a campanha publicitária instituída tenha influenciado na intenção
de compra dos clientes selecionados para o estudo, ao nível de significân-
cia de 1% (α = 0,01).

Comparação entre grupos pareados


Observe que, diferente do qui-quadrado da independência, no qual os gru-
pos são escolhidos separadamente, neste tipo de teste, os sujeitos são escolhi-
dos par a par, isto é, um indivíduo de cada grupo. Somente após a escolha dos
pares, verifica-se se ambos, se um ou o outro, ou se nenhum dos indivíduos de

114 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 114 25/06/12 17:21


cada par foi exposto, no passado, ao fator de risco estudado. A seguir, os dados
são anotados na tabela de contingência, tal como no modelo a seguir.
Exemplo: Um estudo caso-controle foi conduzido no sentido de verifi-
car a associação entre a exposição prolongada ao fator de risco “irradiação
solar” e a ocorrência de neoplasia da cutânea do tipo carcinoma basocelular.
Para tal finalidade, foram pareados 100 indivíduos portadores da neoplasia
(grupo caso) com 100 indivíduos não-portadores da doença (grupo contro-
le). Todos os indivíduos do estudo foram investigados quanto à exposição
prolongada ou não ao fator de risco, no passado. Os dados estão expressos na
Tabela 14.13, abaixo.

Tabela 14.13 – Resultado do estudo caso-controle com 400 indivíduos

Grupo controle
Com Sem
Total
exposição Exposição
Com exposição 29 25 54
Grupo caso
Sem exposição 8 38 46
Total 37 63 100
a – Expostos no grupo caso e no grupo controle
b – Expostos no grupo caso e não-expostos no grupo controle
c – Não-expostos no grupo caso e expostos no grupo controle
d – Não-expostos no grupo caso e no grupo controle

• Passo 1 – Formular as hipóteses estatísticas:


H0: A exposição prolongada à irradiação solar não está associada à neoplasia.
HA: A exposição prolongada à irradiação solar está associada à neoplasia.
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,01 (1%)
• Passo 3 – Determinar o valor crítico do teste:
gl(l - 1)(c - 1)= (2 - 1)(2 - 1)= 1

χ20,01;1 = 6,63

Distribuição Qui-Quadrado 115

BIOESTATISTICA_VOL02.indb 115 25/06/12 17:21


• Passo 4 – Calcular o valor do teste:

(|b − c | −1) = (|25 − 8 | −1)


2 2
256
χ2McNemar = = = 7,75
b +c 25 + 8 33
• Passo 5 – Regra de decisão:

Se χ2McNemar < χ20,01;1 , aceita-se H 0 .

Se χ2McNemar ≥ χ20,01;1 , rejeita-se H 0 .

Como χ2McNemar = 7,75 > χ20,01;1 = 6,63, rejeita-se H 0 .



• Passo 6 – Conclusão:
Como o valor calculado para χMcNemar é maior que o valor crítico tabelado
2

χ20,01;1 , rejeita H e conclui-se que existe discordância quanto à exposição à


0
irradiação solar nos grupos estudados, pois χMcNemar = 7,75; P = 0,005 . Isto
2

é, que os indivíduos do grupo caso apresentaram maior propensão do que


o esperado pelo acaso de terem sido expostos à irradiação solar quando
comparados aos indivíduos do grupo controle, ao nível de significância de
1% (α = 0,01).

Observe, ainda, que, na tabela do teste de McNemar para estudos pareados,


a odds ratio (razão de chance) pode ser calculada pela fórmula OR = b /c.
No exemplo em questão, temos:

b 25
OR = = = 3,12
c 8

O resultado encontrado indica que a chance da ocorrência de neoplasia


cutânea associada à exposição prolongada à radiação solar é 3,12 vezes maior
nos indivíduos do grupo caso quando comparada à incidência nos indivíduos
do grupo controle.

116 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 116 25/06/12 17:21


14.5 TESTE EXATO DE FISHER ( PFisher )

Como explicado anteriormente, quando em uma tabela de contingência


2 x 2, uma ou mais caselas apresentam contagens esperadas (E) menores que
5 ou o número total de indivíduos estudados é menor do que 20, o teste do
qui-quadrado não pode ser usado, devendo ser substituído pelo teste de pro-
babilidade exata de Fisher, o qual calcula a probabilidade exata de se obter, ao
acaso, os valores observados nas caselas.
Inicialmente proposto por Sir Ronald Fisher3, em 1930, o teste é baseado na
distribuição hipergeométrica4 originada quando as proporções de duas amostras
independentes são inseridas numa tabela 2 x 2 com valores marginais fixos. Ele
considera, como hipótese nula (H0), a independência entre as variáveis estuda-
das, sendo realizado pelo cálculo da probabilidade de ocorrer a distribuição veri-
ficada para os dados observados na tabela de contingência. Essa probabilidade é,
na realidade, o nível crítico amostral ou o valor P, o qual traduz a probabilidade
de rejeitar a hipótese nula admitindo-se a suposição de independência, ou seja,
é a probabilidade de se estar errado em afirmar que existe dependência entre as
variáveis quando, de fato, elas são independentes. O valor calculado para o teste
deve ser comparado com o nível de significância (valor α) estipulado para a pes-
quisa. Assim, se a probabilidade calculada for inferior ao valor α preestabelecido,
rejeita-se a hipótese nula, pois a distribuição observada não deve ter ocorrido
por puro acaso. Caso contrário, a hipótese de nulidade não deve ser rejeitada.
A fórmula para calcular o teste é a seguinte:

(a + b )!(c + d )!(a + c )!(b + d )!


PFisher =
n!a!b !c !d !

A probabilidade calculada pela fórmula acima não é o resultado final para


o teste, pois a hipótese nula também seria rejeitada caso os resultados obser-
vados na tabela de contingência fossem ainda mais extremos, tal como o valor
zero em uma das caselas. Daí porque se devem calcular as probabilidades rela-

3 Sir Ronald Aylmer Fisher (1890-1962) – Estatístico e biólogo inglês, criador das fundações
para a ciência estatística moderna.
4 Método de amostragem sem reposição.

Distribuição Qui-Quadrado 117

BIOESTATISTICA_VOL02.indb 117 25/06/12 17:21


tivas a esses resultados mais extremos, as quais serão somadas à probabilidade
inicialmente calculada, de modo que se obtenha a área da cauda da distribui-
ção. Assim, designando-se por P1 a probabilidade calculada para a tabela de
dados observada, os valores das probabilidades calculadas para os resultados
mais extremos serão designados por P2 , P3 ,... Pn etc. Deste modo, para calcular
as demais probabilidades, uma nova tabela de contingência deve ser constru-
ída, subtraindo-se uma unidade dos valores das caselas da diagonal com me-
nor número de casos. A seguir, adicionam-se aos valores das caselas da outra
diagonal, as duas unidades subtraídas, de maneira que os totais marginais não
sejam alterados. A partir dessa nova tabela, calcula-se a probabilidade P2 . O
processo se repete até que, em uma das caselas, o valor zero seja atingido. Para
um teste unicaudal, a probabilidade final PFisher consiste da soma de todas as
probabilidades calculadas ( PFisher = P1 + P2 ... + Pn ). Para um teste bicaudal, a pro-
babilidade final deve ser multiplicada por dois.
O exemplo, a seguir, ilustra a aplicação do teste exato de Fisher.

Exemplo: Suponha que um pesquisador queira verificar a associação en-


tre o tipo de acidulante adicionado e a presença de contaminação por fungo
no interior de embalagens de alimentos. Para tal experimento, dois grupos
de 10 embalagens são selecionados. Ao primeiro grupo, ele adiciona o aci-
dulante A, e ao segundo grupo, o acidulante B. A contaminação por fungo é
categorizada como “presente” e “ausente”. Os dados estão relacionados na
Tabela 14.14, abaixo.

Tabela 14.14 – Resultado do estudo com 20 embalagens de alimentos


Fungo
Total
Presente Ausente

Tipo de Acidulante A 6 4 10
acidulante Acidulante B 3 7 10

Total 9 11 20

• Passo 1 – Formular as hipóteses estatísticas:


H0: A proporção de fungos é a mesma com os dois tipos de acidulante.

118 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 118 25/06/12 17:21


HA: A proporção de fungos é diferente para os dois tipos de acidulante.
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%) - Bicaudal.
• Passo 3 – Calcular o valor do teste:
6 4 10
10!10!9!11! 1
3 7 10 P1 = × = 0,1500
20! 6!4!3!7!
9 11 20

7 3 10
10!10!9!11! 1
2 8 10 P2 = × = 0,0321
20! 7!3!2!8!
9 11 20

8 2 10
10!10!9!11! 1
1 9 10 P3 = × = 0,0026
20! 8!2!1!9!
9 11 20

9 1 10
10!10!9!11! 1
0 10 10 P4 = × = 0,0001
20! 9!1!0!10!
9 11 20

PFisher = 2(0,1500 + 0,0321 + 0,0026 + 0,0001) = 2 × 0,184


48=0,3696

• Passo 4 – Regra de decisão:


Se PFisher < α, rejeita-se H 0 .

Se PFisher ≥ α, aceita-se H 0 .

Como PFisher = 0,3696 > α = 0,05, aceita-se H 0 .


• Passo 5 – Conclusão:
Como o valor calculado para PFisher = 0,3696 é maior que o nível de signi-
ficância α = 0,05, não se rejeita H0 e conclui-se que a proporção de embalagens

Distribuição Qui-Quadrado 119

BIOESTATISTICA_VOL02.indb 119 25/06/12 17:21


com fungo no grupo tratado com o acidulante A não difere da proporção das
embalagens tratadas com acidulante B.
Note que o cálculo da probabilidade exata de Fisher envolve o cálculo de
fatoriais, o que torna a operação bastante complexa e trabalhosa. O uso de cal-
culadoras mais sofisticadas ou de programas computacionais de estatística tem
facilitado a determinação do valor P. Uma outra maneira mais simples é através
da transformação logarítmica da equação, cujo valor P corresponde ao anti-
logaritmo do resultado obtido. A seguir, demonstraremos o cálculo de P1 , do
exemplo anterior, obtido pela transformação logarítmica da equação.

(a + b )!(c + d )!(a + c )!(b + d )! (a + b )!(c + d )!(a + c )!(b + d )!/ n!


P1 = =
n!a!b !c !d ! a!b !c !d !

Sendo: (a + b) = Total da linha 1 (TL1)


(c + d) = Total da linha 2 (TL2)
(a + c) = Total da coluna 1 (TC1)
(b + d) = Total da coluna 2 (TC2)
log(AxB) = log A + log B
log(A/B) = log A – log B

Então:

( ) ( )
log P1 = logTL1 !+ logTL2 !+ logTC1 !+ logTC 2 !− log n! − log a!+ log b !+ log c !+ log d !

log P = ( log 10! + log10! + log9! + log11! − log20!) − ( log 6! + log4! + log3! + log7!)
1

log P1 = (6,560 + 6,560 + 5,560 + 7,601 − 18,386) − (2,857 + 1,380 + 0,778 + 3,702)

log P1 = (7,894) − (8,718) = −0,824

P1 = antilog ( − 0,824) = 10−0,824 = 0,1500

Observe que o resultado de P1 = 0,1500 , calculado com a transformação lo-


garítmica, é igual ao resultado calculado com a fórmula original do teste exato
de Fisher.

120 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 120 25/06/12 17:21


15
Probabilidade e Medidas
de Associação

A principal razão para a realização de pesquisas experimentais é genera-


lizar, a toda uma população, os achados ocorridos em um conjunto de
observações verificadas nos indivíduos participantes do estudo. Ou seja, é
fazer inferências para um grupo maior de sujeitos, com base nos achados do
estudo de uma amostra retirada da população. No entanto, sempre que isto
é feito, o pesquisador não pode estar totalmente seguro ao fazer afirmações
sobre possíveis desfechos na população estudada, uma vez que a ocorrência
de inúmeros acontecimentos do dia-a-dia podem ser determinados apenas
pelo efeito do acaso. Porém, mesmo que existam situações de incerteza, nas
quais não se sabe o que de fato pode ocorrer, na maioria dos casos, o pesqui-
sador pode conhecer todos os resultados possíveis da pesquisa, e prever, com
razoável margem de acerto, a frequência com que cada resultado pode ser
esperado no estudo, com base na probabilidade conhecida para a ocorrência
do evento na população estudada. A esta previsão para a ocorrência de eventos
possíveis esperados, chamamos de ensaio probabilístico.
Assim, alguns conceitos da teoria da probabilidade são realmente impor-
tantes a fim de que se possa compreender o que, de fato, significa a inferência
estatística quando se estuda a associação de causa e efeito entre um possível
fator de risco (ou de proteção) e um desfecho de interesse, tal como uma doença

BIOESTATISTICA_VOL02.indb 121 25/06/12 17:21


ou um evento qualquer. Desta forma, o objetivo do presente capítulo é descrever
as principais medidas de efeito e associação mais utilizadas em pesquisa
experimental, assim como discutir suas aplicabilidades com base na teoria da
probabilidade.

15.1 TEORIA DA PROBABILIDADE

Em estatística, o estudo da teoria da probabilidade tem ajudado os


pesquisadores a compreender e interpretar os dados obtidos através de seus
experimentos, além de permitir que afirmativas mais confiáveis possam ser
feitas, especialmente no que tange aos estimadores calculados a partir de
estudos de amostras, tal como a determinação das medidas de associação
do tipo razão de risco e razão de chance. Do mesmo modo, conhecer seus
conceitos é peça fundamental a fim de que se possam entender as regras
elementares para o cálculo das probabilidades dos desfechos estudados.
Assim, facilitando o entendimento do leitor, algumas definições serão aqui
apresentadas.
Suponhamos que um dado experimento possa ser repetido inúmeras
vezes, e que cada repetição seja denominada de ensaio. Suponha, ainda, que,
em cada repetição (ensaio), um ou mais eventos mutuamente excludentes
possam ocorrer. Assim, a probabilidade para esse evento é dada pela divisão
entre o número de vezes que ele ocorre no experimento e o número total de
ensaios do experimento. Portanto, para a ocorrência do evento A, a probabi-
lidade de A é dada por:

Número de eventos de A
P( A ) =
Número total de eventtos do experimento

Com base nessa linha de raciocínio, podemos deduzir que a probabilidade


para um determinado evento varia de 0 a 1, sendo 0 a probabilidade para um
evento impossível e 1 a probabilidade para um evento certo. Do mesmo modo,
se os eventos forem mutuamente excludentes, a soma das probabilidades de
todos os eventos possíveis para um experimento é sempre igual a 1.

122 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 122 25/06/12 17:21


Portanto, para a aplicação da teoria da probabilidade em estatística, vamos
considerar o seguinte exemplo: um estudo para verificar a resposta de pacientes
portadores de uma determinada doença, à ação de uma nova droga a ser testada.
Os possíveis desfechos podem ser caracterizados como “piora”, “inalterado”,
“melhora” e “cura”. Os dados estão representados na Tabela 15.1, abaixo.

Tabela 15.1 – Resultados para o teste de uma nova droga

Nº de casos
Tipo de resposta
Homens Mulheres
Piora 5 6
Inalterado 10 8
Melhora 42 35
Cura 53 61
Total 110 110

• Experimento – É definido como qualquer processo planejado que permita


ao pesquisador fazer observações, cuja finalidade é a coleta de dados. O
exemplo acima constitui um experimento. A probabilidade de cura no gru-
po dos homens é dada por:

53
P(cura) = = 0, 48
110

• Ensaio – É cada uma das repetições independentes que compõem um de-


terminado experimento. Para o exemplo anterior, cada ensaio consiste em
testar a droga em cada um dos 110 indivíduos selecionados para o estudo.

• Evento – Corresponde ao desfecho obtido em cada um dos ensaios de um


experimento. Um evento é dito simples quando não pode ser desdobrado.
Um evento é denominado complementar quando ele é o oposto ao evento
estudado, podendo ser calculado como 1 menos a probabilidade do evento
em questão. Ou seja, é a probabilidade do evento estudado não ocorrer.
Para o exemplo dado, o evento pode ser qualquer um dos desfechos con-

Probabilidade e Medidas de Associação 123

BIOESTATISTICA_VOL02.indb 123 25/06/12 17:21


siderados no estudo, de acordo com a resposta individual à droga testada.
Ou seja, pode ser a “piora”, o estado “inalterado”, a “melhora” ou a “cura” do
paciente. A probabilidade complementar para a cura no grupo das mulhe-
res é dada por:

P(complementar para cura) = 1 − P(cura)

61
= 1−
110

= 0, 45

• Espaço amostral – Consiste no conjunto de todos os eventos simples pos-


síveis de um experimento. No caso em tela, o espaço amostral é constituído
por quatro eventos simples: “piora”, “inalterado”, “melhora” e “cura”.

15.1.1 Operações com probabilidades


A seguir, mostraremos as regras básicas para operações com probabilidades.

A – Regra da adição
• Eventos mutuamente excludentes – Dois ou mais eventos são ditos exclu-
dentes quando a ocorrência de um impedir a ocorrência do outro. Tome-
-se, como exemplo, o sexo; uma criança não pode nascer com os dois sexos,
masculino e feminino, ao mesmo tempo. Com base nesse princípio, todos os
eventos complementares são mutuamente excludentes, embora os eventos
possam ser mutuamente excludentes sem que sejam complementares. Isto
ocorre quando o espaço amostral é constituído por três ou mais eventos.
Assim, a probabilidade da ocorrência de dois ou mais eventos mutuamente
excludentes é igual à soma das probabilidades de suas ocorrências no mes-
mo experimento. Para o exemplo da Tabela 15.1, qual a probabilidade de um
paciente do sexo masculino evoluir com “melhora” ou “cura”?

P( melhora ou cura) = P(melhora) + P(cura)

42 53
= + = 0,86
110 110

124 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 124 25/06/12 17:21


• Eventos não mutuamente excludentes – Eventos não mutuamente ex-
cludentes são aqueles cuja ocorrência de um não impede a ocorrência
do outro, tal como o sexo e grupo sanguíneo, pois o nascimento de uma
criança do sexo masculino sempre terá um dos grupos sanguíneos típi-
cos da espécie humana. Deste modo, regra da adição de probabilidades
deve ser modificada, de tal maneira que a probabilidade da ocorrência
de ambos os eventos não seja acrescentada duas vezes no mesmo cálculo
final. Portanto, a probabilidade da ocorrência de dois ou mais eventos
não mutuamente excludentes é igual à soma das probabilidades de suas
ocorrências no mesmo experimento, menos a probabilidade de que os
eventos ocorram simultaneamente. No Quadro 15.1, a probabilidade do
paciente ser do sexo feminino é 0,50 e a probabilidade de “cura” é 0,55
(61/110). Entretanto a probabilidade de pertencer ao sexo feminino ou
evoluir com “cura” não é igual a 0,50 + 0,55, pois nessa soma, as mulheres
com evolução para “cura” foram contadas duas vezes. Assim, a proba-
bilidade conjunta de pertencer ao sexo feminino e de ter evoluído para
“cura” deve ser subtraída do cálculo. O valor a ser subtraído é calculado
pela regra da multiplicação para eventos independentes, a qual será mos-
trada no próximo item. O cálculo é dado por:

P(mulher ou cura) = P(mulher) + P(cura) − P(mulher e cura)

= 0,5 + 0,55 − (0,5 × 0,55)

= 1,05 − 0,27 = 0,77

B – Regra da multiplicação
• Eventos independentes – Dois ou mais eventos são ditos independentes
se a ocorrência de um não tiver efeito sobre a ocorrência do outro, tal como
o sexo e o tipo sanguíneo, pois o tipo sanguíneo de um indivíduo não está
relacionado ao fato deste indivíduo ser homem ou mulher. Assim, a proba-
bilidade conjunta de que dois ou mais eventos ocorram simultaneamente é
igual ao produto da ocorrência de suas probabilidades isoladamente. Para
o exemplo da Tabela 15.1, a probabilidade conjunta do paciente ser ho-
mem e evoluir para a cura é dada por:

Probabilidade e Medidas de Associação 125

BIOESTATISTICA_VOL02.indb 125 25/06/12 17:21


P(hom em e cura) = P(hom em) × P(cura)
= 0,5 × 0, 48 = 0,24

• Eventos não-independentes – Também ditos associados ou correlacionados,


são aqueles cuja probabilidade da ocorrência de um deles depende da ocorrên-
cia do outro, isto é, a ocorrência de um deles altera a probabilidade da ocor-
rência do outro. Por exemplo: para dois eventos A e B1 considerados não-inde-
pendentes, se quisermos saber a probabilidade do evento A, supondo-se que o
evento B tenha ocorrido, ou vice-versa, a probabilidade condicional é dada por:

P( A e B) = P( A | B) × P(B) ou P(B e A) = P(B | A) × P( A)

Como: P( A e B) = P(B e A); P( A | B) × P(B) = P(B | A) × P( A)

P(B | A) × P( A) P( A | B) × P(B)
Então: P( A | B) = ou P (B | A) =
P (B) P( A)

As duas equações resultantes são derivadas da fórmula do teorema de Bayes,


que será discutido mais adiante, sendo o termo P(A), à direita da equação P(A | B),
denominado probabilidade anterior, uma vez que o seu valor é conhecido antes
do cálculo, ao passo que o termo P(A | B), da mesma equação, é denominado proba-
bilidade posterior, pois seu valor somente é conhecido após o cálculo.

15.2 MEDIDAS DE ASSOCIAÇÃO

De modo geral, na maioria dos estudos estatísticos, o principal objetivo é


verificar se existe uma relação de causa e efeito entre duas ou mais variáveis,
sempre no sentido de avaliar o quanto a ação de uma influencia sobre o
desfecho da outra. Estes métodos, frequentemente chamados de medidas
de força de associação, têm sido amplamente utilizados em pesquisas
epidemiológicas, cujo intuito é mensurar a magnitude da associação entre
a exposição a um dado fator de risco e o desfecho de interesse, sendo as

1. A grafia P(A | B) é lida como a probabilidade do evento A dado o evento B.

126 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 126 25/06/12 17:21


variáveis apresentadas sob a forma categórica (dicotômica) ou contínua.
Nesta parte do livro, abordaremos apenas as medidas de força de associação
com variáveis categóricas, pois aquelas com variáveis contínuas já foram
discutidas em outros capítulos.
De qualquer forma, as medidas de força de associação podem ser calcu-
ladas tanto em termos relativos, do tipo razão, como em termos absolutos,
do tipo diferença, e a escolha de um ou de outro método depende do tipo
de estudo realizado. Porém, seja um ou outro o método escolhido, o nível de
significância deve ser previamente estabelecido, de tal maneira que a signifi-
cância estatística possa ser testada para se verificar se a diferença encontrada
não tenha ocorrido em razão do acaso. O Quadro 15.1, abaixo, mostra a classi-
ficação das medidas de força de associação mais utilizadas em estatística.

Quadro 15.1 – Classificação geral das medidas de força de associação

Medidas de associação Tipos


- Risco Relativo (RR)
• Relativas (tipo razão)
- Razão de Chances (OR)
- Risco Atribuível (RA)
- Porcentagem de Risco Atribuível (RA%)
• Absolutas (tipo diferença)
- Risco Atribuível na População (RAP)
- Porcentagem de Risco Atribuível na População (RAP%)
- Coeficiente de correlação
• Outras
- Tamanho de efeito padronizado (TEP)

As medidas de associação relativas (tipo razão) são utilizadas quando


o objetivo é mensurar a associação entre a exposição ao fator de risco e a
ocorrência de uma doença. Isto é, quando queremos medir quantas vezes a
ocorrência da doença no grupo dos expostos é maior em relação à ocorrência
no grupo dos não-expostos. Portanto, as medidas de associação relativas
podem variar entre 0 e ∞, de modo que, quando o valor é igual a 1, isto
significa que as frequências da doença entre os expostos e não-expostos são
iguais, não existindo, portanto, associação entre o fator de risco incriminado
e a doença estudada. Por sua vez, quando o valor for maior que 1, significa que
a frequência no grupo dos expostos é maior que no grupo dos não-expostos,

Probabilidade e Medidas de Associação 127

BIOESTATISTICA_VOL02.indb 127 25/06/12 17:21


indicando, portanto, que a exposição ao fator de risco está associado a um
aumento na ocorrência da doença. Por outro lado, valores entre 0 e 1 indicam
que a frequência da doença no grupo dos expostos é menor em relação aos
não-expostos, sugerindo que a exposição é um fator de proteção.
Por sua vez, as medidas de associação absolutas (tipo diferença)
são utilizadas quando o objetivo é mensurar o quanto a frequência de
uma doença no grupo dos expostos excede a frequência no grupo dos
não-expostos, de tal modo que se possa determinar o número de casos
atribuíveis à exposição ao fator de risco estudado. Assim, com base nesta
relação, se a doença acomete igualmente os dois grupos, a diferença entre
as frequências será igual a zero, logo se conclui que não há associação
entre o fator de risco incriminado e a doença estudada. Porém, se alguma
diferença é verificada, isto sugere que pode existir uma associação entre o
fator de risco e a doença em questão. Assim, com base neste raciocínio, as
medidas absolutas podem variar de uma associação fortemente positiva,
situação em que muitos expostos adoecem e poucos não-expostos adoecem,
a uma associação fortemente negativa, quando poucos expostos adoecem
e muitos não-expostos adoecem.
De qualquer maneira, seja para calcular as medidas de força de associação
relativas ou absolutas, necessitamos utilizar a tabela de contingência 2 x 2
padrão, a qual é mostrada, a seguir, com os dados hipotéticos de um estudo
de coorte que será tomado como exemplo para que se possam demonstrar os
cálculos das diferentes mediadas de associação. Nas linhas, serão colocadas
as categorias relativas à exposição ao fator de risco estudado; nas colunas,
estarão as categorias relativas à doença de desfecho.

Exemplo: Um estudo de coorte prospectivo foi conduzido no sentido de


verificar a associação entre o fator de risco “consumo de gordura saturada”
e incidência de hipercolesterolemia. Parar tal experimento, dois grupos de
200 pacientes, com nível de colesterol sérico normal, foram selecionados.
Ao grupo dos expostos, foi administrada dieta rica em gordura saturada; ao
grupo dos não-expostos, foi administrada dieta normal. O ponto de corte
considerado para a dosagem de colesterol total foi de 200 mg/dL.

128 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 128 25/06/12 17:21


Tabela 15.2 – Resultados de um estudo de coorte com 400 indivíduos
Doença
Presente Ausente Total

Exposição ao fator Exposto (a) 36 (b) 164 200


de risco Não-exposto (c) 12 (d) 188 200
Total 48 352 400
a - Indivíduos expostos ao fator de risco e com a doença
b - Indivíduos expostos ao fator de risco e sem a doença
c - Indivíduos não-expostos ao fator de risco, mas com a doença
d - Indivíduos não-expostos ao fator de risco e sem a doença
a + b - Todos os Indivíduos expostos ao fator de risco
c + d - Todos os Indivíduos não-expostos ao fator de risco
a + c - Todos os Indivíduos com a doença
b + d - Todos os Indivíduos sem a doença
a + b + c + d - Todos os indivíduos do estudo

15.2.1 Razão de Risco (RR)


Também conhecida como risco relativo ou risk ratio, a razão de risco
corresponde à razão entre o risco de adoecer em um grupo de indivíduos
expostos ao fator de risco e o risco de adoecer em um grupo de indivíduos
não-expostos ao mesmo fator de risco. A razão de risco pode ser calculada pela
seguinte fórmula:

Risco(Expostos ) a c
RR = , onde Risco(Expostos ) = e Risco( Não-expostos ) =
Risco( Não-expostos ) a +b c +d

Para o exemplo dado, temos:

a 36
RR = a + b = 200 = 3,0
c 12
c + d 200

O risco relativo fornece uma estimativa da magnitude da associação entre


a exposição ao fator de risco e o desfecho estudado, isto é, ele mostra quantas
vezes o risco de desenvolver a doença nos indivíduos expostos é maior em

Probabilidade e Medidas de Associação 129

BIOESTATISTICA_VOL02.indb 129 25/06/12 17:21


relação aos indivíduos não-expostos. Assim, para o exemplo em questão, o risco
no grupo exposto foi três vezes maior que no grupo não-exposto. Ou seja, os
indivíduos que consumiram dieta rica em gordura saturada apresentaram uma
probabilidade três vezes maior de evoluir com hipercolesterolemia quando
comparados aos indivíduos com consumo de dieta normal.
Observe que este resultado foi calculado com base em um estudo amostral
e, portanto, deve ser avaliado para que se possa verificar a sua significância
estatística, a qual pode ser testada pela aplicação do teste do qui-quadrado
(χ2), já discutido no capítulo anterior. Para o exemplo dado, importa
saber que o resultado para o teste foi estatisticamente significante, pois
χcalc
2
= 13,64 e valor P = 0,0002.
Uma outra maneira de testar a significância estatística é através da análise
do intervalo de confiança (IC), o qual pode ser calculado por diferentes métodos
estatísticos, todos eles bastante complexos, porém com resultados muito
semelhantes, de modo que a utilização de programas estatísticos tem facilitado
este tipo de análise. No caso do exemplo da Tabela 15.2, o intervalo de confiança
de 95% (IC95%) calculado pelo programa Epi Info 3.5.1 (séries de Taylor) é
igual a 1,61 - 5,59, indicando que na população de onde a amostra foi retirada, a
verdadeira razão de risco pode ser qualquer valor entre 1,61 e 5,59, com 95% de
confiança. Assim, uma vez que o referido intervalo não contém a razão de risco
igual a 1, isto significa que, em nenhum momento, os riscos são iguais, e que,
portanto, o resultado encontrado (RR = 3,0) é estatisticamente significante, fato
este que confirma o achado do teste de significância do qui-quadrado.
De qualquer maneira, o intervalo de confiança para a razão de risco (RR)
pode ser determinado pela seguinte fórmula:

• IC95% para Razão de Risco

 1 − a /(a + b ) 1 − c /(c + d ) 



IC 95% = exp ln(RR ) ± 1, 96 + 
 a c 
 

 1 − (36 / 200) 1 − (12 / 200 


IC 95% = exp ln(3,0) ± 1, 96 + 
 36 12 

IC 95% = exp 1,098 ± 1, 96 0,101 


 
130 Bioestatística aplicada à Pesquisa Experimental

IC 95% = exp 1,098 ± 0,623

IC 95% = 1,61 (limite inferior)


BIOESTATISTICA_VOL02.indb 130 25/06/12 17:21
IC 95% = exp ln(RR ) ± 1, 96 + 
 a c 
 

 1 − (36 / 200) 1 − (12 / 200 


IC 95% = exp ln(3,0) ± 1, 96 + 
 36 12 

IC 95% = exp 1,098 ± 1, 96 0,101 


 

IC 95% = exp 1,098 ± 0,623

IC 95% = 1,61 (limite inferior)

= 5,59 (limite superior)

C 95% = 1,61 < RR < 5,59


IC

Observe, ainda, que o risco relativo não pode ser calculado para um
estudo do tipo caso-controle. Este tipo de medida de associação somente deve
ser utilizado para um estudo de coorte ou para um ensaio clínico, nos quais
um grupo de indivíduos com o fator de risco e um grupo sem o fator de risco
são selecionados e acompanhados ao longo do tempo, para determinar quais
indivíduos desenvolverão o desfecho de interesse.

15.2.2 Razão de Chance (RC)


Também conhecida como odds ratio (OR), a razão de chance é dada pela
razão entre chance de exposição no grupo de indivíduos doentes e a chance
de exposição no grupo de indivíduos não-doentes. A razão de chance pode ser
calculada pela seguinte fórmula:

a c
Chance(Doença )
, onde Chance(Doença ) = a +b = e Chance( Não-doença ) = c +d =
a c
OR =
Chançe( Não-doença ) b b d d
a +b c +d

Para o exemplo dado, temos:

a
c a ⋅d 36 × 188 6.768
OR = = = = = 3, 44
b b ⋅c 164 × 12 1.968
d

Probabilidade e Medidas de Associação 131

BIOESTATISTICA_VOL02.indb 131 25/06/12 17:21


Observe que dada a disposição de sua fórmula na tabela de contingência,
a razão de chances é também conhecida como razão dos produtos cruzados,
sendo usada quando o objetivo é avaliar se a chance de ocorrer a doença no
grupo de expostos é maior ou menor que no grupo de não-expostos. Assim,
para o exemplo em questão, a chance no grupo exposto foi 3,4 vezes maior
que no grupo não-exposto. Ou seja, os indivíduos que consumiram dieta rica
em gordura saturada apresentaram uma chance 3,4 vezes maior de evoluir
com hipercolesterolemia quando comparados aos indivíduos com consumo
de dieta normal.
Portanto, embora a razão de risco não possa ser calculada em um estudo
caso-controle, a razão de chances pode, sendo esta medida de associação uma
boa estimativa da razão de risco que seria obtida neste tipo de estudo, especial-
mente quando a frequência da doença na população é muito baixa.
Por outro lado, erroneamente, é comum a utilização do termo risco
relativo para designar as medidas calculadas pela razão de chance. Em termos
práticos, as duas medidas apresentam fórmulas matemáticas diferentes.
Mas, afinal, por que nos estudo caso-controle não pode ser utilizada a razão
de risco? A questão é simples. Se fôssemos calcular a chance de doença no
grupo exposto ao fator de risco, a fórmula seria a/b; ao passo que a chance
de doença no grupo não-exposto seria c/d, e a razão de chance entre os
dois grupos seria OR = (a/b)/(c/d). Matematicamente, não teria diferença
se a razão de chance fosse calculada desta maneira ou pela fórmula tradi-
cionalmente correta, OR = (a/c)/(b/d), pois a multiplicação cruzada, em
cada caso, seria sempre OR = ad/bc. Porém, em termos conceituais, não tem
sentido usar a fórmula OR = (a/b)/(c/d), pois os valores das células a e b
vêm de diferentes grupos estudados, isto é, a vem do grupo caso, enquanto
b vem do grupo controle.
Note que, neste tipo de estudo, as únicas medidas disponíveis são
as proporções de pessoas expostas entre os casos e entre os controles.
Não temos dados sobre o número de pessoas expostas e não-expostas na
população que produziu os casos e que, também, produziu os controles, pois
o número de casos e controles é definido arbitrariamente pelo pesquisador
e não reflete a proporção real entre o número de casos, ou controles, e o
total de pessoas na população. Por este motivo, a apresentação dos dados

132 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 132 25/06/12 17:21


tabulares nos estudos caso-controle não inclui a coluna de total, que soma
casos e controles nos grupos expostos e não-expostos ao fator de risco. Por
isso, não podemos calcular os riscos de doença em expostos e não-expostos,
nem, tampouco, a razão de risco, daí porque, em estudos caso-controle,
os grupos são comparados quanto à frequência de exposição pela
aplicação da razão de chance de exposição, que corresponde ao valor de
quanto a exposição é mais frequente em um grupo em relação ao outro.
Como a razão de chance (OR) de exposição e a razão de chance de doença,
em expostos e não-expostos, são, matematicamente, iguais, esta última
também pode ser calculada em estudos caso-controle, pois ela é semelhante
à razão de risco de doença, quando esta é relativamente rara, em especial,
quando sua incidência na população é menor que 5%, sendo a razão
de chance uma boa estimativa da razão de risco. Nestes casos, a razão de
chance é semelhante à razão de risco, e isso explica o uso do termo razão de
risco ou risco relativo, quando a razão de chance é calculada em estudos do
tipo caso-controle.
Outro ponto importante a ser considerado no cálculo das medidas de
associação do tipo razão é a disposição dos grupos na tabela de contingência
2 x 2. Como já explicado anteriormente, para o cálculo do qui-quadrado, a
posição dos grupos não altera o resultado final, porém, nos cálculos da razão
de risco (RR) e da razão de chances (RC), essa disposição é importante para
a interpretação do resultado. Tradicionalmente, o grupo exposto é colocado
no numerador, uma vez que, quase sempre, o risco, neste grupo, é maior que
no grupo não-exposto, o que leva a um valor maior que 1, tal como ocorreu
no exemplo mostrado na Tabela 15.2, onde o risco para hipercolesterolemia
é 3 vezes maior no grupo exposto em relação ao não-exposto. Por outro
lado, nada impede que o grupo exposto seja colocado no denominador. Nesta
disposição, o risco seria 1/3, isto é, 0,33, o que significa que os indivíduos
os quais consumiram dieta normal têm um terço do risco dos indivíduos
com dieta rica em gordura saturada. Neste caso, poderíamos dizer que não
consumir gordura saturada é um fator de proteção para a hipercolestero-
lemia. De qualquer forma, as duas maneiras fazem sentido, e a interpretação
é matematicamente compreensível, esteja o grupo exposto no numerador ou
no denominador da equação.

Probabilidade e Medidas de Associação 133

BIOESTATISTICA_VOL02.indb 133 25/06/12 17:21


• IC95% para Razão de Chances

 1 1 1 1
IC 951% = exp ln(OR ) ± 1, 96 + + + 
 a b c d 

 1 1 1 1 
IC 95% = exp ln(3, 44) ± 1, 96 + + + 
 36 164 12 188 

IC 95% = exp(1,235 ± 1, 96 0,122 )

IC 95% = exp(1,235 ± 0,684)

IC 95% = 1,73 (limite inferior) e 6,81 (limite sup


perior)

IC 95% = 1,73 < OR < 6,81

15.2.3 Risco Atribuível (RA)


Também conhecido como diferença de risco, o risco atribuível é dado
pela diferença entre o risco em um grupo exposto e o risco em um grupo
não-exposto.

RA = Risco(Expostos) − Risco(Não-expostos)

a c 36 12
RA = − = −
a + b c + d 200 200

RA = 0,18 − 0,06 = 0,12

O risco atribuível fornece uma estimativa do efeito da exposição ao fator de


risco sobre o excesso de risco da doença no grupo exposto em relação ao grupo
não-exposto. Isto é, mostra a quantidade de risco que é atribuída ao fator de
risco estudado, desde que a relação entre a exposição e a doença não ocorra
por acaso. Isto significa que, para cada 100 indivíduos expostos ao fator de
risco, em média 18 (36/200) deles apresentam hipercolesterolemia, e desses
18, a exposição ao consumo excessivo de gordura saturada é responsável pela
hipercolesterolemia em 12 indivíduos. Assim, caso a exposição fosse eliminada

134 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 134 25/06/12 17:21


e a doença fosse reversível, o risco no grupo dos expostos reduziria de 0,18
para 0,06, o que evitaria que, de cada 100 pessoas expostas ao fator de risco,
12 indivíduos apresentassem a doença.

15.2.4 Porcentagem de Risco Atribuível (RA%)

Corresponde ao risco atribuível (RA) expresso em porcentagem em relação


à incidência no grupo dos expostos. É dada pela equação:

Risco(Expostos) − Risco(Não-expostos)
RA % = x 100
Risco(Expostos)

0,18 − 0,06
RA % = x 100
0,18

RA % = 66,66%

A porcentagem de risco atribuível reflete que porcentagem de risco total


para hipercolesterolemia é devido ao consumo de gordura saturada. Assim,
para o exemplo em questão, 66,6% do risco entre os expostos são atribuídos à
exposição ao fator de risco estudado.
Uma outra maneira de calcular o RA% é tomar como base o risco relativo
(RR). Esta maneira deve ser considerada quando, no estudo, não for possível
calcular o risco absoluto. A fórmula é:

RR − 1
RA % = × 100
RR

3−1
RA % = × 100 ∴ RA % = 66,66%
3

Nos estudos do tipo caso-controle, nos quais não se pode estimar a


incidência da doença, ou nas pesquisas em que a doença estudada é de baixa
frequência e, portanto, com baixo risco na população, a razão de chances (OR)
pode ser usada como um estimador aproximado do risco relativo (RR). Nestes
casos, a fórmula da RA% pode ser escrita substituindo-se o RR pelo OR.

Probabilidade e Medidas de Associação 135

BIOESTATISTICA_VOL02.indb 135 25/06/12 17:21


OR − 1
RA % = × 100
OR

3, 44 − 1
RA % = × 100
3, 44

RA % = 70, 93%

15.2.5 Risco Atribuível na População (RAP)


É calculado pela diferença entre o risco total na população menos o risco
no grupo não-exposto. Estima, na população em geral, o quanto do risco total
para a doença em questão é decorrente do fator de risco estudado. É dado
pela fórmula:

RAP = Risco(Total ) − Risco( Não-expostos )

a +c c 48 12
RAP = − = −
a + b + c + d c + d 400 200

RAP = 0,12 − 0,06 = 0,06

Portanto, se não houvesse o consumo de gordura saturada na população, o


total de indivíduos com hipercolesterolemia seria somente de 6 para cada 100
pessoas avaliadas, sendo o excesso sobre esse número, isto é, de 6 indivíduos
hipercolesterolêmicos, atribuído ao fator de risco estudado.

15.2.6 Porcentagem de Risco Atribuível na


População (RAP%)
Igualmente ao RA%, a porcentagem de risco atribuível na população
(RAP%) também pode ser calculada com base na diferença de risco absoluto
ou no risco relativo. A fórmula que utiliza a diferença de risco é a seguinte:

Risco(total ) − Risco( Não-exposto )


RAP % = × 100
Risco(Total )

0,12 − 0,06
RAP % = × 100
136 Bioestatística aplicada à Pesquisa 0 ,12
Experimental

RAP % = 50%

BIOESTATISTICA_VOL02.indb 136 25/06/12 17:21


Risco(total ) − Risco( Não-exposto )
RAP % = × 100
Risco(Total )

0,12 − 0,06
RAP % = × 100
0,12

RAP % = 50%

A RAP% informa, na população em geral, que porcentagem de risco total


para a doença é devido ao fator de risco estudado. No caso em questão, 50%
do risco de hipercolesterolemia é decorrente do consumo de gordura saturada.
Portanto, as medidas de associação, sejam do tipo razão ou do tipo
diferença, têm sido amplamente utilizadas para avaliação de custos e benefícios
de programas de saúde pública para investigação e controle de riscos que
podem causar doenças na população em geral. O perfeito entendimento de suas
aplicações e a correta interpretação dos resultados constituem importantes
pontos a serem considerados pelos pesquisadores envolvidos com estudos na
área da epidemiologia.

Probabilidade e Medidas de Associação 137

BIOESTATISTICA_VOL02.indb 137 25/06/12 17:21


BIOESTATISTICA_VOL02.indb 138 25/06/12 17:21
16
Testes de Rastreamento
Diagnóstico

No dia-a-dia da prática da pesquisa clínica, o médico e outros profis-


sionais da área da saúde são frequentemente chamados a decidir quanto ao
diagnóstico e ao tipo mais indicado de tratamento para as mais diversas varie-
dades de doenças. Neste complexo processo de tomada de decisões, estes
profissionais se deparam com situações que exigem não apenas a escolha
correta dos exames diagnósticos, mas, também, a perfeita interpretação e
minuciosa avaliação da precisão dos resultados fornecidos, sejam eles positivos
ou negativos. Entretanto, como geralmente existem diferentes exames, sejam
clínicos ou laboratoriais, a fim de que se possa diagnosticar uma determinada
doença, o pesquisador sempre deverá buscar aquele que forneça um resultado
mais confiável, escolha esta que, certamente, dependerá de vários fatores, tais
como a acurácia, a sensibilidade e a especificidade do teste solicitado, assim
como do espectro da doença na população e do estágio em que a ela se encontra
no momento do estudo.
De qualquer maneira, antes de se decidir por um ou por outro tipo exame,
ou até mesmo antes que um novo exame de diagnóstico seja implantado como
um bom teste de rastreamento para uma determinada doença, um pesqui-
sador deverá submetê-lo a uma série de análises no sentido de verificar sua
efetividade. Estas análises, geralmente realizadas comparativamente com

BIOESTATISTICA_VOL02.indb 139 25/06/12 17:21


outros testes já bem estabelecidos pela ciência, são embasadas em princípios
estatísticos e teorias probabilísticas anteriormente explanadas neste livro,
as quais têm assumido grande destaque na área da pesquisa médica, pois
constituem uma importante ferramenta de orientação e de avaliação de
políticas de saúde pública. Assim, o objetivo do presente capítulo é orientar
o pesquisador quanto à correta aplicação do processo de tomada de decisões
terapêuticas, com base no método de análise e validação de teste de
diagnóstico e de rastreamento.

16.1 BASES PARA OS TESTES DE RAsTREAMENTO


DIAGNÓSTICO

Também conhecidos como screening test, os testes de rastreamento


têm sido largamente empregados como estimadores de doenças em estudos
de pesquisas epidemiológicas e clínicas, de modo a oferecer uma forma
segura para o processo de tomada de decisão se um determinado proce-
dimento diagnóstico deve ou não ser aplicado para uma dada população.
Como o diagnóstico é condição fundamental para o planejamento terapêutico,
é essencial que o profissional envolvido possa dispor de métodos seguros
para avaliar a efetividade do exame solicitado, de maneira que o tratamento
indicado tenha mais chances de sucesso. Assim, a escolha do instrumento
utilizado para a tomada de decisão assume grande importância, uma vez
que, dos dados obtidos a partir de sua aplicação, depende todo um planeja-
mento terapêutico.
Na prática clínica, um teste de rastreamento diagnóstico é utilizado
para a detecção de uma doença específica ou de um agravo à saúde em uma
população exposta a um determinado fator de risco, mesmo que na ausência
de queixas, isto é, ainda na fase pré-clínica da doença, podendo, porém,
ser ampliado para toda a população de acordo com critérios técnicos bem
definidos, tal como a alta prevalência da doença na população em questão,
a faixa etária ou o sexo acometido, sempre no sentido de contribuir com o
prognóstico da doença estudada. Com base neste raciocínio, um bom teste
de rastreamento diagnóstico, além de outras características, deve detectar

140 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 140 25/06/12 17:21


o maior número possível de casos da doença investigada na população
alvo, de modo que possa distinguir, com precisão, as pessoas que estão
aparentemente bem, mas que se encontram doentes, daquelas que não
apresentam a doença investigada. Ou seja, um bom teste deve ser preciso
quando separa os casos positivos (com a doença) dos casos negativos
(sem a doença).
Porém, como não existe um teste diagnóstico perfeito no que tange
à identificação da doença estudada, o pesquisador sempre irá incluir, em
sua avaliação, uma razoável margem de erro quanto ao resultado obtido,
seja ele positivo ou negativo. Essa margem de erro pode ser aumentada ou
diminuída segundo algumas características assumidas para o teste, tal como
a sensibilidade, a especificidade e o ponto de corte definido como limite
de normalidade para os valores encontrados no exame diagnóstico, assim
como um bom juízo crítico baseado na experiência do avaliador. Por essa
razão, ao solicitar um determinado exame diagnóstico, o pesquisador deverá
considerar que o resultado obtido poderá incluir uma das seguintes possi-
bilidades: teste positivo (alterado) para um paciente portador da doença
investigada (teste verdadeiro-positivo); teste positivo (alterado) para um
paciente sem a doença investigada (teste falso-positivo); teste negativo
(normal) para um paciente com a doença investigada (teste falso-negativo);
teste negativo (normal) para um paciente sem a doença investigada
(teste verdadeiro-negativo).
Assim, diante destas quatro possibilidades acima expostas, o pesquisador
deverá decidir qual aquela que melhor se aplica para a situação em estudo. Esta
tomada de decisão requer, além do conhecimento das particularidades clínicas
inerentes à doença investigada, a determinação das medidas de sensibilidade
e especificidade que definem a qualidade intrínseca do teste utilizado, assim
como a análise dos parâmetros que refletem a sua capacidade de produzir
decisões clínicas corretas, dentre as quais se destacam os valores de predição
positiva e negativa, todas elas embasadas nos princípios da teoria da probabi-
lidade, já anteriormente demonstradas.
No entanto, para que um teste seja considerado efetivo como instrumento
de diagnóstico clínico ou de rastreamento para uma determinada doença ou
agravo à população, é necessário submetê-lo a um processo de avaliação, de

Testes de Rastreamento Diagnóstico 141

BIOESTATISTICA_VOL02.indb 141 25/06/12 17:21


modo que se possa verificar a sua sensibilidade e especificidade em sujeitos
com características semelhantes às da população em que o teste será usado.
Para tal, deve-se comparar a proporção de resultados corretos para o teste
a ser avaliado, quando aplicado em dois grupos distintos: a) um grupo de
sujeitos sabidamente saudáveis e que, portanto, os resultados do teste devem
ser negativos; b) um grupo de sujeitos no qual se tem a certeza que a doença
esta presente e que, portanto, os resultados do teste devem ser positivos.
Note que, nesta avaliação, a presença da doença no segundo grupo também
foi confirmada por um teste diagnóstico, o qual é utilizado como referência.
Este teste, geralmente chamado padrão-ouro1 (gold standard), deve
ser teoricamente melhor que o teste avaliado e, de preferência, totalmente
isento de erros.
Em resumo, para um exame de diagnóstico clínico ou de rastrea-
mento poder ser utilizado correntemente, de forma a produzir resultados
confiáveis, há de se proceder a sua validação com base em um teste consi-
derado teoricamente melhor no momento da execução da pesquisa, mesmo
que este não ofereça uma certeza absoluta a respeito do diagnóstico.
Assim, o desafio do pesquisador é encontrar um teste o mais próximo possível
do ideal, mais rápido, com menor custo e menos invasivo.
De qualquer maneira, para executar a validação de um teste diagnóstico
ou de rastreamento, a maneira mais didática é a utilização da tabela de
contingência 2 x 2, já amplamente discutida no capítulo 14 deste livro.
Nesta tabela, são comparados os resultados do teste avaliado e do teste
padrão-ouro tomado como referência. A partir destes resultados, é
possível calcular as medidas que caracterizam as qualidades intrínsecas e
os parâmetros de decisões do teste em análise. Um modelo para a tabela-
-padrão 2 x 2, que compara os resultados do teste analisado e a verdadeira
condição de doença nos indivíduos testados, é mostrada a seguir. Note que
os pacientes são classificados apenas como doentes e não-doentes, não se
admitindo estágios intermediários.

1. Termo utilizado para designar testes com satisfatória exatidão diagnóstica, tal como biópsias,
inspeções cirúrgicas e outros.

142 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 142 25/06/12 17:21


Tabela 16.1 – Tabela-padrão 2 x 2 para a validação de um teste de rastreamento diagnóstico

Resultado do teste padrão ouro

Doente Não-doente Total

Positivo a b a+b
Resultado do teste
analisado
Negativo c d c+d

Total a+c b+d a + b +c + d

a - Indivíduos com resultado verdadeiro-positivo para o teste


b - Indivíduos com resultado falso-positivo para o teste
c - Indivíduos com resultado falso-negativo para o teste
d - Indivíduos com resultado verdadeiro-negativo para o teste
a + b - Todos os Indivíduos com resultado positivo para o teste
c + d - Todos os Indivíduos com resultado negativo para o teste
a + c - Todos os Indivíduos com a doença (teste padrão ouro)
b + d - Todos os Indivíduos sem a doença (teste padrão ouro)
a + b + c + d - Todos os indivíduos do estudo

Note, também, que apenas nas caselas a e d o teste em análise está


correto. Isto ocorre porque, na prática, não existem testes diagnósticos
perfeitos, capazes de identificar todos os indivíduos portadores da doença
investigada. Assim, com o objetivo de demonstrar todos os cálculos envol-
vidos no processo de avaliação de um teste diagnóstico, tomaremos como
base o seguinte exemplo:

Exemplo: Suponha que um laboratório queira realizar um estudo para


verificar a confiabilidade de um teste rápido para gravidez com o uso de
um kit caseiro. Para tal finalidade, os autores compararam os resultados do
teste realizado pela detecção qualitativa de gonadotrofina coriônica humana
(hCG) na urina de mulheres supostamente grávidas. O diagnóstico definitivo de
gravidez foi feito pela dosagem da gonadotrofina coriônica humana no sangue
(padrão ouro). Os resultados estão expressos na Tabela 16.2, a seguir.

Testes de Rastreamento Diagnóstico 143

BIOESTATISTICA_VOL02.indb 143 25/06/12 17:21


Tabela 16.2 – Resultado da avaliação do teste rápido para gravidez em 800 mulheres
supostamente grávidas

Resultado do teste padrão ouro


Grávida Não-grávida Total

Resultado do teste Positivo 416 105 521


rápido Negativo 48 231 279
Total 464 336 800

16.2 INDICADORES DE UM TESTE DIAGNÓSTICO

16.2.1 Sensibilidade e Especificidade


A precisão de um teste diagnóstico é mais frequentemente medida através
de dois importantes indicadores, a sensibilidade e a especificidade, os quais
serão descritos a seguir:

Sensibilidade (S)
Refere-se à capacidade do teste em detectar a doença que está sendo inves-
tigada quando ela está de fato presente. Ou seja, de ser positivo nos pacientes
que realmente têm a doença. A sensibilidade expressa a porcentagem dos
pacientes com a doença, cujos resultados do exame foram positivos. É calculada
pela seguinte fórmula:

a 416
S= , onde, para o exemplo dado: S = = 0,897 (89,7%)
a +c 464

Se o teste apresentar alta sensibilidade, raramente deixará de diagnos-


ticar indivíduos com a doença. Por outro lado, se o teste não é sensível, ele não
detectará a doença em alguns dos indivíduos doentes, os quais irão aparecer
na casela c. A proporção destes indivíduos é chamada de taxa de erro falso-
-negativo (EFN), cujo denominador inclui todos os indivíduos doentes, pois
somente eles podem ser falsamente chamados de não-doentes. A EFN é
calculada por:

144 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 144 25/06/12 17:21


c 48
EFN = = = 0,103 (10,3%)
a + c 464

Importa saber que a sensibilidade e a taxa de erro falso-negativo somam


1,0 (100%).

Especificidade (E)
Refere-se à capacidade do teste em identificar os indivíduos que não têm
a doença investigada quando, de fato, ela não está presente. Ou seja, de ser
negativo nos pacientes que realmente não têm a doença. A especificidade
expressa a porcentagem dos pacientes sem a doença, cujos resultados do exame
foram negativos. É calculada pela seguinte fórmula:

d 231
E= , onde, para o exemplo dado: E = = 0,687 (68,7%)
b +d 336

Se o teste apresentar alta especificidade, raramente classificará como


doente um indivíduo sem a doença. Por outro lado, se o teste não é específico,
ele indicará, erroneamente, a presença da doença em alguns dos indivíduos
não-doentes, os quais irão aparecer na casela b. A proporção destes indivíduos
é chamada de taxa de erro falso-positivo (EFP), cujo denominador inclui
todos os indivíduos não-doentes, pois somente eles podem ser falsamente
chamados de doentes. A EFP é calculada por:

b 105
EFP = = = 0,313 (31,3%)
b + d 336

Importa saber que a especificidade e a taxa de erro falso-positivo somam


1,0 (100%).

De maneira geral, para a detecção de uma determinada condição clínica,


o ideal seria a escolha de um teste com alta sensibilidade e especificidade. No
entanto, nem sempre existem testes que combinem estas duas características,
simultaneamente. Na prática clínica, o mais comum é se encontrar mais de um

Testes de Rastreamento Diagnóstico 145

BIOESTATISTICA_VOL02.indb 145 25/06/12 17:21


teste para a mesma doença, daí a necessidade da comparação entre eles, de
modo que a escolha recaia sobre aquele mais adequado para a situação. Assim,
suponha que dois diferentes testes estejam disponíveis: um com alta sensibi-
lidade e baixa especificidade, e outro com alta especificidade, porém com baixa
sensibilidade. Qual seria a escolha mais apropriada? Neste caso, alguns pontos
devem ser considerados, dentre eles as indicações pertinentes à condição clínica
do paciente e o tipo de doença a ser diagnosticada, assim como a capacidade
do teste em fazer previsões diagnósticas (valores preditivos), que dependem
conjuntamente da sensibilidade e especificidade. A seguir, citaremos algumas
indicações clínicas para a escolha do melhor teste. Os valores preditivos e a
razão de probabilidades serão descritas mais adiante.
Quando o objetivo é rastrear uma doença ou agravo à saúde em grupos
populacionais, como por exemplo, traçar o perfil epidemiológico da soropre-
valência2 de uma determinada doença infecciosa, como a hepatite B e C, a
escolha deve recair sobre um teste de alta sensibilidade. Igualmente, os testes
mais sensíveis devem ser utilizados para diagnosticar condições clinicamente
graves, especialmente na fase inicial da doença, quando o objetivo é fazer
diagnóstico diferencial.
Por sua vez, os testes mais específicos dever ser escolhidos quando o
objetivo for confirmar um diagnóstico indicado por um teste mais sensível,
pois raramente ele mostrará um resultado positivo na ausência de doença.
Do mesmo modo, a especificidade deve ser prioritária nos casos em que um
resultado falso-positivo possa comprometer a saúde do paciente pela indicação
de um tratamento desnecessário, por exemplo.
Assim, para o exemplo mostrado na Tabela 16.2, o teste rápido para
diagnóstico da gravidez apresenta alta sensibilidade (89,7%), porém com
razoável especificidade (68,7%).

Relação entre sensibilidade e especificidade


Como referido anteriormente, o teste ideal seria aquele em que a sensibi-
lidade e a especificidade fossem iguais a 100%. Porém, como na prática isto não
ocorre, os valores da sensibilidade e da especificidade devem ser combinados a

2. 
Refere-se aos indivíduos que têm positividade para anticorpos contra um dado agente
infeccioso. O surgimento da soropositividade é chamado de soroconversão.

146 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 146 25/06/12 17:21


fim de que se possa determinar a utilidade do exame como meio de diagnóstico
para uma determinada doença. Entretanto, o que frequentemente existe é um
equilíbrio (contrabalanço ou trade-off) entre estas duas propriedades, de tal
modo que, quando aumenta a sensibilidade, a especificidade tende a diminuir
e vice-versa. Assim, esses indicadores também devem ser combinados com o
índice de suspeita (ou probabilidade anterior) do médico de que o indivíduo
pesquisado tenha ou não a doença investigada, visando a determinar a proba-
bilidade da doença (ou sua ausência), tendo em vista o conhecimento do
resultado do exame.
Quando o resultado do teste é expresso de forma dicotômica, isto é, como
positivo ou negativo, normal ou anormal, por exemplo, muito pouco se pode
fazer para ajustar a sensibilidade ou a especificidade. Porém, para um teste
diagnóstico cujo resultado é determinado por uma escala contínua de valores,
como o método enzimático para a dosagem de colesterol sérico, expressa em
mg/dL, por exemplo, é necessário que se estabeleça um limite (ponto de corte
ou cutoff point) entre os valores considerados normais e os anormais. Neste
caso, alterando-se o ponto de corte para mais ou para menos, pode-se modificar
as propriedades do teste, de modo que a sensibilidade somente poderá ser
aumentada se ocorrer uma diminuição considerável da especificidade e
vice-versa. Assim, como a escolha envolve uma decisão entre aumentar a sensi-
bilidade à custa de redução da especificidade, ou vice-versa, deve-se optar por
um ponto de corte para o qual ocorra o menor erro possível, tanto para falsos-
-positivos quanto para falsos-negativos.
O exemplo a seguir mostra a importância da determinação do melhor
ponto de corte. A dosagem sérica do hormônio triiodotironina (T3) pelo método
enzima-imuno-fluorimétrico é usada para diagnosticar o hipertireoidismo,
cujo ponto de corte é 200 ng/100 ml. O ideal seria que todos os indivíduos com
dosagem acima deste valor fossem considerados com hipertireoidismo, e os
indivíduos com dosagem abaixo fossem considerados normais (Figura 16.1A).
Contudo, na prática clínica, podemos encontrar indivíduos com sintomas
de hipertireoidismo mesmo apresentando valores de T3 dentro dos limites
da normalidade, assim como indivíduos clinicamente normais, porém com
elevados níveis hormonais, existindo, portanto, uma sobreposição dos sintomas
em relação aos valores definidos para o exame (Figura 16.1B).

Testes de Rastreamento Diagnóstico 147

BIOESTATISTICA_VOL02.indb 147 25/06/12 17:21


 
A B

200 200
T3 (ng/100ml) T3 (ng/100ml)

Fig. 16.1 – Distribuição dos valores séricos da triiodotironina (T3) em indivíduos normais
e com hipertireoidismo. A – Distribuição ideal em relação ao ponto de corte. B – Sobreposição
de sintomas em relação aos valores hormonais

De qualquer maneira, a critério do pesquisador, o ponto de corte para um


determinado exame poderá ser modificado para mais ou para menos, de modo a
torná-lo mais sensível ou mais específico. Entretanto, essa mudança acarretará
uma alteração no equilíbrio (contrabalanço) entre estas duas propriedades, o
que leva a uma diminuição (ou aumento) na sensibilidade ou na especificidade,
respectivamente, conforme mostrado na Figura 16.2. Assim, se um ponto de corte
mais baixo for selecionado, isso acarretará um aumento na sensibilidade do teste,
e todos os indivíduos com hipertireoidismo serão detectados pelo exame, porém,
muitos dos indivíduos normais (assintomáticos) poderão ser taxados como
portadores da doença (falsos-positivos). Por outro lado, se for selecionado um
ponto de corte mais elevado, isso aumentará a especificidade do teste, e todos
os indivíduos sem a doença serão classificados como normais, embora muitos
pacientes com hipertireoidismo não sejam detectados pelo exame (falsos-
-negativos). As áreas sombreadas na Figura 16.2 representam, respectivamente,
a taxa de erro falso-positivo para um ponto de corte reduzido (Figura 16.2A) e a
taxa de erro falso-negativo quando o ponto de corte é aumentado (Figura 16.2B).
Portanto, uma questão importante que sempre deve ser considerada é o
ponto de corte que positivará o teste avaliado. Como a escolha sempre envolve
a decisão entre aumentar a sensibilidade à custa de redução da sensibilidade
e vice-versa, o pesquisador deve avaliar, com muita cautela, a importância
relativa da sensibilidade e especificidade do teste, de modo que possa estabe-

148 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 148 25/06/12 17:21


 
A B

180 220
T3 (ng/100ml) T3 (ng/100ml)

Figura 16.2 – Variações da sensibilidade e especificidade conforme as alterações


no ponto de corte do teste para a dosagem da triiodotironina

lecer o ponto de transição diagnóstica mais adequada. Assim, como regra geral,
quando o objetivo é evitar resultado falso-negativo, o ponto de corte deve buscar
o máximo de sensibilidade, e se o objetivo for evitar o resultado falso-positivo,
o ponto de corte deve objetivar o máximo de especificidade. Na prática, o
pesquisador deverá buscar um equilíbrio para o ponto de corte, de maneira
que possa ajustar a sensibilidade e a especificidade do teste diagnóstico, otimi-
zando tanto o erro falso-positivo quanto o falso-negativo. A Figura 16.3 mostra
o ponto de corte com o mínimo de erro para o teste de diagnóstico do hiperti-
reoidismo, enquanto que a Tabela 16.3 mostra a relação entre a sensibilidade e
a especificidade para diferentes pontos de corte em relação ao teste utilizado.

200
T3 (ng/100ml)
Fig. 16.3 – Ponto de corte ideal para o teste da triiodotironina

Testes de Rastreamento Diagnóstico 149

BIOESTATISTICA_VOL02.indb 149 25/06/12 17:21


Tabela 16.3 – Relação entre sensibilidade e especificidade (diferentes pontos de corte)

T3 Sensibilidade Especificidade
(ng/100ml) (%) (%)

150 99,2 9,7


160 97.9 17,7
170 95,8 29,4
180 92,9 43,8
190 85,1 60,9
200 69,6 77,6
210 51,2 86,8
220 28,5 95,4
230 9,1 98,6
240 2,3 100,0

Em resumo, um bom teste de rastreamento deve ter alta sensibilidade para


não perder os casos da doença presentes na população testada, bem como alta
especificidade a fim de reduzir o número de pessoas com resultados falsos-
-positivos que necessitem de posterior investigação.

16.2.2 Curva ROC


Originalmente desenvolvida pela área de engenharia elétrica, na Inglaterra,
a curva ROC (receiver operating characteristic curve) foi primeiramente
utilizada em programas para analisar a sensibilidade na detecção de sinais de
radar durante a batalha da Grã-Bretanha, na segunda Guerra Mundial. Porém,
somente a partir de 1950, o modelo foi empregado na área da saúde, inicial-
mente na área da psicofísica e, mais recentemente, na medicina, onde tem
sido amplamente empregada no campo da epidemiologia para avaliação de
testes diagnósticos. Assim com base no modelo inicialmente desenvolvido, a
curva ROC (curva de operadores recebedores de características) é um método
estatístico e gráfico utilizado para determinar o melhor ponto de corte de um
teste diagnóstico. Neste método, a relação entre a sensibilidade e a especi-
ficidade é determinada pela construção de uma curva a partir dos pontos
marcados em um gráfico binário.

150 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 150 25/06/12 17:21


Para construir uma curva ROC, devem-se marcar, no gráfico, os pares
ordenados constituídos pelos valores da sensibilidade e da especificidade,
calculados a partir de diferentes pontos de corte determinados para o teste
diagnóstico avaliado. Sobre o eixo das ordenadas (eixo y) colocam-se os valores
da sensibilidade (proporção de verdadeiros positivos) e sobre o eixo das
abscissas (eixo x) são colocados os valores do complemento da especificidade
(1 – especificidade), isto é, a proporção de falsos-positivos. A seguir, os pontos
são conectados entre si por uma linha, conforme demonstrado na Figura 16.4,
abaixo, que representa a curva ROC para diferentes pontos de corte da triiodo-
tironina sérica.


Fig. 16.4 – Curva ROC para determinar o melhor ponto de corte para os valores da dosagem
da triiodotironina, conforme mostrado na Tabela 16.3

Raciocínio para o modelo


Suponhamos que um pesquisador quisesse determinar o melhor ponto
de corte para a triiodotironina (T3) em um programa de rastreamento para o
hipertireoidismo. Inicialmente, ele deveria dosar o hormônio em uma grande
amostra representativa da população, e, então, executar uma avaliação clínica
(padrão ouro) para definir quais os indivíduos que, de fato, apresentam
a doença. Assim, cada indivíduo teria um valor para a dosagem de T3 e um
diagnóstico, presente ou ausente, para a doença investigada. A seguir, o

Testes de Rastreamento Diagnóstico 151

BIOESTATISTICA_VOL02.indb 151 25/06/12 17:21


pesquisador deveria definir diferentes valores limítrofes (pontos de corte)
que separariam os indivíduos sadios dos doentes, e, então, verificar, com base
no diagnóstico clínico, quais aqueles em que os diagnósticos laboratorial e
clínico foram coincidentes ou não. Após esse procedimento, os valores da
sensibilidade e da especificidade do teste seriam calculados para cada um dos
diferentes pontos de corte previamente estabelecidos. Com base nas infor-
mações coletadas, uma curva ROC seria construída.
Portanto, com base neste raciocínio, se o ponto de corte para T3 fosse
estabelecido em 0,0 ng/100ml, todos os indivíduos com hipertireoidismo
seriam detectados, e a sensibilidade do exame seria de 100%. Neste caso,
porém, todas as pessoas sem a doença também seriam detectadas como
portadoras do hipertireoidismo, o que levaria a uma taxa de erro falso-
-positivo igual a 100%, com o ponto da curva situado no canto superior
direito do gráfico. Por outro lado, se fosse estabelecido para T3 um ponto de
corte muito elevado, algo em torno de 400 ng/100ml, nenhuma pessoa seria
detectada pelo exame como portadora de hipertireoidismo, pois raramente o
pesquisador encontraria alguém com a dosagem hormonal acima deste valor,
logo, a sensibilidade do teste seria 0%. Nesta condição, a taxa de erros falsos-
-positivos também seria igual a 0%, com o ponto da curva situado no canto
inferior esquerdo do gráfico. Posteriormente, o pesquisador marcaria, no
gráfico, os valores da sensibilidade e da especificidade (1 – especificidade)
calculados para os demais pontos de corte estabelecidos, tais como 160
ng/100ml, 170 ng/100ml, 180 ng/100ml, e assim, sucessivamente. A seguir,
os pontos seriam unidos pela linha que desenharia a curva ROC para o teste
de rastreamento em questão.
Note que, à medida em que o ponto de corte se torna maior, o ponto da
curva, que corresponde à sensibilidade e à especificidade, desloca-se para
baixo e para a esquerda, pois o teste fica menos sensível e mais específico. Do
mesmo modo, se o ponto de corte é diminuído, o ponto da curva é deslocado
para cima e para a direita, ficando, o teste, mais sensível e menos específico.
Assim, quanto mais próxima a curva ROC estiver do canto superior esquerdo
do gráfico, onde a taxa de verdadeiros-positivos é 100% e a taxa de falsos-
-positivos é 0%, mais exata ela será, e melhor será o poder discriminatório do
teste diagnóstico. Da mesma maneira, quanto mais distante estiver do canto

152 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 152 25/06/12 17:21


superior esquerdo, até o limite máximo da diagonal do gráfico, menor será o
poder discriminatório do teste estudado.
Em outras palavras, a curva ideal para um teste seria aquela que subiria
quase verticalmente a partir do canto inferior esquerdo e, então, na parte
superior do gráfico, mover-se-ia horizontalmente em direção ao canto
superior direito. Por outro lado, uma curva sem qualquer poder discrimina-
tório (curva ruim) seria aquela que coincidiria com a diagonal do gráfico,
traçada do canto inferior esquerdo até canto superior direito. Na prática, a
curva ROC para um teste diagnóstico estará sempre situada entre a curva
boa e a curva ruim, e o melhor ponto de corte seria aquele mais próximo do
canto superior esquerdo do gráfico. A Figura 16.5 mostra os três diferentes
exemplos de curva ROC.

Fig. 16.5 – Exemplos de curva ROC para três diferentes teste

É válido ressaltar que a curva ROC pode ser utilizada com o objetivo comparar
a acurácia entre dois ou mais exames diagnósticos para uma mesma doença. O
método é realizado pela comparação das áreas localizadas sob as curvas ROC.
Assim, quanto maior for a área, melhor será o teste diagnóstico. Porém, um teste
estatístico deverá ser aplicado para decidir se as áreas diferem significativa-
mente entre si. Neste caso, deve-se utilizar o teste da soma de Wilcoxon.

Testes de Rastreamento Diagnóstico 153

BIOESTATISTICA_VOL02.indb 153 25/06/12 17:21


16.2.3 Acurácia e prevalência
Outras medidas para um teste diagnóstico também podem ser determi-
nadas a partir da tabela de contingência 2 x 2.
Acurácia (A)
Refere-se à proporção de acertos de um teste diagnóstico. Ou seja, mostra
a proporção dos indivíduos verdadeiros-positivos e verdadeiros-negativos em
relação a todos os resultados possíveis para o teste. É calculada pela seguinte
fórmula:

a +d 47
64
A= , onde, para o exemplo dado: A = = 0,808 (80,7%)
a +b +c +d 800

Prevalência (P)
Também chamada de probabilidade pré-teste, a prevalência corresponde
à proporção de casos da doença existentes antes da realização do teste em
relação ao total de indivíduos da população. Isto é, ela expressa a probabilidade
da doença antes do teste ser realizado. É calculada pela seguinte fórmula:

a +c 64
46
P= , onde, para o exemplo dado: P = = 0,580 (58,0%)
a +b +c +d 800

A acurácia do teste diagnóstico utilizado depende, não apenas da sensi-


bilidade e da especificidade, mas, também, da prevalência da doença na
população na qual o mesmo está sendo utilizado. Assim, quanto mais baixa a
prevalência da doença, mais específico deve ser o teste de rastreamento para
que ele seja passível de detectar os casos presentes na população, pois, nesse
caso, um teste positivo pode refletir um resultado falso, aumentando o número
de casos falsos-positivos para o teste em questão. Do mesmo modo, quando
a prevalência da doença é muito alta, o teste deve ser muito sensível, porque,
nessa situação, um teste negativo terá uma razoável probabilidade de ser falso,
o que aumentaria o número de falsos-negativos para o teste.
Ainda em relação à prevalência, note que a taxa calculada pela fórmula
acima citada representa apenas a prevalência determinada para a população
em estudo, ou seja, para a qual o teste foi aplicado, não significando, portanto,

154 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 154 25/06/12 17:21


que o valor seja considerado o mesmo para a prevalência na população em
geral, uma vez que este indicador pode apresentar grandes variações entre
diferentes localidades, municípios, estados, países etc.

16.3 VALORES PREDITIVOS

Ao aplicar um teste de rastreamento diagnóstico, além da sensibilidade e


da especificidade, o pesquisador também deverá estar interessado em deter-
minar a capacidade do mesmo em fazer previsões quanto às probabilidades
de um indivíduo ter ou não a doença investigada. A estas probabilidades da
ocorrência ou não da doença, calculadas a partir dos resultados de um teste
diagnóstico, dá-se o nome de valores preditivos, os quais são expressos como
mostrado a seguir:
Valor Preditivo Positivo (VPP)
Refere-se à proporção de verdadeiros-positivos entre todos os indivíduos
com resultado positivo para o teste diagnóstico. Ou seja, expressa a probabi-
lidade de um paciente com o teste positivo ter, de fato, a doença. É calculado
pela seguinte fórmula:

a 416
VPP = , onde, para o exemplo dado: VPP = = 0,798 (79,8%)
a +b 52
21

Valor Preditivo Negativo (VPN)


Refere-se à proporção de verdadeiros-negativos entre todos os indivíduos
com resultado negativo para o teste diagnóstico. Ou seja, expressa a probabi-
lidade de um paciente com o teste negativo não ter, de fato, a doença. É calculado
pela seguinte fórmula:

d 231
VPN = , onde, para o exemplo dado: VPN = = 0,828 (82,8%)
c +d 27
79

Em resumo: o VPP mostra a probabilidade de o paciente estar realmente


doente quando o resultado do teste é positivo, enquanto que o VPN reflete

Testes de Rastreamento Diagnóstico 155

BIOESTATISTICA_VOL02.indb 155 25/06/12 17:21


a probabilidade do paciente não estar doente quando o resultado do teste é
negativo. No entanto, note que a sensibilidade e a especificidade embora repre-
sentem bons indicadores da qualidade de um teste diagnóstico, na prática,
apresentam limitações quanto às suas aplicações, pois pouco auxiliam no
critério de decisão do pesquisador que, diante de um teste positivo, ainda
precisa avaliar se o indivíduo tem ou não a doença investigada. Isto ocorre
porque tanto a sensibilidade quanto a especificidade são indicadores calcu-
lados a partir de uma situação em que há certeza total sobre o diagnóstico, o
que, no dia-a-dia do consultório, isto não acontece. Assim, como não se pode
depender apenas destes dois indicadores, é necessário que se calculem os
valores preditivos para o teste em análise.
Contudo, é importante ressaltar que os valores preditivos de um teste
diagnóstico refletem probabilidades cujos valores estão condicionados ao
resultado do próprio teste que, na prática, acontece primeiro. Deste modo,
como os resultados do teste dependem da prevalência da doença na população
estudada, a qual é também denominada de probabilidade pré-teste, os
valores preditivos também variam com a prevalência da doença na população
estudada. Assim, como os valores preditivos estimam as probabilidades de
ter ou não a doença nos indivíduos com teste positivo ou negativo, esses
estimadores são também chamados de probabilidade pós-teste, podendo
ser calculados para qualquer prevalência, conforme as fórmulas mostradas
no exemplo abaixo.

Exemplo: Tomando-se como referência o exemplo anterior, cujos resultados


são mostrados na Tabela 16.2, quais os valores preditivos para o teste de rastre-
amento, supondo-se que a prevalência de gravidez na população é igual a 5%?

• Valor Preditivo Positivo

S xP
VPP =
(S x P ) + (1 − E ) x (1 − P )

0,897 x 0,05 0,0449


VPP = = = 0,131 (13,1%)
(0,897 x 0,05) + (1 − 0,687) x (1 − 0,05) 0,3423

156 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 156 25/06/12 17:21


• Valor Preditivo Negativo
E x (1 − P )
VPN =
(1 − S ) x P + E x (1 − P )

0,687 x (1 − 0,05) 0,6527


VPN = = = 0, 992 (99,2%)
(1 − 0,897) x 0,05 + 0,687 x (1 − 0,05) 0,6579

Observe que se a prevalência da doença na população for muito baixa, o


valor preditivo positivo também será baixo, mesmo que a sensibilidade e a
especificidade do teste sejam altas. Assim, ao escolher um teste de rastrea-
mento diagnóstico, o investigador deverá considerar os seguintes pontos:

• Quanto mais sensível for o teste diagnóstico, melhor será o seu valor pre-
ditivo negativo. Isto é, maior será a certeza de que um paciente com resul-
tado negativo não tenha a doença investigada;
• Quanto mais específico for o teste diagnóstico, melhor será o seu valor pre-
ditivo positivo. Isto é, maior será a certeza de que um paciente com resul-
tado positivo tenha a doença investigada;
• Para um mesmo teste diagnóstico, quanto maior for a prevalência da do-
ença na população estudada, maior será o valor preditivo positivo e menor
será o valor preditivo negativo do teste.

16.4 RAZÃO DE PROBABILIDADES


(VEROSSIMILHANÇA)

Também chamada de razão de verossimilhança3, a razão de probabili-


dades (likelihood ratio) constitui um método alternativo para avaliar um
teste diagnóstico. O método expressa a razão entre a probabilidade de que um
determinado resultado de um exame ocorra nos pacientes com a doença e a
probabilidade do mesmo resultado nos pacientes sem a doença. Assim, com

3. Verossimilhança - Qualidade ou caráter de verossímil. Semelhante à verdade; que parece


verdadeiro (Dicionário Aurélio).

Testes de Rastreamento Diagnóstico 157

BIOESTATISTICA_VOL02.indb 157 25/06/12 17:21


base neste raciocínio, os exames positivos e negativos têm razões de probabili-
dades diferentes, as quais serão demonstradas a seguir:

Razão de Probabilidade Positiva (RV+)


Refere-se à razão entre probabilidade de um teste ser positivo nos
pacientes com a doença (sensibilidade) e a probabilidade do mesmo teste
ser positivo nos pacientes sem a doença (falsos-positivos). A RV+ expressa
quantas vezes é mais provável encontrar um resultado positivo em pessoas
doentes quando comparado com pessoas não doentes. É calculada pela
seguinte fórmula:

S 0,897
RV + = , onde, para o exemplo dado: RV + = = 2,86
1−E 1 − 0,687

Razão de Probabilidade Negativa (RV-)


Refere-se à razão entre a probabilidade de um teste ser negativo nos
pacientes com a doença (falsos-negativos) e a probabilidade do mesmo teste
ser negativo nos pacientes sem a doença (especificidade). A RV- expressa
quantas vezes é mais provável encontrar um resultado negativo em pessoas
doentes quando comparado com pessoas não doentes. É calculada pela
seguinte fórmula:

1−S 1 − 0,8
897
RV − = , onde, para o exemplo dado: RV − = = 0,15
E 0,687

Observando-se o resultado obtido para RV+, pode-se concluir que a chance


do teste positivo ser verdadeiro é 2,8 vezes maior que a chance de ser falso.
Isto é, que a chance de se encontrar um resultado positivo entre os pacientes
doentes (verdadeiros-positivos) é 2,8 vezes maior que a chance de se encontrar
um resultado positivo entre os pacientes não doentes. Neste caso, um resultado
positivo terá apenas uma chance muito pequena para discriminar uma paciente
grávida de uma não grávida.
Do mesmo modo, o resultado de RV- indica que a chance do teste
negativo ser falso é 0,15 (15:100) vezes maior que a chance de ser

158 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 158 25/06/12 17:21


verdadeiro. Isto é, que a chance de se encontrar um resultado negativo
entre os pacientes doentes é 0,15 vezes maior que a de se encontrar um
resultado positivo entre os pacientes não doentes. Em outras palavras:
a chance do teste negativo ser verdadeiro é 6,66 (100:15) vezes maior
do que a de ser falso. No caso em questão, um resultado negativo para o
teste irá discriminar, de forma bastante segura, as mulheres não grávidas
das grávidas.
Note que a razão de probabilidade pode ser utilizada a fim de comparar
diferentes pontos de corte para um teste de rastreamento diagnóstico, e definir,
a partir dos resultados encontrados, qual aquele que melhor discrimina os
pacientes doentes dos não doentes em uma população.

16.5 COMBINAÇÃO DE MÚLTIPLOS TESTES


DIAGNÓSTICOS

No dia-a-dia dos consultórios, o médico, frequentemente, é levado a


solicitar mais de um teste diagnóstico para identificar, com segurança, uma
determinada doença. Esta opção por múltiplos testes é decorrente do fato de
que, na prática, não existe um único teste perfeito, com 100% de sensibilidade
e especificidade, ou, se existe, este é muito dispendioso ou oferece grande
risco e/ou muito desconforto ao paciente. Nestas circunstâncias, a opção
mais frequente é a utilização de testes mais simples que, quando combinados,
aumentam a acurácia e a precisão diagnóstica, diminuindo a ocorrência de
resultados falso-positivos ou falso-negativos.
Desta forma, quando os resultados dos testes solicitados são coinci-
dentes, isto é, todos positivos ou negativos, o processo de decisão diagnóstica
quanto à presença ou ausência da doença investigada é muito fácil. Contudo,
quando os resultados são discordantes, o método requer um critério mais
apurado para o processo de decisão, devendo o profissional lançar mão de
um conjunto de probabilidades associadas a cada um dos testes solicitados.
Assim, ao optar por associar os resultados de múltiplos testes, o médico deverá
decidir como solicitá-los, se todos ao mesmo tempo (testes em paralelo) ou
de forma sequencial (testes em série), com a escolha por um ou por outro

Testes de Rastreamento Diagnóstico 159

BIOESTATISTICA_VOL02.indb 159 25/06/12 17:21


método recaindo sobre aquela mais apropriada para a situação em análise.
Como a forma mais simples é combinar os resultados de dois testes, é impor-
tante saber que, no caso de testes em paralelo, considera-se o resultado da
combinação como positiva (evidência da doença) se um dos dois testes solici-
tados é positivo. Por outro lado, no caso de testes em série, o resultado da
combinação é considerado positivo se os dois testes forem positivos quando
individualmente analisados. O mesmo raciocínio é aplicado para o caso de
mais de dois testes.
A seguir, será demonstrada a combinação de dois testes, em paralelo e em
série, os quais serão chamados de teste A e teste B. As fórmulas serão apresen-
tadas conforme o quadro de notação mostrado abaixo:

Teste em paralelo Teste em série

TP+ - Teste em paralelo positivo. TS+ - Teste em série positivo.


A+ - Resultado positivo para o teste A A+ - Resultado positivo para o teste A
B+ - Resultado positivo para o teste B B+ - Resultado positivo para o teste B
SP - Sensibilidade combinada em paralelo SS - Sensibilidade combinada em série

SA - Sensibilidade para o teste A SA - Sensibilidade para o teste A

SB - Sensibilidade para o teste B SB - Sensibilidade para o teste B

EP - Especificidade combinada em paralelo ES - Especificidade combinada em série

EA - Especificidade para o teste A EA - Especificidade para o teste A

EB - Especificidade para o teste B EB - Especificidade para o teste B

O exemplo a seguir será utilizado para ilustrar os cálculos.

Exemplo: Suponha, agora, que o mesmo laboratório queira verificar qual a


melhor associação, se em paralelo ou em série, entre os resultados obtidos para
o diagnóstico da gravidez com o uso do teste rápido (teste A) e os resultados
obtidos pela dosagem da gonadotrofina coriônica humana no sangue (teste
B). O diagnóstico definitivo de gravidez foi feito pela presença de batimentos
cardíacos fetais constatados na quinta semana da provável gestação (padrão
ouro). Os resultados estão expressos a seguir.

160 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 160 25/06/12 17:21


Teste A: SA = 89,7% e EA = 68,7%
Teste B: SB = 96,8% e EB = 92,4%

16.5.1 Testes em paralelo


A associação de testes em paralelo deve ser utilizada pelo médico quando
a situação requer um diagnóstico rápido, como, por exemplo, nos casos de
urgência ou emergência, ou em outra situação, como para pacientes com difícil
acesso ao atendimento. Neste caso, a interação entre os testes A e B pode ser
representada da seguinte maneira:

TP + = A+ ∪ B +

Sensibilidade Combinada (SP)


Admitindo-se que os resultados dos dois testes são conhecidos, a sensi-
bilidade combinada em paralelo pode ser calculada pela aplicação das regras
para o cálculo de probabilidades para a união de dois eventos independentes.
A fórmula é a seguinte:

SP = S A + SB − (S A × SB )

SP = 0,897 + 0, 968 − (0,897 × 0,968)

SP = 0, 997 (99,7%)

Especificidade Combinada (EP)


Admitindo que o resultado negativo do teste em paralelo somente será
considerado se ambos os testes apresentarem resultados negativos, a especifi-
cidade combinada pode ser calculada, utilizando-se as regras para o cálculo da
probabilidade condicional. A fórmula é a seguinte:

EP = E A × EB

E P = 0,687 × 0, 924

E P = 0,635 (63,5%)

Testes de Rastreamento Diagnóstico 161

BIOESTATISTICA_VOL02.indb 161 25/06/12 17:21


Valores Preditivos
A partir da sensibilidade e da especificidade combinadas, os valores
preditivos positivo (VPPP) e negativo (VPNP) para o teste em paralelo podem
ser calculados. Para tal, utiliza-se a prevalência da doença na população em
estudo. No caso em questão, P = 5%. As fórmulas e os respectivos cálculos são
mostrados a seguir.

SP × P
VPPP =
(SP × P ) + (1 − E P ) × (1 − P )

0, 997 × 0,05
VPPP =
(0, 997 × 0,05) + (1 − 0,635) × (1 − 0,05)

0,0499
VPPP = = 0,126 (12,6%)
0,3967

E P × (1 − P )
VPN P =
(1 − SP ) × P + E P × (1 − P )

0,635 × (1 − 0,05)
VPN P =
(1 − 0, 997) × 0,05 + 0,635 × (1 − 0,05)

0,6033
VPN P = = 0, 999 (99,9%)
0,6034

Os valores da sensibilidade e da especificidade para cada um dos testes A


e B, individualmente e combinados em paralelo, assim como os resultados dos
valores preditivos (VPP e VPN), para uma prevalência de 5%, são mostrados na
Tabela 16.4, a seguir.

162 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 162 25/06/12 17:21


Tabela 16.4 – Sensibilidade, Especificidade e Valores Preditivos Positivo e Negativo
para os testes A e B, individuais e combinados em paralelo

Testes S (%) E (%) VPP (%) VPN (%)


Teste A 89,7 68,7 13,1 99,2
Teste B 96,8 92,4 40,9 99,9
Teste A U B 99,7 63,5 12,6 99,8

Observando-se os valores da Tabela 16.4, pode-se constatar que para uma


mesma prevalência, o uso dos testes em paralelo aumentou a sensibilidade e
o valor preditivo negativo, enquanto que a especificidade e o valor preditivo
positivo diminuíram.

16.5.2 Testes em série


A associação de testes em série deve ser utilizada pelo médico quando a
situação não requer um diagnóstico rápido, de urgência, como nos casos de
pacientes ambulatoriais que podem ser acompanhados por um tempo mais
prolongado, ou naqueles internados para investigação diagnóstica. Também
pode ser utilizada nos casos em que os exames são muito dispendiosos ou
oferecem risco ao paciente. Neste caso, o médico deve inicialmente optar por
exames mais seguros e de baixo custo, ficando a solicitação dos exames de
maior risco ou mais caros somente quando ele necessite confirmar a presença
da doença, caso o primeiro exame seja sugestivo. Assim, como regra geral, o
segundo exame somente será solicitado se o primeiro apresentar um resultado
positivo, pois se for negativo, não é justificada a realização do segundo exame.
Lembre-se que o teste em série somente será considerado positivo se o segundo
teste também for positivo. A interação entre os testes A e B pode ser repre-
sentada da seguinte maneira:

TS + = A+ ∩ B +

Sensibilidade Combinada (SS)


Admitindo-se que os resultados dos dois testes são conhecidos, a sensi-
bilidade combinada em série pode ser calculada pela aplicação das regras do

Testes de Rastreamento Diagnóstico 163

BIOESTATISTICA_VOL02.indb 163 25/06/12 17:21


cálculo de probabilidades para a interseção de dois eventos independentes. A
fórmula é a seguinte:

SS = S A × SB

SS = 0,897 × 0, 968

SS = 0,868 (86,8%)

Especificidade Combinada (ES)


Considerando-se as regras para o cálculo da probabilidade condicional, a
especificidade combinada pode ser calculada pela seguinte fórmula:

E S = E A + E B − (E A × E B )

E S = 0,687 + 0, 924 − (0,687 × 0, 924))

E S = 0, 976 (97,6%)

Valores Preditivos
A partir da sensibilidade e da especificidade combinadas, os valores
preditivos positivo (VPPS) e negativo (VPNS) para o teste em série podem
ser calculados. Para tal, utiliza-se a prevalência da doença na população em
estudo. No caso em questão, P = 5%. As fórmulas e os respectivos cálculos são
mostrados a seguir.

SS × P
VPPS =
(SS × P ) + (1 − E S ) × (1 − P )

0,868 × 0,05
VPPS =
(0,868 × 0,05) + (1 − 0, 976) × (1 − 0,05)

0,0434
VPPS = = 0,678 (67,8%)
0,0640

164 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 164 25/06/12 17:21


E S × (1 − P )
VPN S =
(1 − SS ) × P + E S × (1 − P )

0, 976 × (1 − 0,05)
VPN S =
(1 − 0,868) × 0,05 + 0, 976 × (1 − 0,05)

0, 9272
VPN S = = 0, 993 (99,3%)
0, 9335

Os valores da sensibilidade e da especificidade para cada um dos testes


A e B, individualmente e combinados em série, assim como os resultados dos
valores preditivos (VPP e VPN), para uma prevalência de 5%, são mostrados na
Tabela 16.5, abaixo.

Tabela 16.5 – Sensibilidade, Especificidade e Valores Preditivos Positivo e Negativo para os


testes A e B, individuais e combinados em série

Testes S (%) E (%) VPP (%) VPN (%)


Teste A 89,7 68,7 13,1 99,2
Teste B 96,8 92,4 40,9 99,9
Teste A ∩ B 86,8 97,6 67,8 99,3

Comparando-se os valores da Tabela 16.5, pode-se constatar que para


uma mesma prevalência, o uso dos testes em série aumentou a especificidade
combinada e o valor preditivo positivo, enquanto que a sensibilidade e o valor
preditivo negativo diminuíram.
Visto que a combinação de dois ou mais testes diagnósticos é uma conduta
frequentemente adotada, o médico, ao solicitar os exames, deverá observar os
seguintes pontos:

• A combinação em paralelo melhora a sensibilidade diagnóstica, mas a sua


especificidade é menor que a dos testes quando analisados isoladamente;
• A combinação em série apresenta alta especificidade, ao passo que a sensi-
bilidade é relativamente baixa quando comparada com a dos testes isolados;

Testes de Rastreamento Diagnóstico 165

BIOESTATISTICA_VOL02.indb 165 25/06/12 17:21


• Os valores preditivos negativos são bastante elevados, tanto para os tes-
tes isolados quanto para as formas combinadas em paralelo e em série,
enquanto que os valores preditivos positivos não são tão altos, com a com-
binação em série, apresentando melhor resultado quando comparada à
combinação em paralelo;
• Para o cálculo da sensibilidade e da especificidade, tanto para a combi-
nação em paralelo quanto em série, pressupõe-se que os testes sejam
independentes entre si, pois, caso contrário, os valores combinados da
sensibilidade e da especificidade tenderão a superestimar o verdadeiro
valor do parâmetro.

16.6 TEOREMA DE BAYES

Como citado anteriormente, todas as vezes que o médico recebe o resultado


de um exame diagnóstico, ele se depara com duas importantes questões as
quais devem ser bem definidas: se o resultado for positivo, qual a probabi-
lidade de que o paciente tenha a doença? Ou, se o resultado for negativo, qual a
probabilidade de que esse paciente não tenha a doença? Um método alternativo
para responder tais questões envolve a utilização de uma fórmula matemática
conhecida como teorema de Bayes4, um corolário5 do teorema da probabilidade
total que permite calcular o valor preditivo positivo de um teste diagnóstico, ou
a chance de que um paciente com resultado positivo tenha, de fato, a doença. A
fórmula do teorema de Bayes é a seguinte:

P(T + | D + )P(D + )
P(D + |T + ) =
P (T + | D + )P (D + ) + P (T + | D − )P(D − )
   

Onde: P = Probabilidade que um determinado evento aconteça.

4. Thomas Bayes (1702-1761) - Matemático inglês e pastor presbiteriano, conhecido por ter
formulado o caso especial do teorema de Bayes, o qual deu origem à estatística bayesiana.
5. Proposição que imediatamente se deduz de outra que pode ser demonstrada a partir de um
teorema, o qual é uma afirmação que pode ser provada.

166 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 166 25/06/12 17:21


P(D+|T+) = Probabilidade que a doença esteja presente, sendo o
teste positivo.
D+ - O paciente tem a doença.
D- - O paciente não tem a doença.
T+ - Teste diagnóstico positivo para a doença.
T- - Teste diagnóstico negativo para a doença.

A referida fórmula, na verdade, refere-se àquela utilizada para calcular


o valor preditivo positivo, citada anteriormente. Ou seja, ela mostra a proba-
bilidade da ocorrência da doença, na presença de um teste positivo. Observe
que as duas probabilidades expressas no numerador da equação do teorema
de Bayes correspondem, respectivamente, à probabilidade de que o exame
seja positivo, considerando que a doença está presente (sensibilidade); e
a probabilidade anterior de que o paciente tenha a doença (prevalência).
Essas duas probabilidades, em conjunto, descrevem os resultados verda-
deiro-positivos para o teste.
Já o denominador da equação expressa duas probabilidades: a primeira,
que é igual ao numerador, descreve os resultados verdadeiro-positivos (sensi-
bilidade x prevalência), enquanto que a segunda representa a probabilidade
do teste ser positivo, tendo em vista que a doença está ausente, multiplicado
pela probabilidade de que a doença não esteja presente. Nessa segunda parte
do denominador, o primeiro termo representa a taxa de erro falso-positivo,
enquanto o segundo representa 1 menos a probabilidade de que a doença
esteja presente (1 - prevalência). Assim, podemos reescrever o teorema de
Bayes considerando a sensibilidade e especificidade para o teste em questão,
tornando-o mais compreensível ao leitor, tal como mostrado a seguir:

(Sensibilidade)(Prevalência)
P(D + |T + ) =
(Sensibilid
dade )(Prevalência)  + (Taxa de erro falso-positivo)(1− Prevalência)
   

Portanto, como foi relatado anteriormente, se a prevalência da doença na


população for muito baixa, o valor preditivo positivo também será baixo, mesmo
que a sensibilidade e a especificidade do teste sejam altas. Neste caso, a maioria
dos resultados positivos encontrados para a doença em questão podem ser

Testes de Rastreamento Diagnóstico 167

BIOESTATISTICA_VOL02.indb 167 25/06/12 17:21


falso-positivos. Embora isto não invalide o programa de rastreamento, outras
providências podem ser tomadas no sentido de ajustar a sensibilidade e a especi-
ficidade para o teste, de maneira que melhore o valor preditivo positivo e diminua
a taxa de erro falso-positivo. Esta melhora pode ser conseguida pela aplicação do
teorema de Bayes em diferentes pontos de corte para o teste utilizado.
Assim, suponha que um programa de rastreamento foi implantado para
detectar uma determinada doença cuja prevalência na população é igual a 5%.
O teste diagnóstico empregado apresenta uma sensibilidade de 89,7% e uma
especificidade de 68,7%, com uma taxa de erro falso-positivo igual a 31,3%.
Se a sensibilidade e a especificidade do teste em questão e a prevalência da
doença na população são conhecidas, o teorema de Bayes pode ser utilizado
para predizer que proporção de pessoas com resultado positivo para o teste
está realmente doente.
Dados: S = 89,7%; P = 0,05%; EFP = 31,3

(0,897)(0,05)
P(D + |T + ) =
(0,897)(0,05) + (0,313)(1 − 0,05)
   

0,0449
P (D + |T + ) = = 0,131 (13,1%
%)
0,3423

Portanto, se o teste empregado tem uma sensibilidade de 89,7% e uma


especificidade de 68,7%, e se a prevalência da doença na população estudada
é igual a 5%, pode-se prever que, apenas 13,1% das pessoas com teste positivo
estão realmente doentes.
Observe que uma fórmula para o teorema de Bayes, semelhante à primeira,
pode ser utilizada para prever o valor de um resultado negativo. A fórmula é a
seguinte:

P(T − | D − )(P(D − )
P(D − |T − ) =
P (T − | D − )(P (D − ) + P (T − | D + )(P(D + )
   

Quando escrita em termos de sensibilidade, especificidade e prevalência,


assume a seguinte forma:

168 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 168 25/06/12 17:21


(Especificidade)(1 − Prevalência)
P(D − |T − ) =
(Especificidade)(1 − Prevalência) + (Taxa de erro falso-negativo)(Prevalência)
   

De qualquer forma, ao solicitar um teste de rastreamento diagnóstico, o


médico deve sempre atentar para três pontos que são muito importantes:

• Para excluir a possibilidade de uma determinada doença, ele precisa da


certeza de que um resultado negativo para o teste é, de fato, negativo, isto
é, que o resultado não seja um falso-negativo. Para tal decisão, a escolha de
um teste de alta sensibilidade é a melhor opção, pois o aumento da sensi-
bilidade reduz o número de falso-negativos e ajuda a excluir a doença se o
resultado do teste for negativo;
• Para detectar a presença de uma doença, ele precisa da certeza de que um
resultado positivo para o teste é, de fato, positivo, isto é, que o resultado
não seja um falso-positivo. Para tal decisão, a escolha deverá recair sobre
um teste de alta especificidade, pois o aumento da especificidade reduz o
número de falso-positivos e ajuda a detectar a doença se o resultado for
positivo;
• Para confirmar o diagnóstico, o médico precisa conhecer a importância da
prevalência da doença (probabilidade anterior). Se a prevalência for ex-
tremamente baixa, um resultado positivo tem pouco significado e deve ser
seguido de um exame de alta especificidade, ao passo que a importância
de um resultado negativo dependerá da sensibilidade do exame solicitado.

Testes de Rastreamento Diagnóstico 169

BIOESTATISTICA_VOL02.indb 169 25/06/12 17:21


BIOESTATISTICA_VOL02.indb 170 25/06/12 17:21
17
Testes para Variáveis Ordinais

Como citado nos capítulos anteriores, as técnicas estatísticas classicamente


utilizadas para a estimação de parâmetros e testes de hipóteses compreendem
os chamados testes paramétricos, cujos modelos mais utilizados são o teste
t de Student e a análise de variância (ANOVA), os quais pressupõem que a
variável estudada seja medida numa escala dimensional contínua e apresente,
a princípio, uma distribuição normal e variâncias iguais (homocedasticidade)
entre os grupos estudados. Porém, na prática, em muitas pesquisas os dados
não obedecem a estes princípios, pois se apresentam distribuídos em uma
escala ordinal de valores ou sem nenhuma distribuição previsível, violando,
portanto, os pressupostos básicos necessários para a utilização de um teste
paramétrico. Nestes casos, a opção é pela utilização de testes não-paramé-
tricos, os quais não exigem a estimação da variância, da média populacional
ou da distribuição da variável estudada, além de outros pré-requisitos, embora
apresentem menor robustez quando comparados aos testes paramétricos.
Assim, em razão de sua pouca exigência, estes testes são chamados de testes
de distribuição livre, entre os quais se destaca o teste do qui-quadrado, o qual
já foi abordado no capítulo 14 deste livro. Aqui, neste capítulo, serão discutidos
outros testes não-paramétricos bivariados para dados ordinais, os quais serão
descritos a seguir.

BIOESTATISTICA_VOL02.indb 171 25/06/12 17:21


17.1 TESTE U DE WILCOXON-MANN-WHITNEY
(WMW)

Também chamado de teste da soma de postos (Wilcoxon rank-sum


test), na estatística inferencial o teste U de Wilcoxon-Mann-Whitney é um
dos mais conhecidos entre todos os testes de significância não-paramé-
tricos, sendo utilizado para comparar se duas amostras independentes e
de tamanhos iguais provêm de uma mesma população. O teste foi inicial-
mente proposto por Frank Wilcoxon1, em 1945, como uma alternativa para
o teste t de Student para amostras independentes. Posteriormente, foi
aperfeiçoado por H. B. Mann 2 e D. R. Whitney, daí a origem do nome e a sigla
WMW, que o generalizaram para que pudesse ser aplicado em amostras de
tamanhos diferentes,
Para que o teste possa ser utilizado, é necessário que as duas amostras
sejam aleatórias e as observações independentes, tanto dentro de cada
amostra como entre as amostras estudadas, ao mesmo tempo em que a
variável considerada seja mensurada em escala ordinal, isto é, que seja
apresentada do menor para o maior valor. Para tal, é necessário que cada
valor da mostra corresponda a um posto (escore ou rank), o qual deve ser
representado por um número natural que indicará sua posição no conjunto
de dados amostrais, quando ordenados. Assim, o menor valor da amostra
receberá o posto de número 1, e assim sucessivamente, até que o maior valor
receba o posto de maior número. Quando ocorre a presença de valores iguais
na amostra, considera-se a média dos postos que seriam ocupados por eles,
de tal modo que não afete o posto seguinte. Tome-se, como exemplo, um
conjunto de seis valores já ordenados: {9; 15; 17; 17; 21; 23}. Os respectivos
postos serão: {1; 2; 3,5; 3,5; 5; 6}.

1 Frank Wilcoxon (1892-1965) – Químico e estatístico irlandês que publicou mais de 70 trabalhos,
dos quais o mais conhecido descreve dois novos testes estatísticos: o teste da soma de Wilcoxon
e o teste de Wilcoxon.
2 Henry Berthold Mann (1905-2000) – Renomado matemático austríaco responsável por
significativas contribuições no campo da álgebra, da teoria dos números e da estatística,
particularmente na análise de variância.

172 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 172 25/06/12 17:21


Raciocínio do teste
Para ilustrar o raciocínio, consideremos a comparação entre duas amostras,
A e B. Se os valores para os indivíduos da amostra A forem, em geral, menores
que os valores para os indivíduos da amostra B, quando se ordenam, do menor
para o maior, todos os valores das duas amostras consideradas conjuntamente,
os postos ocupados pelos indivíduos da amostra A serão, em geral, menores do
que os postos ocupados pelos indivíduos da amostra B. Como consequência,
o posto médio (mediana) da amostra A será menor do que o posto médio
(mediana) da amostra B. Neste caso, se a diferença encontrada for grande o
suficiente para que possa ser explicada além do que se esperaria encontrar
somente pelo acaso, a diferença entre os dois postos médios é dita estatistica-
mente significativa, o que indica que a população A é diferente da população B.
O teste envolve o cálculo de um valor estatístico, usualmente chamado de
valor U, cuja distribuição é testada contra a hipótese de nulidade. No caso de
pequenas amostras, isto é, nenhuma delas maior do que 20 indivíduos, a distri-
buição pode ser tabulada, mas para grandes amostras, das quais ao menos uma
delas é maior que 20, existe uma boa aproximação com a distribuição normal.
Assim, importa saber que os procedimentos para a utilização do teste U de
Wilcoxon-Mann-Whitney diferem de acordo com o tamanho amostral, todos
facilmente calculados. Os procedimentos serão mostrados a seguir:

• Inicialmente, denomina-se a amostra menor como amostra 1 e a maior


como amostra 2;
• Determinam-se os tamanhos amostrais, os quais são designados por n1 e n2;
• A seguir, ordenam-se, do menor para o maior, os valores das duas amostras
e anota-se, ao lado de cada valor, o número de ordem (ou posto) correspon-
dente. Não esqueça que quando houver empate, o posto para cada valor
empatado corresponde à média dos postos que seriam ocupados por eles;
• Obtêm-se os valores para R1 e R2 que correspondem às somas dos postos
para as amostras 1 e 2, respectivamente. Se a ordenação estiver correta,
teremos:

N (N + 1)
R1 + R2 = ; para N = n1 + n2
2

Testes Para Variáveis Ordinais 173

BIOESTATISTICA_VOL02.indb 173 25/06/12 17:21


• Em seguida, calculam-se os valores de U1 e U2 conforme mostrado abaixo.
Para o teste de hipótese, o menor destes dois valores será denominado
como U calculado (Ucalc), o qual será comparado ao valor crítico U tabelado
( U a;n ;n ), encontrado na tabela de valores críticos da distribuição U de
1 2
Mann-Whitney (ver tabelas dos valores críticos no final deste livro).

n1 (n1 + 1)
U 1 = n1n2 + − R1
2

n2(n2 + 1)
U 2 = n1n2 + − R2 ou U 2 = n1n2 −U 1
2

• Finalmente, o teste de hipótese é realizado conforme mostrado abaixo:


H0: as duas populações não diferem entre si quanto à locação;
HA: as duas populações diferem entre si quanto à locação.

Para demonstrar a aplicação do teste de WMW, utilizaremos o seguinte exemplo:

Exemplo: A Escala de coma de Glasgow (ECG) é uma escala neurológica


que constitui um método confiável para avaliar o nível de consciência de uma
pessoa, após um traumatismo craniencefálico. Ela compreende três testes que
avaliam a abertura ocular, a resposta verbal e a melhor resposta motora, cujos
escores obtidos variam de três a 15 pontos. Quanto menor o escore, mais grave
é o comprometimento da função cerebral. Um pesquisador, que queria verificar
se o uso de capacete diminui a gravidade da lesão craniana em motociclistas
acidentados, comparou os escores obtidos em dois grupos de pacientes, com e
sem uso de capacete. Os escores (já ordenados) são apresentados nas tabelas
17.1 e 17.2, abaixo.

Tabela 17.1 – Ordem, escore da escala de coma de Glasgow e posto de cada um dos 18
pacientes do estudo
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

Escore 5 6 6 7 7 8 8 8 8 9 9 10 10 11 12 13 14 14

Posto 1 2,5 4,5 7,5 10,5 12,5 14 15 16 17,5

174 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 174 25/06/12 17:21


Tabela 17.2 – Ordem, escore da escala de coma de Glasgow e posto de 10 pacientes com uso
de capacete e 8 pacientes sem uso de capacete
Pacientes com capacete Pacientes sem capacete
Paciente Escore Posto Paciente Escore Posto
5 7 4,5 1 5 1
6 8 7,5 2 6 2,5
7 8 7,5 3 6 2,5
11 9 10,5 4 7 4,5
13 10 12,5 8 8 7,5
14 11 14 9 8 7,5
15 12 15 10 9 10,5
16 13 16 12 10 12,5
17 14 17,5
18 14 17,5
n2 = 10 md = 10,5 R2 = 122,5 n1 = 8 md = 7,5 R1 = 48,5

Uma vez que não existe um padrão de distribuição para a escala de coma de
Glasgow na população estudada, e o número de indivíduos nas duas amostras
é pequeno, a melhor maneira de compará-las é utilizar um teste não-paramé-
trico. Neste caso, o teste WMW é o mais adequado, pois as duas amostras são
independentes e a variável estudada é do tipo ordinal.

WMW para pequenas amostras (n ≤ 20)


• Passo 1 – Formular as hipóteses estatísticas:
H 0 :U 1 = U 2 (As duas populações não diferem entre si quanto aos escores
da escala de coma de Glasgow, com e sem uso do capacete).
H A :U 1 ≠ U 2 (As duas populações diferem entre si quanto aos escores da
escala de coma de Glasgow, com e sem uso do capacete).
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%)
• Passo 3 – Calcular os valores para U1 e U2:
8(8 + 1) 10 + 1)
10(1
U 1 = 8 × 10 + − 48,5 = 67,5 e U 2 = 8 × 10 + − 122,5 = 12,5
2 2

Testes Para Variáveis Ordinais 175

BIOESTATISTICA_VOL02.indb 175 25/06/12 17:21


N (N + 1)  18(18 + 1) 
Sendo R1 + R2 = ; então (48,5 + 122,5) = 171 =  
2  2 

A ordenação está correta.

Como U calc = mín{U 1 ;U 2 }; tem-se que: U calc = 12,5

• Passo 4 – Determinar o valor crítico do teste:


U α;n = U 0,05;8;10 = 17
1 ;n2

• Passo 5 – Regra de decisão:

Se Ucalc ≤ U 0,05;8;10 , rejeita-se H 0 .

Se U calc > U 0,05;8;10 , aceita-se H 0 .

Como U calc = 12,5 < U 0,05;8;10 = 17, rejeita-se H 0 .

• Passo 6 – Conclusão:
Como o valor para U calc é menor que o valor crítico tabelado U 0,05;8;10 ,
rejeita-se H0 e conclui-se que os escores da escala de coma de Glasgow
observados para os pacientes que usavam capacete são significativa-
mente maiores que escores dos pacientes que não usavam capacete.
Portanto, o uso do capacete diminuiu a gravidade da lesão, pois
U calc = 12,5; P = 0,0145 .

WMW para grandes amostras (n > 20)


Quando a maior das duas amostras apresenta mais de 20 observações
(n2 > 20), a estatística U aproxima-se da distribuição normal gaussiana, cuja
significância estatística é verificada na tabela dos valores críticos da distri-
buição z. O valor de zcalc é dado por:

U − µU
zcalc = , onde:
σU

176 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 176 25/06/12 17:21


onde: µ
 U- Média de U. Tanto U1 como U2 podem ser utilizados para o
cálculo de zcalc.
aU - Desvio padrão de U.

n1n2 n1n2(n1 + n2 + 1)
Sendo µU = e σU = , então:
2 12

n1n2
U−
então: zcalc = 2
n1n2(n1 + n2 + 1)
12

Assim, supondo-se n > 20 para o exemplo mostrado na Tabela 17.2, temos:

• Passo 1 – Formular as hipóteses estatísticas:


H 0 :U 1 = U 2 (As duas populações não diferem entre si quanto aos escores
da escala de coma de Glasgow, com e sem uso do capacete).
H A :U 1 ≠ U 2 (As duas populações diferem entre si quanto aos escores da
escala de coma de Glasgow, com e sem uso do capacete).
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%)
• Passo 3 – Determinar o valor crítico do teste:
z 0,05 = 1, 96
• Passo 4 – Calcular o valor do teste:
n1n2
U−
2 12,5 − 40 196
zcalc = = = = −2, 44
n1n2(n1 + n2 + 1) 11,25 39
12

• Passo 5 – Regra de decisão:

Se |zcalc | < z0,05 , aceita-se H 0 .

Se |zcalc | ≥ z 0,05 , rejeita-se H 0 .

Como |zcalc |= 2,44 > z 0,05 = 1, 96, rejeita-se H 0 .


Testes Para Variáveis Ordinais 177

BIOESTATISTICA_VOL02.indb 177 25/06/12 17:22


Se |zcalc | < z0,05 , aceita-se H 0 .

Se |zcalc | ≥ z 0,05 , rejeita-se H 0 .

Como |zcalc |= 2,44 > z 0,05 = 1, 96, rejeita-se H 0 .

• Passo 6 – Conclusão:
Como o valor para zcalc é maior que o valor crítico tabelado z 0,05 , rejeita-
-se H0 e conclui-se que os escores da escala de coma de Glasgow observados
para os pacientes que usavam capacete são significativamente maiores do que
os escores dos pacientes que não usavam capacete. Portanto, o uso do capacete
diminuiu a gravidade da lesão, pois zcalc = 2, 44; P = 0,0145 .

Quando n2 > 20 e ocorrerem empates, o denominador de zcalc deve ser


substituído por:

 nn   N 3 − N − CE 
σU =  1 2   , onde: CE = ∑(t 3 − t )
 N2 −N  12 
  

Sendo t o número de observações empatadas em cada posto. Por exemplo:


se hover dois empates com o posto 2,5 e outros quatro empates com o posto
7,5, o cálculo para CE será:

CE = (23 − 2) + (43 − 4) = 66

17.2 TESTE T DE WILCOXON

É um teste de hipótese não-paramétrico utilizado para amostras pareadas,


isto é, para comparar dois tratamentos em duas amostras relacionadas
(amostras pareadas) ou para comparar os resultados de uma mesma medida
quando esta é repetida em uma mesma amostra (teste pareado). Este teste
pode ser usado como uma alternativa ao teste t de Student pareado quando
a população estudada não assume o padrão da distribuição normal gaussiana,
sendo a variável medida em uma escala intervalar ou ordinal.

178 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 178 25/06/12 17:22


Tal como o teste WMW, a prova de Wilcoxon (signed-rank test) também
foi idealizada por Frank Wilcoxon em 1945 e tem como princípio ordenar os
postos das diferenças intrapares, com ênfase para a maior diferença, para a
qual se atribui o maior valor (posto), diminuindo-se este valor de acordo com
as menores diferenças encontradas. Para a utilização do teste, pressupõe-se que
as duas amostras sejam aleatórias e que as diferenças intrapares constituem
uma variável contínua, de distribuição simétrica em torno da mediana.

Raciocínio do teste
Para ilustrar o raciocínio, consideremos a comparação entre duas
amostras, A e B. Se o tratamento para A produz valores maiores que aqueles
encontrados para o tratamento B, as diferenças entre os pares de A e B (A – B),
de sinal positivo, serão em maior número e graus do que as diferenças de sinal
negativo. Caso ambos os tratamentos tenham o mesmo efeito, as diferenças
positivas e negativas devem se anular. Assim, se a diferença encontrada for
grande o suficiente para que possa ser explicada além do que se esperaria
encontrar somente pelo acaso, a diferença entre os dois postos médios é dita
estatisticamente significativa, o que indica que a população A é diferente da
população B.
O teste envolve o cálculo de um valor estatístico usualmente chamado
de valor T, cuja distribuição é testada contra a hipótese de nulidade. No caso
de pequenas amostras (n ≤ 25), o valor T deve ser comparado ao valor crítico
encontrado na tabela de valores críticos da distribuição T de Wilcoxon, que
consta no final deste livro, mas para grandes amostras (n > 25), a distribuição
da estatística T aproxima-se da distribuição normal gaussiana e o teste de
significância pode ser realizado, usando-se essa distribuição. Na prática, como
a tabela da distribuição T de Wilcoxon possui valores críticos para amostras
com até 100 diferenças intrapares, somente será necessário calcular o valor
z quando o tamanho amostral for superior a este número. Os procedimentos
serão mostrados a seguir:
• Inicialmente, calcula-se a diferença (d) em cada um dos pares, conser-
vando-se o sinal da diferença. As diferenças iguais a zero são desprezadas.
Assim, como se pressupõe que as diferenças constituem uma variável
contínua, poucos zeros devem aparecer nos cálculos dessas diferenças;

Testes Para Variáveis Ordinais 179

BIOESTATISTICA_VOL02.indb 179 25/06/12 17:22


• As diferenças restantes são designadas por n;
• A seguir, ordenam-se, do menor para o maior, os valores das diferenças,
ignorando-se o sinal. Não esqueça que, quando houver empate, o posto
para cada valor empatado corresponde à média dos postos que seriam
ocupados por eles. Se a ordenação estiver correta, teremos:

n(n + 1)
∑| postos | = 2

• Transfere-se o sinal da diferença ao posto correspondente e somam-se


os postos conforme o sinal seja positivo ou negativo. Denomina-se T+
à soma dos postos com sinal positivo e T– à soma dos postos com sinal
negativo. Para o teste de hipótese, o menor destes dois valores, em
valor absoluto, será denominado como T calculado (Tcalc), o qual será
comparado ao valor crítico T tabelado (T α;n), encontrado na tabela de
valores críticos da distribuição T de Wilcoxon (ver tabelas dos valores
críticos no final deste livro). Semelhante ao teste WMW, a hipótese nula
será rejeitada se T­calc ≤ Tα;n.
• Finalmente, o teste de hipótese é realizado conforme mostrado abaixo:
H0: as medidas antes e depois não diferem entre si;
HA: as medidas antes e depois diferem entre si.

Para demonstrar a aplicação do teste de T de Wilcoxon, utilizaremos o


seguinte exemplo:

Exemplo: Análise Sensorial é uma ciência que utiliza os sentidos humanos


para avaliar as características organolépticas de um alimento, constituindo
uma poderosa ferramenta frequentemente utilizada pelas indústrias alimen-
tícias para o desenvolvimento e otimização da qualidade de seus produtos.
Uma empresa realizou uma análise sensorial para comparar o sabor de duas
diferentes formulações para um determinado produto. Foram realizadas duas
análises para cada provador: a primeira, com a formulação normal; a segunda,
com a fórmula modificada. Os escores, medidos de zero a 10, estão apresen-
tados na Tabela 17.3, abaixo.

180 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 180 25/06/12 17:22


Tabela 17.3 - Ordem, escore e posto de 10 análises antes e após a modificação da formulação

Escores
Provador d=A–B Posto
Antes (A) Depois (B)

1 7,40 7,10 0,3 2,5


2 9,30 8,30 1,0 8
3 6,80 7,40 –0,6 –6
4 7,50 8,70 –1,2 –9
5 8,10 9,40 –1,3 –10
6 8,80 9,10 –0,3 –2,5
7 9,20 8,40 0,8 7
8 7,20 7,60 –0,4 –4,5
9 7,50 7,90 –0,4 –4,5
10 9,40 9,20 0,2 1

mdA = 8,45 mdB = 9,25 Σ = |55|

Teste t para pequenas amostras (n ≤ 25)

• Passo 1 – Formular as hipóteses estatísticas:


H0: os valores dos escores não diferem nas duas formulações;
HA: os valores dos escores são diferentes para as duas formulações.
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%)
• Passo 3 – Calcular os valores para T+ e T–:
T+ = +18,5 e T− = −36,5

n(n + 1) 10(10 + 1)
Sendo ∑| postos | = = = 55 , a ordenação está correta.
2 2

Como Tcalc = mín{TA ;TB }; tem-se que: Tcalc = | + 18,5 | = 18,5

• Passo 4 – Determinar o valor crítico do teste:


Tα ;n = T0,05;10 = 8

Testes Para Variáveis Ordinais 181

BIOESTATISTICA_VOL02.indb 181 25/06/12 17:22


• Passo 5 – Regra de decisão:
Se Tcalc ≤ T0,05;10 , rejeita - se H 0 .

Se Tcalc > T0,05;10 , aceita - se H 0 .

Como Tcalc = 18,5 > T0,05;10 = 8, aceita - se H 0 .

• Passo 6 – Conclusão:
Como o valor para Tcalc é maior que o valor crítico tabelado T0,05;10 , se
aceita H0 e conclui-se que os escores da análise sensorial relatados pelos
provadores para a formulação normal não diferiram dos escores relatados
para a formulação modificada. Portanto, as formulações do produto são
equivalentes quanto ao sabor, pois Tcalc = 18,5; P = 0,386 .

Teste t para grandes amostras (n > 25)


A fórmula utilizada para o teste T de Wilcoxon para grandes amostras é a
seguinte:

n(n + 1)
T−
4
zcalc = , onde: CE = ∑(t 3 − t )
CE
n(n + 1)(2n + 1) −
2
24

Sendo t o número de observações empatadas em cada posto. Por exemplo:


se hover dois empates com o posto 2,5 e outros quatro empates com o posto
7,5, o cálculo para CE será:

CE = (23 − 2) + (43 − 4) = 66

Assim, supondo-se n > 25 para o exemplo mostrado na Tabela 17.3, temos:


• Passo 1 – Formular as hipóteses estatísticas:
HO: os valores dos escores não diferem nas duas formulações;
HA: os valores dos escores são diferentes para as duas formulações.

182 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 182 25/06/12 17:22


• Passo 2 – Escolher o nível de significância (nível alfa):
a = 0, 05 (5%)
• Passo 3 – Determinar o valor crítico do teste:
z0,05 = 1,96
• Passo 4 – Calcular o valor do teste:

n(n + 1) 10(10 + 1)
T− 18,5 −
4 4 9, 0
zcalc = = = = 0, 918
CE 12 9, 8
n(n + 1)(2n + 1) − 10(10 + 1)(20 + 1) −
2 2
24 24

• Passo 5 – Regra de decisão:

Se |zcalc | < z0,05 , aceita-se H 0 .

Se |zcalc | ≥ z 0,05 , rejeita-se H 0 .

Como |zcalc |= 0,918 < z 0,05 = 1, 96, aceita-se H 0 .

• Passo 6 – Conclusão:
Como o valor para zcalc é menor que o valor crítico tabelado z 0,05 , acei-
ta-se H0 e conclui-se que os escores da análise sensorial relatados pelos
provadores para a formulação normal não diferiram dos escores relatados
para a formulação modificada. Portanto, as formulações do produto são
equivalentes quanto ao sabor, pois zcalc = 0, 918; P = 0,386 .

17.3 COEFICIENTE DE CORRELAÇÃO DE


SPEARMAN (TESTE rho)

Também chamado de coeficiente de correlação de postos de Spearman,


o teste foi inicialmente idealizado por Charles Spearman3, em 1904, e constitui

3 Charles Edward Spearman (1863-1945) - Psicólogo inglês conhecido pelo seu trabalho na área
da estatística, como um pioneiro da análise fatorial e pelo coeficiente de correlação de postos
de Spearman.

Testes Para Variáveis Ordinais 183

BIOESTATISTICA_VOL02.indb 183 25/06/12 17:22


uma alternativa para o teste do coeficiente produto-momento de Pearson
quando este apresenta variáveis que não satisfazem as condições exigidas para
o teste, tais como a homocedasticidade e a distribuição normal.
No teste rho, para que as variáveis possam ser ordenadas, é necessário que
sejam medidas em escala ordinal e, tal como no teste de Pearson, o coeficiente
de Spearman (rs) varia de +1, que indica uma correlação perfeita positiva, a –1,
uma correlação perfeita negativa. O valor 0 indica ausência de correlação. A
interpretação é semelhante ao teste de Pearson.

Raciocínio para o teste


Para calcular o valor rs, é necessário que as duas variáveis supostamente
correlacionadas tenham sido medidas para cada um dos indivíduos da amostra.
Deste modo, cada indivíduo terá um par ordenado determinado por (x, y), sendo x
os valores da variável tomada como preditora e y os valores da variável resposta,
se for o caso. Note que rs indica a correlação entre postos e não entre os valores
medidos para as variáveis. Assim, x e y devem ser ordenados em separado para
que seus postos possam ser comparados. Neste caso, se as variáveis estiverem
correlacionadas positivamente, os postos mais baixos de x serão acompanhados
dos postos mais baixos de y, enquanto que os postos altos de x corresponderão
aos postos altos de y. Por outro lado, se a correlação for negativa, os postos altos
de uma variável estarão relacionados aos postos baixos da outra variável e vice-
-versa. Porém, se não houver correlação entre x e y, não haverá coerência na
associação entre os postos das duas variáveis estudadas, uma vez que os postos
altos de x podem corresponder a postos altos, médios ou baixos de y, indistinta-
mente. Portanto, tem-se como hipótese nula para o teste, aquela em que os postos
de uma variável não se alteram de igual maneira com os postos da outra variável;
em outras palavras, enquanto os postos de uma variável aumentam, os postos
da outra variável podem aumentar ou diminuir sem qualquer relação entre elas.

Determinação do coeficiente de spearman (rs)


O teste envolve o cálculo do valor estatístico rs, cujos procedimentos serão
mostrados a seguir:
• Inicialmente, ordenam-se, do menor para o maior, os valores das duas
amostras x e y, e anota-se, ao lado de cada valor, o número de ordem (ou

184 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 184 25/06/12 17:22


posto) correspondente. Não esqueça que, quando houver empate, o pos-
to para cada valor empatado corresponde à média dos postos que seriam
ocupados por eles;
• A seguir, calculam-se as diferenças (d) entre os postos de x e de y determi-
nados para cada um dos indivíduos da amostra. O sinal da operação deve
ser conservado, pois o somatório das diferenças deve ser igual a zero;
• O valor de rs é calculado pela seguinte fórmula:

6∑d 2
rs = 1 − , onde n é o número de pares.
n3 − n

• Quando ocorrerem empates nos postos, deve-se usar a fórmula corrigida,


a qual é mostrada a seguir:

Ax + A y − ∑ d 2 (n3 − n ) − ∑(t 3 − t )
rs = , onde: A x ou y =
2 Ax A y ( ) 12

Sendo t o número de observações empatadas em cada posto. Por exemplo:


se hover dois empates com o posto 2,5 e outros quatro empates com o posto
7,5, o cálculo para Σ(t3 – t) será:

∑(t 3 − t ) = (23 − 2) + (43 − 4) = 66

Para demonstrar a aplicação do teste de correlação de Spearman, utiliza-


remos o seguinte exemplo:

Exemplo: Na indústria alimentícia, a densidade aparente de um sorvete


é dada pela multiplicação entre a quantidade de ar incorporado (overun), a
massa do produto e uma constante igual a 0,2. Essa medida constitui um impor-
tante parâmetro de qualidade, pois sua variação influencia na relação entre
a textura e a palatibilidade do produto. Simões et al (2008) realizaram uma
análise sensorial com 10 diferentes formulações de um sorvete de fruta, com
o objetivo de verificar se a sua densidade aparente está relacionada ao grau de

Testes Para Variáveis Ordinais 185

BIOESTATISTICA_VOL02.indb 185 25/06/12 17:22


aceitação quanto à palatibilidade do mesmo. As densidades (g/L) e os respec-
tivos escores, medidos de zero a 10, estão apresentados na Tabela 17.4, abaixo.

Tabela 17.4 – Variação do escore atribuído pela análise sensorial em função da densidade
relativa (g/L) de um tipo de sorvete de fruta

Provador Densidade Posto de Escore Posto de d d2


(x) x (y) y (x – y)
01 480 1 8.1 5,5 -4.5 20,25
02 500 2 9.4 9 -7 49,00
03 520 3 9.8 10 -7 49,00
04 540 4 8.1 5,5 -1.5 2.25
05 560 5 8.8 7 -2 4,00
06 580 6 8.9 8 -2 4,00
07 600 7 7.6 3,5 3.5 12.25
08 620 8 7.6 3,5 4.5 20.25
09 640 9 7.2 1 8 64,00
10 660 10 7.4 2 8 64,00
Σ=0 Σ = 289

Uma vez que as duas variáveis correlacionadas são medidas por postos,
o uso do coeficiente de Spearman (rs), em vez do coeficiente de correlação de
Pearson (r), é justificado. Assim, para os dados do exemplo apresentado na
Tabela 17.4, o valor de rs é calculado como mostrado a seguir:

6∑d 2 6 x 289 1.734


rs = 1 − = 1− = 1− = 1 − 1,7515 = −0,7515
n −n
3
10 − 10
3 990

Como apenas os postos da variável análise sensorial apresentam empates,


não é necessária a aplicação da fórmula corrigida. Assim, com base no resultado
calculado, o coeficiente de correlação de Spearman indica uma forte correlação
negativa entre a densidade aparente e o grau de aceitação quanto à palatibi-
lidade do sorvete de frutas analisado, pois rs = – 0,7515. No entanto, para que se
possa concluir com segurança, é necessário realizar um teste de hipótese para
verificar se essa correlação foi um achado casual ou se, de fato, ela é estatistica-
mente significante. Esse procedimento será demonstrado a seguir.

186 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 186 25/06/12 17:22


Teste de hipótese para o coeficiente de spearman
O teste de hipótese é realizado comparando-se o valor calculado de rs(calc)
com o valor verificado na tabela dos valores críticos para o coeficiente de corre-
lação de Spearman (ver tabela no final do livro). Nesta tabela, estão indicados
todos os valores significativos para rs(α;n) conforme o nível de significância (α)
preestabelecido e os diferentes tamanhos amostrais para n ≤ 100. Para testar
a hipótese, aplica-se o seguinte raciocínio: se o valor obtido para rs(calc) for igual
ou superior ao tabelado, a correlação é estatisticamente significativa para o
nível α preestabelecido para a pesquisa, caso contrário, aceita-se a hipótese
nula de que não há correlação entre as variáveis estudadas. Assim, para o
exemplo apresentado na Tabela 17.4, o valor calculado para rs(calc) foi igual a
0,7515, enquanto que o valor tabelado para um teste bilateral, com α = 0,05 e
n = 10, é rs(0,05;10) = 0,648. Deste modo, o coeficiente de correlação obtido para o
teste realizado entre os valores da densidade aparente e do grau de satisfação
quanto à palatibilidade do sorvete analisado é estatisticamente significativo,
pois rs(calc) = 0,7515 > rs(0,05;10) = 0,648, com valor P = 0,0104.
No entanto, para valores de n maiores que 30 e menores ou iguais a 100
(30 < n ≤ 100), podemos usar tanto a tabela dos valores críticos para o coefi-
ciente de correlação de Spearman quanto um teste t, tal como foi utilizado para
avaliar a significância do coeficiente de correlação de Pearson (ver capítulo 12).
Neste caso, o valor obtido para tcalc é comparado com o valor crítico da tabela t
de Student (ver tabela no final do livro), com (n – 2) graus de liberdade. A regra
de decisão é a mesma para o teste t: se |tcalc| for igual ou maior que o t crítico
tabelado (tα;n-2), a correlação é estatisticamente significativa, caso contrário,
aceita-se que não há correlação entre as variáveis estudadas. A fórmula para
calcular t é a seguinte:

rs
t calc =
1 − rs2
n −2

Exemplo: Uma indústria de alimentos congelados realizou uma análise


para verificar se existe uma correlação significativa entre a densidade aparente
e o tempo de derretimento de seus sorvetes de frutas. Para tal, foram selecio-

Testes Para Variáveis Ordinais 187

BIOESTATISTICA_VOL02.indb 187 25/06/12 17:22


nadas 32 amostras de diferentes sabores de sorvete. Pela análise da simetria
das variáveis, verificou-se que os valores do tempo de derretimento não se
apresentavam normalmente distribuídos, enquanto que, no gráfico de distri-
buição conjunta (gráfico de dispersão), os pontos não apresentavam uma
nuvem de formato elíptico. Por este motivo, a opção da análise recaiu sobre o
coeficiente de correlação de Spearman. O valor obtido foi rs = – 0,7842.

• Passo 1 – Formular as hipóteses estatísticas:


H 0 : rs = 0 (Não existe correlação entre a densidade aparente e tempo de
derretimento dos sorvetes analisados).
H A : rs ≠ 0 (A densidade aparente e o tempo de derretimento estão corre-
lacionados).
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,01 (1%) bilateral
• Passo 3 – Determinar o valor crítico do teste t:
gl = n − 2 = 32 − 2 = 30 ∴ t 0,01;30 = 2,750
• Passo 4 – Calcular o valor do teste t para rs = – 0,7842:

rs −0,6842 −0,6842
t calc = = = = −43,859
1 − rs2 1 − ( −0,6842) 2 0,0156
n −2 32 − 2

• Passo 5 – Regra de decisão:

Se |t calc | < t 0,01;30 , aceita-se H 0 .

Se |t calc | ≥ t 0,01;30 , rejeita-se H 0 .

Como |t calc | = 43,859 > t 0,01;30 = 2,750, rejeita-se H 0 .

• Passo 6 – Conclusão:
Existe, portanto, uma forte evidência de que as variáveis “densidade apa-
rente” e “tempo de derretimento” estejam inversamente relacionadas, isto
é, que existe uma correlação linear estatisticamente significante entre elas,
pois t calc = 43,859; gl = 30; P = 0,001 .

188 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 188 25/06/12 17:22


17.4 TESTE DE CONCORDÂNCIA KAPPA

Também chamado de coeficiente kappa, o teste, inicialmente sugerido


por Jacob Cohen4, em 1960, tem a finalidade de medir o grau de concor-
dância entre as proporções encontradas para a mesma variável mensurada
em duas diferentes ocasiões. O teste é baseado no número de resultados
concordantes, ou seja, no número de casos cujo resultado é o mesmo entre
os avaliadores, sendo, portanto, uma medida interobservador, que mede
o grau de concordância além do esperado tão somente pelo acaso. Esse
teste, que pressupõe que as variáveis sejam medidas em escala dicotômica,
tem o valor máximo igual a 1, que representa total concordância entre os
tratamentos, ao passo que os valores próximos ou abaixo de zero indicam
ausência de concordância, ou que a concordância ocorreu em razão do
acaso. Por outro lado, um valor de kappa eventualmente menor que zero
sugere que a concordância encontrada foi menor do que aquela que seria
esperada somente por acaso, isto é, que existe discordância entre os trata-
mentos, embora este valor não tenha interpretação como intensidade de
discordância. Em outras palavras, testa-se a reprodutibilidade dos resul-
tados, admitindo-se que haverá concordância entre eles em relação às
proporções medidas nas duas ocasiões consideradas.
Neste teste, os dados devem ser introduzidos em uma tabela de contin-
gência conforme mostrado abaixo:

Tabela 17.5 – Tabela de contingência para a concordância entre os diagnósticos de dois


diferentes avaliadores

Avaliador 1
Presente (+) Ausente (–) Total
Presente (+) a (++) b (+−) n1 = a + b
Avaliador 2
Ausente (–) c (−+) d (−−) n2 = c + d
Total m1 = a + c m2 = b + d n

4. Jacob Cohen (1923-1998) – Psicólogo e estatístico americano melhor conhecido pelo seu
trabalho sobre poder estatístico e medidas de efeito de tratamento.

Testes Para Variáveis Ordinais 189

BIOESTATISTICA_VOL02.indb 189 25/06/12 17:22


O cálculo do coeficiente de kappa toma como base a relação entre a
proporção de concordância observada (po) e a proporção da concordância
esperada (pe), conforme as fórmulas mostradas abaixo:

po − pe a +d n .m + n .m
kappa = , onde: po = e pe = 1 1 2 2
1 − pe n n2

Um teste deve ser realizado para avaliar a significância estatística do


valor calculado para Kappa, cuja hipótese nula a ser testada é aquela que
indicaria uma ausência de concordância entre os observadores (kappa = 0).
No caso de rejeição da hipótese nula (kappa > 0), há a indicação de que existe
alguma concordância entre os observadores, sem, no entanto, significar neces-
sariamente que a concordância seja alta, cabendo ao pesquisador avaliar se a
medida obtida é satisfatória ou não. Alguns autores, como Landis e Koch, 1977,
sugerem a seguinte interpretação:

Tabela 17.6 – Avaliação do grau de intensidade da concordância entre dois observadores

Valor de kappa Intensidade da concordância


<0 Sem concordância
0,0 – 0,20 Leve
0,21– 0,40 Moderada
0,41 – 0,60 Forte
0,61 – 0,80 Muito forte
0,81 – 0,99 Quase perfeita
1,0 Perfeita

Observe que esta tabela não é universalmente aceita, uma vez que os autores
não mostram evidências que amparem a sua exatidão, sendo baseada apenas
na experiência pessoal, pois, na prática, verifica-se que o número de categorias
e de sujeitos afeta o valor de kappa, o qual será maior quando existirem poucas
categorias. Assim, apesar de suas limitações, o teste é considerado como uma
medida mais robusta do que um simples cálculo de percentagens, já que o
mesmo considera o grau de concordância em razão da ocorrência da chance.

190 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 190 25/06/12 17:22


Entretanto, alguns autores afirmam que o teste subestima o grau de concor-
dância entre os observadores, isto porque, quando não completamente certos,
estes tendem a advinhar os resultados de suas observações. O exemplo a seguir
mostra uma aplicação para o teste de concordância de kappa.

Exemplo: Um estudo foi conduzido por Ferreira et al (2006) para verificar


a capacidade dos odontólogos em identificar o sexo dos pacientes pela análise
visual de suas arcadas dentárias. Para tal experimento, foram selecionadas
as fotografias das arcadas de 20 indivíduos adultos jovens, sendo 10 do sexo
masculino e 10 do sexo feminino. A identificação das arcadas foi feita em dois
diferentes momentos, com intervalo de 30 dias entre eles. Para que os odontólogos
selecionados fizessem o reconhecimento, as fotografias foram aleatoriamente
misturadas imediatamente antes de cada sessão de identificação. Os resultados
das avaliações efetuadas por um dos odontólogos estão mostrados abaixo. Existe
concordância estatisticamente significativa entre os resultados?

Foto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Sexo F M M F F M F M M M F M F M F F M F F M
Primeira F M M F F M M M F M M M F F M F F F F M
avaliação + + + + + + − + − + − + + − − + − + + +
Segunda F F M F M M F F M M M M F M M F M F F M
avaliação + − + + − + + − + + − + + + − + + + + +

M – Masculino; F – Feminino.

Com base no resultado acima, pode-se construir a seguinte tabela de


contingência:

Tabela 17.7 – Tabela de contingência para a concordância entre os diagnósticos de um


odontólogo em duas diferentes avaliações
Primeira avaliação
Total
Correta Incorreta
Segunda Correta 11 4 15
avaliação Incorreta 3 2 5
Total 14 6 20

Testes Para Variáveis Ordinais 191

BIOESTATISTICA_VOL02.indb 191 25/06/12 17:22


• Passo 1 – Formular as hipóteses estatísticas:
H 0 : kappa = 0 (Não existe concordância quanto aos resultados encontra-
dos nas duas avaliações).
H A : kappa > 0 (Existe concordância quanto aos resultados encontrados
nas duas avaliações).
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%) unilateral
• Passo 3 – Calcular o valor de kappa:

a + d 11 + 2
po = = = 0,65
n 20

n1 .m1 + n2 .m2 (15 x 14) + (5 x 6) 240


pe = = = = 0,60
2
n 202 400

po − pe 0,65 − 0,60 0.05


kappa = = = = 0,125
1 − pe 1 − 0,60 0, 40

• Passo 4 – Conclusão:
Não existem, portanto, evidências que comprovem ter havido concordân-
cia em relação às observações nos dois momentos avaliados. Isto é, não
houve concordância na identificação do sexo dos indivíduos avaliados, pois
kappa = 0,125; P = 0,286 .

Note que o teste de concordância de Kappa mede apenas o grau de concor-


dância entre dois avaliadores. Para uma medida de concordância entre três ou
mais avaliadores, o teste a ser utilizado é a estatística pi de Scott.

17.5 TESTE PARAMÉTRICO versus


NÃO-PARAMÉTRICO

Antes de se decidir por um teste não-paramétrico, o pesquisador deve


conhecer algumas de suas vantagens e devantagens em relação aos testes
baseados na distribuição normal gaussiana. São elas:

192 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 192 25/06/12 17:22


• Quando as exigências clássicas para a utilização dos testes paramétricos
não são atendidas, os testes não-paramétricos são os mais apropriados,
pois são mais livres em termos de regras, sendo, portanto, de aplicação
mais ampla. Porém, quando utilizados em dados que satisfazem as exigên-
cias de simetria, os testes não-paramétricos são menos eficientes em de-
tectar alguma diferença entre os grupos comparados, especialmente quan-
do o tamanho amostral é pequeno. Nestes casos, a preferência de escolha
recai sempre sobre um teste paramétrico;
• Os testes não-paramétricos são indicados quando o modelo de distribui-
ção dos dados na população é desconhecida ou é assimétrica, assim como
quando os grupos a serem comparados apresentam variâncias desiguais
(heterocedasticidade). Ou ainda, quando entre os grupos a serem compa-
rados, alguns apresentam distribuição simétrica enquanto que outros são
assimétricos;
• Em geral, os testes não-paramétricos são menos robustos em relação
aos testes paramétricos, uma vez que são empregados em dados mensu-
rados em escalas não-dimensionais, do tipo nominal, ordinal ou dicotô-
mica. De fato, a transformação de dados quantitativos dimensionais em
dados categóricos, ou a sua redução para uma escala qualitativa orde-
nável que possa ser substituída por postos, tal como ocorre no teste de
Wilcoxon-Mann-Whitney, causa perda de informação relativa à variabili-
dade dos dados da amostra estudada, fato este que pode comprometer a
qualidade do teste de hipótese. Portanto, antes de escolher este ou aquele
teste, o pesquisador deverá proceder à minuciosa análise de seus dados,
de maneira que possa optar pelo teste mais apropriado ao delineamento
de sua pesquisa.

Testes Para Variáveis Ordinais 193

BIOESTATISTICA_VOL02.indb 193 25/06/12 17:22


BIOESTATISTICA_VOL02.indb 194 25/06/12 17:22
parte 5

ANÁLISE MULTIVARIADA

“Para alguns, a frase pode parecer contundente,


mas, após longos anos estudando o assunto,
posso dizer que, quem ainda não aprendeu estatística
não pode afirmar que sabe fazer pesquisa”.

Prof. Mauro Fontelles


Médico, cirurgião do trauma e pesquisador.

BIOESTATISTICA_VOL02.indb 195 25/06/12 17:22


BIOESTATISTICA_VOL02.indb 196 25/06/12 17:22
18
Análise Conceitual
Multivariada

O objetivo do presente capítulo é fornecer ao leitor, subsídios para que


ele possa compreender os princípios que regem o processo de aplicação
da estatística multivariada, de modo que, dentre todos os diferentes testes
estatísticos existentes, ele possa escolher aquele que melhor se aplica ao
modelo delineado no projeto de sua pesquisa, assim como possa interpretar
de modo correto os resultados observados. Na prática, nos modelos de
estudo multivariado, o pesquisador estuda a influência relativa simultânea
de duas ou mais variáveis preditoras, possivelmente causais, sobre uma
única variável resposta, a qual é tomada como desfecho. Assim, embora com
algumas limitações, este modelo é, sem dúvida, mais atraente que aqueles
de análise bivariada, pois, em razão de analisar vários fatores simulta-
neamente, reflete de forma mais fidedigna os fenômenos observados na
prática do dia-a-dia da pesquisa. Por isso, é importante que os pesquisa-
dores dominem suas técnicas, pois, somente dessa maneira, podem extrair
o máximo de informações contidas em seus experimentos.

BIOESTATISTICA_VOL02.indb 197 25/06/12 17:22


18.1 BASES CONCEITUAIS DA ESTATÍSTICA
MULTIVARIADA

A compreensão de como a interação de múltiplas variáveis atua sobre um
determinado desfecho é o objetivo maior de um estudo que emprega a análise
multivariada como método de pesquisa, sendo, portanto o resultado final
da investigação. Assim, para tornar mais fácil a base do raciocínio para esta
compreensão, utilizaremos um exemplo extraído do cotidiano: suponha que,
após uma longa viagem turística de ônibus, um passageiro queira mensurar o
seu grau de satisfação com a referida viagem, isto é, se ela deve ser classificada
como excelente, boa, média ou ruim. Com vistas a este objetivo, ele considera
que alguns fatores inerentes à viagem contribuíram de forma efetiva para sua
classificação. São eles: o conforto do ônibus, o preço da passagem, o tempo
de viagem e o roteiro turístico. Neste caso, podemos afirmar que o conforto,
o preço, o tempo e o roteiro são as variáveis preditoras (independentes), que
atuaram conjuntamente, modificando o desfecho da variável resposta (depen-
dente) grau de satisfação. Existe, portanto, uma relação entre as variáveis
estudadas, a qual pode ser posta da seguinte maneira: “o grau de satisfação
depende do conforto, do preço, do tempo e do roteiro”. Tornando a afirmação
mais lógica, podemos escrevê-la da seguinte forma:

Grau de satisfação ≈ Conforto + Preço + Tempo + Roteiro

Aqui, um fato importante deve ser considerado. As quatro variáveis indepen-


dentes não atuam, necessariamente, com a mesma intensidade na determinação
do desfecho. Cada uma delas tem uma determinada importância quanto ao grau
de satisfação do passageiro. Em outras palavras, para cada uma das variáveis
independentes deve ser atribuído um fator de ponderação (peso), de tal maneira
que as suas importâncias relativas sejam proporcionalmente ajustadas às demais
na determinação do desfecho estudado. Assim, a afirmação anterior pode ser
reescrita de uma maneira mais apropriada, tal como mostrado a seguir:

Grau de satisfação ≈ pesoc .Conforto + pesop .Preço + pesot .Tempo + pesor .Roteiro

198 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 198 25/06/12 17:22


O próximo passo a ser considerado é transformar a afirmação em um
modelo matemático que possa ser utilizado para cálculos estatísticos. Para tal,
é necessário transformá-la em uma equação matemática, tomando-se como
referência a equação da reta y = a + bx, a qual, em estatística, é considerada
como a fórmula da regressão linear simples. Porém, como existem outras
variáveis independentes que também atuam no grau de satisfação, como por
exemplo, o horário da partida do ônibus, mas que não foram consideradas
pelo passageiro, a fórmula não é perfeita, necessitando, portanto, de um fator
de correção chamado termo de erro (e), para que a igualdade, em ambos os
membros da equação, seja satisfeita. Este termo de erro, embora de nome um
tanto inadequado, pois não significa necessariamente um erro no processo
de avaliação da interação, englobará todas as outras variáveis que não estão
sendo analisadas, mas que também atuam no desfecho do estudo. Assim, repre-
sentando-se a variável-resposta “grau de satisfação” pela letra y, as variáveis
preditoras “conforto”, “preço”, “tempo” e “roteiro” por x1, x2, x3 e x4, e os respec-
tivos pesos por b1, b2, b3 e b4, a equação pode ser escrita da seguinte forma:

y = a + b1x 1 + b2x 2 + b3x 3 + b4 x 4 + e

Como se pode observar, o uso desta equação não permite que o verda-
deiro valor para y (desfecho) possa ser calculado, pois o termo de erro e não
é conhecido. Na prática, para que a equação possa ser empregada, o que na
verdade se calcula é o valor estimado de y, designado por ŷ (lê-se y-chapéu).
Deste modo, o valor de e deve ser subtraído da equação, a qual passa a ser
escrita da seguinte forma:

ŷ = a + b1x 1 + b2x 2 + b3x 3 + b4 x 4

Assim, subtraindo-se a segunda da primeira equação, tem-se: (y – ŷ) = e.


Deste modo, o termo de erro e corresponde ao valor observado para a variável-
-resposta y, menos o valor previsto para a mesma variável, sendo, por isso,
chamado de resíduo. Portanto, com base neste raciocínio, podemos afirmar
que as melhores estimativas para os valores da variável de desfecho são obtidas
quando o resíduo for mínimo.

Análise Conceitual Multivariada 199

BIOESTATISTICA_VOL02.indb 199 25/06/12 17:22


A equação para calcular ŷ é comumente chamada de modelo linear geral,
a qual é utilizada como base para diversos procedimentos de análise multiva-
riada, entre os quais se destacam a análise de variância (ANOVA), a regressão
linear múltipla e a regressão logística múltipla, todos mostrados nos capítulos
subsequentes deste livro.
Como em outros capítulos, nosso objetivo é fornecer subsídios suficientes
para que o leitor possa identificar as situações em que a análise multivariada
é a mais adequada, assim como interpretar os resultados obtidos. Portanto,
agora que estes fundamentos foram explicados, o leitor poderá demonstrar,
a título de exercício, os procedimentos para um estudo que queira avaliar a
interação das variáveis preditoras “idade”, “estatura”, “massa corporal” e “sexo”
na determinação da variável resposta “pressão arterial”. Caso tenha interesse
em aprender mais sobre este procedimento, consultar Jekel et al (2005).

18.2 OBJETIVOS DA ESTATÍSTICA MULTIVARIADA

Os objetivos de uma análise multivariada podem ser resumidos como


mostrado a seguir:
• Testar se existe, de fato, uma associação verdadeira entre cada uma das
variáveis preditoras (x) estudadas e a variável resposta analisada (y). Ou
seja, é verificar se a correlação entre cada uma das variáveis preditoras e a
variável resposta não ocorreu por puro acaso;
• Verificar se existe uma interação entre as diversas variáveis predi-
toras (x) na determinação da variável resposta (y). A interação está
presente quando uma das variáveis preditoras influencia a maneira
pela qual outra variável, também preditora, explica o comportamento
da variável resposta;
• Caso exista interação entres as variáveis preditoras, compreender quão
importante são estas variáveis preditoras (x), tanto individual como
conjuntamente, para explicar a variação da variável resposta (y);
• Determinar qual das variáveis independentes é a mais forte ao predizer
o comportamento da variável resposta, ou como interage com as outras
variáveis na sua capacidade para a predição.

200 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 200 25/06/12 17:22


18.3 A ESCOLHA DO TESTE ESTATÍSTICO

A escolha do teste estatístico apropriado deve ser realizada ainda na fase


de delineamento do estudo, logo após a escolha das variáveis que comporão a
pesquisa. Esta escolha, que geralmente se traduz em algum grau de dificuldade
para um pesquisador menos experiente, envolve uma série de fatores que
deverão ser considerados, sendo os mais importantes o tipo de delineamento
do estudo, o tipo de variável estudada e o número de grupos comparados. Assim,
quando se considera o modelo de delineamento, deve-se verificar se a compa-
ração entre os grupos é um estudo do tipo pareado ou se envolve comparação
de grupos de amostras independentes, ou se o estudo é do tipo caso-controle
ou coorte etc. Quanto ao tipo de variável, o pesquisador deve estar atento, pois
as variáveis podem ser paramétricas, ordinais, dicotômicas ou nominais e, para
cada tipo de variável, um tipo diferente de teste estatístico deve ser escolhido.
Igualmente, o número de variáveis a serem comparadas também determina
o tipo de teste, pois a análise pode ser univariada, bivariada ou multivariada,
assim como o número de grupos estudados também deve ser considerado.
Com base nesses requisitos, os testes estatísticos podem ser classificados
em dois grandes grupos, os testes paramétricos e os testes não-paramétricos,
conforme o tipo de variável estudada. Os testes paramétricos são mais robustos
do que os não-paramétricos e, consequentemente, devem ser a primeira escolha
do investigador, quando o seu emprego for permitido, isto é, quando os dados
coletados achem-se normalmente distribuídos. Quando a escolha é um teste
não-paramétrico, o pesquisador admite que a distribuição de seus dados não
seja normal, ou que ele não tem elementos suficientes para poder afirmar que
o sejam. Na dúvida, o pesquisador deve optar pela estatística não-paramétrica.
De qualquer maneira, seja qual for a opção do pesquisador, ele precisa
ainda decidir qual, dentre os diversos testes existentes, em ambos os grupos,
é o mais apropriado para o modelo de sua pesquisa. Isto porque, existem
testes específicos para amostras dependentes e independentes, como, da
mesma forma, o número de comparações a serem realizadas na pesquisa é
também importante, uma vez que existem testes indicados para comparação
somente entre duas amostras, e outros indicados para comparações múltiplas,
entendendo-se como múltiplas, um número de comparações superior a duas

Análise Conceitual Multivariada 201

BIOESTATISTICA_VOL02.indb 201 25/06/12 17:22


amostras. Deste modo, com o intuito de facilitar ao leitor quanto à escolha do
teste estatístico apropriado, os quadros 18.1 e 18.2 mostram as opções para as
análises bivariadas e multivariadas, respectivamente.

Quadro 18.1 – Escolha do teste estatístico para análise bivariada, conforme o tipo
de variável estudada

Tipos de Primeira variável


variáveis Contínua Ordinal Dicotômica Nominal
- Teste de - Teste
Dicotômica Mann-Whitney qui-quadrado
- Teste t de Student ---
não-pareada - Teste qui-quadrado - Teste exato de
para tendência linear Fisher
- Teste do
Dicotômica
- Teste t pareado - Teste de Wilcoxon qui-quadrado de ---
pareada
McNemar
- Análise de
- Teste - Teste
Segunda variável

Nominal variância de uma - Teste Kruskal-Wallis


qui-quadrado qui-quadrado
via (ANOVA).

- Coeficiente de
correlação de
Ordinal --- Spearman --- ---
- Coeficiente de
correlação de Kendall

- Agrupar a variáveis
-C
 oeficiente de contínuas e calcular o
correlação de coef. de correlação de
Contínua Pearson --- ---
Spearman ou coef. de
-R
 egressão linear correlação de Kendall
ou qui-quadrado.

202 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 202 25/06/12 17:22


Quadro 18.2 – Escolha do teste estatístico para análise multivariada, conforme
o tipo de variável estudada
Tipos de Variável dependente
variáveis Contínua Ordinal Dicotômica Nominal
- Regressão
Todas são - Análise de logística - Análise do
categóricas variância (ANOVA) - Análise do log-linear
- Não existe teste log-linear
para análise - Agrupar as
Algumas
Variáveis independentes

- Análise de multivariada variáveis


categóricas de variáveis - Regressão
covariância contínuas e
e algumas dependentes logística
(ANCOVA) realizar análise do
contínuas ordinais. log-linear.
- Tratar como
variáveis contínuas - Análise da função
ou realizar a discriminante
- Regressão
análise do - Agrupar as
Todas são - Regressão linear logística
log-linear.
contínuas múltipla - Análise da função variáveis
discriminante contínuas e
realizar análise do
log-linear.

Análise Conceitual Multivariada 203

BIOESTATISTICA_VOL02.indb 203 25/06/12 17:22


BIOESTATISTICA_VOL02.indb 204 25/06/12 17:22
19
Análise de Variância
(ANOVA)

Na pesquisa experimental, embora o mais frequente seja a comparação


de apenas dois grupos amostrais, não raro o pesquisador é desafiado a
comparar os resultados de três ou mais amostras, simultaneamente. Neste
caso, quando os dados são obtidos de amostras cujas variáveis são expressas
em uma escala contínua e com distribuição normal, a comparação será feita
entre três ou mais médias amostrais ao mesmo tempo. Por exemplo, se o
interesse é verificar se pessoas em diferentes grupos etários, isto é, crianças,
adultos e idosos têm, em média, diferentes valores para a dosagem sérica do
colesterol total, o estudo será feito comparando-se as médias das medidas
dos três grupos, simultaneamente.
Do mesmo modo, se o que se deseja é comparar diferentes situações
experimentais em uma mesma população, como por exemplo, testar quatro
diferentes tipos de tratamentos em uma mesma comunidade, o investigador
deverá separar, aleatoriamente, quatro grupos de indivíduos e administrar um
tipo de tratamento para cada um dos grupos estudados. Aqui, novamente, terá
que comparar quatro médias amostrais, simultaneamente.
Note que, em ambos os casos, a hipótese nula a ser testada é que as médias
amostrais não diferem entre si. Ou seja, H0: μ1 = μ2 = μ3 = ... μn. Como os valores
que serão comparados são médias resultantes de variáveis contínuas, num

BIOESTATISTICA_VOL02.indb 205 25/06/12 17:22


primeiro momento, pode parecer correto realizar vários testes t de Student
entre os diferentes grupos, tomando-se as amostras duas a duas. Esta seria
uma solução pouco eficiente, uma vez que, para um número k de amostras, a
formação total de pares (p) seria:

k (k − 1)
p=
2

Assim, para o caso de quatro amostras, tem-se a formação de seis pares


e, portanto, a aplicação de seis testes t para comparar as médias duas a duas:
x 1x x 2 , x 1x x 3 , x 1x x 4 , ... e assim, sucessivamente. Tal processo de comparação,
no entanto, é estatisticamente incorreto, pois resulta num trabalho exaustivo
e desnecessário, além de aumentar a probabilidade de se cometer um erro
falso-positivo (erro tipo I), porque, com o aumento do número de médias a
serem comparadas, maior será a possibilidade de se encontrar, entre elas, uma
diferença estatisticamente significante somente por acaso, em razão do erro
amostral. Isto ocorre porque o teste t de Student foi idealizado para comparar
apenas duas médias, com probabilidade α de se concluir, de maneira incorreta,
por uma diferença que não existe. Desta forma, quando se aumenta o número
de médias, aumenta-se a probabilidade de erro.
Portanto, quando o objetivo é comparar vários grupos, simultaneamente,
e para que se possa manter o erro tipo I em um nível constante, o proce-
dimento correto é o emprego de um teste de abrangência global, o qual é
utilizado para avaliar se existe alguma diferença entre as médias e, somente se
este primeiro teste for positivo, deve-se, então, testar as várias combinações
entre elas. Neste caso, a técnica a ser empregada é a análise de variância
(ANOVA1), a qual compara todas as médias em um único teste, objetivando
identificar se existe ao menos uma diferença estatisticamente significativa
entre os grupos comparados. Caso esta diferença exista, aplica-se, então, uma
das diversas técnicas de comparações múltiplas para que se possam identi-
ficar quais os grupos diferem entre si.

1. ANOVA – Acrônimo das palavras inglesas analysis of variance.

206 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 206 25/06/12 17:22


19.1 BASE DA ANOVA (TESTE F)

Desenvolvida por Sir Ronald Fisher2, o teste ANOVA constitui uma
poderosa ferramenta estatística de análise multivariada que, com base no
modelo linear geral, permite comparar mais de duas médias simultanea-
mente, constituindo-se, portanto, no primeiro passo para identificar a variação
entre três ou mais grupos estudados simultaneamente. O argumento do teste
é baseado no seguinte princípio: se tomarmos dois métodos diferentes para
estimar a variância, sendo o primeiro empregado para o cálculo em diferentes
amostras e o segundo para o cálculo em uma determinada população; se todas
as amostras vierem desta população, estas duas estimativas da variância devem
ser necessariamente iguais. Isto é, se a variância de diferentes amostras não
diferirem significativamente entre si, elas são estimativas da mesma variância
populacional σ2 e, portanto, da mesma média populacional μ. Com base neste
princípio, Fischer desenvolveu duas maneiras distintas para medir a variância
das observações de diferentes grupos. São elas:
2
• Variância entre grupos ( s E ) – É aquela que tem como base a variação
entre as médias dos grupos estudados, isto é, que mede a variação
existente entre todas as médias amostrais selecionadas para o estudo. A
variância entre grupos é também chamada de quadrado da média entre
grupos (QME);
2
• Variância dentro dos grupos ( s D ) – É aquela que tem como base a
variação dentro de cada grupo, isto é, que mede a variação dentro de
cada uma das médias amostrais selecionadas para o estudo. A variância
dentro dos grupos é também chamada de quadrado da média dentro
dos grupos (QMD);
2
• Variância total ( sT ) – Corresponde àquela que é obtida quando todos os
grupos são reunidos de modo a formar um único bloco, composto da soma
de todos os elementos das amostras.

De tal modo que podemos escrever: sT = s E + s D


2 2 2

2. Sir Ronald Aylmer Fisher (1890-1962) – Estatístico e biólogo inglês, criador das fundações
para a ciência estatística moderna.

Análise de variância 207

BIOESTATISTICA_VOL02.indb 207 25/06/12 17:22


Note que o quadrado da média corresponde a um outro nome para a
variância, a qual é definida como a soma dos quadrados dos desvios em relação
à média (SQ), dividida pelo número de graus de liberdade (gl), de modo que o
teste F corresponde à razão entre as variâncias entre os grupos e dentro dos
grupos, o qual pode ser expresso da seguinte maneira:

Variância entre os grupos s 2 QM E SQE / gl E


Teste F = = E = =
Variância dentro dos grupos s 2 QM D SQD / gl D
D

Portanto, o teste F consiste em um procedimento estatístico que calcula a


variação total observada no estudo e a divide em dois componentes perfeitamente
identificáveis: o primeiro componente é a variação entre média de cada grupo e a
média geral de todos os indivíduos do estudo (variação entre os grupos). Este
componente representa o efeito dos diferentes tratamentos. O segundo compo-
nente é a variação observada entre cada indivíduo e a média de seu respectivo
grupo (variação dentro dos grupos). Este componente representa as diferenças
individuais aos tratamentos. Assim, se as médias dos grupos forem bastantes
diferentes umas das outras, ocorrerá uma variação considerável entre elas e a
média geral de todos os indivíduos do estudo. Entretanto, se as médias dos grupos
não forem muito diferentes entre si, a variação entre elas e a média geral não será
muito maior do que a variação entre os indivíduos dentro de cada grupo.
Desta forma, a hipótese nula (H0) para o teste F é a afirmativa de que as duas
variâncias (entre e dentro) são iguais. Isto é, que a variação entre as médias não
é maior do que a variação entre as observações individuais dentro de um grupo.
Assim, para que a hipótese nula seja aceita, bastará que se demonstre que as médias
amostrais ( x ) não diferem significativamente entre si, além do que seria de se
esperar somente pelo acaso, em razão do erro aleatório. Isto é, que elas estimam a
mesma média populacional μ. Caso contrário, rejeita-se a hipótese nula e se aceita a
hipótese alternativa (HA) de que as médias amostrais não estimam a mesma média
μ. Neste caso, concluímos que nem todas as médias são iguais, ou seja, que pelo
menos uma delas difere das demais. Entretanto, o teste F não mostra qual ou quais
delas são diferentes entre si, o que explica a necessidade da utilização de testes de
comparação múltipla (post hoc) para que se possa determinar qual ou quais das
diferenças entre as médias são estatisticamente significantes (verdadeiras).

208 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 208 25/06/12 17:22


Portanto, se o valor calculado para o teste F for próximo a 1, as duas
estimativas da variância são semelhantes, e a hipótese nula de que todas as
médias provêm de uma mesma população não é rejeitada. Porém, se o valor
Fcalc é muito maior que 1, com o valor desta diferença maior do que seria de se
esperar somente por acaso, deve haver alguma razão que explique esta grande
diferença entre os grupos comparados, a qual deve ser atribuída ao efeito dos
tratamentos. Neste caso, a hipótese da não-diferença deve ser rejeitada.
Da mesma maneira, para que se possa testar a significância estatística do
valor de Fcalc obtido no experimento, compara-se este valor com o valor Fα ;gl ;gl
N D
extraído da tabela de valores críticos da distribuição F, a qual é encontrada no
final deste livro. Este valor crítico determina o limite para uma diferença ao
acaso entre as variâncias entre e dentro dos grupos comparados. Assim, para
um determinado nível de significância (nível α) preestabelecido e com (k – 1)
graus de liberdade no numerador e (n – k) graus de liberdade no denominador,
se o valor de Fcalc for menor que Fα ;glN ;glD tabelado, aceita-se a hipótese nula
de que não há diferença entre os tratamentos, pois a variação observada entre
os grupos é da mesma ordem daquela observada dentro dos grupos. Caso
contrário, se o valor de Fcalc for maior que Fα ;glN ;glD , rejeita-se a hipótese nula e
se conclui que há diferença entre os grupos comparados.

19.2 TIPOS DE ANOVA

O uso da análise de variância como método estatístico requer que o pesqui-


sador conheça suas diferentes formas de aplicação, uma vez que são possíveis
vários modelos experimentais para a ANOVA. Na prática, entretanto, a maioria
dos modelos mais complexos constituem combinações de modelos mais simples,
os quais podem ser classificados conforme o número de variáveis indepen-
dentes analisadas no estudo. São eles: modelo de delineamento inteiramente
casualizado, também chamado de ANOVA de um critério (one way ANOVA)
e modelo de delineamento em blocos casualizados, conhecido como ANOVA
de dois critérios, ou múltiplos critérios. Outros modelos mais complexos, tais
como os modelos fatoriais, modelos de quadrados latinos, modelos agrupados
e modelos de medidas repetidas (dados emparelhados) também podem ser

Análise de variância 209

BIOESTATISTICA_VOL02.indb 209 25/06/12 17:22


calculados. Neste livro, abordaremos apenas os modelos básicos de análise de
variância. Caso o leitor tenha interesse em aprender mais sobre os procedi-
mentos mais complexos, consultar Dawson et al (2003) e Beiguelman (2002).
Assim, no sentido de melhor esclarecer o leitor, antes de mostrar as carac-
terísticas de cada um dos modelos básicos da ANOVA, convém definir alguns
termos específicos mais utilizados neste tipo de análise estatística.

• Tratamento (k) – Corresponde a cada um dos diferentes processos experi-


mentais estudados em um dado experimento;
• Unidade experimental – É cada um dos grupos de indivíduos que
recebem um determinado processo experimental (tratamento). A escolha
dos indivíduos para a formação de uma unidade experimental deve ser
aleatória. É, portanto, cada uma das amostras do estudo;
• Repetição (r) – É a aplicação de um mesmo tratamento a todos os
indivíduos que compõem uma determinada unidade experimental. As
repetições permitem uma aferição da variabilidade intrínseca de cada
unidade experimental, assim como da variabilidade entre as diversas
unidades experimentais estudadas em um experimento;
• Erro experimental – Corresponde à variação entre as unidades experi-
mentais (indivíduos) que constituem um mesmo tratamento (grupo).
É, portanto, a variação dentro do mesmo tratamento, a qual é estimada
pela média das variâncias de cada grupo, sendo, por isso, chamada de
variância média dentro dos grupos (variância dentro). Também
conhecida como variância residual, ela representa a fração da variabi-
lidade que não é explicada pelo efeito dos tratamentos;
• Bloco – Também chamado de fator, representa cada um dos conjuntos
formados por unidades experimentais semelhantes e homogêneas entre
si. Um experimento poderá ser formado por um, dois ou mais blocos,
segundo seja ANOVA de um critério ou de múltiplos critérios. Assim,
em cada bloco, haverá tantas unidades experimentais quantos forem os
tratamentos a ser comparados.

Deste modo, dependendo do tipo de delineamento experimental, o teste F


para análise da variância pode ser classificado como:

210 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 210 25/06/12 17:22


ANOVA de um critério (one way ANOVA)
Também chamado de modelo inteiramente casualizado, é o tipo de
delineamento em que os grupos (amostras) estudados são comparados
segundo um único critério de classificação, isto é, pelo tipo de tratamento
que recebem. Neste modelo de estudo, testa-se apenas uma variável indepen-
dente, designada pelo tipo de tratamento, o qual é analisado em apenas um
bloco constituído por várias unidades experimentais, sendo os elementos
dentro de cada amostra obtidos de maneira aleatória (randômica). Assim,
para cada unidade experimental é sorteado um dos tipos de tratamentos que
deverão ser comparados no estudo. Por exemplo: Simões et al (2008) anali-
saram a estabilidade oxidativa da carne mecanicamente separada (CMS) da
piramutaba (Branchyplatystoma vaillant) por meio de várias análises físico-
-químicas e microbiológicas, dentre elas o pH. Foram coletadas 10 amostras
em quatro momentos distintos: 0, 30, 60 e 90 dias de estocagem à –18oC.
Neste exemplo de ANOVA, testou-se o efeito do tempo de estocagem (tipo de
tratamento ou variável preditora) sobre o valor do pH (variável resposta ou
dependente), em quatro diferentes amostras (grupos).
A Tabela 19.1 mostra a notação e o modelo de organização de dados para
uma ANOVA de um critério, com um único bloco experimental.

Tabela 19.1 – Notação e modelo de organização de dados para uma ANOVA


de um critério (bloco único)

Tratamentos Total
1 2 3 ... k
x11 x21 x31 ... xk1
x12 x22 x32 ... xk2
. . . ... .
. . . ... .
x1r x2r x3r ... xkr

Total T1 T2 T3 ... Tk ∑T = ∑ x
Repetições r r r ... r N= kr
Média x1 x2 x3 xk
Adaptado de Rossi, RM (2006)

Análise de variância 211

BIOESTATISTICA_VOL02.indb 211 25/06/12 17:22


ANOVA de dois critérios (two way ANOVA)
Também chamado de modelo fatorial, este tipo de delineamento é semelhante
à ANOVA de um critério, exceto pelo fato de que são analisados dois fatores (ou
duas variáveis independentes) simultaneamente, sendo cada fator distribuído
em um bloco constituído por três ou mais unidades experimentais homogêneas
(grupos). Neste caso, o pareamento é feito por blocos. Por exemplo: no experi-
mento anterior em que se relaciona a variação do pH com o tempo de estocagem
da carne mecanicamente separada da espécie de peixe piramutaba, suponha que
o pesquisador tenha realizado o mesmo experimento para as temperaturas de
–18 oC, –25 oC e –36 oC. Neste caso, cujos blocos seriam representados pelos experi-
mentos realizados em diferentes temperaturas, o pesquisador busca controlar a
variação entre os sujeitos das amostras para que ela não seja confundida com
uma possível diferença entre os tempos de congelamento. Assim, a variação
total do pH observada no experimento seria atribuída à variação natural entre
os sujeitos da amostra (variação residual), entre os tempos de congelamento
(tratamentos) e entre as diferentes temperaturas (blocos).

19.2.1 Requisitos para uso da ANOVA


Para que os dados de três ou mais amostras possam ser submetidos a um
teste de análise de variância, é necessário que algumas condições sejam obser-
vadas. São elas:
• Que a variável em estudo (x) apresente-se normalmente distribuída na
população. Porém, para grandes amostras, em razão do teorema do limite
central, essa condição pode ser relaxada;
• Que as amostras sejam randômicas e haja homocedasticidade de suas
variâncias, isto é, que elas não difiram significativamente entre si. Assim,
antes de realizar a ANOVA, é fundamental que se proceda a um teste
de homogeneidade das variâncias, o que pode ser feito pela aplicação
do teste de Cochran, para números iguais de repetição dentro de cada
grupo, e o teste de Bartlett, para variáveis com números desiguais de
repetição. Em razão de ser um teste bastante robusto, a ANOVA fornece
resultados confiáveis mesmo na presença de uma considerável heteroce-
dasticidade entre as variâncias, desde que os tamanhos amostrais sejam
iguais ou quase iguais.

212 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 212 25/06/12 17:22


19.3 ANOVA DE UM CRITÉRIO

Os cálculos para a obtenção do valor do teste F podem ser realizados pela


aplicação de fórmulas alternativas, desenvolvidas a partir das fórmulas tradi-
cionais das somas dos quadrados total, entre os grupos e dentro dos grupos.
Como o objetivo deste livro não é a dedução das fórmulas gerais, mostraremos
apenas a aplicação das fórmulas alternativas, as quais são mostradas na Tabela
19.2, também denominada tabela de análise de variância, cujo objetivo é
mostrar o modelo geral de um experimento inteiramente casualizado. Esta
tabela é utilizada pela maioria dos programas computacionais estatísticos
tradicionais.

Tabela 19.2 – Modelo geral de tabela de análise de variância contendo as fórmulas alternativas

Graus de liberdade Soma dos quadrados Variância


Fontes de variação Razão F
(gl) (SQ) (s2)
2
 n 
Entre os grupos  ∑ x  SQE
k–1 k  s E2 =
(tratamentos) SQE = ∑   −C k −1 s E2
n Fcalc =
s D2
Dentro dos grupos SQD
SQD = SQT − SQE s D2 =
(variação residual) N–k N −k
k n
Total SQT = ∑ ∑ x 2 − C
N–1
2
 k n  k – Número de amostras (tratamentos) do estudo
 ∑ ∑ x  N – Total de elementos das k amostras
Fator de correção C =  
n – Número de elementos de cada amostra
N

Exemplo: Com o objetivo de avaliar o padrão de ensino de uma escola


pública estadual, um pesquisador selecionou, aleatoriamente, a nota de seis
alunos nas disciplinas de língua portuguesa, física, química e matemática. Os
dados estão relacionados na Tabela 19.3. Existe diferença estatisticamente
significante entre os aproveitamentos dos alunos em relação às disciplinas
cursadas? Considerar nível de significância de 5%.

Análise de variância 213

BIOESTATISTICA_VOL02.indb 213 25/06/12 17:22


Tabela 19.3 – Valores das notas escolares de seis alunos de uma escola pública estadual

Notas nas disciplinas


Total
Português Matemática Física Química
6 9 8 6
9 8 6 5
9 7 7 4
8 8 6 5
7 8 7 6
9 8 8 4
Totais 48 48 42 30 Σx = 168
Repetições (n) 6 6 6 6 N = 24
Médias ( x ) 8 8 7 5
Σx2 392 386 298 154 1.230

• Passo 1 – Formular as hipóteses estatísticas:


HO: Não existem diferenças entre as médias das notas das disciplinas
analisadas, pois µP = µ M = µF = µQ .
HA: Ao menos uma das médias difere das demais, sendo µP ≠ µ M ou µP ≠ µF
ou µP ≠ µQ ou µ M ≠ µF ou µ M ≠ µQ ou µF ≠ µQ .
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%) unilateral
• Passo 3 – Determinar o valor crítico do teste F:
gl do numerador (entre) - gl E = k − 1 = 4 − 1 = 3
gl do denominador (dentro) - gl D = N − k = 24 − 4 = 20
gl do total - glT = N − 1 = 24 − 1 = 23
Então, Fα ;gl ;gl = F0,05;3;20 = 3,10
N D
• Passo 4 – Calcular o valor do fator de correção C:
2
 k n 
 ∑ ∑ x  2
C=  = 168 = 28.224 = 1.176
N 24 24

• Passo 5 – Calcular o valor do teste F:


k n
SQT = ∑ ∑ x 2 − C = 1.230 − 1.176 = 54

214 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 214 25/06/12 17:22


2
 n 
 ∑ x 
k 
 − C = 48 + 48 + 42 + 30 − 1.176 = 36
2 2 2 2
SQE = ∑ 
n 6

SQE 36
s E2 = =
= 12
k −1 3

SQD = SQT − SQE = 54 − 36 = 18

SQD 18
s D2 = = = 0, 90
N −k 20

s E2 12
Fcalc = = = 13,33
s D2 0, 9

Tabela 19.4 – Análise de variância dos dados da Tabela 19.3

Fonte de variação gl SQ QM (s2) Fcalc

Entre os grupos
3 36 12
(tratamentos) 13,33
Dentro dos grupos P = 0,0001
20 18 0,9
(variação residual)
23 54

• Passo 6 – Regra de decisão:

Se Fcalc < F0,05;3;20 , aceita-se H 0 .

Se Fcalc ≥ F0,05;3;20 , rejeita-se H 0 .

Como Fcalc = 13,33 > F0,05;3;20 = 3,10, rejeita-se H 0 .

• Passo 7 – Conclusão:
Como o valor para Fcalc é maior que o valor crítico tabelado F0,05;3;20 ,
rejeita-se H0 e conclui-se que ao menos uma das médias difere das de-

Análise de variância 215

BIOESTATISTICA_VOL02.indb 215 25/06/12 17:22


mais. Portanto, existe alguma diferença estatisticamente significan-
te entre as médias referentes às notas nas disciplinas avaliadas, pois
Fcalc = 13,33; P = 0,0001 .

Assim, como já anteriormente explicado, quando o resultado do teste F


não é estatisticamente significante, nenhum outro teste adicional é necessário,
uma vez que se estima que todas as médias são estatisticamente semelhantes e
foram retiradas da mesma população. Isto é, elas estimam a mesma média μ. No
entanto, quando ocorre uma diferença significante entre as médias amostrais,
o teste F não indica quais destas médias são estatisticamente diferentes entre
si. Neste caso, para que se possam determinar quais são diferentes, deve-se
passar para a segunda fase da ANOVA, na qual se aplica um dos testes de
comparações múltiplas disponíveis em estatística, dos quais os mais utilizados
serão descritos a seguir.

19.4 TESTES DE COMPARAÇÕES MÚLTIPLAS

Os testes de comparações múltiplas são complementos para a ANOVA,


que identificam as diferenças entre as médias, comparando-as duas a duas.
Semelhantes ao teste t de Student, estes testes controlam o erro ao considerar o
nível de significância conforme o número de comparações realizadas no experi-
mento. Além do mais, a variância dentro dos grupos é estimada entre todas as
amostras analisadas, ao passo que, no teste t, a variância dentro dos grupos é
estimada somente com base entre duas amostras.

19.4.1 Teste Tukey (HSD)


Desenvolvido por John Tukey3, o mesmo estatístico que criou o diagrama
de caule e folha (steam-and-leaf) e o gráfico box plot (box-and-whisker plot), o
teste é também conhecido como teste HSD, do inglês honestly significant diffe-

3. John Wilder Tukey (1915-2000) – Estatístico americano, premiado, em 1982, com a medalha
de honra do Institute of Electrical and Electronics Engineers (EUA) pela sua contribuição para
a análise espectral dos processos randômicos e pela transformada rápida do algoritmo de
Fourier. Durante a Segunda Guerra Mundial, trabalhou com Samuel Wilks e William Cochran.

216 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 216 25/06/12 17:22


rence (diferença verdadeiramente significante), assim chamado em razão dos
outros testes de comparações múltiplas tornarem a significância estatística
mais fácil de ser obtida.
Na prática, o teste de Tukey é mais exato e mais eficaz em relação aos
demais testes existentes, pois permite que se estabeleça a diferença mínima
significante (d.m.s) entre as médias amostrais quando estas são comparadas
duas a duas, tomando-se como referência um determinado nível de signifi-
cância previamente estabelecido para o experimento. Esta eficácia significa
que a hipótese nula é com mais frequência corretamente rejeitada.

Tukey para amostras de mesmo tamanho


Para amostras, ou grupos, com o mesmo número de elementos, o teste
Tukey é dado por:

QMR
d .m.s = qα;k ;glresíduo
n

Onde: qa ;k ; glresíduo = Amplitude total estudentizada obtida na tabela de


valores críticos da distribuição q (ver tabela no final do livro).
QMR = Quadrado médio da variação dentro dos grupos (variação
residual) obtido na análise de variância.
n = Número de elementos submetidos a cada tratamento.

Após calcular o valor para a d.m.s, deve-se construir uma tabela de compa-
ração entre as médias, conforme demonstrado na Tabela 19.5. Assim, de acordo
com o teste Tukey, para que qualquer diferença entre as médias seja consi-
derada estatisticamente significante, é necessário que o valor absoluto da
diferença seja igual ou superior ao valor da d.m.s.

Exemplo: Com base nos dados da Tabela 19.3, análise de variância


apresentada na Tabela 19.4 mostra um valor F significante ao nível de
5%, o que indica que ao menos uma das médias das notas obtidas nas
disciplinas analisadas é diferente das demais. Mas, qual é, ou quais são as
médias diferentes?

Análise de variância 217

BIOESTATISTICA_VOL02.indb 217 25/06/12 17:22


• Passo 1 – Calcular o valor da d.m.s:

Para: q0,05;4 ,20 = 3, 958; QMR = 0, 9 e n = 6


0, 9
Tem-se: d .m.s = 3, 958 = 1,53
6

• Passo 2 – Calcular as diferenças entre as médias:

Tabela 19.5 – Comparações entre as médias pelo teste Tukey

Valor absoluto da
Pares de médias | ≠ | ≥ d.m.s Conclusão
diferença
P vs M |8 – 8| = 0 Não Médias não diferem
P vs F |8 – 7| = 1 Não Médias não diferem
P vs Q |8 – 5| = 3 Sim Médias diferem
M vs F |8 – 7| = 1 Não Médias não diferem
M vs Q |8 – 5| = 3 Sim Médias diferem
F vs Q |7 – 5| = 2 Sim Médias diferem
P – Português; M – Matemática; F – Física; Q – Química.

• Passo 3 – Conclusão:
Entre as médias analisadas, conclui-se que ocorreram diferenças estatis-
ticamente significativas somente entre as notas de Português e Química,
Matemática e Química, e Física e Química. As demais combinações de mé-
dia não diferiram entre si.

Tukey para amostras de tamanhos diferentes


Para amostras com tamanhos diferentes, o teste de Tukey é realizado
comparando-se o valor de qcalc com o valor crítico tabelado qα;k;glresíduo, para
cada uma das diferença entre as médias analisadas. O valor qcalc é obtido pela
seguinte fórmula:

|x A − xB | QMR  1 1 
qcalc = , onde: EP =  + 
EP 2  nA nB 

218 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 218 25/06/12 17:22


Sendo:  x A e x B = As médias das duas amostras que estão sendo
comparadas.
 EP = Erro padrão de cada diferença entre as médias.
 QMR = Quadrado médio da variação dentro dos grupos (variação
residual) obtido na análise de variância.

Após calcular os valores para o erro padrão (EP) e para o qcalc, deve-se
construir uma tabela de comparação entre as médias, conforme demonstrado
na Tabela 19.8. Assim, de acordo com o teste Tukey, para que qualquer diferença
entre elas seja considerada estatisticamente significativa, é necessário que o
valor de qcalc seja maior que o valor tabelado de qα;k;glresíduo. O exemplo, a seguir,
mostra uma análise de variância com grupos de tamanhos desiguais, seguida
da aplicação do teste Tukey.

Exemplo: Um estudo foi conduzido para avaliar o efeito de três diferentes
programas de treinamento na redução da massa corporal de pacientes com
sobrepeso, frequentadores de uma academia especializada. Para tal experi-
mento, três grupos de pacientes foram aleatoriamente selecionados. Para cada
grupo, o programa foi ministrado durante um período de 30 dias. Os dados
relativos à perda de peso, em kg, estão expressos na Tabela 19.6, abaixo.

Tabela 19.6 – Valores da perda de peso, em kg, de pacientes submetidos


a três diferentes programas de treinamento

Programas de treinamento
Pacientes
A1 B2 C3
01 8 7 12
02 10 8 10
03 7 8 9
04 9 7 11
05 8 8 9
06 10 6 --
n 6 6 5
Total 52 44 51
x 8,66 7,33 10,20

Análise de variância 219

BIOESTATISTICA_VOL02.indb 219 25/06/12 17:22


A análise de variância mostrou que existe diferença estatisticamente
significativa entre as médias dos valores das perdas de peso dos programas
comparados no experimento, isto é, que ao menos uma das médias difere
significativamente das demais. Os resultados da ANOVA estão relacionados na
Tabela 19.7, abaixo.

Tabela 19.7 – Análise de variância dos dados da Tabela 19.6

Fonte de variação gl SQ QM (s2) Fcalc

Entre os grupos
2 22,416 11,208
(tratamentos)
8,98
P = 0,0034
Dentro dos grupos
14 17,467 1,248
(variação residual)

16 39,883

• Passo 1 – Calcular o valor crítico do teste:


q0,05;3;14 = 3,702

• Passo 2 – Determinar os valores para qcalc:

| x A1 − x B 2 | | 8,66 − 7,33| 1,330


qcalcA1B 2 = = = = 2, 916
QMR  1 1  1,248  1 1  0, 456
 +   + 
2  nA1 nB 2  2 6 6

| x A1 − x C 3 | | 8,66 − 10,20 | 1,540


qcalcA1C 3 = = = = 3,377
QMR 1 1  1 , 248  1 1  0 , 456
 +   + 
2  nA1 nC 3  2 6 6

| x B 2 − xC 3 | | 7,33 − 10,20 | 2,870


qcalcB 2C 3 = = = = 6,004
QMR  1 1  1,248  1 1  0, 478
 +   + 
2  nB 2 nC 3  2 6 5

220 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 220 25/06/12 17:22


• Passo 3 – Construir a tabela de comparação:

Tabela 19.8 – Comparação entre as médias pelo teste Tukey

Grupos comparados | x A − xB | | qcalc | q0,05;3;14 Conclusão

A1 vs B2 1,330 2,916 < 3,702 Médias não diferem

A1 vs C3 1,540 3,377 < 3,702 Médias não diferem

B2 vs C3 2,870 6,004 > 3,702 Médias diferem

• Passo 4 – Conclusão:
Ocorreu diferença estatisticamente significativa somente entre os progra-
mas B2 e C3.

Intervalo de confiança para a média


Com o teste Tukey, também pode ser calculado o intervalo de confiança para
a média de um dos tratamentos participantes da ANOVA. A fórmula é dada por:

QMR
IC 95% = x i ± t α;glresíduo
n1

Para o grupo A1, o intervalo de confiança para a estimativa da perda de


peso é calculada da seguinte maneira:

1,248
IC 95% = 8,66 ± 2,145
6

IC 95% = 8,66 ± (2,145)(0, 456)

IC 95% = 8,66 ± 0, 98

IC 95% = 8,66 − 0, 98 = 7,68 (limite inferior)

= 8,66 + 0, 98 = 9.64 (limite superior)

IC 95% = 7,68 kg < µ A1 < 9,64 kg

Análise de variância 221

BIOESTATISTICA_VOL02.indb 221 25/06/12 17:22


19.4.2 Teste de Student-Newman-Keuls (SNK)

O teste SNK corresponde a um outro tipo de análise de comparação post


hoc derivada do trabalho de William Gosset (1927), Newman (1939) e Keuls
(1952). O modelo, que também é baseado no teste de significância entre as
médias tomadas duas a duas, é semelhante ao teste Tukey, exceto pelo valor
crítico, que depende não do número de grupos (k) envolvidos no experimento,
mas do número de médias (k’) do experimento incluídas na amplitude entre as
duas médias que estão sendo testadas. Por exemplo, no caso de quatro médias
sendo testadas, quando se compara a maior com a menor das quatro médias,
k = 4; quando se compara a segunda maior média com a menor delas, k = 3, e
assim, sucessivamente. Então o valor crítico é dado por: qα;k ' ;glresíduo .
Para o exemplo mostrado na Tabela 19.6, os valores críticos de qα;k ' ;glresíduo
são determinados da seguinte maneira:

C3 vs B2: k’ = 3 e q0,05;3;14 = 3,702 ( amplitude entre 10,20 e 7,33 contém as


médias 10,20; 8,66 e 7,33).
C3 vs A1: k = 2 e q0,05;2;14 = 3,033 (amplitude entre 10,20 e 8,66 contém as

médias 10,20 e 8,66).


A1 vs B2: k = 2 e q0,05;2;14 = 3,033 (amplitude entre 8,66 e 7,33 contém as

médias 8,66 e 7,33).

Assim, o primeiro passo é proceder à análise de variância (teste F), com


o objetivo de verificar se as amostras foram retiradas da mesma população.
Caso o teste F forneça um valor estatisticamente significante, o próximo passo é
dispor as médias em ordem crescentes de seus valores e calcular o valor qSNKcalc
de acordo com a fórmula a seguir:

x A − xB
q SNKcalc =
QMR  1 1 
 + 
2  nA nB 

Sendo: x A e x B = As médias das duas amostras que estão sendo


comparadas.

222 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 222 25/06/12 17:22



QMR = Quadrado médio da variação dentro dos grupos (variação
residual) obtido na análise de variância.

Após calcular os valores para o qcalc, deve-se construir uma tabela de


comparação entre as médias, conforme demonstrado na Tabela 19.9. Assim, de
acordo com o teste Student-Newman-Keuls, para que qualquer diferença entre
elas seja considerada estatisticamente significativa, é necessário que o valor de
qcalc seja maior que o valor tabelado de qα;k’;glresíduo.

Tabela 19.9 – Comparação entre as médias pelo teste de Student-Newman-Keuls

Grupos comparados x A − xB qSNKcalc qtabelado Conclusão

C3 vs B2 2,870 6,004 > 3,702 Médias diferem

C3 vs A1 1,540 3,377 > 3,033 Médias diferem

A1 vs B2 1,330 2,916 < 3,033 Médias não diferem

Note que o teste de Student-Newman-Keuls e o teste Tukey utilizam o


mesmo valor crítico para a primeira comparação entre as médias. De outro
modo, o teste Tukey utiliza o mesmo valor crítico para todas as demais compa-
rações, enquanto que o teste de Student-Newman-Keuls reduz o tamanho do
valor crítico conforme o número de médias contidas na amplitude das médias
então comparadas. Isto é justificado pelo fato de que algumas diferenças
avaliadas no teste são consideradas como se fosse uma única diferença entre
duas médias, quando, na realidade, envolve três ou mais médias e, portanto,
três ou mais diferenças. Como resultado, para alguns autores, o teste SNK é
mais robusto que o teste Tukey.
Assim, comparando-se os resultados dos dois testes aplicados ao mesmo
exemplo mostrado na Tabela 19,6, verifica-se que o teste Tukey considerou apenas
uma comparação estatisticamente significante entre as médias analisadas (C3 vs
B2), ao passo que o teste de Student-Newman-Keuls encontrou duas diferenças
(C3 vs B2 e C3 vs A1). Outro ponto importante a ser considerado é que, se não existe
diferença estatisticamente significativa entre duas médias, conclui-se, portanto,
que também não há diferença entre as médias compreendidas entre elas.

Análise de variância 223

BIOESTATISTICA_VOL02.indb 223 25/06/12 17:22


19.4.3 Teste de Bonferroni
Também chamado de teste de comparações múltiplas de Dunn, o procedi-
mento de Bonferroni4 pode ser utilizado para múltiplas comparações entre todas
as médias do experimento, assim como para comparações das médias experi-
mentais contra um grupo controle, se este existir. Neste caso, a única diferença
é que o número de comparações k é menor, porque elas são realizadas somente
contra o grupo controle. Por exemplo, para o estudo mostrado na Tabela 19.6,
supondo-se que o grupo A1 é o grupo controle, se as comparações forem feitas
somente contra ele, o valor de k será igual a 2. Assim, como condição, é neces-
sário que a escolha das comparações a serem realizadas seja feita antes da
realização inicial do teste F, sendo, por este motivo, o procedimento proposto
por Bonferroni, considerado um teste de comparações a priori ou planejadas.
O teste consiste em corrigir o nível de significância α, de modo a manter a
taxa total de erro igual ou abaixo do valor previamente estipulado para o estudo;
no caso do exemplo dado, em 5%. O valor αBonf é corrigido pela seguinte fórmula:

α
αBonf = , onde : α - Nível de significância preestabelecido para
k
o experimento.
k - Número de comparações que serão realiza-
das no experimento.

Por sua vez, para o caso das comparações múltiplas realizadas após o
teste F, o procedimento consiste e calcular o valor de tBonf para cada uma das
diferenças entre as médias comparadas, o qual é dado pela seguinte fórmula:

x A − xB
t Bonf =
 1 1 
QMR  + 
n 
 A nB 

Após calcular os valores de tBonf, cada valor deve ser comparado com o
valor t crítico tabelado, para um alfa corrigido de Bonferroni (αBonf) e com os

4 Carlo Emilio Bonferroni (1892-1960) – Matemático italiano conhecido pelos seus trabalhos
sobre teorias das probabilidades.

224 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 224 25/06/12 17:22


graus de liberdade do resíduo (variação dentro dos grupos) da tabela ANOVA
(tαBonf;glresíduo). A seguir, deve-se construir uma tabela de comparação entre as
médias, conforme demonstrado na Tabela 19.10. Assim, de acordo com o teste
de Bonferroni, para que qualquer diferença entre elas seja considerada estatis-
ticamente significativa, é necessário que o valor de tBonf seja maior que o valor
crítico tabelado de tαBonf;glresíduo.
Para o caso do exemplo mostrado na Tabela 19.6 e para um nível alfa de
5%, se considerarmos todas as possíveis comparações, o qual será comparado
com os demais grupos, o valor de αBonf é dado por:

0,05
αBonf = = 0,0167
3

Verificando a tabela da distribuição t de Student, para um teste bicaudal, o


valor α mais próximo de 0,0167 é 0,02. Então o valor crítico a ser utilizado nas
comparações múltiplas é t0,02;14 = 2,624. A Tabela 19.19 mostra os resultados
das comparações entre os grupos estudados.

Tabela 19.10 – Comparação entre as médias pelo teste de Bonferroni

Grupos comparados x A − xB tBonf t0,02;14 Conclusão

A1 vs B2 1,330 2,062 < 2,624 Médias não diferem

A1 vs C3 1,540 2,278 < 2,624 Médias não diferem

B2 vs C3 2,87 4,245 > 2,624 Médias diferem

19.5 ANOVA DE MÚLTIPLOS CRITÉRIOS

Como referido anteriormente, na ANOVA de múltiplos critérios, a


variação total observada no experimento é atribuída à variação natural entre
os diferentes tratamentos (entre os grupos), entre os sujeitos das amostras
(dentro dos grupos ou variação residual) e entre os blocos. Portanto, como
dois fatores são analisados neste tipo de estudo, no caso, as duas variáveis

Análise de variância 225

BIOESTATISTICA_VOL02.indb 225 25/06/12 17:22


independentes, sendo cada uma delas medida em diferentes blocos, o modelo
é chamado de delineamento em blocos casualizados, cuja análise é a ANOVA de
dois critérios (two way ANOVA).
Assim, tal como para a ANOVA de um critério, demonstraremos apenas a
aplicação das fórmulas alternativas, as quais estão relacionadas na Tabela 19.11,
também denominada tabela de análise de variância, cujo objetivo é mostrar o
modelo geral de um experimento em blocos casualizados. Esta tabela é utilizada
pela maioria dos programas computacionais estatísticos tradicionais.

Tabela 19.11 – Modelo geral de tabela de análise de variância contendo as fórmulas alternativas
para delineamentos em blocos casualizados
Fontes de Graus de liberdade Soma dos quadrados Variância
Razão F
variação (gl) (SQ) (s2)

∑(∑ x ) sT2 (Trat.)


2
Entre os grupos SQT
FcalcT =
glT = k −1 = −C sT2 =
(tratamentos) SQT
k −1 s R2 (Res.)
b

Entre os blocos gl B = b −1 ∑ (TB2 ) s B2 =


SQB
FcalcB =
s B2 (Bloc .)
SQB = −C
k b −1 s R2 (Re s .)

SQR
Variação residual gl R = glTot − glT − gl B SQR = SQTot − SQT − SQB s R2 =
gl R

Total glTot = (kb ) − 1 SQTot = ∑ x 2 − C

k–N  úmero de amostras (tratamentos) do


(∑ x )
2

Fator de correção C = estudo


kb b – Número de blocos do estudo
O raciocínio é o mesmo utilizado para a ANOVA de um critério. Inicialmente,
calcula-se o valor para a razão FcalcT , o qual será comparado com o valor crítico
tabelado Fα;gl ;gl , de modo que se possa verificar se existe alguma diferença
T R
estatisticamente significativa entre os diferentes tratamentos (amostras).
Assim, se FcalcT > Fα;gl ;gl , conclui-se que existe ao menos uma diferença signi-
T R
ficativa, sendo a determinação da significância entre os tratamentos, tomados
dois a dois, verificada pela aplicação de um teste de comparações múltiplas
do tipo Tukey, Student-Newman-Keuls ou Bonferroni. Caso contrário, se
FcalcT < Fα;gl ;gl , não há necessidade de se aplicar nenhum teste de comparações
T R
múltiplas, pois não existem diferenças significativas entre os tratamentos. Do

226 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 226 25/06/12 17:22


mesmo modo, para a comparação entre os blocos, o raciocínio é idêntico àquele
empregado para os tratamentos.
A seguir, para ilustrar um modelo de aplicação da ANOVA de dois critérios,
utilizaremos uma variante do exemplo mostrado para a ANOVA de um critério.

Exemplo: Em uma determinada cidade, com o objetivo de avaliar o padrão


do ensino das escolas de ensino médio, compararam-se as médias obtidas nas
disciplinas Português, Matemática, Física e Química (tratamentos), segundo
a categoria da escola de origem do aluno, seja ela federal, estadual, municipal
ou particular (blocos). Os dados estão relacionados na Tabela 19.11. Existe
diferença estatisticamente significante entre os aproveitamentos dos alunos
em relação às disciplinas cursadas? Existe diferença no padrão de ensino
conforme a categoria da escola? Considerar nível de significância de 5%.

Tabela 19.12 – Análise da variância para comparar as médias das notas das disciplinas
(tratamentos) conforme o tipo de escola (blocos)
Médias nas disciplinas
Total do bloco (TB)
Português Matemática Física Química
Tipo de escola
Federal 6 9 9 6 30
Estadual 9 8 6 5 28
Municipal 9 7 7 4 27
Particular 8 8 6 5 27
Totais (Σx) 32 32 28 20 112

Médias ( x ) 8 8 7 5

Σx2 262 258 202 102 824

• Passo 1 – Formular as hipóteses estatísticas:


H0: Não existe diferença entre as médias das notas das disciplinas analisa-
das, pois µP = µ M = µF = µQ .
HA: Ao menos uma das médias difere das demais, sendo µP ≠ µ M ou µP ≠ µF
ou µP ≠ µQ ou µ M ≠ µF ou µ M ≠ µQ ou µF ≠ µQ .
H0: A categoria da escola não interfere na média da disciplina analisada.
HA: A categoria da escola interfere na média da disciplina analisada.

Análise de variância 227

BIOESTATISTICA_VOL02.indb 227 25/06/12 17:22


• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%) unilateral
• Passo 3 – Determinar o valor crítico do teste F:
gl do numerador (tratamentos) - glT = k − 1 = 4 − 1 = 3
gl do numerador (blocos) - gl B = b − 1 = 4 − 1 = 3
gl do total - glTot = (kb ) − 1 = (4 x 4) − 1 = 15
gl do denominador (resíduo) - gl R = glTot − glT − gl B = 15 − 3 − 3 = 9

Então:
Valor crítico para comparação entre os tratamentos = Fα;gl = F0,05;3;9 = 3,86
T ;glR

Valor crítico para comparação entre os blocos = Fα;gl = F0,05;3;9 = 3,86


B ;glR

• Passo 4 – Calcular o valor do fator de correção C:

(∑ x )
2
1122 12.544
C= = = = 784
kb 16 16

• Passo 5 – Calcular o valor do teste F:

SQTot = ∑ x 2 − C = 824 − 784 = 40

∑(∑ x )
2
322 + 322 + 282 + 202
SQT = −C = − 784 = 808 − 784 = 24
b 4

SQT 24
sT2 = =8=
k −1 3

∑ (TB2 ) 302 + 282 + 272 + 272


SQB = −C = − 784 = 785,50 − 784 = 1,50
k 4

SQB 1,50
s B2 = =
= 0,50
b −1 3

SQR = SQTot − SQT − SQB = 40 − 24 − 1,50 = 14 ,50

228 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 228 25/06/12 17:22


SQR 14 ,50
s R2 = = = 1,61
gl R 9

sT2 Tratamentos 8 s 2 Blocos 0, 5


FcalcT = = = 4 , 96 e FcalcB = 2B = = 0,31
s R2 Resíduo 1,61 s R Resíduo 1,61

Tabela 19.13 – Análise de variância para os dados da Tabela 19.12

Fonte de variação gl SQ QM (s2) Fcalc

Entre os grupos FcalcT = 4 , 96


3 24 8
(tratamentos)
P = 0,026

FcalcB = 0,31
Entre os blocos 3 1,5 0,5
P = 0,818
Dentro dos grupos
9 14,5 1,61
(variação residual)


• Passo 6 – Regra de decisão para a comparação entre os tratamentos:
Se FcalcT < F0,05;3;9 , aceita-se H 0 .

Se FcalcT ≥ F0,05;3;9 , rejeita-se H 0 .

Como FcalcT = 4,69 > F0,05;3;9 = 3,86, rejeita-se H 0 .

• Passo 7 – Regra de decisão para a comparação entre os blocos:

Se FcalcB < F0,05;3;9 , aceita-se H 0 .

Se FcalcB ≥ F0,05;3;9 , rejeita-se H 0 .

Como FcalcB = 0,31 < F0,05;3;9 = 3,86, aceita-se H 0 .

• Passo 8 – Conclusão:
Como o valor para FcalcT é maior que o valor crítico tabelado F0,05;3;9 ,
rejeita-se H0 e conclui-se que ao menos uma das médias difere das de-
mais. Portanto, existe alguma diferença estatisticamente significante entre

Análise de variância 229

BIOESTATISTICA_VOL02.indb 229 25/06/12 17:22


as médias referentes às disciplinas avaliadas, pois FcalcT = 4 ,69; P = 0,026 .
Por outro lado, como o valor de FcalcB é menor que o valor crítico tabelado
F0,05;3;9 , aceita-se H0 e se conclui que não ocorreram diferenças estatistica-
mente significativas entre os blocos comparados, demonstrando, portan-
to, que a categoria da escola não influenciou nas médias dos alunos, pois
FcalcB = 0,31; P = 0,818 .

Note que, no teste da ANOVA de dois critérios, também é importante o


processo de randomização para a distribuição dos tratamentos nas amostras,
mesmo que os pacientes sejam distribuídos em grupos homogêneos. No
exemplo acima, a seleção das médias de cada disciplina (tratamentos) foi feita
de modo aleatório entre todos os participantes de cada bloco, o que permite ao
pesquisador estimar a variação que é devida à categoria da escola, que pode
ser subtraída da variação residual. Este procedimento diminui o tamanho do
resíduo, de modo que reste apenas a variação aleatória entre os indivíduos
da pesquisa, a qual não pode ser atribuída nem à disciplina avaliada nem à
categoria da escola estudada.
Observe, também, que a distribuição em blocos melhora a precisão do
experimento, desde que seja interessante verificar se há diferença significativa
entre eles, pois, em muitos casos, os blocos são distribuídos conforme uma
diferença já previamente reconhecida entre os indivíduos do estudo. Porém,
se o teste F para a comparação entre os blocos não for significativo, isto pode
indicar que as unidades experimentais eram originalmente homogêneas entre
si e não houve sucesso em reduzir a variação residual, ou que as amostras são
demasiadamente pequenas para apresentar alguma diferença significativa
entre elas.

230 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 230 25/06/12 17:22


20
Análise de Variância
Não-Paramétrica

Igualmente como já foi referido nos capítulos anteriores, na pesquisa experi-


mental, sempre que os requisitos de normalidade dos dados amostrais forem
violados, para que possa testar suas hipóteses, o pesquisador deverá buscar uma
alternativa nos modelos não-paramétricos. Do mesmo modo, situação semelhante
ocorre na análise de variância, pois, embora o teste F seja bastante robusto,
mesmo para os casos de grandes amostras que não sigam princípio da norma-
lidade, o pesquisador deve sempre considerar o uso da ANOVA não-paramétrica,
especialmente quando estas são pequenas e desviam-se consideravelmente em
relação à distribuição normal, assim como quando as variâncias são acentuada-
mente desiguais e os tamanhos amostrais são diferentes.
De qualquer forma, tal como para os demais testes não-paramétricos,
na ANOVA não-paramétrica, os testes tomam como base a análise dos dados
por postos em vez de considerarem os valores originais, de modo que, para a
ANOVA de um critério, o método não-paramétrico é o teste de Kruskal-Wallis,
com as comparações múltiplas post hoc entre as médias podendo ser feitas
usando-se o teste da soma de postos de Wilcoxon. Por sua vez, para a ANOVA
de dois critérios em que há interesse em mais de duas amostras relacionadas,
em dois momentos distintos, o método não-paramétrico de escolha é o teste de
Friedman. Estes testes serão descritos a seguir.

BIOESTATISTICA_VOL02.indb 231 25/06/12 17:22


20.1 TESTE DE KRUSKAL-WALLIS (Teste H)

Também conhecido como teste H, o teste de Kruskal1-Wallis2 é um procedi-


mento estatístico que objetiva comparar três ou mais amostras independentes,
do mesmo tamanho ou de tamanhos desiguais, cujos escores são mensurados
em nível ordinal (por postos), sendo, portanto, um substituto não-paramétrico
para a ANOVA de um critério. Na prática, o teste é uma extensão do teste da
soma de postos de Wilcoxon-Mann-Whitney (WMW) para três ou mais grupos.
Note, porém, para que o teste possa ser utilizado, é necessário que as três
ou mais amostras sejam aleatórias e as observações independentes, tanto dentro
de cada amostra como entre as amostras estudadas, ao mesmo tempo em que
a variável considerada deve ser mensurada em escala ordinal, isto é, que seja
apresentada do menor ao maior valor. Para tal, é necessário que cada valor da
mostra corresponda a um posto (escore ou rank), o qual deve ser representado
por um número natural, que indicará sua posição no conjunto de dados amostrais,
quando ordenados. Portanto, o menor valor da amostra receberá o posto de
número 1, e assim sucessivamente, até que o maior valor receba o posto de maior
número. Quando ocorre a presença de valores iguais na amostra, considera-se a
média dos postos que seriam ocupados por eles, de tal modo que não afete o posto
seguinte. Tome-se, como exemplo, um conjunto de seis valores já ordenados: {9;
15; 17; 17; 21; 23}. Os respectivos postos serão: {1; 2; 3,5; 3,5; 5; 6}.

Raciocínio do teste
Para ilustrar o raciocínio, consideremos a comparação entre três amostras
(tratamentos), A, B e C. Se os valores para os indivíduos da amostra A forem,
em geral, menores que os valores para os indivíduos das amostras B ou C,
quando se ordenam, do menor para o maior, todos os valores das três amostras
consideradas conjuntamente, os postos ocupados pelos indivíduos da amostra
A serão, em geral, menores do que os postos ocupados pelos indivíduos das
amostras B e C. Como consequência, o posto médio da amostra A será menor do

1. William Henry Kruskal (1919-2005) - Matemático e estatístico americano, foi professor


emérito da Universidade de Chicago.
2 Wilson Allen Wallis (1912-1998) - Economista e estatístico americano, foi sub-secretário de
economia, negócios e agricultura do governo de Ronald Reagan.

232 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 232 25/06/12 17:22


que os postos médios das amostras B e C. Neste caso, se a diferença encontrada
for grande o suficiente para que possa ser explicada além do que se esperaria
encontrar somente pelo acaso, a diferença entre os três postos médios é dita
estatisticamente significativa, indicando que a população A é diferente das
populações B e C. O mesmo princípio é aplicado para as amostras B e C, isto é, o
teste verifica se ao menos uma das amostras difere das demais.
O teste envolve o cálculo de um valor estatístico chamado de valor H, cuja
distribuição é testada contra a hipótese de nulidade. No caso de pequenas
amostras (n < 6) e para experimentos onde o número de grupos (k) é pequeno,
a significância estatística é verificada com a utilização da tabela de valores
críticos da distribuição H de Kruskal-Wallis (ver tabela no final do livro), a
qual fornece os valores críticos para H α;n ;n ;...n . Mas, para grandes amostras
1 2 i
ou quando mais de cinco grupos (k > 5) são comparados, a estatística H tem
uma boa aproximação com a distribuição qui-quadrado (χ2), sendo, neste
caso, o valor Hcalc comparado com o valor crítico tabelado χa;gl com (k – 1)
2

graus de liberdade. Assim, é importante saber que os procedimentos para


a utilização do teste H de Kruskal-Wallis diferem de acordo com o tamanho
amostral, todos facilmente calculados e que serão mostrados a seguir:

• Inicialmente, ordenam-se, do menor para o maior, os valores das amostras


e anota-se, ao lado de cada valor, o número de ordem (ou posto) corres-
pondente. Não esqueça que, se houver empate, o posto para cada valor
empatado corresponde à média dos postos que seriam ocupados por eles;
• A seguir, determinam-se os tamanhos amostrais, os quais são designados
por n1, n2, n3,..., ni;
• Obtêm-se os valores para R1, R2, R3,..., Ri, que correspondem às somas dos
postos para as amostras 1, 2, 3, ...ki, respectivamente. Se a ordenação estiver
correta, teremos:

N (N + 1)
∑Ri = 2
; para N = ∑ n1

• Em seguida, calcula-se o valor do teste (H calc). A fórmula é mostrada a


seguir:

Análise de Variância Não-Paramétrica 233

BIOESTATISTICA_VOL02.indb 233 25/06/12 17:22


12 Ri2
Hcalc = ∑ − 3(N + 1), onde: N = Σni
N (N + 1) ni
ni - Tamanho de cada amostra.
Ri - S oma dos postos de cada
amostra.

• Se ocorrerem empates nos postos, o valor de Hcalc deverá ser corrigido pelo
fator de correção (FC) conforme a fórmula abaixo:

CE
FC = 1 − ; onde: CE = ∑(t 3 − t )
N3 −N

Sendo t o número de observações empatadas em cada posto. Por exemplo:


se hover dois empates com o posto 2,5 e outros quatro empates com o posto
7,5, o cálculo para CE será:

CE = (23 − 2) + (43 − 4) = 66

Hcalc
Então: Hcorrig =
FC

• Finalmente, o teste de significância é realizado da seguinte maneira: se o


valor de Hcalc for maior que o valor crítico tabelado H a;n ;n ;...n ou χα;gl , a
2

1 2 i
hipótese nula é rejeitada. Caso contrário, aceita-se a hipótese nula.
Assim temos:
H0: os tratamentos não diferem significativamente entre si;
H1: ao menos um dos tratamentos difere significativamente dos demais.
Para demonstrar a aplicação do teste Kruskal-Wallis, utilizaremos o
seguinte exemplo:

Exemplo: O teste de Apgar3 é um exame rápido realizado imediatamente


após o nascimento, cujo objetivo é avaliar, ainda na sala de parto, a condição

3. Virginia Apgar (1909-1974) – Médica americana especializada em anestesia pediátrica, foi a


fundadora da neonatologia, sendo mais conhecida pela criação do teste de Apgar, um método
revolucionário de avaliar a saúde de recém-nascido, que reduziu drasticamente a mortalidade
infantil em todo o mundo.

234 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 234 25/06/12 17:22


física do recém-nascido. O teste é feito pela análise dos batimentos cardíacos,
reflexos, tônus muscular, cor da pele e respiração, os quais recebem nota de 0 a
2, podendo chegar ao máximo de 10, que corresponde à criança mais saudável,
e os valores inferiores a 5 indicam que o recém-nascido necessita de assis-
tência médica imediata para se adaptar ao novo ambiente. Um pesquisador,
que queria verificar se a idade materna interfere no teste de Apgar, comparou
os escores obtidos em três grupos de mulheres, adolescentes (idade < 20 anos),
adultas jovens (idade de 20 a 34 anos) e adultas maduras (idade > 34 anos).
Os escores (já ordenados) são apresentados nas tabelas 20.1 e 20.2, abaixo.
Portanto, existe diferença estatisticamente significativa nos valores do teste de
Apgar entre as crianças nascidas de mães com diferentes faixas etárias?

Tabela 20.1 – Ordem, escore do teste de Apgar e o respectivo posto para cada um
dos 17 recém-nascidos incluídos no estudo.

Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Escore 4 5 6 6 6 7 7 7 8 8 8 8 9 9 10 10 10

Posto 1 2 4 7 10,5 13,5 16

Tabela 20.2 - Ordem, escore do teste de Apgar e o respectivo posto para cada um
dos 17 recém-nascidos conforme a idade materna

Idade < 20 anos Idade de 20 a 34 anos Idade > 34 anos


RN Escore Posto RN Escore Posto RN Escore Posto
5 6 4 7 7 7 1 4 1
6 7 7 8 7 7 2 5 2
10 8 10,5 9 8 10,5 3 6 4
11 8 10,5 14 9 13,5 4 6 4
13 9 13,5 16 10 16 12 8 10,5
10 10 16 17 10 16 -- -- --
Ri 61,5 70,0 21,5
ni 6 6 5

Ri
Ri = R1 = 10,25 R2 = 11,66 R3 = 4 ,30
ni

Análise de Variância Não-Paramétrica 235

BIOESTATISTICA_VOL02.indb 235 25/06/12 17:22


Uma vez que, na população estudada, não existe um padrão de distribuição
para o teste de Apgar, e o número de indivíduos nas três amostras é pequeno,
a melhor maneira de compará-las é utilizar um teste não-paramétrico. Neste
caso, o teste Kruskal-Wallis é o mais adequado, pois as três amostras são
independentes e a variável estudada é do tipo ordinal.

• Passo 1 – Formular as hipóteses estatísticas:


H0:Não existem diferenças entre as médias dos escores do teste de Apgar
para os grupos analisados, pois µ1 = µ2 = µ3 .
HA:Ao menos uma das médias difere das demais, sendo µ1 ≠ µ2 ou µ1 ≠ µ3
ou µ2 ≠ µ3 .
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%) unilateral
• Passo 3 – Determinar o valor crítico do teste:
H α;n ;n ;n = H 0,05;6;6;5 = 5,765
1 2 3
• Passo 4 – Calcular o valor do teste Hcalc:

N (N + 1)  17(17 + 1) 
Sendo ∑Ri = ; então (61,5 + 70,0 + 21,5) = 153 =  
2  2 
A ordenação está correta.

12  61,52 70,02 21,52 


Assim: Hcalc =  + +  − 3(1
17 + 1) = 6,372
17(17 + 1)  6 6 5 

Como foram observados empates para os escores 6, 7, 8, 9 e 10, é necessá-


rio realizar a correção para Hcalc.

• Passo 5 – Calcular o valor do teste Hcorrig:

CE = (33 − 3) + (32 − 3) + (43 − 4) + (23 − 2) + (33 − 3) = 24 + 24 + 60 + 6 + 24 = 138

138 138
FC = 1 − = 1− = 1 − 0,0282 = 0, 972
17 − 17
3 4.896

Hcalc 6,372
Hcorrig = = = 6,556
FC 0, 972

236 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 236 25/06/12 17:22


• Passo 6 – Regra de decisão:

Se Hcorrig < H 0,05;6;6;5 , aceita-se H 0 .

Se Hcorrig ≥ H 0,05;6;6;5 , rejeita-se H 0 .

Como Hcorrig = 6,556 > H 0,05;6;6;5 = 5,765, rejeita-se H 0 .

• Passo 7 – Conclusão:
Como o valor para Hcorrig é maior que o valor crítico tabelado H 0,05;6;6;5 ,
rejeita-se H0 e conclui-se que ao menos uma das médias difere das demais.
Portanto, existe alguma diferença estatisticamente significativa entre as
médias dos testes de Apgar de crianças nascidas de mães com diferentes
faixas etárias, pois Hcorrig = 6,556; P = 0,037 .

Assim, como já anteriormente explicado, quando o resultado do teste H não


é estatisticamente significante, nenhum outro teste adicional é necessário, uma
vez que se estima que todas as médias sejam estatisticamente semelhantes e,
portanto, foram retiradas da mesma população. Isto é, elas estimam a mesma
média μ. No entanto, quando ocorre uma diferença significativa entre as
médias amostrais, o teste H não indica quais destas médias são estatistica-
mente diferentes entre si. Neste caso, para que se possam determinar quais
são diferentes, deve-se passar para a segunda fase da ANOVA não-paramétrica,
na qual se aplica um dos testes de comparações múltiplas disponíveis, sendo o
teste de Dunn o mais utilizado e que será mostrado a seguir.

20.1.1 Teste de Dunn (Teste Q)


O teste de Dunn é um procedimento não-paramétrico post hoc, que
corresponde ao teste de comparações múltiplas de Tukey utilizado na ANOVA
paramétrica (Teste F). O raciocínio do teste é semelhante e baseia-se na compa-
ração entre os postos médios ( Ri ) obtidos para cada amostra (tratamento).
O teste de Dunn é realizado comparando-se o valor de Qcalc para cada uma
das diferenças entre os postos médios ( Ri ) analisados, com o valor crítico
tabelado Qα;k obtido na tabela de valores críticos da distribuição Q (ver tabela
no final do livro). O valor Qcalc é obtido pela seguinte fórmula:

Análise de Variância Não-Paramétrica 237

BIOESTATISTICA_VOL02.indb 237 25/06/12 17:23


RA − RB N (N + 1)  1 1 
Qcalc = , onde: EP =  + 
EP 12  nA nB 

Sendo: RA e RB = Os postos médios das duas amostras que estão sendo
comparadas.
EP = Erro padrão de cada diferença entre os postos médios que
estão sendo comparados.
N­= Σni
nA e nB = Tamanho das duas amostras que estão sendo comparadas.

Se ocorrerem empates, o EP deve ser corrigido pela seguinte fórmula:

 N (N + 1) CE  1 1 
EP =  −   +  , onde: CE = ∑(t 3 − t )
 12 12(N − 1)   nA nB 

Após calcular os valores para o erro padrão (EP) e para o Qcalc, deve-se
construir uma tabela de comparação entre os postos médios, conforme
demonstrado na Tabela 20.3. Assim, de acordo com o teste de Dunn, para que
qualquer diferença entre eles seja considerada estatisticamente significativa,
é necessário que o valor de Qcalc seja maior que o valor tabelado de Qα;k. Assim,
para o exemplo mostrado na Tabela 20.2, os testes de significância entre os
postos médios são mostrados abaixo:

• Passo 1 – Calcular o valor crítico do teste:


Q0,05;3 = 2,394
• Passo 2 – Determinar os valores para Qcalc:

R1 − R2
Qcalc 1;2 =
 N (N + 1) CE  1 1 
 −  + 
 12 12(N − 1)   n1 n2 

|10,25 − 11,66 | 1, 410


= = = 0, 490
 17(17 + 1) 138   1 1  2,874
 −  + 
 12 12(17 − 1)   6 6 

238 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 238 25/06/12 17:23


R1 − R3
Qcalc 1;3 =
 N (N + 1) CE  1 1 
 −  + 
 12 12(N − 1)   n1 n3 

|10,25 − 4 ,30 | 5, 950


= = = 1, 974
 17(17 + 1) 138   1 1  3,014
 −  + 
 12 7 − 1)   6 5 
12(17

R2 − R3
Qcalc 2;3 =
 N (N + 1) CE  1 1 
 −  + 
 12 12(N − 1)   n2 n3 

|11,66 − 4 ,30 | 7,360


= = = 2, 442
 17(17 + 1) 138   1 1  3,014
 −  + 
 12 7 − 1)   6 5 
12(17

• Passo 3 – Construir a tabela de comparação:

Tabela 20.3 – Comparação entre as médias pelo teste de Dunn


Grupos etários
| RA e RB | Qcalc Q0,05;3 Conclusão
comparados
< 20 vs 20 a 34 1,410 0,490 < 2,394 Médias não diferem
< 20 vs > 34 5,950 1,974 < 2,394 Médias não diferem
20 a 34 vs > 34 7,360 2,442 > 2,394 Médias diferem

• Passo 4 – Conclusão:
Ocorreu diferença estatisticamente significativa somente entre os recém-
-nascidos dos grupos de mães com idade de 20 a 34 anos e idade > 34 anos.

Observe, também, que os valores do teste de Agar foram, em média,


maiores para os recém-nascidos de mães com idade compreendida de 20 a 34

Análise de Variância Não-Paramétrica 239

BIOESTATISTICA_VOL02.indb 239 25/06/12 17:23


anos e menores para os recém-nascidos de mães com idade maior de 34 anos.
Porém, para os valores dos recém-nascidos de mães com idade menor de 20
anos, o resultado do teste de Dunn foi inconclusivo, provavelmente em razão
do pequeno tamanho amostral utilizado na pesquisa.

20.2 TESTE DE FRIEDMAN (Teste χr )


2

O teste Friedman4 corresponde a um modelo de teste estatístico


não-paramétrico utilizado como uma alternativa para a ANOVA de dois critérios.
Os dados devem ser mensurados em nível ordinal, e a comparação é feita entre
três ou mais amostras (tratamentos) relacionadas ou dependentes, cujos
valores são distribuídos por blocos. Na prática, comparam-se os k tratamentos
em que são formados b blocos, com a finalidade de que ocorra um pareamento
entre as diferentes amostras. As amostras devem ter o mesmo tamanho, e os
dados devem ser dispostos em linhas, que representam os blocos, e em colunas,
que representam as condições experimentais ou tratamentos.
A realização do modelo de Friedman é semelhante aos demais testes
não-paramétricos:

• Inicialmente, atribui-se o número de ordem (posto), de modo crescente,


para os valores dentro de cada bloco (linhas). Não esqueça que, se houver
empate, o posto para cada valor empatado corresponde à média dos postos
que seriam ocupados por eles;
• Posteriormente, obtêm-se os valores para R1, R2, R3,..., Ri, que corres-
pondem às somas dos postos dentro de cada tratamento (colunas);
• Em seguida, calcula-se o valor do teste χr . A fórmula é mostrada abaixo:
2

k
12
χ2r = ∑
b.k (k + 1) i =1
Ri2 − 3.b(k + 1), onde : b - Número de blocos.
k – Número de tratamentos.
Ri - Soma dos postos de cada
amostra.

4. Milton Friedman (1912-2006) – Economista e estatístico americano ganhador do prêmio


Nobel de Economia em 1976.

240 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 240 25/06/12 17:23


• Se ocorrerem empates nos postos, o valor de χr deverá ser corrigido
2

pelo fator de correção (FC) conforme a fórmula abaixo. A única diferença é que
a ordenação se faz separadamente dentro de cada bloco.

CE
FC = 1 − ; onde : CE = ∑(t 3 − t )
b(k − k )
3

Sendo t o número de observações empatadas em cada posto, dentro de


cada bloco. Por exemplo: se no bloco 1, houver dois empates com o posto 1,5 e,
no bloco 2, 3, empates com o posto 2, o cálculo para CE será:

CE = (23 − 2) + (33 − 3) = 30

χ2r
Então: χc2rorrig =
FC

• Finalmente, o teste de significância é realizado da seguinte maneira: no


caso de pequenas amostras, isto é, k ≤ 6 e b ≤ 155, a significância estatística
é verificada com a utilização da tabela de valores críticos da distribuição χr
2

de Friedman (ver tabela no final do livro), a qual fornece os valores críticos


para χr ;k ;b . Mas, para grandes amostras (k > 6 ou b > 15), a estatística χr
2 2

tem uma boa aproximação com a distribuição qui-quadrado (χ2), sendo, neste
caso, o valor χrcalc comparado com o valor crítico tabelado χr α;( k -1) com
2 2

(k – 1) graus de liberdade. Assim, se o valor de χrcalc for maior que o valor


2

crítico tabelado χr ;k ;b ou χr α;( k -1) , a hipótese nula é rejeitada. Caso contrário,


2 2

aceita-se a hipótese nula. Assim, temos:

H0: os tratamentos não diferem significativamente entre si;


H1: ao menos um dos tratamentos difere significativamente dos demais.

Para demonstrar a aplicação do teste de Friedman, utilizaremos o seguinte


exemplo:

5. A tabela da distribuição de Friedman contém apenas valores críticos até k = 6 e b = 15.

Análise de Variância Não-Paramétrica 241

BIOESTATISTICA_VOL02.indb 241 25/06/12 17:23


Exemplo: Um estudo simples-cego foi delineado para avaliar o sabor e
aroma de quatro variedades de café (Coffea sp). Para tal experimento, cinco
baristas6 foram selecionados, e cada um deles deveria atribuir um escore de
zero a dez pontos, conforme a preferência individual. Os resultados estão
relacionados na Tabela 20.4. A análise dos baristas foi influenciada pela
variedade do café?

Tabela 20.4 – Valores dos escores, e respectivos postos, atribuídos a quatro variedades de café,
conforme a preferência individual de cada um dos cinco baristas selecionados para o estudo

Cramer Bourbon Caturra Robusta


Barista
Escore Posto Escore Posto Escore Posto Escore Posto

01 4 1 5 2 7 3 8 4

02 6 1,5 6 1,5 7 3 8 4

03 7 2 6 1 8 3 9 4

04 8 1,5 8 1,5 9 3,5 9 3,5

05 8 1 9 2 10 3,5 10 3,5

ΣRi R1 = 7 R2 = 8 R3 = 16 R4 = 19

Uma vez que, na população estudada, não existe um padrão de distribuição


para a análise sensorial avaliada e o número de observações nas amostras é
pequeno, a melhor maneira de compará-las é utilizar um teste não-paramétrico.
Neste caso, o teste de Friedman é o mais adequado, pois as quatro amostras são
relacionadas, e a variável estudada é do tipo ordinal.

• Passo 1 – Formular as hipóteses estatísticas:


H0: Não existem diferenças entre as médias dos escores para as espécies de
café analisadas, pois µ1 = µ2 = µ3 = µ 4 .
HA: Ao menos uma das médias difere das demais, sendo µ1 ≠ µ2 ou µ1 ≠ µ3
ou µ1 ≠ µ 4 ou µ2 ≠ µ3 ou µ2 ≠ µ 4 ou µ3 ≠ µ 4 .

6. Barista - Profissional especializado em cafés, cuja principal função é conhecer todas as fases
da vida do produto, desde o cultivo da planta, etapas de processamento e beneficiamento do
grão, além dos detalhes dos processos de extração da bebida.

242 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 242 25/06/12 17:23


• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%) unilateral
• Passo 3 – Determinar o valor crítico do teste:
χ2r α;k ;b = H 0,05;4;5 = 7,800

• Passo 4 – Calcular o valor do teste χrcalc :


2

χ2rcalc =
12
5.4(4 + 1)
( )
72 + 82 + 162 + 192 − 3.5(4 + 1) = 87,60 − 75,00 = 12,600

Como foram observados empates nos blocos 2, 4 e 5, é necessário realizar


a correção para χrcalc .
2

• Passo 5 – Calcular o valor do teste χrcorrig :


2

Bloco 1 - 2 postos empatados em 1,5 (23 – 2)


Bloco 4 - 2 postos empatados em 1,5 (23 – 2)
2 postos empatados em 3,5 (23 – 2)
Bloco 5 - 2 postos empatados em 3,5 (23 – 2)

CE = (23 − 2) + (22 − 2) + (23 − 2) + (23 − 2) = 24

24 24
FC = 1 − = 1− = 1 − 0,080 = 0, 920
5(43 − 4) 300

χ2rcalc 12,600
χ2rcorrig = = = 13,695
FC 0, 920

• Passo 6 – Regra de decisão:

Se χ2rcorrig < χ2r 0,05;4;5 , aceita - se H 0 .

Se χ2rcorrig ≥ χ2r 0,05;4;5 , rejeita - se H 0 .

Como χ2rcorrig = 13,695 > χ2r 0,05;4;5 = 7,800, rejeita - se H 0 .

Análise de Variância Não-Paramétrica 243

BIOESTATISTICA_VOL02.indb 243 25/06/12 17:23


• Passo 7 – Conclusão:
Como o valor para χrcorrig é maior que o valor crítico tabelado χr 0,05;4;5 ,
2 2

rejeita-se H0 e se conclui que ao menos uma das médias difere das


demais. Portanto, existe alguma diferença estatisticamente signifi-
cativa entre as avaliações dos baristas e o tipo de café analisado, pois
χ2rcorrig = 13,695; P = 0,005 .

Assim, como já anteriormente explicado, quando o resultado do teste χr


2

não é estatisticamente significante, nenhum outro teste adicional é neces-


sário, uma vez que se estima que todas as médias sejam estatisticamente
semelhantes e, portanto, foram retiradas da mesma população. Isto é, elas
estimam a mesma média μ. No entanto, quando ocorre uma diferença signifi-
cativa entre as médias amostrais, o teste χr não indica quais destas médias são
2

estatisticamente diferentes entre si. Neste caso, para que se possam deter-
minar quais são diferentes, deve-se passar para a segunda fase da ANOVA
não-paramétrica, na qual se aplica um dos testes de comparações múltiplas
disponíveis em estatística.

244 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 244 25/06/12 17:23


21
Regressão Múltipla

Neste capítulo, abordaremos dois modelos de análise de regressão: a


análise de regressão múltipla e a regressão logística, todos muito utilizados
em pesquisa na área das ciências da saúde. Em ambos, correlacionam-se duas
ou mais variáveis independentes com apenas uma variável dependente, obser-
vando-se que o primeiro modelo deve ser utilizado quando a variável-resposta
(dependente) e todas as variáveis preditoras (independentes) são contínuas,
enquanto que a regressão logística deve ser o método de escolha para os casos
em que a variável-resposta é dicotômica (binária) e as variáveis preditoras são
contínuas ou categóricas.

21.1 REGRESSÃO LINEAR MÚLTIPLA

No capítulo 12 deste livro, descrevemos os procedimentos para a regressão


linear simples, a qual deve ser utilizada quando o pesquisador deseja fazer
previsão para o valor de uma variável-resposta (y) com base no conhecimento
dos valores de uma única variável preditora (x). Do mesmo modo, a análise de
regressão linear múltipla corresponde a uma generalização direta da regressão

BIOESTATISTICA_VOL02.indb 245 25/06/12 17:23


linear simples, exceto pelo fato de que, na regressão múltipla utilizam-se duas
ou mais variáveis preditoras.
Assim, a título de uma breve revisão, lembramos que o modelo de
regressão linear simples é dado pela equação da reta y = a + bx, onde y corres-
ponde ao valor encontrado para a variável dependente e x o valor da variável
dependente. Por sua vez, a constante a representa o intercepto, isto é, o ponto
em que a reta cruza, no gráfico, o eixo das ordenadas (eixo y), ao passo que
a constante b corresponde à inclinação da reta, ou seja, ao ângulo que ela
forma com o eixo das abscissas (eixo x), sendo conhecido, também, como
coeficiente de regressão.
Portanto, é interessante notar que verdadeira reta de regressão para uma
dada população somente seria obtida caso todos os valores de x e y fossem
conhecidos. Porém, como normalmente isso é impossível de ser feito, o mais
comum é que a regressão entre as variáveis estudadas seja calculada tomando-
-se uma amostra n de pontos, aleatoriamente coletados, da população e, a partir
desses pontos, determinar os valores do coeficiente linear (a) e do coeficiente
angular (b), de tal maneira que a reta encontrada possa ser ajustada. Assim,
para que se possa utilizar a reta de regressão a fim de fazer previsões para y,
com base em valores determinados de x, deve-se realizar um teste de hipótese
para verificar se a regressão de x sobre y é verdadeira, isto é, se a dependência
de y em relação a x é real, se não ocorreu por acaso, em razão do erro aleatório.
Deste modo, como a dependência de y em relação a x é dada pelo coeficiente de
regressão (b), o qual geralmente é calculado com base em uma amostra, o teste
de hipótese serve para verificar se existe uma diferença estatisticamente signi-
ficativa entre o coeficiente calculado b e o verdadeiro coeficiente da população
(B) de onde a amostra foi retirada.
O mesmo princípio é aplicado à regressão linear múltipla, cujo modelo
matemático é dado pela seguinte equação:

y = a + b1x 1 + b2x 2 + b3x 3 + ... + bk x k

Onde: a = Intercepto do eixo y;


bi = Coeficiente angular da i-ésima variável;
k = Número de variáveis independentes.

246 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 246 25/06/12 17:23


Na equação, onde b1 é o coeficiente de regressão associado à primeira
variável preditora x1 e b2 é o coeficiente de regressão associado à segunda
variável preditora x2 e assim por diante, o modelo é conhecido como combi-
nação linear, cujas fórmulas para calcular a e b foram mostradas no capítulo
12. Note que ela representa um modelo para resumir a combinação de
diferentes variáveis em um único valor numérico, pois corresponde a uma
média ponderada resultante da soma dos valores de x multiplicados por seus
respectivos coeficientes de regressão, de modo que a introdução de variáveis
independentes adicionais aumenta a capacidade de predição do modelo em
relação à regressão linear simples. Este procedimento visa a reduzir o valor
do intercepto, o qual, em regressão, significa a parte da variável dependente
explicada por outras variáveis que não aquelas consideradas na pesquisa.
Deste modo, mesmo quando estamos interessados em estudar o efeito
de uma única variável preditora sobre uma dada variável-resposta, é sempre
aconselhável incluir, mediante a aplicação de um modelo de análise de
regressão múltipla, as outras variáveis capazes de afetar o comportamento
desta variável-resposta. Este procedimento reduz o erro aleatório decorrente
do processo de amostragem, reduz a variância residual e aumenta o poder
do teste estatístico, além de minimizar o viés resultante da não-introdução,
no modelo, de uma variável importante para o desfecho esperado. Aqui, cabe
uma observação: na análise de regressão múltipla, a existência de correlação
entre uma variável dependente e um conjunto de variáveis independentes
não significa necessariamente uma relação de causalidade, mas apenas uma
relação estatística.
Eventualmente, em uma análise de regressão múltipla, pode-se incluir,
entre as variáveis preditoras, uma variável nominal do tipo binária, como o
sexo, por exemplo. Quando isto ocorre, os dois resultados possíveis para esta
variável precisam ser convencionalmente codificados. No caso da variável sexo,
as mulheres podem receber o código 0 e os homens o código 1, ou vice-versa.
Este procedimento, conhecido como codificação dummy, permite que uma
variável nominal possa ser incluída em uma equação de regressão calculada
por programas computacionais. Porém, a decisão de qual dos dois resultados
recebe o código 0 e qual recebe o código 1 é puramente arbitrária e depende
exclusivamente do pesquisador, que deve escolher a maneira mais conveniente

Regressão Múltipla 247

BIOESTATISTICA_VOL02.indb 247 25/06/12 17:23


para a interpretação dos seus resultados. A interpretação de uma variável
dummy é feita sempre em relação ao resultado codificado como 1.

21.1.1 Construção do modelo


Em um modelo de regressão linear múltipla, a decisão crucial para o
pesquisador está em selecionar o menor número de variáveis preditoras, para
que a maior porcentagem possível de variação da variável-resposta possa ser
explicada. Por exemplo, acrescentar uma variável, que seja responsável apenas
por uma pequena fração de variação, pode não ser compensador. Assim, o
pesquisador deverá selecionar um modelo de regressão que lhe permita
escolher, dentre outras, as variáveis que atuam de maneira mais importante
sobre o desfecho a ser estudado.

Cálculo dos indicadores da correlação múltipla


Tal como na regressão simples, os indicadores representam uma impor-
tante ferramenta para a interpretação dos resultados. A seguir, descreveremos
os principais indicadores utilizados na análise de regressão múltipla.

• Coeficiente de correlação múltipla (R) – Semelhante ao coeficiente de


correlação produto-momento de Pearson (r), calculado para a regressão
linear simples, na regressão múltipla, calcula-se o coeficiente de correla-
ção múltipla R, o qual é interpretado exatamente da mesma maneira, isto é
para indicar a intensidade da relação linear entre as variáveis preditoras e
a variável-resposta estudada.
• Matriz de correlação – O uso da tabela de correlações é uma ferramenta
muito útil na verificação de possíveis correlações entre as variáveis predi-
toras (colinearidade1). Assim, para evitar o problema de colinearidade, a
matriz de correlações entre as variáveis independentes deve ser analisada.
Como regra geral, se a correlação entre duas variáveis for superior a 0,70,
pode haver colinearidade entre elas. Esta regra, no entanto, é ineficiente,
sendo a melhor alternativa aquela em que seriam analisadas todas as pos-

1. A colinearidade ocorre quando duas ou mais variáveis independentes apresentam correlação


entre si.

248 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 248 25/06/12 17:23


síveis correlações entre cada uma das variáveis preditoras. Isto pode ser
feito construindo-se a matriz de correlações combinadas.
• Coeficiente de determinação múltipla (R2) – Do mesmo modo, o coefi-
ciente de determinação da regressão (R2) também pode ser calculado, o
qual indica o percentual da variância total da variável dependente, que é
explicado pela equação de regressão. A colinearidade entre as variáveis
preditoras também pode ser identificada pelo coeficiente de determina-
ção. Isto ocorre quando este coeficiente é relativamente alto e, no entan-
to, todos os coeficientes de regressão não apresentam valores estatistica-
mente significativos. Para eliminar o problema da colinearidade, algumas
variáveis independentes podem ser retiradas da equação após análise da
matriz de correlação.
• Coeficiente de determinação múltipla ajustado (R2A) – É outro im-
portante indicador, pois, na análise de regressão múltipla, toda vez que
uma variável independente é adicionada à equação, o coeficiente de de-
terminação aumenta, mesmo que esta nova variável não contribua sig-
nificativamente para a explicação da variância residual. Desta forma, é
útil analisar o coeficiente de determinação ajustado, que, ao contrário
do coeficiente de determinação, diminui se a variável adicionada possuir
um pequeno poder de explicação para a variável-resposta, podendo ter
até um valor negativo.
• Estatística t – É calculada para determinar se cada um dos coeficientes de
regressão é estatisticamente significativo. Ela utiliza a função da distribui-
ção t de Student para retornar os valores da probabilidade de significância,
assim como para gerar os intervalos de confiança (IC) para cada coeficien-
te de regressão.
• Teste ANOVA – É utilizado na verificação da significância estatística para
os valores do coeficiente de correlação múltipla (R) e coeficiente de deter-
minação (R2). Utiliza a função da distribuição F para retornar os valores de
probabilidade de significância.
• Estatística Durbin-Watson (DW) – É utilizada para verificar se existe co-
linearidade entre as variáveis independentes incluídas no modelo. O valor
da estatística DW é calculado com os resíduos (erros) da equação de re-
gressão. A análise da estatística de Durbin-Watson é feita a partir da ta-

Regressão Múltipla 249

BIOESTATISTICA_VOL02.indb 249 25/06/12 17:23


bela de valores críticos (ver tabela no final do livro). As conclusões sobre
o coeficiente DW devem considerar o limite crítico inferior (dL) e o limite
crítico superior (dU), obtidos nessa tabela, o qual depende no nível de sig-
nificância (α), do número de variáveis independentes (k) e do tamanho da
amostra (n) do modelo. A fórmula é a seguinte:

n
∑(εi − εi −1 )2
DW = i =2
n
∑ ε2i
i =1

Cálculo do coeficiente de regressão padronizado (β)


De todo jeito, tal como ocorre na regressão simples, é relevante notar que
a regressão múltipla avalia apenas a relação linear entre as variáveis preditoras
e a variável-resposta. Por sua vez, os coeficientes de regressão (bi) são inter-
pretados de modo diferente na regressão múltipla quando comparados com
a regressão simples. Nesta, o coeficiente de regressão b indica a quantidade
de variação da variável-resposta y, que é devida a cada acréscimo de uma
unidade na variável preditora x. Na regressão múltipla, um determinado coefi-
ciente de regressão bi mostra até que ponto o valor da variável-resposta y pode
ser alterado em função do aumento de uma unidade na variável preditora xi,
mantendo-se constantes os valores das demais variáveis preditoras da equação
de regressão. Porém, embora sejam importantes, na análise múltipla, os valores
dos coeficientes de regressão não podem ser utilizados para se decidir quais
variáveis preditoras são as mais importantes, uma vez que eles se referem às
diferentes grandezas, pois cada um deles está relacionado com a escala em
que a variável x foi mensurada. Deste modo, a única informação que se pode
inferir desses coeficientes é que o sinal positivo ou negativo descreve o sentido
da correlação entre a variável preditora e o desfecho, ou seja, se a correlação
é positiva ou negativa, sendo, por este motivo, chamados de coeficientes de
regressão não-padronizados.
Uma maneira de eliminar este inconveniente, é padronizar os coefi-
cientes de regressão, o que pode ser feito a partir da equação de regressão.
Para tal, basta multiplicar o coeficiente de regressão não-padronizado pelo

250 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 250 25/06/12 17:23


desvio padrão da variável x e, em seguida, dividir o resultado pelo desvio-
-padrão da variável y. Assim, temos:

bi .s x
βi =
sy

Assim, uma vez que a padronização tenha sido realizada, pode-se, agora,
comparar as magnitudes dos valores dos coeficientes de regressão e fazer
inferências acerca de quais variáveis preditoras são mais importantes na deter-
minação do desfecho da variável-resposta, pois, quanto maior for o coeficiente,
maior será a influência de x sobre y.

Modelo de regressão múltipla escalonada


A escolha do modelo é um dos passos mais importantes na análise de
regressão múltipla, pois é ele que irá possibilitar a escolha das variáveis
independentes que mais se correlacionam com a variável-resposta. Os modelos
mais tradicionais compreendem a seleção progressiva (método forward) e a
eliminação regressiva (método backward).
No modelo de seleção progressiva, o processo começa com a inclusão
da variável preditora x que tiver maior correlação com a variável-resposta y.
Em seguida, as demais variáveis preditoras são acrescentadas uma de cada
vez, até que todas as variáveis estatisticamente significativas sejam incluídas
na equação de regressão, respeitando-se a ordem decrescente de seus coefi-
cientes de correlação. Por sua vez, o modelo de eliminação regressiva começa
pela inclusão de todas as variáveis preditoras e, em seguida, aquelas que não
apresentam coeficiente de regressão significativo são retiradas da equação.
Após este procedimento, a equação deve ser recalculada, usando-se, agora,
apenas as variáveis significativas, uma vez que estes coeficientes modificam-se
quando algumas variáveis são retiradas da análise.
Uma outra abordagem para a escolha das variáveis preditoras é usar
o processo regressão escalonada, o qual combina os dois procedimentos
descritos acima. O método inicia da mesma maneira que a seleção progressiva.
Entretanto, após a inclusão, na equação, de uma nova variável preditora
x, procede-se à verificação para saber se todas as variáveis anteriormente

Regressão Múltipla 251

BIOESTATISTICA_VOL02.indb 251 25/06/12 17:23


incluídas mantêm o seu nível de significância. Caso isto ocorra, cada uma delas
será mantida na equação de regressão somente se a sua retirada causar uma
redução significativa no coeficiente de determinação R2. Caso contrário, ela será
eliminada. O processo se repete até que todas as variáveis explicativas tenham
sido testadas. No dia a dia da pesquisa, a utilização de programas computa-
cionais oferece opções para a escolha do melhor modelo de combinação entre
todas variáveis preditoras incluídas no estudo.
A seguir, mostraremos um exemplo de regressão linear múltipla. Os cálculos
não serão aqui abordados, uma vez que foram apresentados no capítulo 12, que
trata da regressão linear simples. Para tal, será utilizado o programa BioEstat,
de fácil aplicação.
Exemplo: Suponha que uma pesquisa foi conduzida para verificar se existe
correlação entre os valores da pressão arterial sistólica e os valores da estatura,
da massa corporal e da idade, em 10 atletas frequentadores de uma academia
de ginástica. Os dados estão relacionados na Tabela 21.1, mostrada a seguir.

Tabela 21.1 – Valores da pressão arterial sistólica, idade (anos), massa corporal (kg)
e estatura (cm) de 10 atletas

Pressão sistólica Idade Massa corporal Estatura


Atleta
y x1 x2 x3
01 132 29 63 162
02 134 33 72 168
03 132 37 72 166
04 143 41 79 179
05 142 43 71 167
05 147 45 69 168
07 144 47 83 173
08 146 49 85 171
09 152 51 64 163
10 149 51 58 165

• Passo 1 – Formular as hipóteses estatísticas:


H0:Os valores da pressão arterial sistólica não dependem da estatura e/ou
da massa corporal e/ou da idade, pois b1 = 0, b2 = 0, b3 = 0 ;

252 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 252 25/06/12 17:23


HA:Os valores da pressão arterial sistólica dependem da estatura e/ou da
massa corporal e/ou da idade, pois, ao menos um bi ≠ 0.
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%) unilateral
• Passo 3 – Determinar os valores do teste:
Os dados devem ser introduzidos no grid do programa, com a primeira
coluna contendo os valores da variável dependente y, e as demais colunas,
os valores das variáveis preditoras x. Selecionar o menu estatísticas e es-
colher a opção regressão e clicar em linear múltipla. Selecionar as colunas
e clicar em executar o teste. O programa exibirá um quadro contendo as
seguintes informações:

• Passo 4 – Conclusões:
Como o valor do teste ANOVA (teste F) foi significativo (P = 0,0023), re-
jeita-se a hipótese nula (H0) e aceita-se a hipótese alternativa (HA) que ao

Regressão Múltipla 253

BIOESTATISTICA_VOL02.indb 253 25/06/12 17:23


menos uma das variáveis preditoras, idade, massa corporal ou estatura,
influencia no valor da pressão arterial sistólica. Entre os coeficientes par-
ciais de regressão, somente o b1 mostrou-se estatisticamente significativo,
com t = 7,4497 e P = 0,0003. Isto mostra, portanto, que a variável idade (x1)
é aquela mais explicativa para a variação da pressão arterial sistólica dos
atletas avaliados. Com base nos dados, o valor da pressão arterial sistólica
deve aumentar 0,8738 mmHg para cada acréscimo de um ano de idade, a
partir de 29 e até 51 anos.

Os coeficientes de determinação múltipla (R2), de determinação múltipla


ajustado (R2A) e de correlação múltipla (R) são mostrados no quadro de resul-
tados. O valor do coeficiente de determinação igual a 0,9088 é alto, o que indica
um poder de explicação da equação de regressão de 90,88%. No entanto, como
dois dos coeficientes parciais de regressão não são significativos, pode-se
suspeitar da existência de colinearidade nas variáveis independentes (variáveis
independentes correlacionadas).
Com base nas variáveis preditoras, o modelo linear para a predição de y é
representado pela seguinte equação:
yˆ = 68, 97 + 0,87x 1 + ( −0,23x 2 ) + 0,31x 3

O programa também disponibiliza o procedimento para a análise de


regressão passo-a-passo (stepwise), progressiva e regressiva. Para o exemplo
descrito, o método progressivo exibe o quadro mostrado abaixo, no qual se
verifica que, quando a variável x3 (estatura) é incluída, o coeficiente de deter-
minação (R2) da equação não se altera, indicando, portanto, que esta variável
deve ser retirada da regressão.

Para o método regressivo, o programa exibe outro quadro, o qual é


mostrado a seguir. Neste quadro, verifica-se que, quando a variável x3 (estatura)

254 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 254 25/06/12 17:23


é excluída, o coeficiente de determinação (R2) da equação também não se altera,
confirmando, portanto, que esta variável deve ser retirada da regressão.

O programa BioEstat não mostra a matriz de correlação e a matriz de


correlações combinadas, ambas bastante úteis na análise da colinearidade.
Estas matrizes serão mostradas nas tabelas 21.2 e 21.3, a seguir:

Tabela 21.2 – Matriz de correlação entre as variáveis preditoras idade, massa corporal e
estatura de 10 atletas

Idade Massa corporal Estatura


Correlações
(x1) (x2) (x3)

Idade (x1) 1,00 0,0844 0,1414

Massa corporal (x2) 0,0844 1,00 0,7767

Estatura (x3) 0,1414 0,7767 1,00

A matriz de correlação mostrada na Tabela 21.2 confirma as suspeitas de colinea-


ridade, pois existe uma alta correlação de x2 (massa corporal) em relação a x3 (estatura),
o que sugere mais estudos para concluir sobre a existência de colinearidade.

Tabela 21.3 – Matriz de correlações combinadas entre as variáveis preditoras idade,


massa corporal e estatura de 10 atletas

Correlações combinadas

x2 : x3 x2 x3
Idade (x1)
0,1471 0,0844 0,1414
x1 : x3 x1 x3
Massa corporal (x2)
0,7772 0,0844 0,7767
x1 : x2 x1 x2
Estatura (x3)
0,7805 0,1414 0,7767

Regressão Múltipla 255

BIOESTATISTICA_VOL02.indb 255 25/06/12 17:23


A tabela de correlações combinadas é uma ferramenta muito útil na
verificação das correlações entre as variáveis preditora (colinearidade). Pela
análise da Tabela 21.3, verifica-se que a variável x2 apresenta forte corre-
lação com a combinação das variáveis x1 e x3, porém, sem correlação com x1,
quando comparada isoladamente. Por sua vez, a variável x3 apresenta forte
correlação com a combinação das variáveis x1 e x2, porém, sem correlação
significativa com x1, quando comparadas isoladamente, sendo provavel-
mente a responsável pelas interpretações contraditórias de significância.
Pela análise apenas da matriz de correlações, normalmente não há dados
suficientes para concluir quais variáveis podem ou não ser retiradas da
regressão. Mas, olhando para as correlações combinadas, pode-se inferir
que a variável x3 deve ser retirada da regressão, pois ela é representada pela
combinação de x1 e x2.
É válido ressaltar que, para validar os testes de regressão linear múltipla,
é necessário que o modelo de análise siga todos os pressupostos básicos
referentes à regressão linear simples, os quais estão relacionados no capítulo
12 deste livro.

21.2 REGRESSÃO LOGÍSTICA SIMPLES


E MÚLTIPLA

O método da regressão logística é o modelo ideal de análise quando a


variável-resposta em estudo é dicotômica (binária) e as variáveis preditoras
incluem valores numéricos (dimensionais) e medidas nominais. É, pois, uma
técnica estatística que tem como objetivo produzir, a partir de um conjunto
de observações, um modelo que permita a predição de valores assumidos
por uma variável categórica a partir de um conjunto de variáveis explicativas,
contínuas e/ou binárias, sendo amplamente utilizada em ciências médicas e
sociais, como um método é útil para predizer a probabilidade da ocorrência
de um determinado evento, como uma doença, por exemplo, em função da
exposição a determinados fatores de risco. Uma outra vantagem da regressão
logística é que a sua aplicação não exige os pressupostos de normalidade para a
distribuição das variáveis preditoras, além do que, os coeficientes de regressão

256 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 256 25/06/12 17:23


podem ser interpretados em termos de risco relativo nos estudos de coorte, ou
mesmo taxas de tendência nos delineamentos do tipo caso-controle.
Assim, quando o modelo correlaciona a variável-resposta y com uma única
variável preditora x, ele é chamado de regressão logística simples. Neste
caso, a variável y, binária, é codificada (codificação dummy) como 1 (sucesso)
e 0 (insucesso), o mesmo ocorrendo para a variável x. Por sua vez, nos casos em
que a correlação é realizada entre a variável-resposta y e duas ou mais variáveis
preditoras x, o modelo é conhecido como regressão logística múltipla, sendo
a variável y do tipo binária, a qual assume valores 1 (sucesso) e 0 (insucesso). As
variáveis preditoras podem ser binárias ou contínuas (dimensionais); quando
binárias, também recebem a codificação dummy.
Portanto, como no modelo multivariado utilizam-se os valores de um
conjunto de variáveis preditoras para calcular a probabilidade da ocorrência da
variável-resposta, os efeitos das associações entre essas variáveis podem ser
controlados, sendo a odds ratio, a medida de associação calculada a partir do
modelo logístico. A fórmula, também denominada Logit, é mostrada a seguir.

1
Px =

 ( )
1 + exp − b0 + b1x 1 + b2x 2 + ... + bn x n 

Onde: b0 = Intercepto.
b1, b2 ...bn – Coeficientes de regressão.
exp = Base do logaritmo natural (2,718) usada para a potência
mostrada entre parênteses.

Nesta equação, os termos b0 e bn representam os parâmetros desconhe-


cidos e que serão estimados a partir dos dados amostrais, com base no método
máxima verossimilhança, o qual mostra a probabilidade máxima de se obter o
resultado observado. Assim, conhecendo-se os parâmetros b0 e bn e os valores
das variáveis preditoras para um determinado indivíduo, pode-se, então,
aplicar a fórmula da regressão logística para calcular a probabilidade (Px) de
que este indivíduo desenvolva o desfecho estudado.
A equação pode ser montada especificando-se as variáveis a serem incluídas
no modelo, ou utilizando-se um dos métodos semelhantes àqueles empregados

Regressão Múltipla 257

BIOESTATISTICA_VOL02.indb 257 25/06/12 17:23


para a regressão múltipla. Na regressão logística, em vez do teste F, utiliza-se
o teste do qui-quadrado (χ2) para se verificar a significância estatística de cada
variável em relação à determinação do resultado da regressão.
A seguir, utilizando-se o programa BioEstat 5.0, mostraremos os exemplos
para os modelos de regressão logística simples e múltipla.

Modelo de regressão logística simples


Exemplo: Um estudo foi conduzido para verificar a associação entre a
incidência de neoplasia cutânea e a história clínica de exposição excessiva à luz
solar. Para tal finalidade, 20 mulheres, na faixa etária de 60 a 70 anos, foram
aleatoriamente selecionadas dentre aquelas atendidas em um ambulatório
público de dermatologia. Os dados estão expressos na Tabela 21.4, abaixo.

A codificação dummy estabelecida foi a seguinte:


Variável y: neoplasia cutânea presente = 1; ausente = 0.
Variável x: exposição excessiva à radiação solar presente = 1; ausente = 0.

Tabela 21.4 – Codificação dummy para as variáveis incluídas na regressão logística simples

Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Variável y 1 0 1 0 1 0 1 0 0 0 0 0 0 0 1 1 0 1 1 1

Variável x 1 0 0 0 1 0 1 0 0 0 1 0 0 0 0 1 1 1 1 0

• Passo 1 – Formular as hipóteses estatísticas:


H0: a incidência de neoplasia cutânea não está associada à exposição exces-
siva à luz solar , pois b1 = 0 ;
HA: a incidência de neoplasia cutânea está associada à exposição excessiva
à luz solar, pois b1 ≠ 0 .
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%) unilateral
• Passo 3 – Determinar os valores do teste:
Os dados devem ser introduzidos no grid do programa, com a primeira co-
luna contendo os valores da variável dependente y, e a segunda coluna, os
valores da variável preditora x. Selecionar o menu estatísticas e escolher a

258 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 258 25/06/12 17:23


opção regressão e clicar em logística simples. Selecionar as colunas e clicar
em executar o teste. O programa exibirá um quadro contendo as seguintes
informações:

• Passo 4 – Conclusões:
Como o valor P do teste foi significativo (P = 0,0371), rejeita-se a hipótese
nula (H0) e aceita-se a hipótese alternativa (HA) que a exposição excessiva à
luz solar influencia na incidência da neoplasia cutânea. Isto é, a odds ratio
indica que a chance da ocorrência de neoplasia é 9 vezes maior em mulhe-
res com antecedentes de exposição excessiva à radiação solar quando com-
parada à chance em mulheres sem antecedentes. O intervalo de confiança
de 95% confirma a significância estatística do teste, pois o valor 1 não está
contido no referido intervalo.
O programa fornece a equação de regressão para o modelo proposto. Para
o exemplo acima, a equação é dada por:

Logit Pi = −1,0986 + 2,1972x i

Assim, com base na equação mostrada acima, podem-se calcular as


probabilidades para as possíveis ocorrências da variável-resposta “neoplasia
cutânea”, tal como mostrado a seguir.

Regressão Múltipla 259

BIOESTATISTICA_VOL02.indb 259 25/06/12 17:23


Para xi = 1 (com antecedentes de exposição excessiva à luz solar):

Logit P = −1,0986 + 2,1972 x 1 = 1,0986

1 1
P= = = 0,75 (75%)
1 + exp −(1 ,0986 ) 1 + 0,3333

Para xi = 0 (sem antecedentes de exposição excessiva à luz solar):

Logit P = −1,0986 + 2,1972 x 0 = −1,0986

1 1
P= = = 0,25 (25%)
1 + exp −( −1 ,0
0986 ) 1 + 2, 9999

Na regressão logística, cada coeficiente bi, calculado, fornece uma estimativa


do logaritmo natural (ln) da odds ratio ajustada, de modo a permitir que, para
todas as variáveis incluídas no modelo, a odds ratio pode ser estimada direta-
mente a partir da exponenciação destes coeficientes. Assim, para o exemplo
dado, tem-se:

b
OR = exp 1 = exp2,1972 = 8, 9998

O intervalo de confiança de 95% para a odds ratio é calculado da seguinte


maneira:

b ±1 ,96 x erro padrão(b )


IC 95%(OR ) = exp 1 1 

2,1972±1 ,96 x1,0541 2,1972±2,0660


IC 95%(OR ) = exp  = exp 

IC 95% = exp0,1312 = 1,1402 (limite inferiorr)

= exp4 ,2632 = 71,0369 (limite superior)

IC 95%(OR ) = 1,1402 < OR < 71,0369

260 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 260 25/06/12 17:23


Modelo de regressão logística múltipla
Exemplo: Um estudo foi conduzido para verificar a associação entre a
incidência de neoplasia cutânea em relação ao sexo, à exposição excessiva
à radiação solar, à idade e ao uso de filtro solar. Para tal finalidade,
40 pacientes de ambos os sexos, na faixa etária de 36 a 56 anos, foram
aleatoriamente selecionados dentre aqueles atendidos em um ambulatório
público de dermatologia. Os dados foram introduzidos no grid do programa
BioEstat 5.0.

A codificação dummy estabelecida foi a seguinte:


Variável y: neoplasia cutânea presente = 1; ausente = 0.
Variável x1: sexo masculino = 1; feminino = 0.
Variável x2: exposição excessiva à radiação solar presente = 1; ausente = 0.
Variável x3: idade (variável contínua).
Variável x4: uso de filtro solar presente = 1; ausente = 0.

• Passo 1 – Formular as hipóteses estatísticas:


H0: a incidência de neoplasia cutânea não está associada aos fatores de ris-
co estudados, pois b1=0, b2 = 0, b3 = 0, b4 = 0 ;
HA: a incidência de neoplasia cutânea está associada a um dos fatores de
risco estudado, sendo b1≠ 0 e/ou b2 ≠ 0 e/ou b3 ≠ 0 e/ou b4 ≠ 0 .

• Passo 2 – Escolher o nível de significância (nível alfa):


a = 0, 05 (5%) unilateral

• Passo 3 – Determinar os valores do teste:


Os dados devem ser introduzidos no grid do programa, com a primeira
coluna contendo os valores da variável dependente y, e as demais colunas,
os valores das variáveis preditoras x. Selecionar o menu estatísticas e esco-
lher a opção regressão e clicar em logística múltipla. Selecionar as colunas
e clicar em executar o teste. O programa exibirá um quadro contendo as
seguintes informações:

Regressão Múltipla 261

BIOESTATISTICA_VOL02.indb 261 25/06/12 17:23


• Passo 4 – Conclusões:
Como o valor do teste foi significativo (P < 0,0001), rejeita-se a hipótese
nula (H0) e aceita-se a hipótese alternativa (HA) que as variáveis “sexo” e
“exposição excessiva à radiação solar” influenciaram na incidência da ne-
oplasia cutânea. Isto é, a odds ratio indica que a chance da ocorrência de
neoplasia foi 7,6 (1/0.1317)2 vezes maior em pacientes do sexo feminino
quando comparada à chance em pacientes do sexo masculino (P = 0,0464).
Porém, se o paciente é do sexo masculino e apresenta exposição excessiva
à radiação solar, a chance de neoplasia foi 14,7 vezes maior quando compa-
rada à chance em um paciente do sexo feminino e sem exposição excessiva
à radiação solar (P = 0,0117).
A incidência de neoplasia cutânea não apresentou relação estatisticamente
significante com as variáveis “idade” e “uso de filtro solar”.

O programa fornece a equação de regressão para o modelo proposto. Para


o exemplo acima, a equação é dada por:

Logit Pi = −5,8443 − (2,027x 1 ) + (2,6880x 2 ) + (0,1460x 3 ) − (2,286x 4 )

2. Para calcular a chance para o paciente do sexo feminino, divide-se o valor 1 pela chance para
o paciente do sexo masculino (0,1317). Isto é, 1/0,1317 = 7,59.

262 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 262 25/06/12 17:23


Assim, com base na equação acima referida, podem-se calcular as probabi-
lidades para as possíveis ocorrências da variável-resposta “neoplasia cutânea”
em função das variáveis preditoras, tal como para os dois exemplos mostrados
a seguir.

Para: x1 = 1 (sexo masculino).


x2 = 1 (com exposição excessiva à radiação solar).
x3 = 50 (idade igual 50 anos).
x4 = 1 (com uso de filtro solar)

Logit Pi = −5,8443 − (2,027 × 1) + (2,6880 × 1) + (0,1460 × 50) − (2,286 × 1)

Logit Pi = −0,1693

1 1
P = = = 0, 4578 (45,78%)
1 + exp −( −0 ,1693) 1 + 1,1845

Para: x1 = 0 (sexo feminino).


x2 = 0 (sem exposição excessiva à radiação solar).
x3 = 60 (idade igual a 60 anos).
x4 = 0 (com uso de filtro solar)

Logit Pi = −5,8443 − (2,027 × 0) + (2,6880 × 0) + (0,1460 × 60) − (2,286 × 0)

Logit Pi = 2, 9157

1 1
P = = = 0, 9487 (94,87%)
1 + exp −( 2,9157 ) 1 + 0,0541

Estratégia de modelagem reduzida


O objetivo da estratégia de modelagem reduzida é obter o melhor ajuste
para o modelo, com um número mínimo de variáveis preditoras, de tal modo
que aquelas não significativas e que pouco contribuem para o resultado,

Regressão Múltipla 263

BIOESTATISTICA_VOL02.indb 263 25/06/12 17:23


possam ser descartadas da regressão. Como regra geral, permanecem no
modelo (modelo não reduzido) apenas as variáveis com valor de P menor
que 0,05, ou aquelas com um P um pouco maior, mas que sejam comprovada-
mente importantes para a variável-resposta da regressão. Do mesmo modo,
deve permanecer no modelo a variável que, quando retirada, provoca uma
grande alteração na probabilidade do desfecho, mesmo que ela não seja
estatisticamente significativa. A seguir, mostraremos os passos necessários
para a realização do modelo reduzido.

• Passo 1 – O processo inicia pela realização da regressão logística simples


entre a variável-resposta e cada uma das variáveis preditoras incluídas
no estudo. A seguir, selecionam-se aquelas que apresentarem, no teste
de hipótese, um valor P menor ou igual a 0,20. Para o exemplo mostrado
acima, a Tabela 21.5 relaciona os valores de P das variáveis em questão.
Nesta tabela, observa-se que somente a variável x4 “uso de filtro solar”
não apresenta o critério de inclusão, pois P > 0,20, devendo, portanto, ser
excluída do modelo.

Tabela 21.5 – Variáveis e respectivos valores de P obtidos na regressão logística simples

Variável Valor de P

Sexo 0,0007

Exposição excessiva à radiação solar 0,0032

Idade 0,0667

Uso de filtro solar 0,4005

• Passo 2 – O próximo passo é realizar a regressão logística múltipla com to-


das as variáveis preditoras, exceto com aquela retirada do modelo, no caso,
a variável x4 “uso de filtro solar”. Com utilização do programa BioEstat 5.0,
obteremos o resultado mostrado a seguir:

264 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 264 25/06/12 17:23


A razão de verossimilhança verifica o ajuste global do modelo e testa a
hipótese de nulidade de que todos os coeficientes bi das variáveis, exceto o
intercepto, são iguais a zero. O resultado de P = 0,0001 indica que o modelo
se ajusta adequadamente aos dados.

• Passo 3 – O procedimento seguinte é a exclusão das variáveis que apresen-


tam o valor de P > 0,10. Para o exemplo acima, a variável x3 “idade” deve ser
retirada, pois P = 0,8155. Em seguida, executa-se, novamente, a regressão
múltipla com as variáveis preditoras que permaneceram no modelo e, en-
tão, compara-se o modelo anterior com o modelo reduzido final.

Regressão Múltipla 265

BIOESTATISTICA_VOL02.indb 265 25/06/12 17:23


• Passo 4 – Conclusões:
Como o valor do teste foi significativo (P < 0,0001), rejeita-se a hipótese
nula (H0) e aceita-se a hipótese alternativa (HA), que as variáveis “sexo” e
“exposição excessiva à radiação solar” influenciaram na incidência da ne-
oplasia cutânea. Isto é, a odds ratio indica que a chance da ocorrência de
neoplasia foi 14,9 (1/0.0667) vezes maior em pacientes do sexo feminino
quando comparada à chance em pacientes do sexo masculino (P = 0,0032).
Porém, se o paciente é do sexo masculino e apresenta exposição excessiva
à radiação solar, a chance de neoplasia foi 9.0 vezes maior quando compa-
rada à chance em um paciente do sexo feminino e sem exposição excessiva
à radiação solar (P = 0,0166).

Regressão para variável categórica com mais de dois níveis


Quando uma variável categórica apresentar mais de dois níveis de resposta,
é necessário proceder ao fatoramento para transformá-la em variáveis dummies
(categoria 0 - 1). O esquema abaixo, mostra este procedimento para uma variável
que apresente três categorias de resposta, como, por exemplo, a religião.

Religião Religião 1 Religião 2 Religião 3

1 - Evangélica 1 0 0

2 - Católica 0 1 0

3 - Outras 0 0 1

A variável dummy para a religião evangélica será a variável “religião 1”,


a qual assumirá o valor 1 quando a religião for a evangélica e o valor 0 para
as demais. A variável “religião 2” assumirá o valor 1 quando a religião for a
católica e 0 nos demais casos. A variável “religião 3’ assumirá o valor 1quando
a religião for outra, e o valor 0 para as demais.

266 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 266 25/06/12 17:23


22
Análise de Sobrevida

Em muitos modelos de pesquisa, a variável em estudo pode corresponder


ao período de acompanhamento para um determinado evento de interesse,
sendo o resultado medido em termos de extensão do tempo apurado desde o
início da observação até que o referido desfecho ocorra. Na área da economia,
por exemplo, um economista pode querer estudar o tempo médio em que uma
determinada classe de trabalhadores permanece desempregada após a perda
do emprego, e compará-lo com o tempo médio de outra classe qualquer; ou um
engenheiro pode avaliar o tempo médio de vida útil de um novo equipamento,
até que uma determinada falha mecânica ocorra.
Na área da saúde, muitos estudos são delineados com a finalidade de
avaliar o tempo de acompanhamento de pacientes submetidos a um deter-
minado tipo de tratamento, que pode ser o emprego de uma nova droga, a
aplicação de uma nova intervenção clínica ou um novo procedimento cirúrgico,
sempre com o intuito de compará-los aos procedimentos já existentes, no
sentido de identificar aquele que apresenta melhor desempenho em termos
de remissão dos sintomas ou de sobrevida1, por exemplo. Em todos os casos,

1. Prolongamento da vida além de determinado prazo; tempo de vida que ultrapassa determinado
limite (Dicionário Aurélio).

BIOESTATISTICA_VOL02.indb 267 25/06/12 17:23


seja na área da saúde ou em qualquer outra área do conhecimento, o modelo
requer que a variável-resposta (desfecho) seja dicotômica, do tipo sucesso/
insucesso, presença/ausência ou sobrevida/morte. Porém, como neste tipo de
estudo sempre existe a possibilidade de que alguns participantes possam ser
“perdidos” durante o período de acompanhamento, ou por que abandonam o
tratamento ou por que são excluídos, pois o estudo termina antes da ocorrência
do desfecho de interesse, técnicas especiais de análise estatística devem ser
empregadas para esses casos, sendo a mais apropriada, a tábua de análise de
sobrevida, que pode ser estudada pelo método atuarial ou pelo método de
Kaplan-Meier, ambos discutidos no presente capítulo.
Nestes tipos estudos de sobrevida, geralmente os sujeitos participantes
são incluídos na pesquisa em diferentes momentos do ano calendário, porém,
na análise, todos eles têm seu tempo de sobrevivência2 contado a partir de sua
entrada no estudo, a qual é considerada como o tempo zero para observação
de cada indivíduo, sendo o evento final, o óbito ou qualquer outro que indique
uma modificação do estado inicial do sujeito da pesquisa, tal como a cura, a
recorrência da doença ou o seu retorno ao trabalho, por exemplo. Nestes casos,
o evento final é denominado ocorrência ou falha, por referir-se mais frequen-
temente a eventos indesejáveis, tais como o aparecimento da doença ou mesmo
a morte do paciente.
Por outro lado, pode ocorrer que alguns indivíduos não sejam observados
até a ocorrência da falha, ou seja, que tenham seu tempo de observação incom-
pleto. Esse tipo de perda no tempo de observação é denominado censura. Isso
pode ocorrer quando os indivíduos permanecem, ao término, sem mudança
da condição estudada, ou falecem por causas não relacionadas com a doença
de interesse, ou abandonam espontaneamente a pesquisa. Os estudos em que
existe censura são denominados com observações incompletas.
Portanto, em pesquisa clínica, há dois tipos de delineamentos que podem
ser utilizados para acompanhar o tempo como variável de interesse. Um deles
é o estudo experimental do tipo ensaio clínico controlado e randomizado,
o qual é indicado para avaliar diferentes formas de tratamento. O outro tipo é
o estudo observacional do tipo coorte histórica (retrospectiva), cujos dados

2. Qualidade ou estado de sobrevivente; duração contínua no espaço e no tempo (Aurélio).

268 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 268 25/06/12 17:23


podem ser obtidos pela coleta direta em bases de dados já existentes, tais como
registros médicos existentes prontuários hospitalares.
Assim, neste capítulo, abordaremos os dois métodos mais comumente utili-
zados para determinar as curvas de sobrevida – o método atuarial e o método
de Kaplan-Meier, considerando-se o tempo transcorrido desde a entrada do
indivíduo no estudo (data da inclusão) até a ocorrência do evento de interesse
(falha) ou até a censura por perda no tempo de observação (observação incom-
pleta). Da mesma maneira, mostraremos o teste do logrank e a estatística do
qui-quadrado de Mantel-Haenszel, ambos utilizados no teste de significância
para diferenças entre duas curvas de sobrevida.

22.1 MÉTODO ATUARIAL

Também conhecido como método de análise do quadro vital ou de Cutler-


Ederer, o método atuarial3, inicialmente desenvolvido pelas companhias seguradoras
para o cálculo de prêmios de seguro e de aposentadoria, tem sido amplamente
utilizado na prática médica para calcular a taxa de sobrevida de pacientes subme-
tidos a avaliações clínicas decorrentes de tratamentos experimentais.
Neste tipo de análise, as probabilidades de sobrevida são calculadas para
intervalos fixos e arbitrários previamente estabelecidos pelo pesquisador,
como em anos ou meses, por exemplo, de modo que o número de observações
seja bem distribuído ao longo de todo o período do estudo, sendo o número
de pacientes expostos ao risco igual ao número de pacientes vivos por ocasião
do início de cada intervalo. Por sua vez, o método considera que todos os
afastamentos (censuras) ocorrem, em média, a meio caminho do intervalo,
de tal maneira que, nas análises, são considerados apenas os pacientes
presentes no início do intervalo, mas não no seu término, seja porque não
estavam no estudo há tempo suficiente ou porque abandonaram a pesquisa.
Assim, em cada intervalo, o número de pacientes expostos é ajustado de
acordo com o número de censuras, supondo-se que elas ocorreram de modo

3. Atuária - Parte da estatística que investiga problemas relacionados com a teoria e o cálculo de
seguros numa coletividade (Dicionário Aurélio).

Análise de sobrevida 269

BIOESTATISTICA_VOL02.indb 269 25/06/12 17:23


uniforme durante cada período analisado. Isto é feito subtraindo-se metade
das censuras do total de pacientes expostos ao risco no início do período,
supondo-se que estes pacientes ficaram, em média, expostos apenas metade
do intervalo analisado. O número de pacientes expostos ao risco é dado pela
seguinte equação:

wi
E i = ni − , onde: ni - Número de sujeitos no início do intervalo.
2
wi - Número de censuras no intervalo.

Desta forma, no método atuarial, para cada um dos intervalos, a proba-


bilidade da ocorrência do desfecho estudado, como o óbito, por exemplo, a
probabilidade de sobrevida e a probabilidade acumulada de sobrevida
são calculadas pelas seguintes fórmulas:

di di
qi = = , onde: qi - Probabilidade da ocorrência do desfecho em
Ei wi
ni − estudo.
2
di - Número de ocorrências no intervalo.

pi = 1 − qi , onde: pi - Probabilidade de sobrevida no intervalo.

Si = p1 x p2 x ... x pi , onde: Si - Probabilidade acumulada de sobrevida ao


final do intervalo.

d
EP(Si ) = Si ∑ n (n i− d ) , onde: EP - Erro padrão da probabilidade acu-
i i i mulada de sobrevida.

Para ilustrar a aplicação prática do método atuarial para análise de


sobrevida, utilizaremos os dados do estudo publicado por Bustamante-Teixeira
et al (2002), que avaliou a probabilidade de sobrevida de casos incidentes de
câncer de estômago em Campinas, São Paulo, entre 1991 e 1994. A Tabela 22.1
mostra o resultado do estudo.

270 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 270 25/06/12 17:23


Tabela 22.1 – Cálculo das probabilidades de sobrevida pelo método atuarial, para casos de
câncer de estômago diagnosticados em Campinas, entre 1991 e 1994

Intervalo Sujeitos Ocorrências Censuras Pacientes Probabilidade Probabilidade Probabilidade


em anos presentes no intervalo no intervalo expostos do desfecho de sobrevida acumulada
ao início do ao risco
intervalo
i ni di wi Ei qi pi Si

0-1 337 224 15 329,5 0,6798 0,3202 0,3202

1-2 98 46 4 96 0,4792 0,5208 0,1668

2-3 48 13 0 48 0,2708 0,7291 0,1216

3-4 35 6 2 34 0,1764 0,8235 0,1001

4-5 27 4 2 26 0,1538 0,8461 0,0847

Modificado de Bustamante-Teixeira et al, 2002

Na tabela, a coluna ni corresponde ao número de pacientes por ocasião


do início de cada intervalo, de tal maneira que, na primeira linha, estão todos
pacientes incluídos no estudo, isto é, n1 = 337. Durante este primeiro intervalo
de um ano, morreram 224 pacientes (ocorrências) e 15 foram perdidos
(censurados), de forma que d1 = 224 e w1 = 15. Assim, no primeiro intervalo, o
número ajustado de pacientes expostos ao risco de morrer foi de 337 – (15 ÷
2) = 329,5; a probabilidade de morte foi 224 ÷ 329,5 = 0,6798, o que resulta em
uma probabilidade de sobreviver de 1 – 0,6798 = 0,3202.
Para o segundo intervalo, que corresponde ao espaço de tempo decorrido
entre o primeiro e o segundo ano após o diagnóstico, havia somente 98
pacientes vivos no início do período; ocorreram 46 mortes (ocorrências) e
4 pacientes foram perdidos do acompanhamento (censurados). Assim, 96
(98 – (4 ÷ 2)) pacientes estavam expostos ao risco de morrer, o que resulta
em uma probabilidade de morte de 0,4792 (46 ÷ 96) e, em consequência, na
probabilidade de sobreviver de 0,5208 (1 – 0,4792). Observe que a probabi-
lidade acumulada no segundo intervalo depende do paciente ter sobrevivido
ao intervalo anterior, sendo, portanto, um exemplo de probabilidade condi-
cional. Assim, a sobrevida acumulada após dois anos do diagnóstico é de
0,1668, resultado da multiplicação da sobrevida no primeiro intervalo

Análise de sobrevida 271

BIOESTATISTICA_VOL02.indb 271 25/06/12 17:23


(0,3202) pela sobrevida no segundo intervalo (0,5208). Desta forma, neste
estudo, a probabilidade de um paciente com câncer gástrico estar vivo após
cinco anos do diagnóstico é de 0,0847 (8,47%).
As probabilidades acumuladas de sobrevivência podem ser represen-
tadas em um gráfico de curva de sobrevida. Neste gráfico, a linha é disposta
na forma de degraus de uma escada, irregularmente desnivelados, e, para o
exemplo em questão, ela representa a probabilidade de sobrevivência para os
337 pacientes introduzidos no estudo. Assim, verifica-se, ao longo do tempo,
à medida que o ocorre ampliação do intervalo transcorrido desde a admissão
de cada paciente ao estudo, a probabilidade de sobrevivência torna-se cada
vez menor, uma vez que o número de pacientes que permanecem na análise
decresce a cada intervalo. Alguns programas estatísticos para computa-
dores fornecem gráficos com linhas pontilhadas em cada lado da curva de
sobrevida, que representam os limites para o intervalo de confiança de 95%,
o qual pode ser calculado utilizando-se a fórmula do erro-padrão da proba-
bilidade acumulada de sobrevida. A Figura 22.1, abaixo, mostra o gráfico da
curva de sobrevida para o exemplo dado.

Fig. 22.1 - Curva de probabilidade de sobrevida acumulada para pacientes com diagnóstico de
câncer gástrico, em Campinas, no período entre 1991 e 1994. Método atuarial

272 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 272 25/06/12 17:23


De qualquer modo, embora o método atuarial tenha ampla aplicação na
análise da curva de sobrevida de pacientes submetidos a determinados tipos
de tratamento, ele pode ser empregado em estudos que analisem outros
desfechos além de morte, tal como para comparar o tempo de internação de
pacientes submetidos a diferentes procedimentos, para verificar o tempo de
vida útil de próteses ou equipamentos médicos e laboratoriais, ou para analisar
o tempo de adesão de pacientes a determinados programas de saúde pública
etc. Por outro lado, como este método considera que todas as censura ocorrem a
meio caminho do período de tempo transcorrido para cada intervalo, isto pode
levar a viés significativo de avaliação caso estes intervalos sejam muito longos,
se houver muitas censuras ou se elas não ocorrerem na metade do intervalo.
Este viés é menos preocupante quando o tamanho da amostra é relativamente
grande, porém, para pequenas amostras, o problema pode ser contornado pela
aplicação do método de Kaplan-Meier, que será descrito a seguir.

22.2 MÉTODO DE KAPLAN-MEIER

Também conhecido como método produto-limite de Kaplan-Meier,


a análise de sobrevida por este método é semelhante à análise atuarial,
exceto que o período de tempo transcorrido desde a admissão do paciente
ao estudo não é subdividido em intervalos fixos, tal como em anos ou
meses, o que o torna adequado para pesquisas com pequenas amostras.
Neste método, uma nova probabilidade de sobrevida é calculada toda vez
que é registrada uma ocorrência, isto é, uma morte, sendo os afastamentos
(censuras) ignorados. Assim, a cada morte, o método calcula uma nova linha
para a tábua de sobrevida, de tal maneira que os intervalos de tempo são
desiguais, pois as mortes não ocorrem todas com igual período de tempo
contado a partir da entrada do paciente no estudo. Por esta razão, a curva
de Kaplan-Meier parece com uma escada cujos degraus, irregularmente
desnivelados, também apresentam diferentes comprimentos. Deste modo,
cada morte marca o término de um intervalo e o início de outro, para o qual
a taxa de sobrevida é menor que do intervalo anterior, sendo os períodos
de tempo entre as ocorrências, livres de morte. Portanto, cada ocorrência

Análise de sobrevida 273

BIOESTATISTICA_VOL02.indb 273 25/06/12 17:23


produz uma queda imediata na probabilidade de sobrevivência e, então, um
outro período livre de mortes inicia.
Desta forma, no método de Kaplan-Meier, para cada um dos intervalos,
a probabilidade da ocorrência do desfecho estudado, como o óbito, por
exemplo, a probabilidade de sobrevida e a probabilidade acumulada de
sobrevida são calculadas pelas seguintes fórmulas:

di
qi = , onde: qi - Probabilidade da ocorrência do desfecho
ni
em estudo.
di - Número de ocorrências no período.
ni - Sujeitos vivos no início do período.

pi = 1 − qi , onde: pi - Probabilidade de sobrevida no intervalo.

Si = p1 x p2 x ... x pi , onde: Si - Probabilidade acumulada de sobrevida


ao final do intervalo.

d
EP(Si ) = Si ∑ n (n i− d ) , onde: EP - Erro padrão da probabilidade acu-
i i i mulada de sobrevida.

Para ilustrar a aplicação prática do método produto-limite de Kaplan-Meier


para estudo de sobrevida, novamente utilizaremos, parcialmente, os dados do
estudo publicado por Bustamante-Teixeira et al (2002). A Tabela 22.2 mostra o
resultado do estudo até o tempo de 48 meses após o início da pesquisa.
Na tabela, a coluna ni corresponde ao número de pacientes por ocasião
do início do primeiro intervalo, de tal maneira que, na primeira linha estão
todos pacientes incluídos no estudo, isto é n1 = 29. Durante este primeiro
intervalo de um mês após o diagnóstico, morreram 5 pacientes (ocorrências)
e nenhum paciente foi perdido (censurado), de forma que n1 = 29 e d1 = 5.
Assim, um mês após de acompanhamento, a probabilidade de morte foi de
0,1724 (5 ÷ 29), o que resulta em uma probabilidade de sobreviver igual a
0,8276 (1 – 0,1724).

274 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 274 25/06/12 17:23


Tabela 22.2 – Cálculo das probabilidades de sobrevida, pelo método de Kaplan-Meier, para
casos de câncer de estômago diagnosticados em Campinas, entre 1991 e 1994

Meses Sujeitos vivos Ocorrências Censuras Probabilidade Probabilidade Probabilidade


após o no início do no período no período do desfecho de sobrevida acumulada
diagnóstico mês
i ni di wi qi pi Si

1 29 5 0 0.1724 0.8276 0.8276


2 24 2 0 0.0833 0.9167 0.7587
3 22 2 1 0.0909 0.9091 0.6897
5 19 2 0 0.1053 0.8947 0.6171
6 17 1 0 0.0588 0.9412 0.5808
10 16 1 1 0.0625 0.9375 0.5445
11 14 2 0 0.1429 0.8571 0.4667
13 12 1 0 0.0833 0.9167 0.4278
14 11 3 0 0.2727 0.7273 0.3111
18 8 1 0 0.1250 0.8750 0.2722
19 7 1 0 0.1429 0.8571 0.2333
38 6 1 0 0.1667 0.8333 0.1945
48 5 1 0 0.2000 0.8000 0.1556
Modificado de Bustamante-Teixeira et al, 2002

No segundo intervalo, que corresponde ao espaço de tempo decorrido no


segundo mês após o diagnóstico, dos 24 pacientes vivos no início do intervalo,
2 morreram ao final do período, o que resulta em uma probabilidade de morte
de 0,0833 (2 ÷ 24) e, em consequência, na probabilidade de sobreviver igual a
0,9167 (1 – 0,0833). Observe que, tal qual o método atuarial, a probabilidade
acumulada no segundo intervalo depende do paciente ter sobrevivido ao
intervalo anterior, sendo, portanto, um exemplo de probabilidade condicional.
Assim, a sobrevida acumulada, após dois meses do diagnóstico, é de 0,8577,
resultado da multiplicação da sobrevida no primeiro intervalo (0,8276) pela
sobrevida no segundo intervalo (0,9167). Desta forma, neste estudo, a proba-
bilidade de um paciente com câncer gástrico estar vivo após 48 meses do
diagnóstico é de 0,1556 (15,56%).

Análise de sobrevida 275

BIOESTATISTICA_VOL02.indb 275 25/06/12 17:23


Para o método de Kaplan-Meier, as probabilidades acumuladas de sobre-
vivência também podem ser representadas em um gráfico de curva de
sobrevida. Neste gráfico, a linha é disposta na forma de degraus irregular-
mente desnivelados. Para o exemplo em questão, ela representa a probabilidade
de sobrevivência para os 29 pacientes com câncer gástrico, introduzidos no
estudo. Assim, verifica-se ao longo do tempo, à medida que ocorre a ampliação
do intervalo transcorrido desde a admissão de cada paciente ao estudo, a proba-
bilidade de sobrevivência torna-se cada vez menor, uma vez que o número
de pacientes que permanecem na análise decresce a cada intervalo. Alguns
programas estatísticos para computadores fornecem gráficos com linhas
pontilhadas em cada lado da curva de sobrevida, que representam os limites
para o intervalo de confiança de 95%, o qual pode ser calculado utilizando-se
a fórmula do erro-padrão da probabilidade acumulada de sobrevida. A Figura
22.2, abaixo, mostra o gráfico da curva de sobrevida de Kaplan-Meier para o
exemplo da Tabela 22.2.
De qualquer forma, os modelos descritos acima permitem que um
conjunto de curvas de sobrevida acumulada, formadas a partir de duas ou
mais amostras, possam ser comparadas, no sentido de se verificar se elas são
estatisticamente diferentes. Os métodos mais utilizados para esta compa-
ração serão descritos a seguir.

Fig. 22.2 - Curva de probabilidade de sobrevida acumulada para pacientes com diagnóstico de
câncer gástrico, em Campinas, no período entre 1991 e 1994. Método de Kaplan-Meier

276 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 276 25/06/12 17:23


22.3 TESTES DE SIGNIFICÂNCIA ESTATÍSTICA

Na prática do dia-a-dia da pesquisa, o que geralmente se deseja é comparar


as curvas de sobrevida de pacientes submetidos a diferentes tipos de trata-
mento, no sentido de verificar qual é o mais efetivo em termos de prolongar
o tempo de sobrevivência. No entanto, ao se comparar duas ou mais destas
curvas, pode-se esperar que alguma diferença entre elas ocorra somente por
acaso, em razão do erro aleatório ou amostral. Assim, para que a hipótese de
nulidade possa ser efetivamente testada, é necessária a aplicação de técnicas
especiais de comparação entre duas distribuições de tempo de sobrevida,
uma vez que o teste t de Student para amostras independentes não pode ser
utilizado, isto porque estes tempos não são normalmente distribuídos, ou seja,
não seguem o padrão da curva normal gaussiana.
Uma outra opção seria a utilização de testes não-paramétricos, como o teste
da soma de postos de Wilcoxon-Mann-Whitney, o qual poderia comparar
a ordem dos postos (ranks) dos tempos de sobrevida, conforme explicado no
capítulo 17 deste livro. Porém, este teste somente poderá ser empregado nos
casos em que todas as ocorrências (mortes) já tenham acontecido para todos os
sujeitos incluídos no estudo à época da análise dos dados. Assim, caso o estudo
da sobrevida seja realizado enquanto alguns indivíduos ainda estiverem vivos,
este método não pode ser empregado. Nestes casos, outros procedimentos de
comparação deverão ser escolhidos. Dentre estes procedimentos, destacam-se
o teste do logrank e a estatística do qui-quadrado de Mantel-Haenszel, os
quais serão demonstrados a seguir.

22.3.1 Teste do logrank


Primeiro proposto por Nathan Mantel4 e posteriormente nomeado por
Richard5 e Julian Peto6, o teste do logrank é utilizado para comparar as curvas

4. Nathan Mantel (1919-2002) - Bioestatístico americano que, juntamente com William Haenszel,
idealizou o teste conhecido como odds ratio de Mantel-Haenszel.
5. Richard Peto (1943-?) – Estatístico e epidemiologista inglês, professor de estatística médica e
epidemiologia na Universidade de Oxford.
6. Julian Peto – Estatístico e epidemiologista inglês, professor da Escola de Medicina Tropical de
Londres, que, com seu irmão Richard Peto, publicou artigos com o teste do logrank.

Análise de sobrevida 277

BIOESTATISTICA_VOL02.indb 277 25/06/12 17:23


de sobrevida de duas amostras, geralmente de um grupo controle e um grupo
tratamento, no sentido de verificar a hipótese nula de que cada grupo tem a
mesma probabilidade de sobrevida. Assim, apesar do nome, este teste não
utiliza logaritmos ou postos (ranks) na sua fórmula; na prática, ele compara
o número de mortes (ocorrências) observadas (O) em cada grupo com o
número de mortes que seriam esperadas (E) tomando-se por base o número
total de óbitos verificados nos dois grupos, quando analisados de maneira
combinada. Deste modo, cada vez que uma morte ocorre, o teste calcula a
probabilidade de que esta morte observada tenha ocorrido no grupo trata-
mento e a probabilidade que tenha ocorrido no grupo controle, sendo cada
probabilidade, proporcional ao número de sobreviventes em cada grupo,
para aquele ponto no tempo.
Em seguida, o número de mortes esperadas para cada grupo, e em cada
ponto no tempo, é calculado multiplicando-se o número total de mortes
no período pela proporção de pacientes ainda vivos no mesmo período.
Então, dentro de cada grupo em estudo, os números das mortes observadas
e esperadas são somados para que os totais possam ser comparados pela
aplicação do teste do qui-quadrado (χ2) com 1 grau de liberdade, conforme a
fórmula mostrada abaixo:

(OT − ET )2 (OC − EC )2
logrank χ2 = +
ET EC

Onde: OT e ET = Mortes observadas e esperadas no grupo tratamento.


OC e EC = Mortes observadas e esperadas no grupo controle.

Como os métodos de curva de sobrevida podem ser empregados em estudos


que analisem outros desfechos de interesse além de morte, para ilustrar uma
aplicação prática do teste logrank, utilizaremos um exemplo fictício tomado de
uma indústria de processamento de alimentos.

Exemplo: Suponhamos que uma indústria alimentícia queria comparar os


tempos de vida de prateleira (shelflife) de carne bovina resfriada e acondi-
cionada em dois diferentes tipos de embalagem: Tipo A, selada a vácuo; e Tipo

278 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 278 25/06/12 17:23


B, selada com atmosfera modificada. Para tal experimento, 40 peças de carne
resfriada foram pesadas (1 kg) e aleatoriamente divididas em duas amostras
de 20 unidades cada, denominadas A e B. As peças da amostra A foram indivi-
dualmente colocadas em embalagens seladas a vácuo; as peças da amostra B
foram acondicionadas em embalagens com atmosfera modificada7. Ambas as
amostras foram mantidas sob refrigeração a uma temperatura de 4ºC, durante
o período de 16 dias. As ocorrências foram consideradas pela análise sensorial
das carnes, quando estas apresentassem características de deterioração que
a tornavam imprópria para o consumo, tais como alta limosidade, coloração
pálida, formação de exsudato e odor levemente desagradável. Os dados do
experimento estão relacionados na Tabela 22.3.

Tabela 22.3 – Cálculo dos valores do teste logrank para as curvas de vida de prateleira de duas
amostras de carne bovina resfriada

Tempo Embalagens expostas ao risco Ocorrências observadas Ocorrências Esperadas


(dias) Tipo A Tipo B Total Tipo A Tipo B Total Tipo A Tipo B Total
5 20 20 40 1 0 1 0,50 0,50 1
6 19 20 39 1 0 1 0,49 0,51 1
7 18 20 38 2 0 2 0,95 1,05 2
8 16 20 36 3 1 4 1,78 2,22 4
9 13 19 32 4 1 5 2,03 2,97 5
10 9 18 27 5 1 6 2,00 4,00 6
11 4 17 21 3 2 5 0,95 4,05 5
12 1 15 16 1 2 3 0,19 2,81 3
13 0 13 13 0 3 3 0,00 3,00 3
14 0 10 10 0 4 4 0,00 4,00 4
15 0 6 6 0 4 4 0,00 4,00 4
16 0 2 2 0 2 2 0,00 2,00 2
Totais OA = 20 OB = 20 40 EA = 8,88 EB = 31,12 40

7. Método de embalagem de alimentos, cujo ar atmosférico ao redor do produto é substituído por


uma mistura otimizada de CO2, N2 e O2. Proporciona um aumento da vida útil do produto pelo
controle do desenvolvimento de microorganismos.

Análise de sobrevida 279

BIOESTATISTICA_VOL02.indb 279 25/06/12 17:23


• Passo 1 – Formular as hipóteses estatísticas:
H 0 :O = E (as duas curvas não diferem entre si quanto ao tempo de prate-
leira das amostras estudadas).
H A :O ≠ E (as curvas diferem entre si quanto ao tempo de prateleira das
amostras estudadas).
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%)
• Passo 3 – Determinar o valor crítico do teste:
gl = 1

χ20,05;1 = 3,84

• Passo 4 – Calcular o valor do teste:

(20 − 8,88)2 (20 − 31,12)2


logrank χ2 = + = 13, 92 + 3, 97 = 17,89
8,88 31,12

• Passo 5 – Regra de decisão:

Se log rank χ2 < χ20,05;1 , aceita - se H 0 .

Se log rank χ2 ≥ χ20,05;1 , rejeita - se H 0 .

Como log rank χ2 = 17,89 > χ20,05;1 = 3,84 , rejeita - se H 0 .

• Passo 6 – Conclusão:
Como o valor calculado para logrank χ2 é maior que o valor crítico tabelado
χ20,05;1 , rejeita-se H0 e conclui-se que existe uma diferença estatisticamente
significativa entre as distribuições dos tempos de prateleira das duas
amostras de carne bovina resfriada. Portanto, o produto embalado com
atmosfera modificada apresentou maior probabilidade de conservação até
o tempo analisado, pois logrank χ2 = 17,89; P < 0,0001 .

A Figura 22.3 mostra o gráfico de comparação para as curvas de probabi-


lidade relativas às duas amostras estudadas

280 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 280 25/06/12 17:23


Fig. 22.3 - Curvas de probabilidade acumulada de vida de prateleira para as duas amostras
de carne bovina resfriada. Método de Kaplan-Meier

Cálculo da razão de risco


O método de logrank permite que a razão de risco entre as duas amostras
possa ser facilmente calculada com base nos valores observados e esperados.
Para o exemplo em questão, a razão de risco de deterioração da carne resfriada
é calculada dividindo-se o risco de deterioração para a amostra embalada a
vácuo pelo risco para a amostra embalada com atmosfera modificada. A fórmula
é dada pela seguinte equação:

OA / E A 20 / 8,88 2,25
Razão de Risco (RR ) = = = = 3,51
OB / E B 20 / 31,12 0,64

Observe que a razão de risco igual a 3,51 deve ser interpretada da seguinte
maneira: o risco de deterioração para o grupo de carnes resfriadas e acondicio-
nadas em embalagens seladas a vácuo foi 3,51 vezes maior quando comparado
ao risco para o grupo de carnes resfriadas e acondicionadas em embalagens
com atmosfera modificada. A razão de risco calculada pressupõe que o risco ou
a probabilidade de deterioração é igual em qualquer tempo do estudo; no caso,
para qualquer um dos 16 dias da pesquisa.

Análise de sobrevida 281

BIOESTATISTICA_VOL02.indb 281 25/06/12 17:23


 2.3.2 Estatística do qui-quadrado de
2
Mantel-Haenszel
O teste do qui-quadrado de Mantel-Haenszel pode ser utilizado para
comparar outros tipos de distribuição, além das curvas de sobrevida calculadas
pelo método atuarial ou Kaplan-Meier. O método consiste em combinar uma
série de tabelas de contingência 2 x 28 construídas a partir dos valores das
amostras, uma para cada um dos diferentes intervalos de tempo de sobrevi-
vência. Assim, a primeira etapa é definir os intervalos de tempo para que as
tabelas possam ser construídas, nas quais os valores dos indivíduos vivos e
das ocorrências (mortos) são colocados nas linhas da tabela, enquanto que o
número de sujeitos de cada grupo é colocado nas colunas.
Após calcular os totais das linhas e das colunas de cada tabela, a estatística
Mantel-Haenszel é calculada com base no valor da casela superior esquerda
(casela a), para a qual é calculado o seu valor esperado (Ea) e a variância
deste valor esperado (Va), para cada uma das tabelas 2 x 2. As fórmulas são as
seguintes:

Total da linha × Total da coluna


E (a) =
Total geral

 (a + c )(b + d )(a + b )(c + d ) 


V (a) =  de: n - Total geral da tabela.
 , ond
 n2(n − 1) 

Após o cálculo do valor esperado e da variância da casela a de cada uma


das tabelas, estes valores devem ser somados, assim como devem ser somados
os valores observados para a mesma casela. O teste de Mantel-Haenszel é
calculado dividindo-se a diferença entre a soma dos valores observados (Oa)
e a soma dos valores esperados (Ea), elevada ao quadrado, pela soma das
variâncias (Va). A fórmula é a seguinte:

∑O(a ) − ∑ E (a )
2

Mantel - Haenszel χ = 2 i i 

∑V (ai )
8. Para saber mais sobre a tabela de contingência 2 x 2, sugerimos que o leitor consulte o capítulo
14 deste livro.

282 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 282 25/06/12 17:23


Para ilustrar a aplicação prática do qui-quadrado de Mantel-Haenszel como
método para comparar duas curvas de sobrevida, utilizaremos o exemplo a seguir.

Exemplo: Um estudo experimental com Ratos Wistar cirróticos9 foi


conduzido com o objetivo de comparar as curvas de sobrevida para dois
diferentes tipos de tratamento. Ao primeiro grupo, constituído de 16 animais,
foi ministrada a droga A por um período de cinco semanas; ao segundo grupo,
de 20 animais, a droga B foi ministrada por mesmo período de tempo. Existe
diferença estatisticamente significativa entre as curvas de sobrevida para os
grupos estudados? Os dados estão relacionados na Tabela 22.4, abaixo.

Tabela 22.4 – Cálculo dos valores do teste do qui-quadrado de Mantel-Haenszel para as curvas
de sobrevida de ratos cirróticos submetidos a dois diferentes tipos de tratamento
Tabela 2 x 2 Observado Esperado Variância Chances
Semanas
Droga A Droga B Total ai E(ai) V(ai) ad/n bc/n
Vivos 13 18 31 13 13,78 1,09 0,72 1,50
1 Mortos 3 2 5
Total 16 20 36
Vivos 9 15 24 9 10,06 1,36 0,87 1,94
2 Mortos 4 3 7
Total 13 18 31
Vivos 4 11 15 4 5,62 1,38 0,67 2,29
3 Mortos 5 4 9
Total 9 15 24
Vivos 2 7 9 2 2,40 0,75 0,53 0,93
4 Mortos 2 4 6
Total 4 11 15
Vivos 1 5 6 1 1,33 0,39 0,22 0,56
5 Mortos 1 2 3
Total 2 7 9
Somas 29,0 33,19 4,98 3,02 7,22
Qui-quadrado de Mantel-Haenszel = 3,52
OR = 0,42

9. A cirrose hepática em ratos pode ser experimentalmente induzida pela ligadura do ducto biliar
comum por um período de quatro semanas.

Análise de sobrevida 283

BIOESTATISTICA_VOL02.indb 283 25/06/12 17:23


• Passo 1 – Formular as hipóteses estatísticas:
H 0 :O = E (as probabilidades das curvas não diferem entre si quanto ao
tempo de sobrevida dos grupos estudados);
H A :O ≠ E (as probabilidades das curvas diferem entre si quanto ao tempo
de sobrevida dos grupos estudados).
• Passo 2 – Escolher o nível de significância (nível alfa):
α = 0,05 (5%)
• Passo 3 – Determinar o valor crítico do teste:
gl = 1

χ20,05;1 = 3,84

• Passo 4 – Calcular o valor do teste:

29,0 − 33,19
Mantel - Haenszel χ2 = = 3,52
4 , 98

• Passo 5 – Regra de decisão:

Se Mantel - Haenszel χ2 < χ20,05;1 , aceita - se H 0 .

Se Mantel - Haenszel χ2 ≥ χ20,05;1 , rejeita - se H 0 .

Como Mantel - Haenszel χ2 = 3,52 < χ20,05;1 = 3,84 , aceita - se H 0 .

• Passo 6 – Conclusão:
Como o valor calculado para o qui-quadrado de Mantel-Haenszel é menor
que o valor crítico tabelado χ0,05;1 , aceita-se H0 e conclui-se que não
2

existe diferença estatisticamente significativa entre as probabilidades das


curvas de sobrevida para os dois grupos analisados. Portanto, o tempo
de sobrevida para o grupo de animais tratados com a droga A não diferiu
do tempo de sobrevida do grupo de animais tratados com a droga B, pois
Mantel-Haenszel χ2 = 3,52; P = 0,0971 .

A Figura 22.4 mostra o gráfico de comparação para as curvas de probabi-


lidade acumulada de sobrevida relativas aos dois grupos de ratos.

284 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 284 25/06/12 17:23


Fig. 22.4 - Curvas de probabilidade acumulada de sobrevida para os dois grupos de ratos
cirrótico submetidos a dois diferentes tipos de tratamento. Método de Kaplan-Meier

Cálculo da razão de chance combinada


Embora não seja necessário para o cálculo do teste do qui-quadrado de
Mantel-Haenszel, a odds ratio combinada pode ser estimada para fins de
análise dos resultados. A fórmula é dada por:

a di 
x
∑  i
ni 

ORMH =  ∴ ORMH =
3,02
= 0, 42
b x c  7,22
∑  n 
i i

 i 

Para o exemplo em questão, o valor calculado significa que a chance de


sobrevida para o grupo de ratos cirróticos tratados com a droga A foi 0,42
(42:100) vezes maior quando comparada à chance para o grupo de animais
tratados com a droga B. Observe que o valor menor que 1 decorre do fato do
numerador da fração ser menor que o denominador, pois a chance absoluta
para o grupo A (3,02) é menor que para o grupo B (7,22), o que torna a inter-
pretação do resultado um tanto confuso para os menos experientes. Assim,
uma maneira mais compreensível seria inverter a fração, o que dá uma ORMH
igual a 2,39 (7,22/3,02). Este procedimento não altera a relação das chances

Análise de sobrevida 285

BIOESTATISTICA_VOL02.indb 285 25/06/12 17:23


entre os grupos. Assim, neste caso, a chance de sobrevida para o grupo de ratos
tratados com a droga B é 2,39 vezes maior quando comparada à chance para o
grupo de ratos tratados com a droga A. Este valor da razão de chance pressupõe
que a probabilidade de sobrevivência é igual em qualquer tempo do estudo; no
caso, para qualquer uma das cinco semanas da pesquisa.
Como anteriormente relatado, os procedimentos descritos acima são os
mais utilizados para a comparação de curvas de sobrevida. Entretanto, vários
outros métodos de análise existentes na literatura podem ser empregados,
sendo todos muito semelhantes. Dentre eles, citamos os testes de Gehan
(Wilcoxon generalizado) ou o modelo de risco proporcional de Cox. Assim,
para um maior aprofundamento sobre o assunto, sugerimos ao leitor consultar
os seguintes autores: Breslow e Day (1993), Dawson e Trapp (2003).

286 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 286 25/06/12 17:23


23
Experimentos Fatoriais
Mauro José Fontelles
Edson Marcos Leal Soares Ramos1

Como intensamente explanado ao longo de todos os capítulos deste


livro, o objetivo da maioria das pesquisas é determinar a influência de uma
ou mais variáveis preditoras sobre uma outra variável de interesse, a qual é
dita variável-resposta ou dependente. Na prática, o que sempre se deseja
saber é de que maneira estas variáveis preditoras, doravante denominadas de
fatores, interagem entre si de modo que possam influenciar o comportamento
da variável-resposta; como, também, é desejável conhecer o comportamento
desta variável frente a qualquer alteração introduzida em um dos fatores.
Assim, diante desta ideia, percebe-se que o conjunto como um todo constitui
um sistema complexo que atua como uma função matemática, de modo que, a
cada alteração de um dos fatores, pode-se prever o comportamento da resposta,
mesmo que de maneira aproximada, sendo o objetivo da pesquisa, determinar
esta função, para que melhores previsões possam ser feitas.
Portanto, em qualquer projeto de pesquisa, o passo inicial é escolher os fatores
(variáveis) de interesse que serão controlados (manipulados) pelo pesquisador,
e a resposta que se quer estudar, de modo que o experimento possa ser adequa-
damente planejado. Por sua vez, quando desejamos estudar um grande número
de fatores na determinação da resposta, é sempre possível que alguns deles não
tenham qualquer influência sobre o desfecho, e, estudá-los, seria desperdício de

1. Doutor em Estatística, Professor do Instituto de Ciências Exatas e Naturais da Universidade


Federal do Pará.

BIOESTATISTICA_VOL02.indb 287 25/06/12 17:23


tempo e de recursos materiais. Nestes casos, a melhor conduta seria realizar uma
seleção prévia, para decidir quais dos fatores merecem ser incluídos no modelo,
sendo os experimentos fatoriais o modelo de planejamento mais adequado para
este propósito, os quais serão explanados neste capítulo.

23.1 NOÇÕES BÁSICAS SOBRE


EXPERIMENTOS FATORIAIS

No dia-a-dia da pesquisa, geralmente utilizamos experimentos mais


simples, que comparam diferentes níveis de um único fator, considerando
que todos os demais fatores que possam interferir no resultado da resposta
se mantenham constantes. Isto ocorre, por exemplo, quando comparamos os
efeitos de diferentes doses de uma droga experimental (fator) em um mesmo
grupo de animais, mantendo-se constante a massa corporal, a idade, o sexo
etc. Porém, existem diversos outros modelos de delineamento, nos quais as
variações de dois ou mais fatores devem ser estudadas simultaneamente; neste
caso, estamos falando de experimento fatorial, como por exemplo, se compa-
rarmos diferentes dosagens da droga em grupos de animais com diferentes
valores da massa corporal e da idade. Desta forma, é interessante ressaltar que
os experimentos fatoriais geralmente são mais eficientes que os experimentos
simples, pois permitem, ao pesquisador, extrair conclusões mais fidedignas.
Por exemplo, se o objetivo for mensurar o nível da excreção urinária de
uma nova droga experimental, 1 hora após a administração oral da mesma, e
se forem ministradas quatro doses diferentes (D1, D2, D3 e D4), da mesma droga,
em quatro animais com o mesmo peso corporal, somente poderemos concluir
que a dose D1, por exemplo, é a que apresentou menor nível de excreção para
aquela massa corporal estudada. Porém, é possível que, para outro valor de
peso, a dose D2 supere todas as outras dosagens, em relação à excreção renal.
Assim, num experimento fatorial, variando-se simultaneamente as doses do
medicamento e os pesos dos animais, todas as possibilidades possíveis são
pesquisadas, de maneira que as conclusões são mais generalizadas.
Portanto, como regra geral, define-se como experimento fatorial, o tipo de
delineamento que correlaciona as combinações entre os diferentes níveis mensu-

288 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 288 25/06/12 17:23


rados para dois ou mais fatores, sendo os fatores representados por cada uma das
variáveis preditoras, para as quais os níveis são fixados segundo o interesse do
pesquisador. Desta forma, cada uma das subdivisões de um fator é denominada
de nível do fator, e todas as possíveis combinações entre os diversos fatores nos
seus diferentes níveis, são denominadas de tratamentos ou ensaios. Assim, se
todas as possíveis combinações, entre todos os níveis mensurados de cada fator
forem consideradas no modelo, o esquema é dito experimento fatorial completo.
Caso inclua apenas frações bem definidas do modelo completo, o delineamento é
dito experimeto fatorial incompleto, o qual é muito útil na seleção dos níveis
adequados e/ou daqueles fatores que, de fato, influenciam na variável-resposta.
De qualquer modo, a maioria dos autores não considera os experimentos
fatoriais como um delineamento experimental, mas, sim, um esquema de
desdobramento de modelos de tratamento que pode ser adaptado a qualquer
um dos delineamentos experimentais, tais como o delineamento inteiramente
casualizado (DIC) ou em blocos casualizados (DBC), anteriormente abordados
(ver ANOVA), ou em quadrados latinos (DQL) etc. Neste livro, consideraremos
os delineamentos inteiramente casualizados.
Por exemplo, se tomarmos um delineamento inteiramente casualizado, com
somente dois fatores, temperatura (T) e Pressão (P), cada um deles, mensurado
em dois níveis, 1 e 2, teremos um experimento fatorial 2 x 2, com 4 possíveis
combinações (tratamentos) as quais são representadas da seguinte forma:

T1P1 T1P2
T2P1 T2P2

Porém, se os fatores forem mensurados em três níveis, 1, 2 e 3, teremos um


experimento fatorial 3 x 3, isto é, com 9 possíveis combinações:

T1P1 T1P2 T1P3


T2P1 T2P2 T2P3
T3P1 T3P2 T3P3

Assim, se representarmos por k o número de fatores, e por N o número de níveis


mensurados para cada fator, um experimento fatorial completo terá o número de

Experimentos Fatoriais 289

BIOESTATISTICA_VOL02.indb 289 25/06/12 17:23


possíveis combinações determinado por Nk. Deste modo, observa-se que o número
de ensaios cresce exponencialmente à medida que um novo fator ou um nível de
mensuração é acrescentado ao experimento, de tal maneira que modelos completos
com a utilização de 7 ou mais fatores com dois níveis, ou 4 fatores com 3 ou mais
níveis, tornam-se experimentalmente inviáveis em razão do grande número de
combinações. A Tabela 23.1 mostra as possíveis combinações para experimentos
fatoriais completos com até 6 fatores mensurados em até 4 níveis.

Tabela 23.1 – Número de possíveis combinações para esquemas fatoriais completos


até k = 6 e N = 4

Níveis de Fatores (variáveis)


mensuração k=2 k=3 k=4 k=5 k=6
N=2 2 =4
2
2 =8
3
2 = 16
4
2 = 32
5
26 = 64
N=3 32 = 9 33 = 27 34 = 81 35 = 243 36 = 729
N=4 42 = 16 43 = 64 44 = 256 45 = 1.024 46 = 4.096

Note que o principal problema dos experimentos fatoriais é que o número


de tratamentos aumenta rapidamente com um pequeno aumento do número
das variáveis. Assim, uma solução para resolver este problema seria a escolha
de delineamentos fatoriais incompletos ou fracionados, os quais podem ser
utilizados para selecionar os fatores e/ou os seus níveis, que produzem as
melhores respostas para a variável de desfecho estudada.
Por outro lado, a análise estatística é mais trabalhosa, pois são necessários
os cálculos dos efeitos principais e da interação de todos os fatores, além do
que, a interpretação dos resultados se torna mais difícil à medida aumenta o
número de níveis e de fatores no experimento.

Interação entre fatores


Nos experimentos fatoriais, pode-se estudar não apenas os efeitos indivi-
duais de cada um dos fatores, mas, também, se existe interação entre os diversos
fatores considerados no modelo. A interação entre dois ou mais fatores ocorre
quando a modificação na variável-resposta, decorrente da variação entre os
níveis de um fator, não é igual à modificação decorrente da mesma variação dos
outros fatores. Isto é, a interação ocorre quando a mudança de nível em um dos

290 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 290 25/06/12 17:23


fatores produz uma modificação na resposta em um dos níveis do outro fator,
diferente da resposta produzida nos outros níveis deste mesmo fator.
Para ilustrar este conceito, vamos considerar o exemplo de um experimento
fatorial que combina 3 doses (D0, D1 e D2) de uma droga, com 2 medidas (P0 e P1)
de massa corporal, em animais, cujo o objetivo é mediar a excreção urinária da
referida droga. As médias dos valores estão apresentadas na tabela abaixo.

Tabela 23.2 – Valores médios da excreção urinária da droga, em mcg/ml, conforme


a dose e a massa corporal
Massa corporal (Fator B)
Dose da droga (Fator A)
P0 P1
D0 10 20
D1 20 30
D2 30 40

Os gráficos abaixo ilustram a relação entre os dois fatores considerados no


estudo. Neles, podemos verificar que as linhas correspondentes aos diferentes
níveis de cada um dos fatores são paralelas entre si. Isto mostra que, para todos os
níveis do fator A, a diferença entre as médias para os níveis do fator B é a mesma.
Do mesmo modo, para os dois níveis do fator B, as diferenças entre as médias
de quaisquer dos níveis do fator A são sempre iguais. Estas três características,
quando presentes, mostram não haver interação entre os fatores estudados.
 

Fig. 23.1 – Gráficos que mostram a ausência de interação entre os fatores dose e massa
corporal, em relação à excreção urinária de uma droga experimental

Experimentos Fatoriais 291

BIOESTATISTICA_VOL02.indb 291 25/06/12 17:23


Nos experimentos fatoriais, quando a interação entre os fatores está
presente, isto pode afetar as observações, de tal modo que os resultados da
pesquisa podem ser estudados pela combinação de diferentes níveis de cada
um dos fatores. Assim, quando dois fatores são investigados, uma alternativa
seria conduzir dois diferentes experimentos, um para cada fator. Caso isto seja
feito, cada experimento fornecerá apenas informação sobre o seu próprio fator,
de tal maneira que, se mais informações fossem necessárias, novos fatores
deveriam ser investigados, o que aumentaria consideravelmente o número de
experimentos. Por esta razão, a alternativa mais lógica seria estudar todos os
fatores de modo simultâneo, todos reunidos em um experimento fatorial, o
que mostra ser um único experimento com dois ou mais fatores, mais rápido,
preciso e econômico que dois ou mais experimentos com um único fator.
A Figura 23.2, abaixo, mostra os gráficos que ilustram um experimento no
qual ocorre interação entre os fatores.
 

Fig. 23.2 – Gráficos que mostram a presença de interação entre os fatores dose e massa
corporal, em relação à excreção urinária de uma droga experimental

Assim, quando o efeito de um fator depende do nível do outro,dizemos que


os dois fatores interagem. Neste caso, é possível calcular o efeito da interação
entre eles, o que será demonstrado a seguir. Para tal objetivo, vamos considerar
um experimento fatorial 2 x 2, com os fatores, dose da droga, mensurada nos
níveis D0 e D1, e peso corporal (P), nos níveis P0 e P1. A variável de desfecho
estudada é o valor da excreção urinária da referida droga. Os dados estão
representados na Tabela 23.3, abaixo.

292 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 292 25/06/12 17:23


Tabela 23.3 – Valores médios da excreção urinária da droga, em mcg/ml, conforme
a dose e o peso corporal

Peso corporal (Fator B)


Dose da droga (Fator A) Total
P0 P1
D0 22 35 57
D1 48 73 121
Total 70 108 178

A Figura 23.3 mostra a representação geométrica dos efeitos do experi-


mento relacionado na Tabela 23.3. Os vértices do quadrado representam os
resultados da excreção urinária da droga para todas as possíveis combinações
entre os dois fatores incluídos no experimento, ao passo que os sinais + e –
representam o menor e o maior nível desses fatores.

Fig. 23.3 – Representação geométrica de um delineamento fatorial 2 x 2

Efeito simples de um fator


Corresponde ao valor da variação da variável-resposta, no caso, a excreção
urinária da droga, em razão das variações nos níveis de um fator, em cada um
dos níveis do outro fator. É dado pelas seguintes equações:

• Efeito simples do Fator A (Dose) no nível P0 do Fator B (Peso).


Dose(em P0) = y2 – y1 = 48 – 22 = 26 mcg/ml.
Interpretação: Ao nível de P0, a variação da dose da droga causa uma
alteração de 26 mcg/ml na excreção urinária.

Experimentos Fatoriais 293

BIOESTATISTICA_VOL02.indb 293 25/06/12 17:23


• Efeito simples do Fator A (Dose) no nível P1 do Fator B (Peso).
Dose(em P1) = y4 – y3 = 73 – 35 = 38 mcg/ml.
Interpretação: Ao nível de P1, a variação da dose da droga causa uma
alteração de 38 mcg/ml na excreção urinária.

• Efeito simples do Fator B (Peso) no nível D0 do Fator A (Dose).


Peso(em D0) = y3 – y1 = 35 – 22 = 13 mcg/ml.
Interpretação: Ao nível de D0, a variação do peso causa uma alteração de
13 mcg/ml na excreção urinária.

• Efeito simples do Fator B (Peso) no nível D1 do Fator A (Dose).


Peso(em D1) = y4 – y2 = 73 – 48 = 25 mcg/ml.
Interpretação: Ao nível de D1, a variação do peso causa uma alteração de
25 mcg/ml na excreção urinária.

Efeito principal de um fator


Corresponde à diferença entre os valores médios das variações da
variável-resposta, no caso a excreção urinária da droga, medidos níveis
de um fator, independentemente dos níveis do outro fator. Para o exemplo
em questão, o efeito principal do Fator A (Dose) pode ser entendido como
a diferença entre as médias da variação da excreção urinária da droga,
medidas nos dois níveis de A, independente do fator B (Peso). É dado pelas
seguintes equações:

• Efeito principal do Fator A (Dose).


( y + y 4 ) ( y3 + y1 ) (73 + 48) (35 + 22
2)
Fator A (Dose ) = 2 − = − = 32 mcg / ml
2 2 2 2
Interpretação: quando a dose administrada passa do nível baixo para o
nível alto, isto causa um aumento médio de 32 mcg/ml na excreção urinária
da droga.

• Efeito principal do Fator B (Peso).


( y + y 4 ) ( y1 + y2 ) (35 + 73) (22 + 48
8)
Fator B (Peso) = 3 − = − = 38 mcg / ml
2 2 2 2

294 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 294 25/06/12 17:23


Interpretação: quando o peso passa do nível baixo para o nível alto, isto
causa um aumento de 38 mcg/ml na excreção urinária da droga.

Efeito da interação entre dois fatores


Corresponde ao valor da variação que ocorre na variável-resposta, em razão
da variação nos níveis de um fator, quando este passa de um nível a outro do outro
fator. Para o exemplo em questão, o efeito da interação entre os Fatores A e B pode
ser entendido como a diferença entre a variação de A (Dose) em P1 e a variação de
A (Dose) em P0. Pode ser calculada por uma das duas fórmulas abaixo.

• Efeito da interação do Fator A (Dose) x Fator B (Peso).

Efeito da Dose(em P1) − Efeito da Dose(em P0) (38 − 26)


Dose × Peso = = = 6, ou ainda,
2 2

ou ainda,

Efeito do Peso(em D1) − Efeito do Peso(em D0) (25 − 13)


Peso × Dose = = =6
2 2

Note que tanto faz calcular a interação AB como BA, o resultado é o mesmo.
Porém, a maneira mais simples de calcular o efeito da interação entre dois
fatores é pelo cálculo da diferença (contraste) entre as médias determinadas
pelas duas diagonais. A equação é a seguinte:

( y1 + y 4 ) ( y2 + y3 ) y1 − y2 − y3 + y 4
AB = − =
2 2 2

Assim para o exemplo em questão, teríamos:

22 − 48 − 35 + 73 12
AB = = =6
2 2

Note, também, que, na representação geométrica de um experimento


fatorial, os efeitos principais dos fatores são calculados pelas diferenças entre
os lados opostos, ao passo que o efeito de interação é dado pelo contraste entre
as duas diagonais do quadrado. A seguir, mostraremos um delineamento intei-
ramente casualizado, com modelo fatorial 22.

Experimentos Fatoriais 295

BIOESTATISTICA_VOL02.indb 295 25/06/12 17:23


23.2 EXPERIMENTO FATORIAL 22

Para realizar um experimento fatorial 2 x 2, o primeiro passo é definir as


variáveis preditoras, isto é, os dois fatores (ou classes, para dados qualitativos)
que atuarão na determinação da variável de desfecho (variável-resposta).
Portanto, para efeito de ilustração, vamos supor o seguinte exemplo:
Exemplo: Uma indústria de alimentos conduziu um experimento para
estudar os efeitos da temperatura (Fator A) e do tempo (Fator B) sobre o
rendimento, em porcentagem, de um novo produto extrusado (desfecho).
Assim, para que se possa estudar o efeito de qualquer fator sobre uma
variável-resposta, é necessário fazê-lo variar e observar o resultado que essa
variação produz sobre essa variável de desfecho. Para isso, precisamos estudar
o efeito de cada fator em pelo menos dois diferentes níveis, o que nos leva a
concluir que o experimento mais simples é aquele em que cada fator varia
somente entre dois níveis. Neste experimento, cada fator será medido em dois
níveis: baixo (–) e alto (+).
O próximo passo é escolher os níveis de variação de cada um dos dois fatores.
Esta escolha é muito importante e deve ser embasada em conhecimento prévio
sobre a relação entre as variáveis estudadas. Na prática, os melhores níveis
devem ser escolhidos com base em dados publicados na literatura ou colhidos
em ensaios aleatórios realizados em um projeto piloto. Isto evita que o pesqui-
sador “atire” no escuro, isto é, que tente adivinhar quais são os melhores níveis
para o seu experimento. Consideram-se como níveis máximo e mínimo ideais
para um determinado fator, aqueles que, no ensaio piloto, produzem a melhor
e a pior resposta sobre a variável-resposta, respectivamente, quando este fator
é considerado de maneira individual. Para efeitos ilustrativos, tomaremos os
seguintes níveis para as variáveis estudadas:
Fator A (Temperatura): Nível inferior T– = 60 oC.
Nível superior T+ = 80 oC.
Fator B (Tempo): Nível inferior t– = 20 min.
Nível superior t+ = 30 min.

Portanto, para fazer o experimento, deve-se realizar todos os ensaios


possíveis (quatro para o fatorial 2 x 2) e registrar as respectivas respostas

296 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 296 25/06/12 17:23


observadas (rendimentos do produto) para cada uma das quatro possíveis
combinações entre os níveis escolhidos. Assim, teremos: 60 oC x 20 min, 60 oC
x 30 min, 80 oC x 20 min e 80 oC x 30 min. Para que se possa estimar o erro
aleatório da resposta em cada uma das combinações, os ensaios são todos reali-
zados com três repetições (triplicata). Este procedimento é importante para que
se possa determinar se existe significância estatística entre a ação de cada fator e
o desfecho estudado. Os dados dos ensaios devem ser dispostos em uma matriz
de planejamento, conforme mostrado na Tabela 23.4, abaixo.

Tabela 23.4 – Matriz de planejamento para os ensaios

Fator A Fator B Tratamentos Repetições Média


Total
(Temperatura) (Tempo) (Ensaios) 1 2 3 (Rendimento)

– – y1 21 20 19 60 20

+ – y2 21 23 22 66 22

– + y3 26 24 25 75 25

+ + y4 33 32 31 96 32

A Figura 23.4 mostra a representação geométrica dos efeitos do experi-


mento mostrado na Tabela 23.4.

y3 = 25 y4 = 32
t1

Fator B
(Tempo em min)

t0
y1 = 20 y2 = 22

T0 Fator A T1
(Temperatura em 0C)

Fig. 23.4 – Representação geométrica dos resultados obtidos em um experimento que correla-
ciona os efeitos dos fatores Tempo e Temperatura, no rendimento de um produto alimentício

Experimentos Fatoriais 297

BIOESTATISTICA_VOL02.indb 297 25/06/12 17:23


Cálculo dos efeitos dos fatores
O passo seguinte é calcular os efeitos dos fatores, tal como foi demonstrado
no item 22.1. Os cálculos são os seguintes:

• Temperatura:
( y + y 4 ) ( y 1 + y 3 ) (22 + 32) (20 + 25)
T= 2 − = − = 4 ,5%
2 2 2 2
- A mudança da temperatura, do nível baixo para o alto, aumentou o rendi-
mento em 4,5%.

• Tempo:
( y + y 4 ) ( y 1 + y 2 ) (25 + 32) (20 + 22)
t= 3 − = − = 8,5%
2 2 2 2
- A mudança do tempo, do nível baixo para o alto, aumentou o rendimento
em 8,5%.

• Temperatura x Tempo:
y − y 2 − y 3 + y 4 20 − 22 − 25 + 32
Txt = 1 = = 5%
2 2
- A interação entre os dois fatores, temperatura e tempo, aumentou o
rendimento em 5%.

A Tabela 23.5 mostra as médias dos valores dos rendimentos conforme os


efeitos dos fatores estudados.

Tabela 23.5 – valores médios do rendimento conforme o tempo e a temperatura


de processamento
Fator B
Fator A (Tempo) Médias conforme o
(Temperatura) tempo
– +
– 20 25 y t − = 22,5

+ 22 32 y t + = 27

Médias conforme a y = 24 ,75


yT − = 21 yT + = 28,5
temperatura

298 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 298 25/06/12 17:23


Ajuste do modelo de regressão
Quando os fatores em estudo são do tipo quantitativo, como no exemplo em
questão (temperaturas e tempo), está indicado fazer uma análise de regressão
múltipla. O modelo de regressão para um experimento com dois fatores, cada
um mensurado em dois níveis, é dado pela seguinte equação:

y i jr = β0 + β1x 1 j + β2x 2 j + β12x 1 j x 2 j + εijr

Onde: y = É a variável resposta.


 b0, b1, b2 e b12 = Parâmetros que serão estimados pelo método dos
mínimos quadrados.
 x1 e x2 = São as variáveis que representam os fatores A e B respec-
tivamente. As variáveis x1 e x2 são codificadas como -1 e +1, e x1x2
representa a interação entre elas.
e = É o termo do erro aleatório associado à resposta y.

Na prática, os parâmetros são calculados da seguinte maneira:

βˆ 0 = y = 24 ,75

Efeito do fator A 4 ,5%


βˆ 1 = = = 2,25%
2 2

Efeito do fator B 8,5%


βˆ 2 = = = 4 ,25%
2 2

Efeito dos fatores AB 5%


β̂12 = = = 2,5%
2 2

Assim, o modelo ajustado é dado pela equação abaixo, na qual os coeficientes


b0, b1, b2 e b12 são estimadores dos parâmetros populacionais b0, b1, b2 e b12.

yˆ = b0 + b1x 1 + b2x 2 + b12x 1x 2 = 24 ,75 + 2,25x 1 + 4 ,25x 2 + 2,5x 1x 2

De todo jeito, é relevante notar que a regressão múltipla avalia apenas


a relação linear entre as variáveis preditoras e a variável-resposta. Por sua

Experimentos Fatoriais 299

BIOESTATISTICA_VOL02.indb 299 25/06/12 17:23


vez, os coeficientes de regressão (bi) são interpretados de modo diferente na
regressão múltipla quando comparados com a regressão simples. Nesta, o
coeficiente de regressão b indica a quantidade de variação da variável-resposta
y que é devida a cada acréscimo de uma unidade na variável preditora x. Na
regressão múltipla, um determinado coeficiente de regressão bi mostra até que
ponto o valor da variável-resposta y pode ser alterado em função do aumento
de uma unidade na variável preditora xi, mantendo-se constantes os valores
das demais variáveis preditoras da equação de regressão.
Assim, é necessário comparar os efeitos dos fatores para que se
possam determinar qual deles é significativo. Esta comparação é realizada
pela aplicação do teste F (ANOVA), conforme foi abordado no capítulo 19
deste livro.

Confirmação por análise de variância


Portanto, quando o objetivo é comparar vários fatores, simultaneamente, e
para que se possa manter o erro tipo I em um nível constante, o procedimento
correto é o emprego de um teste de abrangência global, o qual é utilizado para
avaliar se existe alguma diferença entre as médias e, somente se este primeiro
teste for positivo, deve-se, então, testar as várias combinações entre elas. Neste
caso, a técnica a ser empregada é a análise de variância (ANOVA), a qual
compara todas as médias em um único teste, objetivando identificar se existe
ao menos uma diferença estatisticamente significativa entre os fatores compa-
rados. Caso esta diferença exista, aplica-se, então, uma das diversas técnicas de
comparações múltiplas para que se possam identificar quais os grupos diferem
entre si. O teste ANOVA também é utilizado na verificação da significância
estatística para os valores do coeficiente de correlação múltipla (R) e coefi-
ciente de determinação (R2). Neste caso, o delineamento foi um experimento
inteiramente casualizado, com os tratamentos dispostos em um modelo de
esquema fatorial 2 x 2, com três repetições. Os dados obtidos são apresentados
na Tabela 23.6.
Assim, existe diferença estatisticamente significante entre os rendimentos
obtidos para o produto extrusado com as variações da temperatura (Fator A)
e do tempo (Fator B)?

300 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 300 25/06/12 17:23


Tabela 23.6 – Valores, em porcentagem, dos rendimentos, para cada uma das repetições
conforme o tipo de tratamento
Tratamentos (ensaios)
Total
T 0t 0 T 1t 0 T 0t 1 T 1t 1
21 21 26 33
Repetições 20 23 24 32
19 22 25 31
Totais 60 66 75 96 Σx = 297
Repetições (n) 3 3 3 3 N = 12

Médias ( x ) 20 22 25 32

Σx2 1.202 1.454 1.877 3.074 7.607

• Passo 1 – Formular as hipóteses estatísticas:


H 0: 
Não existem diferenças entre as médias dos rendimentos, pois
µT t = µT t = µT t = µT t .
0 0 1 0 01 11
HA: Ao menos uma das médias difere das demais, sendo µT t ≠ µT t ou
0 0 1 0

µT t ≠ µT t ou µT t ≠ µT t ou µT t ≠ µT t ou µT t ≠ µT t ou µT t ≠ µT t
0 0 01 0 0 11 1 0 01 1 0 11 01 11

• Passo 2 – Escolher o nível de significância (nível alfa):


α = 0,05 (5%) unilateral
• Passo 3 – Determinar o valor crítico do teste F:
gl do numerador (entre) - gl E = k − 1 = 4 − 1 = 3
gl do denominador (dentro) - gl D = N − k = 12 − 4 = 8
gl do total - glT = N − 1 = 12 − 1 = 11
Então, Fα;gl = F0,05;3;8 = 4 ,07
N ;glD

• Passo 4 – Calcular o valor do fator de correção C:


2
 k n 
 ∑ ∑ x  2
C=  = 297 = 88.209 = 7.350,75
N 12 12

• Passo 5 – Calcular o valor do teste F:


k n
SQT = ∑ ∑ x 2 − C = 7.607 − 7.350,75 = 256,25

Experimentos Fatoriais 301

BIOESTATISTICA_VOL02.indb 301 25/06/12 17:23


2
 n 
 ∑ x 
k 
 − C = 60 + 66 + 75 + 96 − 7.350,75 = 248,25
2 2 2 2
SQE = ∑ 
n 3

SQE 248,25
s E2 = = = 82,75
k −1 3

SQD = SQT − SQE = 256,25 − 248,25 = 8

SQD 8
s D2 = = =1
N −k 8

s E2 82,75
Fcalc = = = 82,75
s D2 1

Tabela 23.7 – Análise de variância dos dados da Tabela 23.6

Fonte de variação gl SQ QM Fcalc


Entre os grupos
3 248,25 82,75
(tratamentos) 82,75
Dentro dos grupos P = 0,00004
8 8,00 1,00
(variação residual)
Total 11 256,25

• Passo 6 – Regra de decisão:

Se Fcalc < F0,05;3;8 , aceita-se H 0 .

Se Fcalc ≥ F0,05;3;8 , rejeita-se H 0 .

Como Fcalc = 82,75 > F0,05;3;20 = 4 ,07, rejeita-se H 0 .

• Passo 7 – Conclusão:
Como o valor para Fcalc é maior que o valor crítico tabelado F0,05;3;8 , rejeita-
-se H0 e conclui-se que ao menos uma das médias difere das demais.

302 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 302 25/06/12 17:23


Portanto, existe alguma diferença estatisticamente significante entre
as médias referentes aos rendimentos dos ensaios avaliados, pois
Fcalc = 82,75; P = 0,00004 .

Com este resultado, a continuação da análise deve envolver a comparação


das médias dos ensaios pelo emprego de um dos procedimentos de comparações
múltiplas, tal como os testes de Tukey, Student-Newman-Keuls, Bonferroni etc.
Uma maneira mais simples de análise é baseada no modelo de experimento
fatorial. Assim, tomando-se os totais repetições das diferentes combinações
dos níveis dos fatores A e B, pode-se construir um novo quadro de análise de
variância que permite testar se existe interação entre os fatores estudados, e se
cada um desses fatores tem efeito estatisticamente significante sobre o rendi-
mento do produto em análise. O Quadro 23.1 mostra os totais das repetições para
cada um dos diferentes níveis dos fatores temperatura (T) e tempo (t).

Quadro 23.1 – Valores totais das repetições das diferentes combinações


dos níveis dos fatores A e B

Fator B
Fator A (Tempo) Totais
(Temperatura)
t0 t1

T0 60 (ya) 25 (yb) 85 (yab)

T1 22 (yc) 32 (yd) 54 (ycd)

Totais 82 (yac) 57 (ybd) 139 (yabcd)

Assim, sendo r o número de repetições, a e b o número de níveis para


os fatores A e B, respectivamente, as Somas dos Quadrados (SQ) podem ser
escritas pelas seguintes fórmulas:
2
y ab + y cd
2 2
y abcd 852 + 542 1392
SQ( A ) = − = − = 80
0,08
2r a.b.r 6 12

2
y ac + y bd
2 2
y abcd 822 + 572 1392
SQ(B ) = − = − = 52
2,08
2r a.b.r 6 12

Experimentos Fatoriais 303

BIOESTATISTICA_VOL02.indb 303 25/06/12 17:23


SQ( AB ) = 248,25 − 80,08 − 52,08 = 116,09

Obs. – As Somas dos Quadrados associadas ao total e ao resíduo perma-


necem as mesmas, sendo SQ(T) = SQ(A) +SQ(B) + SQ(AB).

Deste modo, uma nova tabela para a análise de variância pode ser
construída:

Tabela 23.8 – Análise de variância dos dados do Quadro 23.1

Fonte de variação gl SQ QM Fcalc


Temperatura (A) 1 80,08 80,08 80,08
Tempo (B) 1 52,08 52,08 52,08
Interação AB 1 116,09 116,09 116,09
Tratamentos 3 248,25 82,75 82,75
Resíduo 8 8,00 1,00
Total 11 256,25

Comparando-se os valores de Fcalc, obtidos na Tabela 23.8, com os valores


críticos tabelados, podemos concluir que:

• Para a interação AB:

Se FcalcAB < F0,05;1;8 , aceita-se H 0 .

Se FcalcAB ≥ F0,05;1;8 , rejeita-se H 0 .

Como FcalcAB = 116,09 > F0,05;3;20 = 5,32, rejeita-se H 0 .

Assim, como o teste para interação AB foi significativo, isto indica que
o efeito da temperatura é estatisticamente diferente entre os dois níveis
do fator tempo considerados no estudo. A Figura 23.5 mostra o gráfico das
médias do rendimento para os diferentes níveis da temperatura, conforme o
nível do fator tempo.

304 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 304 25/06/12 17:23


 

Fig. 23.5 – Gráficos das médias do rendimento conforme a interação dos fatores
temperatura e tempo

Uma vez que a interação entre os fatores A e B foi estatisticamente signi-


ficativa, não tem sentido estudar os efeitos simples de cada um dos fatores,
isoladamente. O passo seguinte, então, seria desdobrar a interação para que
se possa estudar o comportamento de um dos fatores dentro de cada nível
do outro fator. Na prática, e em razão da tediosidade dos cálculos, utilizamos
programas estatísticos computacionais que, além de fornecer qual a combi-
nação ótima dos fatores na obtenção da resposta desejada, disponibilizam
métodos gráficos que modelam a função que relaciona essas variáveis, de modo
que uma figura geométrica possa ser obtida quando uma variável resposta é
plotada como uma função de um ou mais fatores quantitativos. Dentro dos
diferentes métodos gráficos, destaca-se a análise de superfície, a qual será
abordada no item subsequente deste capítulo. Mas, de qualquer maneira, para
o leitor interessado em aprofundar seus conhecimentos a respeito de experi-
mentos fatoriais, sugerimos as seguintes leituras: Rodrigues, M. I.; Iemma, A.
F. (Planejamento de experimentos e otimização de processos) e Neto, B. B.;
Scarmino, I. S.; Bruns, R. E. (Como fazer experimentos).

23.3 EXPERIMENTO FATORIAL NO MINITAB

O planejamento de experimentos é utilizado para determinar qual a


combinação ótima de variáveis na obtenção da resposta desejada. A resposta
é a variável dependente, enquanto as variáveis que a influenciam, são as

Experimentos Fatoriais 305

BIOESTATISTICA_VOL02.indb 305 25/06/12 17:23


variáveis independentes, denominadas de fatores. Este tipo de planejamento
de experimentos permite estimar os efeitos de vários fatores e suas respectivas
interações sobre a variável resposta, e, para tanto, deve-se selecionar os níveis
em que cada fator irá atuar. O planejamento fatorial completo permite fazer
experimentos com todas as possíveis combinações entre os níveis dos fatores.
Para acessar este planejamento, utiliza-se, no Minitab®, o caminho Stat → DOE
→ Factorial, conforme a Figura 23.6, mostrada abaixo.

Fig. 23.6 – Comandos para realização do planejamento fatorial no Minitab

A fim de realizar um planejamento fatorial completo 22, estudamos


dois fatores, cada um mensurado em dois níveis. Inicialmente vamos criar o
planejamento; em seguida executar o experimento e finalmente, analisar o
planejamento. Para tal, utiliza-se o seguinte caminho Stat → DOE → Factorial
→ Create → Factorial Design, conforme mostrado na Figura 23.6.
Assim, suponha que se queira criar um planejamento fatorial completo com
dois fatores, Temperatura (Fator A) e Tempo (Fator B), cada um a dois níveis,
conforme mostra Tabela 23.9. O planejamento gerado deve ter três replicações
e deve estar na ordem padrão de execução.

Tabela 23.9 – Planejamento fatorial completo com dois fatores, Temperatura e Tempo
Baixo Alto
Fontes de variação
(–) (+)
Fator A (Temperatura) 60 80
Fator B (Tempo) 20 30

306 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 306 25/06/12 17:23


A expressão geral de um planejamento fatorial completo com dois fatores
é da forma

Ŷ = b0 + b1 A + b2B + b3AB

Onde, b0, b1, b2 e b3 são coeficientes e A, B são os fatores.


A janela inicial é mostrada na Figura 23.7. Nesta janela, pode-se escolher o
tipo de planejamento em Type of Design. Os tipos disponíveis são:
• 2-Level factorial (default generators) – Esta opção é selecionada quando
se deseja criar planejamentos fatoriais com fatores em dois níveis, com os
geradores padrão;
• 2-Level factorial (specify generators) – Esta opção é selecionada quando
se deseja criar planejamentos fatoriais com fatores em dois níveis e se quer
especificar os geradores;
• Plackett-Burman design – Esta opção é selecionada quando se deseja
criar planejamentos Plackett-Burman (planejamento de seleção);
• General full factorial design – Esta opção é selecionada quando se deseja
criar planejamentos fatoriais completos, com pelo menos um dos fatores
sendo mensurado em mais de dois níveis.

Fig. 23.7 – Janela inicial para criar Fig. 23.8 – Tabela de escolha
um experimento fatorial do planejamento adequado

Na janela inicial, têm-se os seguintes submenus: Display Available


Designs, Designs, Factors, Options e Results. Em Display Available
Designs, que aparece na Figura 23.8, é mostrada uma tabela para auxiliar

Experimentos Fatoriais 307

BIOESTATISTICA_VOL02.indb 307 25/06/12 17:23


na escolha do planejamento mais adequado, baseando-se no número de
fatores e execuções que ele terá. Nesta tabela, os planejamentos estão classi-
ficados por cores como em um semáforo: vermelho (resolução III - cuidado,
planejamento altamente fracionado), amarelo (resolução IV - planejamento
deve ser realizado com atenção) e verde (resoluções V, VI, VII, VIII e Full - siga
em frente, estes planejamentos são reconhecidos). Este submenu é apenas um
guia para a escolha do menor planejamento, mas não há seleções a serem feitas.

Em Designs, que aparece na Figura 23.9, podem-se escolher as carac-


terísticas do planejamento. Na primeira caixa escolhe-se o planejamento
a ser criado. Nela, tem-se o nome, o número de execuções, a resolução e
a representação do planejamento. Ainda, no submenu Designs, têm-se as
seguintes opções:
• Number of center points ­– Nesta opção, entra-se com o número de pontos
centrais do planejamento;
• Number of replicates – Nesta opção, entra-se com número de replicações
de cada fator;
• Number of blocks – Entra-se com o número de blocos do planejamento.

Em Factors, mostrado na Figura 23.10, têm-se as seguintes opções:


• Factor – Mostra os fatores (variáveis) que serão considerados no planejamento;
– Name – Nesta opção, entra-se com os nomes dos fatores selecionados;
– Low – Nesta outra opção, entra-se com o nível baixo de cada fator;
– High – Nesta, entra-se com o nível alto de cada fator.

  Fig.  23.9  –  Submenu  Designs  


Fig. 23.9 – Submenu Designs Fig. 23.10 – Submenu Factors

308 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 308 25/06/12 17:23


Em Options, que aparece na Figura 23.11, têm-se as seguintes opções:
• Fold Design – Onde se pode criar um “planejamento invertido” que
consiste no planejamento original e uma cópia deste, mas com os níveis
invertidos. Esta opção é utilizada quando se trabalha com planeja-
mentos fatoriais fracionários, pois neste tipo de planejamento, pode-se
ter confundimento, isto é, um ou mais efeitos não podem ser estimados
separadamente.
• Do not fold – Utiliza-se esta opção quando se quer usar o planejamento
invertido;
• Fold on all factors – Utiliza-se esta opção quando o objetivo é usar um
planejamento com os níveis invertidos de todos os fatores;
• Fold just on factor – Para que os níveis sejam invertidos somente no fator
selecionado;
• Fraction – Esta opção deve ser selecionada quando se quer especificar
qual será a fração utilizada no planejamento, caso ele seja fracionário;
• Use principal fraction – Esta opção deve ser escolhida quando se quer
utilizar a fração principal;
• Use fraction number – É a opção selecionada quando se quer utilizar
outra fração diferente da principal;
• Randomize runs – Utiliza-se esta opção quando se quer tornar aleatória a
ordem de execução do planejamento;
• Base for random data generator – Esta opção permite que se entre com
a semente da ordem aleatória;
• Store design in worksheet – Esta opção permite que se armazenem os
dados do planejamento em uma planilha.

Em Results, mostrado na Figura 23.12, têm-se as seguintes opções:


• Printed Results – Utiliza-se esta opção quando se deseja escolher quais resul-
tados serão exibidos na Session Window. Têm-se as seguintes alternativas:
a. None – Esta opção deve ser selecionada quando se deseja que nenhum
resultado seja exibido;
b. Summary table – Utiliza-se esta opção quando se quer exibir o resumo
do planejamento com o número de fatores, execuções, blocos, repetições e
pontos centrais;

Experimentos Fatoriais 309

BIOESTATISTICA_VOL02.indb 309 25/06/12 17:23


c. Summary table, alias table – Esta opção permite que seja exibido o
resumo do planejamento, como na alternativa acima, e mais a tabela de
confundimento;
d. Summary table, alias table, data table – Utiliza-se esta opção quando
se deseja que sejam exibidos o resumo do planejamento, a tabela de
confundimento e uma matriz de planejamento;
e. Summary table, alias table, data table, defining relation – Esta opção
permite que sejam exibidos o resumo do planejamento, a tabela de confun-
dimento, a matriz do planejamento e as relações definidas entre os fatores.

Fig. 23.11 – Submenu Options Fig. 23.12 – Submenu Results

Na opção Content of Alias Table, têm-se duas alternativas:


a. Default interactions – Utiliza-se esta opção quando se quer que mostrar
a tabela de confundimento com um número de interações padrão;
b. Interactions up through order – Esta opção deve ser selecionada
quando se quer definir a maior ordem de interação que terá a tabela de
confundimento exibida na Session Window.

Para criar o planejamento apresentado na Tabela 23.9, precisa-se


preencher a janela inicial da Figura 23.7 da seguinte forma: em Type of
Design escolhe-se 2-level factorial (default generators) e, na caixa Number
of factors, entra-se com o número 2 (os fatores são Temperatura e Tempo).
O submenu Designs deve ser preenchido de acordo com a Figura 22.13, já
que o planejamento solicitado no exemplo tem duas replicações. O submenu
Factors deve ser preenchido de acordo com a Figura 23.14.

310 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 310 25/06/12 17:23


Fig. 23.13 – Submenu Designs Fig. 23.14 – Submenu Designs com os


para o exemplo da Tabela 23.9 dados do exemplo mostrado na Tabela 23.9

No submenu Options, a única alteração necessária é desmarcar a opção


Randomize runs, já que se quer o planejamento na ordem-padrão. Nenhuma
alteração será feita no submenu Results. Pode-se, desta forma, gerar o plane-
jamento solicitado na Tabela 23.9. Os resultados exibidos na Session Window
são apresentados na Figura 23.15. Neste resumo, tem-se o número de fatores
(Factors), o planejamento base (Base Design), o número de execuções (Runs),
o número de replicações (Replicates), o número de blocos (Blocks) e o número
de pontos centrais (Center pts). Na Figura 23.16, tem-se a matriz de planeja-
mento, armazenada na planilha.

Full Factorial Design


Factors: 2 Base Design:2; 4
Runs: 12 Replicates:3
Blocks: 1 Center pts (total):0

All terms are free from aliasing.

Fig. 23.15 – Resumo do experimento Fig. 23.16 – Matriz de Planejamento para o


fatorial exemplo da Tabela 23.7, armazenada no
Session Window

Experimentos Fatoriais 311

BIOESTATISTICA_VOL02.indb 311 25/06/12 17:23


Seguindo o roteiro inicial, depois que o planejamento é desenvolvido,
devem-se executar os experimentos. Cada linha da planilha mostrada na Figura
23.17 é um experimento executado.

Fig. 23.17 – Matriz de planejamento após executado o experimento do exemplo


mostrado na Tabela 23.7

Para analisar um planejamento de experimentos fatorial, utiliza-se o


caminho Stat → DOE → Analyze Factorial Design, mostrado na Figura 23.18.
Agora, suponha que se deseje analisar o planejamento proposto na Tabela 23.9,
considerando como variável-resposta o Rendimento, conforme a Figura 23.19.
O objetivo é obter o modelo do experimento para unidades não codificadas e
construir os gráficos dos efeitos (Probabilidade Normal e Pareto). Antes de
iniciar a análise dos experimentos, é necessário colocar a coluna Rendimento
na planilha do MINITAB, conforme Figura 23.16.

Fig. 23.18 – Comando Analyze Factorial Design

312 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 312 25/06/12 17:23


A janela inicial do comando Analyze Factorial Design é mostrada na
Figura 23.19. Na caixa Responses, entra-se com a variável-resposta. Nesta,
têm-se os seguintes submenus: Terms, Covariates, Graphs, Results e Storage.
Em Terms, mostrado na Figura 23.20, pode-se se selecionar os termos que
serão incluídos no modelo. Neste submenu, têm-se as seguintes opções:
• Include terms in the model up through order – Utiliza-se esta opção
quando se quer especificar a ordem das interações entre os fatores;
• Available Terms – Nesta opção, selecionam-se os termos que podem ser
incluídos no modelo;
• Selected Terms – Nesta opção, têm-se os termos que já estão selecio-
nados para fazer parte do modelo. Para incluir ou excluir um termo,
seleciona-se o termo e utilizam-se os botões que aparecem entre as cai-
xas de diálogo;
• Include blocks in the model – Utiliza-se esta opção quando se quer os
termos relacionados aos blocos;
• Include center points in the model – Utiliza-se esta opção quando se
querem incluir os termos relacionados aos pontos centrais.

   

Fig. 23.19 – Janela inicial do comando Fig. 23.20 – Submenu Terms


Analyze Factorial Design

Em Graphs, podem-se construir gráficos para analisar os efeitos e


os resíduos. Este submenu é mostrado na Figura 23.21. Em Effects Plots,
podem-se selecionar os gráficos dos efeitos:
• Normal – Nesta opção, um gráfico de probabilidade normal dos efeitos é
construído;

Experimentos Fatoriais 313

BIOESTATISTICA_VOL02.indb 313 25/06/12 17:23


• Pareto – Nesta opção, um gráfico de Pareto dos efeitos é construído. Na
opção Alpha, especifica-se o nível de significância desejado.

Os resíduos são obtidos a partir da diferença entre os valores observados


e os valores ajustados pelo modelo. Para construir os gráficos de resíduos,
deve-se selecionar o tipo de resíduo desejado. Em Residuals for Plots, têm-se
as seguintes opções:
• Regular – Nesta opção, utilizam-se os resíduos regulares;
• Standardized – Nesta opção, utilizam-se resíduos padronizados;
• Deleted – Nesta opção utilizam os resíduos studentizados, que são basea-
dos na distribuição t de Student.

Em Residual Plots, têm-se as seguintes opções de gráficos de resíduos:


• Histogram – Nesta opção, obtém-se um histograma de resíduos;
• Normal Plot – Nesta opção, obtém-se um gráfico de probabilidade normal
dos resíduos;
• Residual versus fits – Nesta opção, obtém-se um gráfico de dispersão dos
resíduos versus os valores ajustados;
• Residual versus order – Nesta opção, obtém-se um gráfico de dispersão
dos resíduos versus a ordem que os experimentos foram executados;
• Residual versus the variables – Nesta opção, obtém-se um gráfico de dis-
persão dos resíduos versus outra variável de interesse.

   

Fig. 23.21 – Submenu Graphs Fig. 23.22 – Submenu Results

314 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 314 25/06/12 17:23


Em Results, mostrado na Figura 23.22, podem-se selecionar quais infor-
mações serão exibidas na Session Window. Nele, tem-se as seguintes opções:
Display of Results, Display of Alias Table e Display of Least Squares Means.

Em Display of Results, pode-se selecionar o conjunto de informações que


serão exibidas na Session Window. As opções são:
• Do not display – Nesta opção nenhuma informação é exibida;
• Coefficients and ANOVA table – São exibidos os coeficientes do modelo e
a tabela da análise de variância - ANOVA;
• Unusual observations in addition to the above – São exibidos os co-
eficientes do modelo, a tabela da análise de variância e as observações
não-usuais;
• Full table of fits and residuals in addition to the above – São exibidos
os coeficientes do modelo, a tabela da análise de variância, as observações
não-usuais e a tabela completa de valores ajustados e resíduos.

Em Display of Alias Table, seleciona-se o conjunto de informações que


são exibidas na Session Window, referente à tabela de confundimento. As
opções são:
• Do not display – Nesta opção nenhuma informação sobre a tabela de con-
fundimento é exibida;
• Default interactions – Exibe a tabela de confundimento com as interações
padrão;
• Interactions up through order – Exibe a tabela de confundimento com as
interações até a ordem especificada na caixa ao lado.

Em Display of Least Squares Means possibilita exibir a média ajustada


ou média de mínimos quadrados dos termos selecionados. Este item possui
duas opções:
• Available Terms – Nesta opção, têm-se os termos para os quais se podem
calcular a média ajustada, e;
• Selected Terms – Nesta opção têm-se os termos já selecionados, para cal-
cular a média ajustada.

Experimentos Fatoriais 315

BIOESTATISTICA_VOL02.indb 315 25/06/12 17:23


Para analisar o exemplo, cujos dados são mostrados na Figura 23.17, deve-se
preencher a janela inicial do comando Analyze Factorial Design, conforme
a Figura 23.19. Como não houve nenhuma restrição aos termos utilizados e
o planejamento não possui blocos ou pontos centrais, não é preciso alterar
nenhuma das caixas de diálogo do submenu Terms. O submenu Graphs deve
ser preenchido de acordo com a Figura 23.20. Nenhuma alteração é necessária
nos submenus Results e Storage. As saídas geradas, pelo MINITAB, são: análise
do planejamento (na Session Window) e os gráficos dos efeitos (probabi-
lidade normal e Pareto). A saída gerada na Session Window é a apresentada
na Figura 23.23.
A partir da Figura 23.23, observam-se as estimativas para os efeitos
(coluna Effect) e para os coeficientes (coluna Coef) de cada termo (coluna
Term). A última coluna é o valor P para cada termo, com base no qual se decide
se um determinado termo é significante ou não. Observando os valores obtidos,
nota-se que a interação Temperatura versus Tempo não possui valor menor que
0,05 (que é o nível de significância adotado), assim, vemos que este termo não
é significante e, portanto, não é necessário incluí-lo no modelo. Então, deve-se
gerar um novo ajuste fatorial sem a interação Temperatura versus Tempo,
conforme se pode ver na Figura 23.24.
A partir da Figura 23.24, observa-se que no primeiro grupo, têm-se as
estimativas para os efeitos, e que os valores obtidos, todos menores que 0,05,
mostram que todos os termos são significantes e, portanto, é necessário incluir
todos no modelo. Para se obter o modelo do planejamento com unidades codifi-
cadas, utilizam-se os valores da coluna Coef, para cada termo correspondente
da coluna Term.
No segundo grupo, tem-se a tabela de análise de variância onde são testados
os efeitos principais e as interações. A última coluna é o valor P para cada efeito,
com base no qual se decide qual o efeito é significante ou não. Observando os
valores obtidos, vê-se que, as interações (Lack of Fit) não são significantes, mas
os efeitos principais (Main Effects) são significantes e, portanto, é necessário
incluir somente os efeitos principais no modelo.
No terceiro grupo, tem-se o modelo do planejamento, para unidades
não-codificadas. Este modelo é:
Rendimento = - 71,50 + 0,65 Temperatura + 3,10 Tempo.

316 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 316 25/06/12 17:23


Factorial Fit: Rendimento versus Temperatura; Tempo

Primeiro Grupo
Estimated Effects and Coefficients for Rendimento (coded units)

Term Effect Coef SE Coef T P


Constant 51,500 1,414 36,42 0,000
Temperatura 13,000 6,500 1,414 4,60 0,002
Tempo 31,000 15,500 1,414 10,96 0,000
Temperatura*Tempo 5,000 2,500 1,414 1,77 0,115

S = 4,89898 R-Sq = 94,75% R-Sq(adj) = 92,78%

Segundo Grupo
Analysis of Variance for Rendimento (coded units)

Source DF Seq SS Adj SS Adj MS F P


Main Effects 2 3390,00 3390,00 1695,00 70,63 0,000
2-Way Interactions 1 75,00 75,00 75,00 3,12 0,115
Residual Error 8 192,00 192,00 24,00
Pure Error 8 192,00 192,00 24,00
Total 11 3657,00

Terceiro Grupo
Estimated Coefficients for Rendimento using data in uncoded units

Term Coef
Constant 16,0000
Temperatura -0,600000
Tempo -0,40000
Temperatura*Tempo 0,0500000

Effects Plot for Rendimento


Alias Structure
I
Temperatura
Tempo
Temperatura*Tempo

Fig. 23.23 – Resultado do Ajuste Fatorial – Exemplo da Tabela 23.7

Experimentos Fatoriais 317

BIOESTATISTICA_VOL02.indb 317 25/06/12 17:23


Factorial Fit: Rendimento versus Temperatura; Tempo

Primeiro Grupo
Estimated Effects and Coefficients for Rendimento (coded units)

Term Effect Coef SE Coef T P


Constant 51,500 1,572 32,75 0,000
Temperatura 13,000 6,500 1,572 4,13 0,003
Tempo 31,000 15,500 1,572 9,86 0,000

S = 5,44671 R-Sq = 92,70% R-Sq(adj) = 91,08%

Segundo Grupo
Analysis of Variance for Rendimento (coded units)

Source DF Seq SS Adj SS Adj MS F P


Main Effects 2 3390,00 3390,00 1695,00 57,13 0,000
Residual Error 9 267,00 267,00 29,67
Lack of Fit 1 75,00 75,00 75,00 3,13 0,115
Pure Error 8 192,00 192,00 24,00
Total 11 3657,00

Unusual Observations for Rendimento

Obs StdOrder Rendimento Fit SE Fit Residual St Resid


3 3 50,0000 60,5000 2,7234 -10,5000 -2,23R

R denotes an observation with a large standardized residual.

Terceiro Grupo
Estimated Coefficients for Rendimento using data in uncoded units

Term Coef
Constant -71,5000
Temperatura 0,650000
Tempo 3,10000

Fig. 23.24 – Resultado do Ajuste Fatorial sem a Interação – Exemplo da Tabela 23.7

Os gráficos, gerados são: gráfico de probabilidade normal e o gráfico de


Pareto, mostrados nas figuras 23.25 e 23.26, respectivamente.

318 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 318 25/06/12 17:23


Fig. 23.25 – Gráfico de probabilidade normal do exemplo mostrado na Tabela 23.9

Fig. 23.26 – Gráfico de Pareto para o exemplo mostrado na Tabela 23.9

No gráfico de probabilidade normal, somente os termos com efeitos signi-


ficantes serão identificados. Os termos que não têm efeitos significantes ficam
próximos à reta, ajustada ao valor zero (0). No gráfico de Pareto, têm-se os
efeitos em ordem de significância. Os termos, cujas barras estiverem acima da
linha vermelha pontilhada, são os termos significantes para o valor a definido.
Com base nos resultados da Session Window, já analisados, e nas figuras
23.25 e 23.26, concluí-se que os fatores Temperatura e Tempo, analisados neste
planejamento, influenciam significativamente a variável resposta Rendimento.
Além disso, a interação entre estes dois fatores não influencia significativa-
mente na variável resposta.

Experimentos Fatoriais 319

BIOESTATISTICA_VOL02.indb 319 25/06/12 17:23


Os gráficos fatoriais são muito úteis para analisar um planejamento. Para
acessar o comando Fatorial Plots, utliza-se o caminho Stat → DOE→ Factorial
→ Factorial Plots, conforme a Figura 23.27. Assim, suponha que se queiram
construir os gráficos de efeitos principais, interações e a representação geomé-
trica para o planejamento da Tabela 23.9.

Fig. 23.27 – Comando Factorial Plots


A janela inicial deste comando é mostrada na Figura 23.28. Nesta janela,
pode-se escolher entre três tipos de gráficos fatoriais:
• Main Effects Plot – Nesta opção constrói-se o gráfico de efeitos principais;
• Interaction Plot – Nesta opção constrói-se o gráfico das interações;
• Cube Plot – Nesta opção constrói a representação geométrica do planejamento.

Em Type of Means to Use in Plots, seleciona-se o tipo de média utilizada


para a construção dos gráficos fatoriais. Têm-se duas opções: a média dos
valores dos experimentos (Data Means) e a média dos valores ajustados pelo
modelo (Fitted Means).

   

Fig. 23.28 – Submenu Factorial Plots Fig. 23.29 – Submenu Factorial Plots - Main Effects

320 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 320 25/06/12 17:23


Quando se seleciona qualquer das opções de gráficos, o submenu Setup se
torna ativo. Nele, podem-se definir as características do gráfico. Por exemplo,
o submenu Setup, mostrado na Figura 23.29, referente ao gráfico Main Effect,
possui as seguintes opções:
• Responses – Nesta opção entra-se com a variável resposta;
• Factors to Include in Plots – Nesta opção podem-se escolher quais fato-
res aparecerão no gráfico. Para isto, utilizam-se as seguintes opções:
• Available – Onde se encontram os fatores que podem ser selecionados
para o gráfico;
• Selected – Nesta opção encontram-se os fatores já selecionados para o
gráfico.

O submenu Setup para os outros dois tipos de gráficos, é idêntico. Para o


exemplo proposto, marcam-se todos os gráficos e seleciona-se a opção Data Means
na janela inicial. Em cada opção Setup, entra-se com a variável “Rendimento” em
Responses e selecionam-se todos os fatores possíveis. Os gráficos fatoriais são
mostrados nas figuras 23.30, 23.31 e 23.32, respectivamente.

Fig. 23.30 – Gráfico dos Efeitos Principais para o exemplo mostrado na Tabela 23.9

No gráfico dos efeitos principais, mostrado na Figura 23.30, vê-se que


ambos os fatores melhoram o Rendimento, quando estão no seu nível alto. No
gráfico das interações, mostrados na Figura 23.31, vê-se que existe alguma

Experimentos Fatoriais 321

BIOESTATISTICA_VOL02.indb 321 25/06/12 17:23


interação entre Temperatura e Tempo, já que as linhas não são paralelas. Ou
seja, o efeito da Temperatura muda, dependendo do nível escolhido para o
Tempo, e vice-versa.

Fig. 23.31 – Gráfico das Interações para o exemplo mostrado na Tabela 23.9

A representação geométrica do planejamento, mostrado na Figura 23.32,


é um quadrado, já que o planejamento possui dois fatores. Neste gráfico,
confirma-se que a Temperatura e o Tempo devem estar nos seus níveis altos
para aumentar o Rendimento, já que o vértice do quadrado, cujo valor é maior
(76), é o que usa Temperatura a 30oC e 20 minutos de Tempo.

Fig. 23.32 – Gráfico Cube plot para o exemplo mostrado na Tabela 23.9

322 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 322 25/06/12 17:23


23.4 SUPERFÍCIE DE RESPOSTA NO MINITAB

O gráfico superfície de resposta é uma técnica de otimização, baseada em


planejamentos fatoriais, que permite investigar a existência de curvaturas. Para
acessar este comando, utiliza-se o caminho Stat → DOE → Response Surface,
conforme mostra a Figura 23.33.
A superfície de resposta possui dois tipos de planejamentos: central
composto e Box-Behnken. Aqui será mostrado um planejamento central
composto. Inicialmente, será criado o planejamento, em seguida executado o
experimento e, finalmente, serão analisados os resultados. Para se criar um
planejamento central composto, utiliza-se o caminho Stat → DOE → Response
Surface → Create Response Surface Design, conforme mostra a Figura 23.33.

Fig. 23.33 – Comando Response Surface

Inicialmente, considere que um pesquisador deseja saber como se comporta


o Rendimento de um experimento similar aquele apresentado na Tabela 23.9,
que altera dois diferentes fatores, a Temperatura (em graus Celsius) e o Tempo
de (em minutos). O pesquisador sabe que o modelo deste planejamento não é
linear, por isto vai usar o planejamento central composto. Este planejamento se
baseia num modelo quadrático, que tem a expressão dada por,

Ŷ = b0 + b1 A + b2B + b3A2 + b4B2 + b5 AB

Onde, b0, b1, b2, b3, b4 e b5 são coeficientes e A, B são os fatores.

Experimentos Fatoriais 323

BIOESTATISTICA_VOL02.indb 323 25/06/12 17:23


O interesse é analisar o planejamento criado pelo pesquisador, de modo
a obter o modelo do planejamento, as curvas de níveis e a superfície de
resposta. Para facilitar o entendimento do planejamento que se quer criar,
toma-se como base o planejamento mostrado na Tabela 23.10. As colunas
Temperatura e Tempo contêm, respectivamente, as unidades não-codifi-
cadas dos fatores Temperatura e Tempo, para cada experimento, ao passo
que as colunas A e B contêm, respectivamente, as unidades codificadas para
esses dois fatores.

Tabela 23.10 – Planejamento Central Composto com dois fatores, Temperatura e Tempo

Experimento Temperatura Tempo A B


1 60,00 20,00 -1 -1
2 80,00 20,00 1 -1
3 60,00 30,00 -1 1
4 80,00 30,00 1 1
5 55,86 25,00 -1,41 0
6 84,14 25,00 1,41 0
7 70,00 17,93 0 -1,41
8 70,00 32,07 0 1,41
9 70,00 25,00 0 0
10 70,00 25,00 0 0
11 70,00 25,00 0 0

Deve-se, então, (i) criar o planejamento central composto; (ii) Gerar


a equação do modelo; (iii) Construir curvas de níveis e de superfície
resposta. A janela inicial deste comando pode ser visualizada na Figura
23.34. Nesta janela, pode-se escolher o tipo de planejamento. Como opções,
têm-se: (i) Central composite e (ii) Box-Behnken. Number of factors –
nesta opção pode-se entrar com o número de fatores que serão analisados
no planejamento.
No submenu Display Available Designs, apresentado na Figura 23.35,
pode-se ver o número de execuções do planejamento de acordo com o número
de fatores e o tipo de planejamento escolhido.

324 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 324 25/06/12 17:23


   

Fig. 23.34 – Janela inicial do comando Fig. 23.35 – Submenu Display


Create Response Surface Design Available Designs

Em designs, apresentado na Figura 23.36, pode-se escolher o planeja-


mento de acordo com o número de execuções, blocos, pontos centrais e valor
do a. Number of Center Points – nesta opção pode-se modificar o número de
pontos centrais do planejamento, acessando a opção Custom. Pode-se, ainda,
modificar o valor de alpha, para isso utiliza-se a opção Custom.
Em Factors, apresentado na Figura 23.37, pode-se definir os fatores e seus
níveis. Quando se deseja que os níveis dos fatores representem os pontos cubo
(ou quadrado), escolhe-se Cube points, em Levels Define. Porém, quando se
deseja que os níveis dos fatores representem os pontos axiais, escolhe-se Axial
points, em Levels define. Em Name, entra-se com o nome dos fatores, em Low,
com os níveis baixos dos fatores e, em High, com os níveis altos dos fatores.

   

Fig. 23.36 – Submenu Designs - Fig. 23.37 – Submenu Factors -


Superfície de Resposta Superfície de Resposta

Experimentos Fatoriais 325

BIOESTATISTICA_VOL02.indb 325 25/06/12 17:23


Em Options, apresentada na Figura 23.38, pode-se aleatorizar a ordem de
execução do planejamento, em Randomize runs. Em Base for random data
generator pode-se entrar com a semente da ordem aleatória. Para realizar o
armazenamento dos dados do planejamento na planilha, é necessário que a
opção Store design in worksheet esteja selecionada.

Fig. 23.38 – Submenu Options - Superfície de Resposta

Em Results, apresentado na Figura 23.39, escolhe-se quais informações


sobre o planejamento serão exibidas na Session Window. Como opções,
têm-se:
• None – Nesta opção, nenhuma informação é exibida na Session Window;
• Summary table – Uma tabela resumo do planejamento é exibida;
• Summary table and data table – É exibida uma tabela resumo e uma ta-
bela com os dados do planejamento.

Fig. 23.39 – Submenu Factors - Superfície de Resposta

Para desenvolver o exemplo proposto, deve-se escolher o planejamento


Central composite em Type of Design e, em Number of factors, escolhe-se
dois fatores, conforme apresentado na Figura 23.34.

326 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 326 25/06/12 17:23


Em Designs deve ser preenchida de acordo com a Figura 23.36. Observando
a figura, o planejamento escolhido possui 13 execuções, com o padrão de cinco
observações no ponto central. Como, neste caso, o planejamento possui três
execuções no ponto central, precisa-se alterar de 5 para 3 pontos centrais, em
Number of Center Points. Assim, o planejamento ficará com 11 execuções,
conforme apresentado na Figura 23.36.
Em Factors deve-se preencher conforme a Figura 23.37. Para se gerar o
planejamento padrão, sem ordem aleatória, é necessário desmarcar a opção
Randomize runs, conforme a Figura 23.38. Em Results, nenhuma alteração
será necessária.
Na tabela resumo da Session Window pode-se confirmar o número de
fatores; de blocos, de pontos centrais, de execuções, e o valor do nível alpha
utilizado. O planejamento após executado, é armazenado na planilha e é
mostrado na Figura 23.40. A coluna StdOrder mostra a ordem padrão dos
experimentos; a coluna RunOrder mostra a ordem aleatória para a execução
do planejamento; a coluna Blocks mostra o número de blocos. Temperatura
indica as unidades não-codificadas do fator Temperatura, e Tempo, indica as
unidades não-codificadas do fator Tempo.

 
Fig. 23.40 – Planejamento Central Composto com dois fatores, Temperatura e Tempo
conforme o exemplo da Tabela 23.8

Agora, devem-se executar os experimentos planejados e apresentados


na planilha mostrada na Figura 23.40 e depois analisá-los. Cada linha desta

Experimentos Fatoriais 327

BIOESTATISTICA_VOL02.indb 327 25/06/12 17:23


planilha é um experimento que deve ser executado. Os resultados obtidos são
apresentados na Tabela 23.11.

Tabela 23.11 – Resultado do Planejamento Central Composto com dois fatores,


Temperatura e Tempo
Experimento Temperatura Tempo Rendimento
1 60,00 20,00 88
2 80,00 20,00 109
3 60,00 30,00 89
4 80,00 30,00 87
5 55,86 25,00 82
6 84,14 25,00 86
7 70,00 17,93 107
8 70,00 32,07 88
9 70,00 25,00 115
10 70,00 25,00 112
11 70,00 25,00 114

Para analisar um planejamento Superfície de Resposta, utiliza-se o


caminho Stat → DOE → Response Surface → Analyze Response Surface
Design, conforme a Figura 23.41.

Fig. 23.41 – Comando Analyze Response Surface Design

O objetivo é analisar o Planejamento Central Composto mostrado na


Tabela 23.11. Inicialmente, é necessário que os valores de Rendimentos,
obtidos a partir dos experimentos, sejam armazenados na Planilha do Minitab,

328 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 328 25/06/12 17:23


conforme Figura 23.42. A janela inicial do comando para analisar este tipo de
planejamento é apresentada na Figura 23.43.

Fig. 23.42 – Resultado do Planejamento Central Composto com dois fatores,


Temperatura e Tempo, conforme o exemplo da Tabela 23.11

Fig. 23.43 – Janela inicial do comando Analyze Response Surface Design

Na janela do comando Analyze Response Surface Design, entra-se com


a variável-resposta na caixa Responses. No exemplo em estudo, a variável-
-resposta (Y) é Rendimento. Nesta caixa pode-se escolher, em Analyze data
using, a unidade usada para analisar o planejamento e para construir o modelo.
Têm-se as seguintes opções:
• Coded units – Nesta opção têm-se as unidades codificadas, ou seja, usan-
do os códigos– 1 para nível baixo e 1 para nível alto, dos fatores;
• Uncoded units – Nesta opção têm-se as unidades não-codificadas, ou
seja, usando o valor real de cada nível do fator. O fator Temperatura, por
exemplo, tem nível baixo 60 oC e nível alto 80 oC. Quando se seleciona a
opção unidades codificadas, são mostrados, na Session Window, os coe-
ficientes do modelo para unidades codificadas e os coeficientes para uni-
dades não-codificadas.

Experimentos Fatoriais 329

BIOESTATISTICA_VOL02.indb 329 25/06/12 17:23


Nos submenus Terms, Graphs, Results e Storage, pode-se ver que eles
têm opções similares às apresentadas durante a análise e planejamentos
fatoriais. No experimento em estudo, nenhuma das opções padrão devem ser
alteradas. Na Figura 23.44, está a saída gerada e vista na Session Window.

Response Surface Regression: Rendimento versus Temperatura; Tempo


The analysis was done using coded units.
Primeiro Grupo
Estimated Regression Coefficients for Rendimento
Term Coef SE Coef T P
Constant 113,667 1,707 66,573 0,000
Temperatura 3,082 1,046 2,948 0,032
Tempo -5,984 1,046 -5,723 0,002
Temperatura*Temperatura -14,208 1,244 -11,417 0,000
Tempo*Tempo -7,458 1,244 -5,993 0,002
Temperatura*Tempo -5,750 1,479 -3,889 0,012

S = 2,957 R-Sq = 97,5% R-Sq(adj) = 95,0%

Segundo Grupo
Analysis of Variance for Rendimento

Source DF Seq SS Adj SS Adj MS F P


Regression 5 1701,18 1701,18 340,236 38,90 0,001
Linear 2 362,44 362,44 181,219 20,72 0,004
Square 2 1206,49 1206,49 603,246 68,98 0,000
Interaction 1 132,25 132,25 132,250 15,12 0,012
Residual Error 5 43,73 43,73 8,746
Lack-of-Fit 3 39,06 39,06 13,021 5,58 0,156
Pure Error 2 4,67 4,67 2,333
Total 10 1744,91
Unusual Observations for Rendimento
Obs StdOrder Rendimento Fit SE Fit Residual St Resid
4 4 87,000 83,348 2,338 3,652 2,02 R

R denotes an observation with a large standardized residual.

Terceiro Grupo
Estimated Regression Coefficients for Rendimento using data in uncoded units

Term Coef
Constant -961,906
Temperatura 23,0749
Tempo 21,7699
Temperatura*Temperatura -0,142083
Tempo*Tempo -0,298333
Temperatura*Tempo -0,115000

Fig. 23.44 – Resultado do Surface Design – Exemplo da Tabela 23.8

330 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 330 25/06/12 17:23


A interpretação desta saída é muito similar àquela feita para o planejamen-
to fatorial. No grupo desta saída, têm-se os coeficientes (coluna Coef) de cada
termo (coluna Term) do modelo. A última coluna é o valor P para cada termo,
com base no qual se decide qual termo é significante ou não. Observando os
valores obtidos, todos menores que 0,05 (que é o nível de significância adota-
do), conclui-se que todos os termos são significantes e, portanto, é necessário
incluir a todos no modelo.
Para obter o modelo do planejamento com unidades codificadas, utilizam-
-se os valores da coluna Coef, para cada termo correspondente da coluna Term.
Portanto, o modelo obtido é:

Rendimento = 113,67 + 3,08 Temperatura – 5,98 Tempo – 14,21 Tempera-


tura2 – 7.46 Tempo2 – 5,75 Temperatura Tempo.

No segundo grupo, tem-se a tabela de análise de variância, onde são tes-


tados os modelos e ajustes. Em seguida, é colocado um alerta de ocorrência de
uma observação não usual para a resposta Y. Pode-se ver que o Minitab ajusta
automaticamente o valor 87, resultado do 4º experimento, para o valor 83,348,
indicando que o resíduo resultante é alto.
No terceiro grupo, é apresentado o modelo do planejamento, para unida-
des não-codificadas.
Durante a construção dos gráficos de curvas de níveis e superfície, utiliza-
-se o caminho Stat → DOE →Response Surface → Countour/Surface Plots,
conforme Figura 23.45.

Fig. 23.45 – Comando Countour/Surface Plots

Experimentos Fatoriais 331

BIOESTATISTICA_VOL02.indb 331 25/06/12 17:23


Agora, suponha que se queira construir o gráfico das curvas de níveis e
a superfície de resposta para o experimento em estudo. A janela inicial deste
comando é mostrada na Figura 23.46.

Fig. 23.46 – Janela inicial do comando Countour / Surface Plots

Em Contour/Suface Plotes, selecionam-se as opções Countour plot e Sur-


face (Wireframe) plot para se obter, respectivamente, o gráfico de curvas de
níveis e o gráfico da superfície resposta. Cada uma das opções possui o subme-
nu Setup, o qual é necessário ser visualizado, mesmo quando nenhuma altera-
ção é necessária. Neste submenu, apresentado na Figura 23.47, deve-se sele-
cionar a variável resposta em Response. Ainda, em Select a pair of factors for
a single plot deve-se selecionar o par de fatores a ser utilizado no gráfico, ou
selecionar a opção Generate plots for all pairs or factors, para gerar gráficos
para todos os pares de fatores.

Fig. 23.47 – Submenu Setup do comando Countour Plot

332 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 332 25/06/12 17:23


Na opção Display plots using, pode-se definir se o gráfico será gerado
com unidades codificadas, selecionando Coded units, ou com unidades não-
-codificadas, selecionando Uncoded units. No submenu Setup do gráfico Sur-
face plot, as opções são as mesmas do Setup do gráfico Contour plot. Para
analisar o experimento em estudo, preenche-se a janela inicial de acordo com a
Figura 23.45, entrando em cada um dos Setups.
Os gráficos gerados são mostrados nas figuras 23.48 e 23.49. Na Figura
23.48, pode-se ver que o maior Rendimento é obtido quando a Temperatura
está por volta de 70 oC e quando o Tempo é um ponto maior que 20 minutos.

Fig. 23.48 – Gráfico Countour Plot para o exemplo da Tabela 23.8

Fig. 23.49 – Gráfico Surface para o exemplo da Tabela 23.8

Experimentos Fatoriais 333

BIOESTATISTICA_VOL02.indb 333 25/06/12 17:23


BIOESTATISTICA_VOL02.indb 334 25/06/12 17:23
TABELAS

BIOESTATISTICA_VOL02.indb 335 25/06/12 17:23


BIOESTATISTICA_VOL02.indb 336 25/06/12 17:23
Tabela 1 - Distribuição normal gaussiana:
valores de z e respectivas áreas entre a média (zero) e z

Área Área Área Área Área Área


z entre z entre z entre z entre z entre z entre
0ez 0ez 0ez 0ez 0ez 0ez
0,00 0,0000 0,56 0,2123 1,12 0,3686 1,68 0,4535 2,24 0,4875 2,80 0,4974
0,01 0,0040 0,57 0,2157 1,13 0,3708 1,69 0,4545 2,25 0,4878 2,81 0,4975
0,02 0,0080 0,58 0,2190 1,14 0,3729 1,70 0,4554 2,26 0,4881 2,82 0,4976
0,03 0,0120 0,59 0,2224 1,15 0,3749 1,71 0,4564 2,27 0,4884 2,83 0,4977
0,04 0,0160 0,60 0,2257 1,16 0,3770 1,72 0,4573 2,28 0,4887 2,84 0,4977
0,05 0,0199 0,61 0,2291 1,17 0,3790 1,73 0,4582 2,29 0,4890 2,85 0,4978
0,06 0,0239 0,62 0,2324 1,18 0,3810 1,74 0,4591 2,30 0,4893 2,86 0,4979
0,07 0,0279 0,63 0,2357 1,19 0,3830 1,75 0,4599 2,31 0,4896 2,87 0,4979
0,08 0,0319 0,64 0,2389 1,20 0,3849 1,76 0,4608 2,32 0,4898 2,88 0,4980
0,09 0,0359 0,65 0,2422 1,21 0,3869 1,77 0,4616 2,33 0,4901 2,89 0,4981
0,10 0,0398 0,66 0,2454 1,22 0,3888 1,78 0,4625 2,34 0,4904 2,90 0,4981
0,11 0,0438 0,67 0,2486 1,23 0,3907 1,79 0,4633 2,35 0,4906 2,91 0,4982
0,12 0,0478 0,68 0,2517 1,24 0,3925 1,80 0,4641 2,36 0,4909 2,92 0,4982
0,13 0,0517 0,69 0,2549 1,25 0,3944 1,81 0,4649 2,37 0,4911 2,93 0,4983
0,14 0,0557 0,70 0,2580 1,26 0,3962 1,82 0,4656 2,38 0,4913 2,94 0,4984
0,15 0,0596 0,71 0,2611 1,27 0,3980 1,83 0,4664 2,39 0,4916 2,95 0,4984
0,16 0,0636 0,72 0,2642 1,28 0,3997 1,84 0,4671 2,40 0,4918 2,96 0,4985
0,17 0,0675 0,73 0,2673 1,29 0,4015 1,85 0,4678 2,41 0,4920 2,97 0,4985
0,18 0,0714 0,74 0,2704 1,30 0,4032 1,86 0,4686 2,42 0,4922 2,98 0,4986
0,19 0,0753 0,75 0,2734 1,31 0,4049 1,87 0,4693 2,43 0,4925 2,99 0,4986
0,20 0,0793 0,76 0,2764 1,32 0,4066 1,88 0,4699 2,44 0,4927 3,00 0,4987
0,21 0,0832 0,77 0,2794 1,33 0,4082 1,89 0,4706 2,45 0,4929 3,01 0,4987
0,22 0,0871 0,78 0,2823 1,34 0,4099 1,90 0,4713 2,46 0,4931 3,02 0,4987
0,23 0,0910 0,79 0,2852 1,35 0,4115 1,91 0,4719 2,47 0,4932 3,03 0,4988
0,24 0,0948 0,80 0,2881 1,36 0,4131 1,92 0,4726 2,48 0,4934 3,04 0,4988
0,25 0,0987 0,81 0,2910 1,37 0,4147 1,93 0,4732 2,49 0,4936 3,05 0,4989
0,26 0,1026 0,82 0,2939 1,38 0,4162 1,94 0,4738 2,50 0,4938 3,06 0,4989
0,27 0,1064 0,83 0,2967 1,39 0,4177 1,95 0,4744 2,51 0,4940 3,07 0,4989
0,28 0,1103 0,84 0,2995 1,40 0,4192 1,96 0,4750 2,52 0,4941 3,08 0,4990
0,29 0,1141 0,85 0,3023 1,41 0,4207 1,97 0,4756 2,53 0,4943 3,09 0,4990
0,30 0,1179 0,86 0,3051 1,42 0,4222 1,98 0,4761 2,54 0,4945 3,10 0,4990

tabelas 337

BIOESTATISTICA_VOL02.indb 337 25/06/12 17:23


Tabela 1 - Distribuição normal gaussiana: valores de z e respectivas áreas
entre a média (zero) e z (continuação)

Área Área Área Área Área Área


z entre z entre z entre z entre z entre z entre
0ez 0ez 0ez 0ez 0ez 0ez

0,31 0,1217 0,87 0,3078 1,43 0,4236 1,99 0,4767 2,55 0,4946 3,11 0,4991
0,32 0,1255 0,88 0,3106 1,44 0,4251 2,00 0,4772 2,56 0,4948 3,12 0,4991
0,33 0,1293 0,89 0,3133 1,45 0,4265 2,01 0,4778 2,57 0,4949 3,13 0,4991
0,34 0,1331 0,90 0,3159 1,46 0,4279 2,02 0,4783 2,58 0,4951 3,14 0,4992
0,35 0,1368 0,91 0,3186 1,47 0,4292 2,03 0,4788 2,59 0,4952 3,15 0,4992
0,36 0,1406 0,92 0,3212 1,48 0,4306 2,04 0,4793 2,60 0,4953 3,16 0,4992
0,37 0,1443 0,93 0,3238 1,49 0,4319 2,05 0,4798 2,61 0,4955 3,17 0,4992
0,38 0,1480 0,94 0,3264 1,50 0,4332 2,06 0,4803 2,62 0,4956 3,18 0,4993
0,39 0,1517 0,95 0,3289 1,51 0,4345 2,07 0,4808 2,63 0,4957 3,19 0,4993
0,40 0,1554 0,96 0,3315 1,52 0,4357 2,08 0,4812 2,64 0,4959 3,20 0,4993
0,41 0,1591 0,97 0,3340 1,53 0,4370 2,09 0,4817 2,65 0,4960 3,21 0,4993
0,42 0,1628 0,98 0,3365 1,54 0,4382 2,10 0,4821 2,66 0,4961 3,22 0,4994
0,43 0,1664 0,99 0,3389 1,55 0,4394 2,11 0,4826 2,67 0,4962 3,23 0,4994
0,44 0,1700 1,00 0,3413 1,56 0,4406 2,12 0,4830 2,68 0,4963 3,24 0,4994
0,45 0,1736 1,01 0,3438 1,57 0,4418 2,13 0,4834 2,69 0,4964 3,25 0,4994
0,46 0,1772 1,02 0,3461 1,58 0,4429 2,14 0,4838 2,70 0,4965 3,30 0,4995
0,47 0,1808 1,03 0,3485 1,59 0,4441 2,15 0,4842 2,71 0,4966 3,35 0,4996
0,48 0,1844 1,04 0,3508 1,60 0,4452 2,16 0,4846 2,72 0,4967 3,40 0,4997
0,49 0,1879 1,05 0,3531 1,61 0,4463 2,17 0,4850 2,73 0,4968 3,45 0,4997
0,50 0,1915 1,06 0,3554 1,62 0,4474 2,18 0,4854 2,74 0,4969 3,50 0,4998
0,51 0,1950 1,07 0,3577 1,63 0,4484 2,19 0,4857 2,75 0,4970 3,60 0,4998
0,52 0,1985 1,08 0,3599 1,64 0,4495 2,20 0,4861 2,76 0,4971 3,70 0,4999
0,53 0,2019 1,09 0,3621 1,65 0,4505 2,21 0,4864 2,77 0,4972 3,80 0,4999
0,54 0,2054 1,10 0,3643 1,66 0,4515 2,22 0,4868 2,78 0,4973 3,90 0,49995
0,55 0,2088 1,11 0,3665 1,67 0,4525 2,23 0,4871 2,79 0,4974 4,00 0,49997

338 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 338 25/06/12 17:23


Tabela 2 - Valores críticos da distribuição t de Student

α Bilateral: 0,40 0,20 0,10 0,05 0,02 0,01 0,001


gl
α Unilateral: 0,20 0,10 0,05 0,025 0,01 0,005 0,0005
1 1,376 3,078 6,314 12,706 31,821 63,656 636,578
2 1,061 1,886 2,920 4,303 6,965 9,925 31,600
3 0,978 1,638 2,353 3,182 4,541 5,841 12,924
4 0,941 1,533 2,132 2,776 3,747 4,604 8,610
5 0,920 1,476 2,015 2,571 3,365 4,032 6,869

6 0,906 1,440 1,943 2,447 3,143 3,707 5,959


7 0,896 1,415 1,895 2,365 2,998 3,499 5,408
8 0,889 1,397 1,860 2,306 2,896 3,355 5,041
9 0,883 1,383 1,833 2,262 2,821 3,250 4,781
10 0,879 1,372 1,812 2,228 2,764 3,169 4,587

11 0,876 1,363 1,796 2,201 2,718 3,106 4,437


12 0,873 1,356 1,782 2,179 2,681 3,055 4,318
13 0,870 1,350 1,771 2,160 2,650 3,012 4,221
14 0,868 1,345 1,761 2,145 2,624 2,977 4,140
15 0,866 1,341 1,753 2,131 2,602 2,947 4,073

16 0,865 1,337 1,746 2,120 2,583 2,921 4,015


17 0,863 1,333 1,740 2,110 2,567 2,898 3,965
18 0,862 1,330 1,734 2,101 2,552 2,878 3,922
19 0,861 1,328 1,729 2,093 2,539 2,861 3,883
20 0,860 1,325 1,725 2,086 2,528 2,845 3,850

21 0,859 1,323 1,721 2,080 2,518 2,831 3,819


22 0,858 1,321 1,717 2,074 2,508 2,819 3,792
23 0,858 1,319 1,714 2,069 2,500 2,807 3,768
24 0,857 1,318 1,711 2,064 2,492 2,797 3,745
25 0,856 1,316 1,708 2,060 2,485 2,787 3,725

tabelas 339

BIOESTATISTICA_VOL02.indb 339 25/06/12 17:23


Tabela 2 - Valores críticos da distribuição t de Student (continuação)

α Bilateral: 0,40 0,20 0,10 0,05 0,02 0,01 0,001


gl
α Unilateral: 0,20 0,10 0,05 0,025 0,01 0,005 0,0005
26 0,856 1,315 1,706 2,056 2,479 2,779 3,707
27 0,855 1,314 1,703 2,052 2,473 2,771 3,689
28 0,855 1,313 1,701 2,048 2,467 2,763 3,674
29 0,854 1,311 1,699 2,045 2,462 2,756 3,660
30 0,854 1,310 1,697 2,042 2,457 2,750 3,646

40 0,851 1,303 1,684 2,021 2,423 2,704 3,551


60 0,848 1,296 1,671 2,000 2,390 2,660 3,460
120 0,845 1,289 1,658 1,980 2,358 2,617 3,373
infinito 0,842 1,282 1,645 1,960 2,326 2,576 3,290

340 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 340 25/06/12 17:23


Tabela 3.1 - Distribuição F: valores críticos para um teste bilateral (α = 0,05)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
1 648 799 864 900 922 937 948 957 963 969 973 977
2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,41
3 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,37 14,34
4 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,79 8,75
5 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,57 6,52
6 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,41 5,37
7 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,71 4,67
8 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,24 4,20
9 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,91 3,87
10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,66 3,62

11 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,47 3,43
12 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,32 3,28
13 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 3,20 3,15
14 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15 3,09 3,05
15 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 3,01 2,96
16 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99 2,93 2,89
17 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92 2,87 2,82
18 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,81 2,77
19 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 2,82 2,76 2,72
20 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,72 2,68

21 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,68 2,64
22 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70 2,65 2,60
23 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,62 2,57
24 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,59 2,54
25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,56 2,51
26 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59 2,54 2,49
27 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,51 2,47
28 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55 2,49 2,45
29 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,48 2,43
30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,46 2,41

tabelas 341

BIOESTATISTICA_VOL02.indb 341 25/06/12 17:23


Tabela 3.1 - Distribuição F: valores críticos para um teste bilateral (α = 0,05)
(continuação)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
32 5,53 4,15 3,56 3,22 3,00 2,84 2,71 2,62 2,54 2,48 2,43 2,38
34 5,50 4,12 3,53 3,19 2,97 2,81 2,69 2,59 2,52 2,45 2,40 2,35
36 5,47 4,09 3,50 3,17 2,94 2,78 2,66 2,57 2,49 2,43 2,37 2,33
38 5,45 4,07 3,48 3,15 2,92 2,76 2,64 2,55 2,47 2,41 2,35 2,31
40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,33 2,29
42 5,40 4,03 3,45 3,11 2,89 2,73 2,61 2,51 2,43 2,37 2,32 2,27
44 5,39 4,02 3,43 3,09 2,87 2,71 2,59 2,50 2,42 2,36 2,30 2,26
46 5,37 4,00 3,42 3,08 2,86 2,70 2,58 2,48 2,41 2,34 2,29 2,24
48 5,35 3,99 3,40 3,07 2,84 2,69 2,56 2,47 2,39 2,33 2,27 2,23
50 5,34 3,97 3,39 3,05 2,83 2,67 2,55 2,46 2,38 2,32 2,26 2,22

55 5,31 3,95 3,36 3,03 2,81 2,65 2,53 2,43 2,36 2,29 2,24 2,19
60 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,22 2,17
65 5,26 3,91 3,32 2,99 2,77 2,61 2,49 2,39 2,32 2,25 2,20 2,15
70 5,25 3,89 3,31 2,97 2,75 2,59 2,47 2,38 2,30 2,24 2,18 2,14
80 5,22 3,86 3,28 2,95 2,73 2,57 2,45 2,35 2,28 2,21 2,16 2,11
100 5,18 3,83 3,25 2,92 2,70 2,54 2,42 2,32 2,24 2,18 2,12 2,08
125 5,15 3,80 3,22 2,89 2,67 2,51 2,39 2,30 2,22 2,15 2,10 2,05
150 5,13 3,78 3,20 2,87 2,65 2,49 2,37 2,28 2,20 2,13 2,08 2,03
200 5,10 3,76 3,18 2,85 2,63 2,47 2,35 2,26 2,18 2,11 2,06 2,01
400 5,06 3,72 3,15 2,82 2,60 2,44 2,32 2,22 2,15 2,08 2,03 1,98
1000 5,04 3,70 3,13 2,80 2,58 2,42 2,30 2,20 2,13 2,06 2,01 1,96
infinito 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,99 1,94

342 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 342 25/06/12 17:23


Tabela 3.1 - Distribuição F: valores críticos para um teste bilateral (α = 0,05)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
1 983 987 993 997 1001 1006 1008 1011 1013 1016 1017 1018
2 39,43 39,44 39,45 39,46 39,46 39,47 39,48 39,48 39,49 39,49 39,50 39,50
3 14,28 14,23 14,17 14,12 14,08 14,04 14,01 13,97 13,96 13,93 13,91 13,90
4 8,68 8,63 8,56 8,51 8,46 8,41 8,38 8,34 8,32 8,29 8,27 8,26
5 6,46 6,40 6,33 6,28 6,23 6,18 6,14 6,10 6,08 6,05 6,03 6,02
6 5,30 5,24 5,17 5,12 5,07 5,01 4,98 4,94 4,92 4,88 4,86 4,85
7 4,60 4,54 4,47 4,41 4,36 4,31 4,28 4,23 4,21 4,18 4,16 4,14
8 4,13 4,08 4,00 3,95 3,89 3,84 3,81 3,76 3,74 3,70 3,68 3,67
9 3,80 3,74 3,67 3,61 3,56 3,51 3,47 3,43 3,40 3,37 3,35 3,33
10 3,55 3,50 3,42 3,37 3,31 3,26 3,22 3,18 3,15 3,12 3,09 3,08

11 3,36 3,30 3,23 3,17 3,12 3,06 3,03 2,98 2,96 2,92 2,90 2,88
12 3,21 3,15 3,07 3,02 2,96 2,91 2,87 2,82 2,80 2,76 2,74 2,72
13 3,08 3,03 2,95 2,89 2,84 2,78 2,74 2,70 2,67 2,63 2,61 2,60
14 2,98 2,92 2,84 2,79 2,73 2,67 2,64 2,59 2,56 2,53 2,50 2,49
15 2,89 2,84 2,76 2,70 2,64 2,59 2,55 2,50 2,47 2,44 2,41 2,40
16 2,82 2,76 2,68 2,63 2,57 2,51 2,47 2,42 2,40 2,36 2,33 2,32
17 2,75 2,70 2,62 2,56 2,50 2,44 2,41 2,35 2,33 2,29 2,26 2,25
18 2,70 2,64 2,56 2,50 2,44 2,38 2,35 2,30 2,27 2,23 2,20 2,19
19 2,65 2,59 2,51 2,45 2,39 2,33 2,30 2,24 2,22 2,18 2,15 2,13
20 2,60 2,55 2,46 2,41 2,35 2,29 2,25 2,20 2,17 2,13 2,10 2,09

21 2,56 2,51 2,42 2,37 2,31 2,25 2,21 2,16 2,13 2,09 2,06 2,04
22 2,53 2,47 2,39 2,33 2,27 2,21 2,17 2,12 2,09 2,05 2,02 2,00
23 2,50 2,44 2,36 2,30 2,24 2,18 2,14 2,08 2,06 2,01 1,99 1,97
24 2,47 2,41 2,33 2,27 2,21 2,15 2,11 2,05 2,02 1,98 1,95 1,94
25 2,44 2,38 2,30 2,24 2,18 2,12 2,08 2,02 2,00 1,95 1,92 1,91
26 2,42 2,36 2,28 2,22 2,16 2,09 2,05 2,00 1,97 1,92 1,90 1,88
27 2,39 2,34 2,25 2,19 2,13 2,07 2,03 1,97 1,94 1,90 1,87 1,85
28 2,37 2,32 2,23 2,17 2,11 2,05 2,01 1,95 1,92 1,88 1,85 1,83
29 2,36 2,30 2,21 2,15 2,09 2,03 1,99 1,93 1,90 1,86 1,83 1,81
30 2,34 2,28 2,20 2,14 2,07 2,01 1,97 1,91 1,88 1,84 1,81 1,79

tabelas 343

BIOESTATISTICA_VOL02.indb 343 25/06/12 17:23


Tabela 3.1 - Distribuição F: valores críticos para um teste bilateral (α = 0,05)
(continuação)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
32 2,31 2,25 2,16 2,10 2,04 1,98 1,93 1,88 1,85 1,80 1,77 1,75
34 2,28 2,22 2,13 2,07 2,01 1,95 1,90 1,85 1,82 1,77 1,74 1,72
36 2,25 2,20 2,11 2,05 1,99 1,92 1,88 1,82 1,79 1,74 1,71 1,69
38 2,23 2,17 2,09 2,03 1,96 1,90 1,85 1,79 1,76 1,71 1,68 1,66
40 2,21 2,15 2,07 2,01 1,94 1,88 1,83 1,77 1,74 1,69 1,66 1,64
42 2,20 2,14 2,05 1,99 1,92 1,86 1,81 1,75 1,72 1,67 1,64 1,62
44 2,18 2,12 2,03 1,97 1,91 1,84 1,80 1,73 1,70 1,65 1,62 1,60
46 2,17 2,11 2,02 1,96 1,89 1,82 1,78 1,72 1,69 1,63 1,60 1,58
48 2,15 2,09 2,01 1,94 1,88 1,81 1,77 1,70 1,67 1,62 1,58 1,56
50 2,14 2,08 1,99 1,93 1,87 1,80 1,75 1,69 1,66 1,60 1,57 1,55

55 2,11 2,05 1,97 1,90 1,84 1,77 1,72 1,66 1,62 1,57 1,54 1,51
60 2,09 2,03 1,94 1,88 1,82 1,74 1,70 1,63 1,60 1,54 1,51 1,48
65 2,07 2,01 1,93 1,86 1,80 1,72 1,68 1,61 1,58 1,52 1,48 1,46
70 2,06 2,00 1,91 1,85 1,78 1,71 1,66 1,59 1,56 1,50 1,46 1,44
80 2,03 1,97 1,88 1,82 1,75 1,68 1,63 1,56 1,53 1,47 1,43 1,40
100 2,00 1,94 1,85 1,78 1,71 1,64 1,59 1,52 1,48 1,42 1,38 1,35
125 1,97 1,91 1,82 1,75 1,68 1,61 1,56 1,49 1,45 1,38 1,34 1,30
150 1,95 1,89 1,80 1,74 1,67 1,59 1,54 1,46 1,42 1,35 1,31 1,27
200 1,93 1,87 1,78 1,71 1,64 1,56 1,51 1,44 1,39 1,32 1,27 1,23
400 1,90 1,84 1,74 1,68 1,60 1,52 1,47 1,39 1,35 1,27 1,21 1,15
1000 1,88 1,82 1,72 1,65 1,58 1,50 1,45 1,36 1,32 1,23 1,16 1,09
infinito 1,87 1,80 1,71 1,64 1,57 1,48 1,43 1,34 1,30 1,21 1,13 1,01

344 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 344 25/06/12 17:23


Tabela 3.2 - Distribuição F: valores críticos para um teste bilateral (α = 0,01)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
1 16212 19997 21614 22501 23056 23440 23715 23924 24091 24222 24334 24427
2 198,5 199,0 199,2 199,2 199,3 199,3 199,4 199,4 199,4 199,4 199,4 199,4
3 55,55 49,80 47,47 46,20 45,39 44,84 44,43 44,13 43,88 43,68 43,52 43,39
4 31,33 26,28 24,26 23,15 22,46 21,98 21,62 21,35 21,14 20,97 20,82 20,70
5 22,78 18,31 16,53 15,56 14,94 14,51 14,20 13,96 13,77 13,62 13,49 13,38
6 18,63 14,54 12,92 12,03 11,46 11,07 10,79 10,57 10,39 10,25 10,13 10,03
7 16,24 12,40 10,88 10,05 9,52 9,16 8,89 8,68 8,51 8,38 8,27 8,18
8 14,69 11,04 9,60 8,81 8,30 7,95 7,69 7,50 7,34 7,21 7,10 7,01
9 13,61 10,11 8,72 7,96 7,47 7,13 6,88 6,69 6,54 6,42 6,31 6,23
10 12,83 9,43 8,08 7,34 6,87 6,54 6,30 6,12 5,97 5,85 5,75 5,66

11 12,23 8,91 7,60 6,88 6,42 6,10 5,86 5,68 5,54 5,42 5,32 5,24
12 11,75 8,51 7,23 6,52 6,07 5,76 5,52 5,35 5,20 5,09 4,99 4,91
13 11,37 8,19 6,93 6,23 5,79 5,48 5,25 5,08 4,94 4,82 4,72 4,64
14 11,06 7,92 6,68 6,00 5,56 5,26 5,03 4,86 4,72 4,60 4,51 4,43
15 10,80 7,70 6,48 5,80 5,37 5,07 4,85 4,67 4,54 4,42 4,33 4,25
16 10,58 7,51 6,30 5,64 5,21 4,91 4,69 4,52 4,38 4,27 4,18 4,10
17 10,38 7,35 6,16 5,50 5,07 4,78 4,56 4,39 4,25 4,14 4,05 3,97
18 10,22 7,21 6,03 5,37 4,96 4,66 4,44 4,28 4,14 4,03 3,94 3,86
19 10,07 7,09 5,92 5,27 4,85 4,56 4,34 4,18 4,04 3,93 3,84 3,76
20 9,94 6,99 5,82 5,17 4,76 4,47 4,26 4,09 3,96 3,85 3,76 3,68

21 9,83 6,89 5,73 5,09 4,68 4,39 4,18 4,01 3,88 3,77 3,68 3,60
22 9,73 6,81 5,65 5,02 4,61 4,32 4,11 3,94 3,81 3,70 3,61 3,54
23 9,63 6,73 5,58 4,95 4,54 4,26 4,05 3,88 3,75 3,64 3,55 3,47
24 9,55 6,66 5,52 4,89 4,49 4,20 3,99 3,83 3,69 3,59 3,50 3,42
25 9,48 6,60 5,46 4,84 4,43 4,15 3,94 3,78 3,64 3,54 3,45 3,37
26 9,41 6,54 5,41 4,79 4,38 4,10 3,89 3,73 3,60 3,49 3,40 3,33
27 9,34 6,49 5,36 4,74 4,34 4,06 3,85 3,69 3,56 3,45 3,36 3,28
28 9,28 6,44 5,32 4,70 4,30 4,02 3,81 3,65 3,52 3,41 3,32 3,25
29 9,23 6,40 5,28 4,66 4,26 3,98 3,77 3,61 3,48 3,38 3,29 3,21
30 9,18 6,35 5,24 4,62 4,23 3,95 3,74 3,58 3,45 3,34 3,25 3,18

tabelas 345

BIOESTATISTICA_VOL02.indb 345 25/06/12 17:23


Tabela 3.2 - Distribuição F: valores críticos para um teste bilateral (α = 0,01)
(continuação)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
32 9,09 6,28 5,17 4,56 4,17 3,89 3,68 3,52 3,39 3,29 3,20 3,12
34 9,01 6,22 5,11 4,50 4,11 3,84 3,63 3,47 3,34 3,24 3,15 3,07
36 8,94 6,16 5,06 4,46 4,06 3,79 3,58 3,42 3,30 3,19 3,10 3,03
38 8,88 6,11 5,02 4,41 4,02 3,75 3,54 3,39 3,26 3,15 3,06 2,99
40 8,83 6,07 4,98 4,37 3,99 3,71 3,51 3,35 3,22 3,12 3,03 2,95
42 8,78 6,03 4,94 4,34 3,95 3,68 3,48 3,32 3,19 3,09 3,00 2,92
44 8,74 5,99 4,91 4,31 3,92 3,65 3,45 3,29 3,16 3,06 2,97 2,89
46 8,70 5,96 4,88 4,28 3,90 3,62 3,42 3,26 3,14 3,03 2,94 2,87
48 8,66 5,93 4,85 4,25 3,87 3,60 3,40 3,24 3,11 3,01 2,92 2,85
50 8,63 5,90 4,83 4,23 3,85 3,58 3,38 3,22 3,09 2,99 2,90 2,82

55 8,55 5,84 4,77 4,18 3,80 3,53 3,33 3,17 3,05 2,94 2,85 2,78
60 8,49 5,79 4,73 4,14 3,76 3,49 3,29 3,13 3,01 2,90 2,82 2,74
65 8,44 5,75 4,69 4,11 3,73 3,46 3,26 3,10 2,98 2,87 2,79 2,71
70 8,40 5,72 4,66 4,08 3,70 3,43 3,23 3,08 2,95 2,85 2,76 2,68
80 8,33 5,67 4,61 4,03 3,65 3,39 3,19 3,03 2,91 2,80 2,72 2,64
100 8,24 5,59 4,54 3,96 3,59 3,33 3,13 2,97 2,85 2,74 2,66 2,58
125 8,17 5,53 4,49 3,91 3,54 3,28 3,08 2,93 2,80 2,70 2,61 2,54
150 8,12 5,49 4,45 3,88 3,51 3,25 3,05 2,89 2,77 2,67 2,58 2,51
200 8,06 5,44 4,41 3,84 3,47 3,21 3,01 2,86 2,73 2,63 2,54 2,47
400 7,97 5,37 4,34 3,78 3,41 3,15 2,95 2,80 2,68 2,57 2,49 2,41
1000 7,91 5,33 4,30 3,74 3,37 3,11 2,92 2,77 2,64 2,54 2,45 2,38
infinito 7,88 5,30 4,28 3,72 3,35 3,09 2,90 2,74 2,62 2,52 2,43 2,36

346 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 346 25/06/12 17:23


Tabela 3.2 - Distribuição F: valores críticos para um teste bilateral (α = 0,01)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
1 24572 24684 24837 24937 25041 25146 25213 25295 25339 25399 25436 25466
2 199,4 199,4 199,4 199,4 199,5 199,5 199,5 199,5 199,5 199,5 199,5 199,5
3 43,17 43,01 42,78 42,62 42,47 42,31 42,21 42,08 42,02 41,92 41,87 41,83
4 20,51 20,37 20,17 20,03 19,89 19,75 19,67 19,55 19,50 19,41 19,36 19,32
5 13,21 13,09 12,90 12,78 12,66 12,53 12,45 12,35 12,30 12,22 12,17 12,14
6 9,88 9,76 9,59 9,47 9,36 9,24 9,17 9,07 9,03 8,95 8,91 8,88
7 8,03 7,91 7,75 7,64 7,53 7,42 7,35 7,26 7,22 7,15 7,10 7,08
8 6,87 6,76 6,61 6,50 6,40 6,29 6,22 6,13 6,09 6,02 5,98 5,95
9 6,09 5,98 5,83 5,73 5,62 5,52 5,45 5,37 5,32 5,26 5,21 5,19
10 5,53 5,42 5,27 5,17 5,07 4,97 4,90 4,82 4,77 4,71 4,67 4,64

11 5,10 5,00 4,86 4,76 4,65 4,55 4,49 4,40 4,36 4,29 4,25 4,23
12 4,77 4,67 4,53 4,43 4,33 4,23 4,17 4,08 4,04 3,97 3,93 3,90
13 4,51 4,41 4,27 4,17 4,07 3,97 3,91 3,82 3,78 3,71 3,67 3,65
14 4,30 4,20 4,06 3,96 3,86 3,76 3,70 3,61 3,57 3,50 3,46 3,44
15 4,12 4,02 3,88 3,79 3,69 3,59 3,52 3,44 3,39 3,33 3,29 3,26
16 3,97 3,87 3,73 3,64 3,54 3,44 3,37 3,29 3,25 3,18 3,14 3,11
17 3,84 3,75 3,61 3,51 3,41 3,31 3,25 3,16 3,12 3,05 3,01 2,98
18 3,73 3,64 3,50 3,40 3,30 3,20 3,14 3,05 3,01 2,94 2,90 2,87
19 3,64 3,54 3,40 3,31 3,21 3,11 3,04 2,96 2,91 2,85 2,80 2,78
20 3,55 3,46 3,32 3,22 3,12 3,02 2,96 2,87 2,83 2,76 2,72 2,69

21 3,48 3,38 3,24 3,15 3,05 2,95 2,88 2,80 2,75 2,68 2,64 2,61
22 3,41 3,31 3,18 3,08 2,98 2,88 2,82 2,73 2,69 2,62 2,57 2,55
23 3,35 3,25 3,12 3,02 2,92 2,82 2,76 2,67 2,62 2,56 2,51 2,48
24 3,30 3,20 3,06 2,97 2,87 2,77 2,70 2,61 2,57 2,50 2,46 2,43
25 3,25 3,15 3,01 2,92 2,82 2,72 2,65 2,56 2,52 2,45 2,41 2,38
26 3,20 3,11 2,97 2,87 2,77 2,67 2,61 2,52 2,47 2,40 2,36 2,33
27 3,16 3,07 2,93 2,83 2,73 2,63 2,57 2,48 2,43 2,36 2,32 2,29
28 3,12 3,03 2,89 2,79 2,69 2,59 2,53 2,44 2,39 2,32 2,28 2,25
29 3,09 2,99 2,86 2,76 2,66 2,56 2,49 2,40 2,36 2,29 2,24 2,21
30 3,06 2,96 2,82 2,73 2,63 2,52 2,46 2,37 2,32 2,25 2,21 2,18

tabelas 347

BIOESTATISTICA_VOL02.indb 347 25/06/12 17:24


Tabela 3.2 - Distribuição F: valores críticos para um teste bilateral (α = 0,01)
(continuação)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
32 3,00 2,90 2,77 2,67 2,57 2,47 2,40 2,31 2,26 2,19 2,15 2,11
34 2,95 2,85 2,72 2,62 2,52 2,42 2,35 2,26 2,21 2,14 2,09 2,06
36 2,90 2,81 2,67 2,58 2,48 2,37 2,30 2,21 2,17 2,09 2,04 2,01
38 2,87 2,77 2,63 2,54 2,44 2,33 2,27 2,17 2,12 2,05 2,00 1,97
40 2,83 2,74 2,60 2,50 2,40 2,30 2,23 2,14 2,09 2,01 1,96 1,93
42 2,80 2,71 2,57 2,47 2,37 2,26 2,20 2,10 2,06 1,98 1,93 1,90
44 2,77 2,68 2,54 2,44 2,34 2,24 2,17 2,07 2,03 1,95 1,90 1,87
46 2,75 2,65 2,51 2,42 2,32 2,21 2,14 2,05 2,00 1,92 1,87 1,84
48 2,72 2,63 2,49 2,39 2,29 2,19 2,12 2,02 1,97 1,90 1,85 1,81
50 2,70 2,61 2,47 2,37 2,27 2,16 2,10 2,00 1,95 1,87 1,82 1,79

55 2,66 2,56 2,42 2,33 2,23 2,12 2,05 1,95 1,90 1,82 1,77 1,73
60 2,62 2,53 2,39 2,29 2,19 2,08 2,01 1,91 1,86 1,78 1,73 1,69
65 2,59 2,49 2,36 2,26 2,16 2,05 1,98 1,88 1,83 1,74 1,69 1,65
70 2,56 2,47 2,33 2,23 2,13 2,02 1,95 1,85 1,80 1,71 1,66 1,62
80 2,52 2,43 2,29 2,19 2,08 1,97 1,90 1,80 1,75 1,66 1,60 1,56
100 2,46 2,37 2,23 2,13 2,02 1,91 1,84 1,74 1,68 1,59 1,53 1,49
125 2,42 2,32 2,18 2,08 1,98 1,86 1,79 1,68 1,63 1,53 1,47 1,42
150 2,38 2,29 2,15 2,05 1,94 1,83 1,76 1,65 1,59 1,49 1,42 1,37
200 2,35 2,25 2,11 2,01 1,91 1,79 1,71 1,60 1,54 1,44 1,37 1,31
400 2,29 2,20 2,06 1,95 1,85 1,73 1,65 1,54 1,47 1,36 1,28 1,21
1000 2,26 2,16 2,02 1,92 1,81 1,69 1,61 1,50 1,43 1,31 1,22 1,13
infinito 2,24 2,14 2,00 1,90 1,79 1,67 1,59 1,47 1,40 1,28 1,17 1,01

348 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 348 25/06/12 17:24


Tabela 4.1 - Distribuição F: valores críticos para um teste unilateral (α = 0,05)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
1 161 199 216 225 230 234 237 239 241 242 243 244
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91

11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28

21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,17 2,13
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,13 2,09

tabelas 349

BIOESTATISTICA_VOL02.indb 349 25/06/12 17:24


Tabela 4.1 - Distribuição F: valores críticos para um teste unilateral (α = 0,05)
(continuação)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
32 4,15 3,29 2,90 2,67 2,51 2,40 2,31 2,24 2,19 2,14 2,10 2,07
34 4,13 3,28 2,88 2,65 2,49 2,38 2,29 2,23 2,17 2,12 2,08 2,05
36 4,11 3,26 2,87 2,63 2,48 2,36 2,28 2,21 2,15 2,11 2,07 2,03
38 4,10 3,24 2,85 2,62 2,46 2,35 2,26 2,19 2,14 2,09 2,05 2,02
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00
42 4,07 3,22 2,83 2,59 2,44 2,32 2,24 2,17 2,11 2,06 2,03 1,99
44 4,06 3,21 2,82 2,58 2,43 2,31 2,23 2,16 2,10 2,05 2,01 1,98
46 4,05 3,20 2,81 2,57 2,42 2,30 2,22 2,15 2,09 2,04 2,00 1,97
48 4,04 3,19 2,80 2,57 2,41 2,29 2,21 2,14 2,08 2,03 1,99 1,96
50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,99 1,95

55 4,02 3,16 2,77 2,54 2,38 2,27 2,18 2,11 2,06 2,01 1,97 1,93
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,95 1,92
65 3,99 3,14 2,75 2,51 2,36 2,24 2,15 2,08 2,03 1,98 1,94 1,90
70 3,98 3,13 2,74 2,50 2,35 2,23 2,14 2,07 2,02 1,97 1,93 1,89
80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00 1,95 1,91 1,88
100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,89 1,85
125 3,92 3,07 2,68 2,44 2,29 2,17 2,08 2,01 1,96 1,91 1,87 1,83
150 3,90 3,06 2,66 2,43 2,27 2,16 2,07 2,00 1,94 1,89 1,85 1,82
200 3,89 3,04 2,65 2,42 2,26 2,14 2,06 1,98 1,93 1,88 1,84 1,80
400 3,86 3,02 2,63 2,39 2,24 2,12 2,03 1,96 1,90 1,85 1,81 1,78
1000 3,85 3,00 2,61 2,38 2,22 2,11 2,02 1,95 1,89 1,84 1,80 1,76
infinito 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,79 1,75

350 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 350 25/06/12 17:24


Tabela 4.1 - Distribuição F: valores críticos para um teste unilateral (α = 0,05)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
1 245 246 248 249 250 251 252 253 253 254 254 254
2 19,42 19,43 19,45 19,45 19,46 19,47 19,48 19,48 19,49 19,49 19,49 19,50
3 8,71 8,69 8,66 8,64 8,62 8,59 8,58 8,56 8,55 8,54 8,53 8,53
4 5,87 5,84 5,80 5,77 5,75 5,72 5,70 5,68 5,66 5,65 5,64 5,63
5 4,64 4,60 4,56 4,53 4,50 4,46 4,44 4,42 4,41 4,39 4,37 4,36
6 3,96 3,92 3,87 3,84 3,81 3,77 3,75 3,73 3,71 3,69 3,68 3,67
7 3,53 3,49 3,44 3,41 3,38 3,34 3,32 3,29 3,27 3,25 3,24 3,23
8 3,24 3,20 3,15 3,12 3,08 3,04 3,02 2,99 2,97 2,95 2,94 2,93
9 3,03 2,99 2,94 2,90 2,86 2,83 2,80 2,77 2,76 2,73 2,72 2,71
10 2,86 2,83 2,77 2,74 2,70 2,66 2,64 2,60 2,59 2,56 2,55 2,54

11 2,74 2,70 2,65 2,61 2,57 2,53 2,51 2,47 2,46 2,43 2,42 2,40
12 2,64 2,60 2,54 2,51 2,47 2,43 2,40 2,37 2,35 2,32 2,31 2,30
13 2,55 2,51 2,46 2,42 2,38 2,34 2,31 2,28 2,26 2,23 2,22 2,21
14 2,48 2,44 2,39 2,35 2,31 2,27 2,24 2,21 2,19 2,16 2,14 2,13
15 2,42 2,38 2,33 2,29 2,25 2,20 2,18 2,14 2,12 2,10 2,08 2,07
16 2,37 2,33 2,28 2,24 2,19 2,15 2,12 2,09 2,07 2,04 2,02 2,01
17 2,33 2,29 2,23 2,19 2,15 2,10 2,08 2,04 2,02 1,99 1,97 1,96
18 2,29 2,25 2,19 2,15 2,11 2,06 2,04 2,00 1,98 1,95 1,93 1,92
19 2,26 2,21 2,16 2,11 2,07 2,03 2,00 1,96 1,94 1,91 1,89 1,88
20 2,22 2,18 2,12 2,08 2,04 1,99 1,97 1,93 1,91 1,88 1,86 1,84

21 2,20 2,16 2,10 2,05 2,01 1,96 1,94 1,90 1,88 1,84 1,83 1,81
22 2,17 2,13 2,07 2,03 1,98 1,94 1,91 1,87 1,85 1,82 1,80 1,78
23 2,15 2,11 2,05 2,01 1,96 1,91 1,88 1,84 1,82 1,79 1,77 1,76
24 2,13 2,09 2,03 1,98 1,94 1,89 1,86 1,82 1,80 1,77 1,75 1,73
25 2,11 2,07 2,01 1,96 1,92 1,87 1,84 1,80 1,78 1,75 1,73 1,71
26 2,09 2,05 1,99 1,95 1,90 1,85 1,82 1,78 1,76 1,73 1,71 1,69
27 2,08 2,04 1,97 1,93 1,88 1,84 1,81 1,76 1,74 1,71 1,69 1,67
28 2,06 2,02 1,96 1,91 1,87 1,82 1,79 1,75 1,73 1,69 1,67 1,65
29 2,05 2,01 1,94 1,90 1,85 1,81 1,77 1,73 1,71 1,67 1,65 1,64
30 2,04 1,99 1,93 1,89 1,84 1,79 1,76 1,72 1,70 1,66 1,64 1,62

tabelas 351

BIOESTATISTICA_VOL02.indb 351 25/06/12 17:24


Tabela 4.1 - Distribuição F: valores críticos para um teste unilateral (α = 0,05)
(continuação)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
32 2,01 1,97 1,91 1,86 1,82 1,77 1,74 1,69 1,67 1,63 1,61 1,59
34 1,99 1,95 1,89 1,84 1,80 1,75 1,71 1,67 1,65 1,61 1,59 1,57
36 1,98 1,93 1,87 1,82 1,78 1,73 1,69 1,65 1,62 1,59 1,56 1,55
38 1,96 1,92 1,85 1,81 1,76 1,71 1,68 1,63 1,61 1,57 1,54 1,53
40 1,95 1,90 1,84 1,79 1,74 1,69 1,66 1,61 1,59 1,55 1,53 1,51
42 1,94 1,89 1,83 1,78 1,73 1,68 1,65 1,60 1,57 1,53 1,51 1,49
44 1,92 1,88 1,81 1,77 1,72 1,67 1,63 1,59 1,56 1,52 1,49 1,48
46 1,91 1,87 1,80 1,76 1,71 1,65 1,62 1,57 1,55 1,51 1,48 1,46
48 1,90 1,86 1,79 1,75 1,70 1,64 1,61 1,56 1,54 1,49 1,47 1,45
50 1,89 1,85 1,78 1,74 1,69 1,63 1,60 1,55 1,52 1,48 1,46 1,44

55 1,88 1,83 1,76 1,72 1,67 1,61 1,58 1,53 1,50 1,46 1,43 1,41
60 1,86 1,82 1,75 1,70 1,65 1,59 1,56 1,51 1,48 1,44 1,41 1,39
65 1,85 1,80 1,73 1,69 1,63 1,58 1,54 1,49 1,46 1,42 1,39 1,37
70 1,84 1,79 1,72 1,67 1,62 1,57 1,53 1,48 1,45 1,40 1,37 1,35
80 1,82 1,77 1,70 1,65 1,60 1,54 1,51 1,45 1,43 1,38 1,35 1,32
100 1,79 1,75 1,68 1,63 1,57 1,52 1,48 1,42 1,39 1,34 1,31 1,28
125 1,77 1,73 1,66 1,60 1,55 1,49 1,45 1,40 1,36 1,31 1,27 1,25
150 1,76 1,71 1,64 1,59 1,54 1,48 1,44 1,38 1,34 1,29 1,25 1,22
200 1,74 1,69 1,62 1,57 1,52 1,46 1,41 1,35 1,32 1,26 1,22 1,19
400 1,72 1,67 1,60 1,54 1,49 1,42 1,38 1,32 1,28 1,22 1,17 1,13
1000 1,70 1,65 1,58 1,53 1,47 1,41 1,36 1,30 1,26 1,19 1,13 1,08
infinito 1,69 1,64 1,57 1,52 1,46 1,39 1,35 1,28 1,24 1,17 1,11 1,00

352 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 352 25/06/12 17:24


Tabela 4.2 - Distribuição F: valores críticos para um teste unilateral (α = 0,01)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
1 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6083 6107
2 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 99,40 99,41 99,42
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,23 27,13 27,05
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,45 14,37
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,96 9,89
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,79 7,72
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,54 6,47
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,73 5,67
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,18 5,11
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,77 4,71

11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,46 4,40
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,22 4,16
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 4,02 3,96
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,86 3,80
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,73 3,67
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,62 3,55
17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,52 3,46
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,43 3,37
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,36 3,30
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,29 3,23

21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,24 3,17
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,18 3,12
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,14 3,07
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,09 3,03
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 3,06 2,99
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 3,02 2,96
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,99 2,93
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,96 2,90
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,93 2,87
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,91 2,84

tabelas 353

BIOESTATISTICA_VOL02.indb 353 25/06/12 17:24


Tabela 4.2 - Distribuição F: valores críticos para um teste unilateral (α = 0,01)
(continuação)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
32 7,50 5,34 4,46 3,97 3,65 3,43 3,26 3,13 3,02 2,93 2,86 2,80
34 7,44 5,29 4,42 3,93 3,61 3,39 3,22 3,09 2,98 2,89 2,82 2,76
36 7,40 5,25 4,38 3,89 3,57 3,35 3,18 3,05 2,95 2,86 2,79 2,72
38 7,35 5,21 4,34 3,86 3,54 3,32 3,15 3,02 2,92 2,83 2,75 2,69
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,73 2,66
42 7,28 5,15 4,29 3,80 3,49 3,27 3,10 2,97 2,86 2,78 2,70 2,64
44 7,25 5,12 4,26 3,78 3,47 3,24 3,08 2,95 2,84 2,75 2,68 2,62
46 7,22 5,10 4,24 3,76 3,44 3,22 3,06 2,93 2,82 2,73 2,66 2,60
48 7,19 5,08 4,22 3,74 3,43 3,20 3,04 2,91 2,80 2,71 2,64 2,58
50 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78 2,70 2,63 2,56

55 7,12 5,01 4,16 3,68 3,37 3,15 2,98 2,85 2,75 2,66 2,59 2,53
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,56 2,50
65 7,04 4,95 4,10 3,62 3,31 3,09 2,93 2,80 2,69 2,61 2,53 2,47
70 7,01 4,92 4,07 3,60 3,29 3,07 2,91 2,78 2,67 2,59 2,51 2,45
80 6,96 4,88 4,04 3,56 3,26 3,04 2,87 2,74 2,64 2,55 2,48 2,42
100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59 2,50 2,43 2,37
125 6,84 4,78 3,94 3,47 3,17 2,95 2,79 2,66 2,55 2,47 2,39 2,33
150 6,81 4,75 3,91 3,45 3,14 2,92 2,76 2,63 2,53 2,44 2,37 2,31
200 6,76 4,71 3,88 3,41 3,11 2,89 2,73 2,60 2,50 2,41 2,34 2,27
400 6,70 4,66 3,83 3,37 3,06 2,85 2,68 2,56 2,45 2,37 2,29 2,23
1000 6,66 4,63 3,80 3,34 3,04 2,82 2,66 2,53 2,43 2,34 2,27 2,20
infinito 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,25 2,18

354 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 354 25/06/12 17:24


Tabela 4.2 - Distribuição F: valores críticos para um teste unilateral (α = 0,01)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
1 6143 6170 6209 6234 6260 6286 6302 6324 6334 6350 6360 6366
2 99,43 99,44 99,45 99,46 99,47 99,48 99,48 99,48 99,49 99,49 99,50 99,50
3 26,92 26,83 26,69 26,60 26,50 26,41 26,35 26,28 26,24 26,18 26,15 26,13
4 14,25 14,15 14,02 13,93 13,84 13,75 13,69 13,61 13,58 13,52 13,49 13,46
5 9,77 9,68 9,55 9,47 9,38 9,29 9,24 9,17 9,13 9,08 9,04 9,02
6 7,60 7,52 7,40 7,31 7,23 7,14 7,09 7,02 6,99 6,93 6,90 6,88
7 6,36 6,28 6,16 6,07 5,99 5,91 5,86 5,79 5,75 5,70 5,67 5,65
8 5,56 5,48 5,36 5,28 5,20 5,12 5,07 5,00 4,96 4,91 4,88 4,86
9 5,01 4,92 4,81 4,73 4,65 4,57 4,52 4,45 4,41 4,36 4,33 4,31
10 4,60 4,52 4,41 4,33 4,25 4,17 4,12 4,05 4,01 3,96 3,93 3,91

11 4,29 4,21 4,10 4,02 3,94 3,86 3,81 3,74 3,71 3,66 3,62 3,60
12 4,05 3,97 3,86 3,78 3,70 3,62 3,57 3,50 3,47 3,41 3,38 3,36
13 3,86 3,78 3,66 3,59 3,51 3,43 3,38 3,31 3,27 3,22 3,19 3,17
14 3,70 3,62 3,51 3,43 3,35 3,27 3,22 3,15 3,11 3,06 3,03 3,00
15 3,56 3,49 3,37 3,29 3,21 3,13 3,08 3,01 2,98 2,92 2,89 2,87
16 3,45 3,37 3,26 3,18 3,10 3,02 2,97 2,90 2,86 2,81 2,78 2,75
17 3,35 3,27 3,16 3,08 3,00 2,92 2,87 2,80 2,76 2,71 2,68 2,65
18 3,27 3,19 3,08 3,00 2,92 2,84 2,78 2,71 2,68 2,62 2,59 2,57
19 3,19 3,12 3,00 2,92 2,84 2,76 2,71 2,64 2,60 2,55 2,51 2,49
20 3,13 3,,05 2,94 2,86 2,78 2,69 2,64 2,57 2,54 2,48 2,44 2,42

21 3,07 2,99 2,88 2,80 2,72 2,64 2,58 2,51 2,48 2,42 2,38 2,36
22 3,02 2,94 2,83 2,75 2,67 2,58 2,53 2,46 2,42 2,36 2,33 2,31
23 2,97 2,89 2,78 2,70 2,62 2,54 2,48 2,41 2,37 2,32 2,28 2,26
24 2,93 2,85 2,74 2,66 2,58 2,49 2,44 2,37 2,33 2,27 2,24 2,21
25 2,89 2,81 2,70 2,62 2,54 2,45 2,40 2,33 2,29 2,23 2,19 2,17
26 2,86 2,78 2,66 2,58 2,50 2,42 2,36 2,29 2,25 2,19 2,16 2,13
27 2,82 2,75 2,63 2,55 2,47 2,38 2,33 2,26 2,22 2,16 2,12 2,10
28 2,79 2,72 2,60 2,52 2,44 2,35 2,30 2,23 2,19 2,13 2,09 2,06
29 2,77 2,69 2,57 2,49 2,41 2,33 2,27 2,20 2,16 2,10 2,06 2,03
30 2,74 2,66 2,55 2,47 2,39 2,30 2,25 2,17 2,13 2,07 2,03 2,01

tabelas 355

BIOESTATISTICA_VOL02.indb 355 25/06/12 17:24


Tabela 4.2 - Distribuição F: valores críticos para um teste unilateral (α = 0,01)
(continuação)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
32 2,70 2,62 2,50 2,42 2,34 2,25 2,20 2,12 2,08 2,02 1,98 1,96
34 2,66 2,58 2,46 2,38 2,30 2,21 2,16 2,08 2,04 1,98 1,94 1,91
36 2,62 2,54 2,43 2,35 2,26 2,18 2,12 2,04 2,00 1,94 1,90 1,87
38 2,59 2,51 2,40 2,32 2,23 2,14 2,09 2,01 1,97 1,90 1,86 1,84
40 2,56 2,48 2,37 2,29 2,20 2,11 2,06 1,98 1,94 1,87 1,83 1,80
42 2,54 2,46 2,34 2,26 2,18 2,09 2,03 1,95 1,91 1,85 1,80 1,78
44 2,52 2,44 2,32 2,24 2,15 2,07 2,01 1,93 1,89 1,82 1,78 1,75
46 2,50 2,42 2,30 2,22 2,13 2,04 1,99 1,91 1,86 1,80 1,76 1,73
48 2,48 2,40 2,28 2,20 2,12 2,02 1,97 1,89 1,84 1,78 1,73 1,70
50 2,46 2,38 2,27 2,18 2,10 2,01 1,95 1,87 1,82 1,76 1,71 1,68

55 2,42 2,34 2,23 2,15 2,06 1,97 1,91 1,83 1,78 1,71 1,67 1,64
60 2,39 2,31 2,20 2,12 2,03 1,94 1,88 1,79 1,75 1,68 1,63 1,60
65 2,37 2,29 2,17 2,09 2,00 1,91 1,85 1,77 1,72 1,65 1,60 1,57
70 2,35 2,27 2,15 2,07 1,98 1,89 1,83 1,74 1,70 1,62 1,57 1,54
80 2,31 2,23 2,12 2,03 1,94 1,85 1,79 1,70 1,65 1,58 1,53 1,49
100 2,27 2,19 2,07 1,98 1,89 1,80 1,74 1,65 1,60 1,52 1,47 1,43
125 2,23 2,15 2,03 1,94 1,85 1,76 1,69 1,60 1,55 1,47 1,41 1,37
150 2,20 2,12 2,00 1,92 1,83 1,73 1,66 1,57 1,52 1,43 1,38 1,33
200 2,17 2,09 1,97 1,89 1,79 1,69 1,63 1,53 1,48 1,39 1,33 1,28
400 2,13 2,05 1,92 1,84 1,75 1,64 1,58 1,48 1,42 1,32 1,25 1,19
1000 2,10 2,02 1,90 1,81 1,72 1,61 1,54 1,44 1,38 1,28 1,19 1,11
infinito 2,08 2,00 1,88 1,79 1,70 1,59 1,52 1,42 1,36 1,25 1,15 1,00

356 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 356 25/06/12 17:24


Tabela 5 - Distribuição binomial: probabilidades para x sucessos em n observações

P
n
x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950
2 0 0,903 0,810 0,640 0,490 0,360 0,250 0,160 0,090 0,040 0,010 0,003
1 0,095 0,180 0,320 0,420 0,480 0,500 0,480 0,420 0,320 0,180 0,095
2 0,003 0,010 0,040 0,090 0,160 0,250 0,360 0,490 0,640 0,810 0,903
3 0 0,857 0,729 0,512 0,343 0,216 0,125 0,064 0,027 0,008 0,001
1 0,135 0,243 0,384 0,441 0,432 0,375 0,288 0,189 0,096 0,027 0,007
2 0,007 0,027 0,096 0,189 0,288 0,375 0,432 0,441 0,384 0,243 0,135
3 0,001 0,008 0,027 0,064 0,125 0,216 0,343 0,512 0,729 0,857
4 0 0,815 0,656 0,410 0,240 0,130 0,063 0,026 0,008 0,002
1 0,171 0,292 0,410 0,412 0,346 0,250 0,154 0,076 0,026 0,004
2 0,014 0,049 0,154 0,265 0,346 0,375 0,346 0,265 0,154 0,049 0,014
3 0,004 0,026 0,076 0,154 0,250 0,346 0,412 0,410 0,292 0,171
4 0,002 0,008 0,026, 0,063 0,130 0,240 0,410 0,656 0,815
5 0 0,774 0,590 0,328 0,168 0,078 0,031 0,010 0,002
1 0,204 0,328 0,410 0,360 0,259 0,156 0,077 0,028 0,006
2 0,021 0,073 0,205 0,309 0,346 0,313 0,230 0,132 0,051 0,008 0,001
3 0,001 0,008 0,051 0,132 0,230 0,313 0,346 0,309 0,205 0,073 0,021
4 0,006 0,028 0,077 0,156 0,259 0,360 0,410 0,328 0,204
5 0,002 0,010 0,031 0,078 0,168 0,328 0,590 0,774
6 0 0,735 0,531 0,262 0,118 0,047 0,016 0,004 0,001
1 0,232 0,354 0,393 0,303 0,187 0,094 0,037 0,010 0,002
2 0,031 0,098 0,246 0,324 0,311 0,234 0,138 0,060 0,015 0,001
3 0,002 0,015 0,082 0,185 0,276 0,313 0,276 0,185 0,082 0,015 0,002
4 0,001 0,015 0,060 0,138 0,234 0,311 0,324 0,246 0,098 0,031
5 0,002 0,010 0,037 0,094 0,187 0,303 0,393 0,354 0,232
6 0,001 0,004 0,016 0,047 0,118 0,262 0,531 0,735
7 0 0,698 0,478 0,210 0,082 0,028 0,008 0,002
1 0,257 0,372 0,367 0,247 0,131 0,055 0,017 0,004
2 0,041 0,124 0,275 0,318 0,261 0,164 0,077 0,025 0,004
3 0,004 0,023 0,115 0,227 0,290 0,273 0,194 0,097 0,029 0,003
4 0,003 0,029 0,097 0,194 0,273 0,290 0,227 0,115 0,023 0,004
5 0,004 0,025 0,077 0,164 0,261 0,318 0,275 0,124 0,041
6 0,004 0,017 0,055 0,131 0,247 0,367 0,372 0,257
7 0,002 0,008 0,028 0,082 0,210 0,478 0,698

tabelas 357

BIOESTATISTICA_VOL02.indb 357 25/06/12 17:24


Tabela 5 - Distribuição binomial: probabilidades para x sucessos em n observações
(continuação)

P
n
x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950
8 0 0,663 0,430 0,168 0,058 0,017 0,004 0,001
1 0,279 0,383 0,336 0,198 0,090 0,031 0,008 0,001
2 0,051 0,149 0,294 0,296 0,209 0,109 0,041 0,010 0,001
3 0,005 0,033 0,147 0,254 0,279 0,219 0,124 0,047 0,009
4 0,005 0,046 0,136 0,232 0,273 0,232 0,136 0,046 0,005
5 0,009 0,047 0,124 0,219 0,279 0,254 0,147 0,033 0,005
6 0,001 0,010 0,041 0,109 0,209 0,296 0,294 0,149 0,051
7 0,001 0,008 0,031 0,090 0,198 0,336 0,383 0,279
8 0,001 0,004 0,017 0,058 0,168 0,430 0,663
9 0 0,630 0,387 0,134 0,040 0,010 0,002
1 0,299 0,387 0,302 0,156 0,060 0,018 0,004
2 0,063 0,172 0,302 0,267 0,161 0,070 0,021 0,004
3 0,008 0,045 0,176 0,267 0,251 0,164 0,074 0,021 0,003
4 0,001 0,007 0,066 0,172 0,251 0,246 0,167 0,074 0,017 0,001
5 0,001 0,017 0,074 0,167 0,246 0,251 0,172 0,066 0,007 0,001
6 0,003 0,021 0,074 0,164 0,251 0,267 0,176 0,045 0,008
7 0,004 0,021 0,070 0,161 0,267 0,302 0,172 0,063
8 0,004 0,018 0,060 0,156 0,302 0,387 0,299
9 0,002 0,010 0,040 0,134 0,387 0,630
10 0 0,599 0,349 0,107 0,028 0,006 0,001
1 0,315 0,387 0,268 0,121 0,040 0,010 0,002
2 0,075 0,194 0,302 0,233 0,121 0,044 0,011 0,001
3 0,010 0,057 0,201 0,267 0,215 0,117 0,042 0,009 0,001
4 0,001 0,011 0,088 0,200 0,251 0,205 0,111 0,037 0,006
5 0,001 0,026 0,103 0,201 0,246 0,201 0,103 0,026 0,001
6 0,006 0,037 0,111 0,205 0,251 0,200 0,088 0,011 0,001
7 0,001 0,009 0,042 0,117 0,215 0,267 0,201 0,057 0,010
8 0,001 0,011 0,044 0,121 0,233 0,302 0,194 0,075
9 0,002 0,010 0,040 0,121 0,268 0,387 0,315
10 0,001 0,006 0,028 0,107 0,349 0,599
11 0 0,569 0,314 0,086 0,020 0,004
1 0,329 0,384 0,236 0,093 0,027 0,005 0,001
2 0,087 0,213 0,295 0,200 0,089 0,027 0,005 0,001

358 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 358 25/06/12 17:24


Tabela 5 - Distribuição binomial: probabilidades para x sucessos em n observações
(continuação)

P
n
x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950
3 0,014 0,071 0,221 0,257 0,177 0,081 0,023 0,004
4 0,001 0,016 0,111 0,220 0,236 0,161 0,070 0,017 0,002
5 0,002 0,039 0,132 0,221 0,226 0,147 0,057 0,010
6 0,010 0,057 0,147 0,226 0,221 0,132 0,039 0,002
7 0,002 0,017 0,070 0,161 0,236 0,220 0,111 0,016 0,001
8 0,004 0,023 0,081 0,177 0,257 0,221 0,071 0,014
9 0,001 0,005 0,027 0,089 0,200 0,295 0,213 0,087
10 0,001 0,005 0,027 0,093 0,236 0,384 0,329
11 0,004 0,020 0,086 0,314 0,569
12 0 0,540 0,282 0,069 0,014 0,002
1 0,341 0,377 0,206 0,071 0,017 0,003
2 0,099 0,230 0,283 0,168 0,064 0,016 0,002
3 0,017 0,085 0,236 0,240 0,142 0,054 0,012 0,001
4 0,002 0,021 0,133 0,231 0,213 0,121 0,042 0,008 0,001
5 0,004 0,053 0,158 0,227 0,193 0,101 0,029 0,003
6 0,016 0,079 0,177 0,226 0,177 0,079 0,016
7 0,003 0,029 0,101 0,193 0,227 0,158 0,053 0,004
8 0,001 0,008 0,042 0,121 0,213 0,231 0,133 0,021 0,002
9 0,001 0,012 0,054 0,142 0,240 0,236 0,085 0,017
10 0,002 0,016 0,064 0,168 0,283 0,230 0,099
11 0,003 0,017 0,071 0,206 0,377 0,341
12 0,002 0,014 0,069 0,282 0,540
16 0 0,440 0,185 0,028 0,003
1 0,371 0,329 0,113 0,023 0,003
2 0,146 0,275 0,211 0,073 0,015 0,002
3 0,036 0,142 0,246 0,146 0,047 0,009 0,001
4 0,006 0,051 0,200 0,204 0,101 0,028 0,004
5 0,001 0,014 0,120 0,210 0,162 0,067 0,014 0,001
6 0,003 0,055 0,165 0,198 0,122 0,039 0,006
7 0,020 0,101 0,189 0,175 0,084 0,019 0,001
8 0,006 0,049 0,142 0,196 0,142 0,049 0,006
9 0,001 0,019 0,084 0,175 0,189 0,101 0,020
10 0,006 0,039 0,122 0,198 0,165 0,055 0,003

tabelas 359

BIOESTATISTICA_VOL02.indb 359 25/06/12 17:24


Tabela 5 - Distribuição binomial: probabilidades para x sucessos em n observações
(continuação)

P
n
x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950
11 0,001 0,014 0,067 0,162 0,210 0,120 0,014 0,001
12 0,004 0,028 0,101 0,204 0,200 0,051 0,006
13 0,001 0,009 0,047 0,146 0,246 0,142 0,036
14 0,002 0,015 0,073 0,211 0,275 0,146
15 0,003 0,023 0,113 0,329 0,371
16 0,003 0,028 0,185 0,440
20 0 0,358 0,122 0,012 0,001
1 0,377 0,270 0,058 0,007
2 0,189 0,285 0,137 0,028 0,003
3 0,060 0,190 0,205 0,072 0,012 0,001
4 0,013 0,090 0,218 0,130 0,035 0,005
5 0,002 0,032 0,175 0,179 0,075 0,015 0,001
6 0,009 0,109 0,192 0,124 0,037 0,005
7 0,002 0,055 0,164 0,166 0,074 0,015 0,001
8 0,022 0,114 0,180 0,120 0,035 0,004
9 0,007 0,065 0,160 0,160 0,071 0,012
10 0,002 0,031 0,117 0,176 0,117 0,031 0,002
11 0,012 0,071 0,160 0,160 0,065 0,007
12 0,004 0,035 0,120 0,180 0,114 0,022
13 0,001 0,015 0,074 0,166 0,164 0,055 0,002
14 0,005 0,037 0,124 0,192 0,109 0,009
15 0,001 0,015 0,075 0,179 0,175 0,032 0,002
16 0,005 0,035 0,130 0,218 0,090 0,013
17 0,001 0,012 0,072 0,205 0,190 0,060
18 0,003 0,028 0,137 0,285 0,189
19 0,007 0,058 0,270 0,377
20 0,001 0,012 0,122 0,358

360 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 360 25/06/12 17:24


Tabela 6 - Valores críticos da distribuição qui-quadrado (χ2 )

α
gl 0,20 0,10 0,05 0,02 0,01 0,001
1 1,64 2,71 3,84 5,41 6,63 10,83
2 3,22 4,61 5,99 7,82 9,21 13,82
3 4,64 6,25 7,81 9,84 11,34 16,27
4 5,99 7,78 9,49 11,67 13,28 18,47
5 7,29 9,24 11,07 13,39 15,09 20,51

6 8,56 10,64 12,59 15,03 16,81 22,46


7 9,80 12,02 14,07 16,62 18,48 24,32
8 11,03 13,36 15,51 18,17 20,09 26,12
9 12,24 14,68 16,92 19,68 21,67 27,88
10 13,44 15,99 18,31 21,16 23,21 29,59

11 14,63 17,28 19,68 22,62 24,73 31,26


12 15,81 18,55 21,03 24,05 26,22 32,91
13 16,98 19,81 22,36 25,47 27,69 34,53
14 18,15 21,06 23,68 26,87 29,14 36,12
15 19,31 22,31 25,00 28,26 30,58 37,70

16 20,47 23,54 26,30 29,63 32,00 39,25


17 21,61 24,77 27,59 31,00 33,41 40,79
18 22,76 25,99 28,87 32,35 34,81 42,31
19 23,90 27,20 30,14 33,69 36,19 43,82
20 25,04 28,41 31,41 35,02 37,57 45,31

21 26,17 29,62 32,67 36,34 38,93 46,80


22 27,30 30,81 33,92 37,66 40,29 48,27
23 28,43 32,01 35,17 38,97 41,64 49,73
24 29,55 33,20 36,42 40,27 42,98 51,18
25 30,68 34,38 37,65 41,57 44,31 52,62

26 31,79 35,56 38,89 42,86 45,64 54,05


27 32,91 36,74 40,11 44,14 46,96 55,48
28 34,03 37,92 41,34 45,42 48,28 56,89
29 35,14 39,09 42,56 46,69 49,59 58,30
30 36,25 40,26 43,77 47,96 50,89 59,70

tabelas 361

BIOESTATISTICA_VOL02.indb 361 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 362 25/06/12 17:24
Tabela 7 - Valores críticos da distribuição q para α = 0,05

gl k: 2 3 4 5 6 7 8 9 10

1 17,97 26,98 32,82 37,08 40,41 43,12 45,40 47,36 49,07

2 6,085 8,331 9,798 10,88 11,74 12,44 13,03 13,54 13,99

3 4,501 5,910 6,825 7,502 8,037 8,478 8,853 9,177 9,462

4 3,927 5,040 5,757 6,287 6,707 7,053 7,347 7,602 7,826

5 3,635 4,602 5,218 5,673 6,033 6,330 6,582 6,802 6,995

6 3,461 4,339 4,896 5,305 5,628 5,895 6,122 6,319 6,493

7 3,344 4,165 4,681 5,060 5,359 5,606 5,815 5,998 6,158

8 3,261 4,041 4,529 4,886 5,167 5,399 5,597 5,767 5,918

9 3,199 3,949 4,415 4,756 5,024 5,244 5,432 5,595 5,739

10 3,151 3,877 4,327 4,654 4,912 5,124 5,305 5,461 5,599

11 3,113 3,820 4,256 4,574 4,823 5,028 5,202 5,353 5,487

12 3,082 3,773 4,199 4,508 4,751 4,950 5,119 5,265 5,395

13 3,055 3,735 4,151 4,453 4,690 4,885 5,049 5,192 5,318

14 3,033 3,702 4,111 4,407 4,639 4,829 4,990 5,131 5,254

15 3,014 3,674 4,076 4,367 4,595 4,782 4,940 5,077 5,198

16 2,998 3,649 4,046 4,333 4,557 4,741 4,897 5,031 5,150

17 2,984 3,628 4,020 4,303 4,524 4,705 4,858 4,991 5,108

18 2,971 3,609 3,997 4,277 4,495 4,673 4,824 4,956 5,071

19 2,960 3,593 3,977 4,253 4,469 4,645 4,794 4,924 5,038

20 2,950 3,578 3,958 4,232 4,445 4,620 4,768 4,896 5,008

24 2,919 3,532 3,901 4,166 4,373 4,541 4,684 4,807 4,915

30 2,888 3,486 3,845 4,102 4,302 4,464 4,602 4,720 4,824

40 2,858 3,442 3,791 4,039 4,232 4,389 4,521 4,635 4,735

60 2,829 3,399 3,737 3,977 4,163 4,314 4,441 4,550 4,646

120 2,800 3,356 3,685 3,917 4,096 4,241 4,363 4,468 4,560

Infinito 2,772 3,314 3,633 3,858 4,030 4,170 4,286 4,387 4,474

tabelas 363

BIOESTATISTICA_VOL02.indb 363 25/06/12 17:24


Tabela 7 - Valores críticos da distribuição q para α = 0,05

gl k: 11 12 13 14 15 16 17 18 19

1 50,59 51,96 53,20 54,33 55,36 56,32 57,22 58,04 58,83

2 14,39 14,75 15,08 15,38 15,65 15,91 16,14 16,37 16,57

3 9,717 9,946 10,15 10,35 10,53 10,69 10,84 10,98 11,11

4 8,027 8,208 8,373 8,525 8,664 8,794 8,914 9,028 9,134

5 7,168 7,324 7,466 7,596 7,717 7,828 7,932 8,030 8,122

6 6,649 6,789 6,917 7,034 7,143 7,244 7,338 7,426 7,508

7 6,302 6,431 6,550 6,658 6,759 6,852 6,939 7,020 7,097

8 6,054 6,175 6,287 6,389 6,483 6,571 6,653 6,729 6,802

9 5,867 5,983 6,089 6,186 6,276 6,359 6,437 6,510 6,579

10 5,722 5,833 5,935 6,028 6,114 6,194 6,269 6,339 6,405

11 5,605 5,713 5,811 5,901 5,984 6,062 6,134 6,202 6,265

12 5,511 5,615 5,710 5,798 5,878 5,953 6,023 6,089 6,151

13 5,431 5,533 5,625 5,711 5,789 5,862 5,931 5,995 6,055

14 5,364 5,463 5,554 5,637 5,714 5,786 5,852 5,915 5,974

15 5,306 5,404 5,493 5,574 5,649 5,720 5,785 5,846 5,904

16 5,256 5,352 5,439 5,520 5,593 5,662 5,727 5,786 5,843

17 5,212 5,307 5,392 5,471 5,544 5,612 5,675 5,734 5,790

18 5,174 5,267 5,352 5,429 5,501 5,568 5,630 5,688 5,743

19 5,140 5,231 5,315 5,391 5,462 5,528 5,589 5,647 5,701

20 5,108 5,199 5,282 5,357 5,427 5,493 5,553 5,610 5,663

24 5,012 5,099 5,179 5,251 5,319 5,381 5,439 5,494 5,545

30 4,917 5,001 5,077 5,147 5,211 5,271 5,327 5,379 5,429

40 4,824 4,904 4,977 5,044 5,106 5,163 5,216 5,266 5,313

60 4,732 4,808 4,878 4,942 5,001 5,056 5,107 5,154 5,199

120 4,641 4,714 4,781 4,842 4,898 4,950 4,998 5,044 5,086

Infinito 4,552 4,622 4,685 4,743 4,796 4,845 4,891 4,934 4,974

364 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 364 25/06/12 17:24


Tabela 7 - Valores críticos da distribuição q para α = 0,05 (continuação)

gl k: 20 22 24 26 28 30 32 34 36

1 59,56 60,91 62,12 63,22 64,23 65,15 66,01 66,81 67,56

2 16,77 17,13 17,45 17,75 18,02 18,27 18,50 18,72 18,92

3 11,24 11,47 11,68 11,87 12,05 12,21 12,36 12,50 12,63

4 9,233 9,418 9,584 9,736 9,875 10,00 10,12 10,23 10,34

5 8,208 8,368 8,512 8,643 8,764 8,875 8,979 9,075 9,165

6 7,587 7,730 7,861 7,979 8,088 8,189 8,283 8,370 8,452

7 7,170 7,303 7,423 7,533 7,634 7,728 7,814 7,895 7,972

8 6,870 6,995 7,109 7,212 7,307 7,395 7,477 7,554 7,625

9 6,644 6,763 6,871 6,970 7,061 7,145 7,222 7,295 7,363

10 6,467 6,582 6,686 6,781 6,868 6,948 7,023 7,093 7,159

11 6,326 6,436 6,536 6,628 6,712 6,790 6,863 6,930 6,994

12 6,209 6,317 6,414 6,503 6,585 6,660 6,731 6,796 6,858

13 6,112 6,217 6,312 6,398 6,478 6,551 6,620 6,684 6,744

14 6,029 6,132 6,224 6,309 6,387 6,459 6,526 6,588 6,647

15 5,958 6,059 6,149 6,233 6,309 6,379 6,445 6,506 6,564

16 5,897 5,995 6,084 6,166 6,241 6,310 6,374 6,434 6,491

17 5,842 5,940 6,027 6,107 6,181 6,249 6,313 6,372 6,427

18 5,794 5,890 5,977 6,055 6,128 6,195 6,258 6,316 6,371

19 5,752 5,846 5,932 6,009 6,081 6,147 6,209 6,267 6,321

20 5,714 5,807 5,891 5,968 6,039 6,104 6,165 6,222 6,275

24 5,594 5,683 5,764 5,838 5,906 5,968 6,027 6,081 6,132

30 5,475 5,561 5,638 5,709 5,774 5,833 5,889 5,941 5,990

40 5,358 5,439 5,513 5,581 5,642 5,700 5,753 5,803 5,849

60 5,241 5,319 5,389 5,453 5,512 5,566 5,617 5,664 5,708

120 5,126 5,200 5,266 5,327 5,382 5,434 5,481 5,526 5,568

Infinito 5,012 5,081 5,144 5,201 5,253 5,301 5,346 5,388 5,427

tabelas 365

BIOESTATISTICA_VOL02.indb 365 25/06/12 17:24


Tabela 7 - Valores críticos da distribuição q para α = 0,05 (continuação)

gl k: 38 40 50 60 70 80 90 100

1 68,26 68,92 71,73 73,97 75,82 77,40 78,77 79,98

2 19,11 19,28 20,05 20,66 21,16 21,59 21,96 22,29

3 12,75 12,87 13,36 13,76 14,08 14,36 14,61 14,82

4 10,44 10,53 10,93 11,24 11,51 11,73 11,92 12,09

5 9,250 9,330 9,674 9,949 10,18 10,38 10,54 10,69

6 8,529 8,601 8,913 9,163 9,370 9,548 9,702 9,839

7 8,043 8,110 8,400 8,632 8,824 8,989 9,133 9,261

8 7,693 7,756 8,029 8,248 8,430 8,586 8,722 8,843

9 7,428 7,488 7,749 7,958 8,132 8,281 8,410 8,526

10 7,220 7,279 7,529 7,730 7,897 8,041 8,166 8,276

11 7,053 7,110 7,352 7,546 7,708 7,847 7,968 8,075

12 6,916 6,970 7,205 7,394 7,552 7,687 7,804 7,909

13 6,800 6,854 7,083 7,267 7,421 7,552 7,667 7,769

14 6,702 6,754 6,979 7,159 7,309 7,438 7,550 7,650

15 6,618 6,669 6,888 7,065 7,212 7,339 7,449 7,546

16 6,544 6,594 6,810 6,984 7,128 7,252 7,360 7,457

17 6,479 6,529 6,741 6,912 7,054 7,176 7,283 7,377

18 6,422 6,471 6,680 6,848 6,989 7,109 7,213 7,307

19 6,371 6,419 6,626 6,792 6,930 7,048 7,152 7,244

20 6,325 6,373 6,576 6,740 6,877 6,994 7,097 7,187

24 6,181 6,226 6,421 6,579 6,710 6,822 6,920 7,008

30 6,037 6,080 6,267 6,417 6,543 6,650 6,744 6,827

40 5,893 5,934 6,112 6,255 6,375 6,477 6,566 6,645

60 5,750 5,789 5,958 6,093 6,206 6,303 6,387 6,462

120 5,607 5,644 5,802 5,929 6,035 6,126 6,205 6,275

Infinito 5,463 5,498 5,646 5,764 5,863 5,947 6,020 6,085

366 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 366 25/06/12 17:24


Tabela 8 - Valores críticos da distribuição U de Mann-Whitney, para testes unilaterais com α =
0,025 e bilaterais com α = 0,05

n2
9 10 11 12 13 14 15 16 17 18 19 20
n1

2 0 0 0 1 1 1 1 1 2 2 2 2

3 2 3 3 4 4 5 5 6 6 7 7 8

4 4 5 6 7 8 9 10 11 11 12 13 13

5 7 8 9 11 12 13 14 15 17 18 19 20

6 10 11 13 14 16 17 19 21 22 24 25 27

7 12 14 16 18 20 22 24 26 28 30 32 34

8 15 17 19 22 24 26 29 31 34 36 38 41

9 17 20 23 26 28 31 34 37 39 42 45 48

10 20 23 26 29 33 36 39 42 45 48 52 55

11 23 26 30 33 37 40 44 47 51 55 58 62

12 26 29 33 37 41 45 49 53 57 61 65 69

13 28 33 37 41 45 50 54 59 63 67 72 76

14 31 36 40 45 50 55 59 64 67 74 78 83

15 34 39 44 49 54 59 64 70 75 80 85 90

16 37 42 47 53 59 64 70 75 81 86 92 98

17 39 45 51 57 63 67 75 81 87 93 99 105

18 42 48 55 61 67 74 80 86 93 99 106 112

19 45 52 58 65 72 78 85 92 99 106 113 119

20 48 55 62 69 76 83 90 98 105 112 119 127

tabelas 367

BIOESTATISTICA_VOL02.indb 367 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 368 25/06/12 17:24
Tabela 9 - Valores críticos da distribuição T de Wilcoxon

α Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,001


n
α Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,0005
4 2 0
5 4 2 0
6 6 3 2 0
7 9 5 3 2 0
8 12 8 5 3 1 0
9 16 10 8 5 3 1 0
10 20 14 10 8 5 3 1

11 24 17 13 10 7 5 3 0
12 29 21 17 13 9 7 5 1
13 35 26 21 17 12 9 7 2
14 40 31 25 21 15 12 9 4
15 47 36 30 25 19 15 12 6
16 54 42 35 29 23 19 15 8
17 61 48 41 34 27 23 19 11
18 69 55 47 40 32 27 23 14
19 77 62 53 46 37 32 27 18
20 86 69 60 52 43 37 32 21

21 95 77 67 58 49 42 37 25
22 104 86 75 65 55 48 42 30
23 114 94 83 73 62 54 48 35
24 125 104 91 81 69 61 54 40
25 136 113 100 89 76 68 60 45
26 148 124 110 98 84 75 67 51
27 160 134 119 107 92 83 74 57
28 172 145 130 116 101 91 82 64
29 185 157 140 126 110 100 90 71
30 198 169 151 137 120 109 98 78

31 212 181 163 147 130 118 107 86


32 226 194 175 159 140 128 116 94
33 241 207 187 170 151 138 126 102
34 257 221 200 182 162 148 136 111
35 272 235 213 195 173 159 146 120

tabelas 369

BIOESTATISTICA_VOL02.indb 369 25/06/12 17:24


Tabela 9 - Valores críticos da distribuição T de Wilcoxon
(continuação)

α Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,001


n
α Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,0005
36 289 250 227 208 185 171 157 130
37 305 265 241 221 198 182 168 140
38 323 281 256 235 211 194 180 150
39 340 297 271 249 224 207 192 161
40 358 313 286 264 238 220 204 172

41 377 330 302 279 252 233 217 183


42 396 348 319 294 266 247 230 195
43 416 365 336 310 281 261 244 207
44 436 384 353 327 296 276 258 220
45 456 402 371 343 312 291 272 233
46 477 422 389 361 328 307 287 246
47 499 441 407 378 345 322 302 260
48 521 462 426 396 362 339 318 274
49 543 482 446 415 379 355 334 289
50 566 503 466 434 397 373 350 304
51 590 525 486 453 416 390 367 319
52 613 547 507 473 434 408 384 335
53 638 569 529 494 454 427 402 351
54 668 592 550 514 473 445 420 368
55 688 615 573 536 493 465 438 385
56 714 639 595 557 514 484 457 402
57 740 664 618 579 535 504 477 420
58 767 688 642 602 556 525 497 438
59 794 714 666 625 578 546 517 457
60 822 739 690 648 600 567 537 476

61 850 765 715 672 623 598 558 495


62 879 792 741 697 646 611 580 515
63 908 819 767 721 669 634 602 535
64 938 847 793 747 693 657 624 556
65 968 875 820 772 718 681 647 577
66 998 903 847 798 742 705 670 599
67 1029 932 875 825 768 729 694 621
68 1061 962 903 852 793 754 718 643

370 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 370 25/06/12 17:24


Tabela 9 - Valores críticos da distribuição T de Wilcoxon
(continuação)

α Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,001


n
α Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,0005
69 1093 992 931 879 819 779 742 666
70 1126 1022 960 907 846 805 767 689

71 1159 1053 990 936 873 831 792 712


72 1192 1084 1020 964 901 858 818 736
73 1226 1116 1050 994 928 884 844 761
74 1261 1148 1081 1023 957 912 871 786
75 1296 1181 1112 1053 986 940 898 811
76 1331 1214 1144 1084 1015 968 925 836
77 1367 1247 1176 1115 1044 997 953 862
78 1403 1282 1209 1147 1075 1026 981 889
79 1440 1316 1242 1179 1105 1056 1010 916
80 1478 1351 1276 1211 1136 1086 1039 943

81 1516 1387 1310 1244 1168 1116 1069 971


82 1554 1423 1345 1277 1200 1147 1099 999
83 1593 1459 1380 1311 1232 1178 1129 1028
84 1632 1496 1415 1345 1265 1210 1160 1057
85 1672 1533 1451 1380 1298 1242 1191 1086
86 1712 1571 1487 1415 1332 1275 1223 1116
87 1753 1609 1524 1451 1366 1308 1255 1146
88 1794 1648 1561 1487 1400 1342 1288 1177
89 1836 1688 1599 1523 1435 1376 1321 1208
90 1878 1727 1638 1560 1471 1410 1355 1240

91 1921 1767 1676 1597 1507 1445 1389 1271


92 1964 1808 1715 1635 1543 1480 1423 1304
93 2008 1849 1755 1674 1580 1516 1458 1337
94 2052 1891 1795 1712 1617 1552 1493 1370
95 2097 1933 1836 1752 1655 1589 1529 1404
96 2142 1976 1877 1791 1693 1626 1565 1438
97 2187 2019 1918 1832 1731 1664 1601 1472
98 2233 2062 1960 1872 1770 1702 1638 1507
99 2280 2106 2003 1913 1810 1740 1676 1543
100 2327 2151 2045 1955 1850 1779 1714 1578

tabelas 371

BIOESTATISTICA_VOL02.indb 371 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 372 25/06/12 17:24
Tabela 10 - Valores críticos da distribuição H de Kruskal-Wallis

n1 n2 n3 a: 0,10 0,05 0,02 0,01 0,005 0,002 0,001

2 2 2 4,571
3 2 1 4,286
3 2 2 4,500 4,714
3 3 1 4,571 5,143
3 3 2 4,556 5,361 6,250
3 3 3 4,622 5,600 6,489 (7,200) 7,200
4 2 1 4,500
4 2 2 4,458 5,333 6,000
4 3 1 4,056 5,208
4 3 2 4,511 5,444 6,144 6,444 7,000
4 3 3 4,709 5,791 6,564 6,745 7,318 8,018
4 4 1 4,167 4,967 (6,667) 6,667
4 4 2 4,555 5,455 6,600 7,036 7,282 7,855
4 4 3 4,545 5,598 6,712 7,144 7,598 8,227 8,909
4 4 4 4,654 5,692 6,962 7,654 8,000 8,654 9,269
5 2 1 4,200 5,000
5 2 2 4,373 5,160 6,000 6,533
5 3 1 4,018 4,960 6,044
5 3 2 4,651 5,251 6,124 6,909 7,182
5 3 3 4,533 5,648 6,533 7,079 7,636 8,048 8,727
5 4 1 3,987 4,985 6,431 6,955 7,364
5 4 2 4,541 5,273 6,505 7,205 7,573 8,114 8,591
5 4 3 4,549 5,656 6,676 7,445 7,927 8,481 8,795
5 4 4 4,619 5,657 6,953 7,760 8,189 8,868 9,168
5 5 1 4,109 5,127 6,145 7,309 8,182
5 5 2 4,623 5,338 6,446 7,338 8,131 6,446 7,338
5 5 3 4,545 5,705 6,866 7,578 8,316 8,809 9,521
5 5 4 4,523 5,666 7,000 7,823 8,523 9,163 9,606
5 5 5 4,940 5,780 7,220 8,000 8,780 9,620 9,920

tabelas 373

BIOESTATISTICA_VOL02.indb 373 25/06/12 17:24


Tabela 10 - Valores críticos da distribuição H de Kruskal-Wallis

n1 n2 n3 a: 0,10 0,05 0,02 0,01 0,005 0,002 0,001

6 1 1 ---
6 2 1 4,200 4,822
6 2 2 4,545 5,345 6,182 6,982
6 3 1 3,909 4,855 6,236
6 3 2 4,682 5,348 6,227 6,970 7,515 8,182
6 3 3 4,538 5,615 6,590 7,410 7,872 8,628 9,346
6 4 1 4,038 4,947 6,174 7,106 7,614
6 4 2 4,494 5,340 6,571 7,340 7,846 8,494 8,827
6 4 3 4,604 5,610 6,725 7,500 8,033 8,918 9,170
6 4 4 4,595 5,681 6,900 7,795 8,381 9,167 9,861
6 5 1 4,128 4,990 6,138 7,182 8,077 8,515
6 5 2 4,596 5,338 6,585 7,376 8,196 8,967 9,189
6 5 3 4,535 5,602 6,829 7,590 8,314 9,150 9,669
6 5 4 4,522 5,661 7,018 7,936 8,643 9,458 9,960
6 5 5 4,547 5,729 7,110 8,028 8,859 9,771 10,271
6 6 1 4,000 4,945 6,286 7,121 8,165 9,077 9,692
6 6 2 4,438 5,410 6,667 7,467 8,210 9,219 9,752
6 6 3 4,558 5,625 6,900 7,725 8,458 9,458 10,150
6 6 4 4,548 5,724 7,107 8,000 8,754 9,662 10,342
6 6 5 4,542 5,765 7,152 8,124 8,987 9,948 10,524
6 6 6 4,643 5,801 7,240 8,222 9,170 10,187 10,889
7 7 7 4,594 5,819 7,332 8,378 9,373 10,516 11,310
8 8 8 4,595 5,805 7,355 8,465 9,495 10,805 11,705
2 2 1 1 ---
2 2 2 1 5,357 5,679
2 2 2 2 5,667 6,167 (6,667) 6,667
3 1 1 1 ---
3 2 1 1 5,143
3 2 2 1 5,556 5,833 6,500

374 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 374 25/06/12 17:24


Tabela 10 - Valores críticos da distribuição H de Kruskal-Wallis
(continuação)

n1 n2 n3 a: 0,10 0,05 0,02 0,01 0,005 0,002 0,001

3 2 2 2 5,544 6,333 6,978 7,133 7,533


3 3 1 1 5,333 6,333
3 3 2 1 5,689 6,244 6,689 7,200 7,400
3 3 2 2 5,745 6,527 7,182 7,636 7,873 8,018 8,455
3 3 3 1 5,655 6,600 7,109 7,400 8,055 8,345
3 3 3 2 5,879 6,727 7,636 8,105 8,379 8,803 9,030
3 3 3 3 6,026 7,000 7,872 8,538 8,897 9,462 9,513
4 1 1 1
4 2 1 1 5,250 5,833
4 2 2 1 5,533 6,133 6,667 7,000
4 2 2 2 5,755 6,545 7,091 7,391 7,964 8,291
4 3 1 1 5,067 6,178 6,711 7,067
4 3 2 1 5,591 6,309 7,018 7,455 7,773 8,182
4 3 2 2 5,750 6,621 7,530 7,871 8,273 8,689 8,909
4 3 3 1 5,589 6,545 7,485 7,758 8,212 8,697 9,182
4 3 3 2 5,872 6,795 7,763 8,333 8,718 9,167 9,455
4 3 3 3 6,016 6,984 7,995 8,659 9,253 9,709 10,016
4 4 1 1 5,182 5,945 7,091 7,909 7,909
4 4 2 1 5,568 6,386 7,364 7,886 8,341 8,591 8,909
4 4 2 2 5,808 6,731 7,750 8,346 8,692 9,269 9,462
4 4 3 1 5,692 6,635 7,660 8,231 8,583 9,038 9,327
4 4 3 2 5,901 6,874 7,951 8,621 9,165 9,615 9,945
4 4 3 3 6,019 7,038 8,181 8,876 9,495 10,105 10,467
4 4 4 1 5,564 6,725 7,879 8,588 9,000 9,478 9,758

tabelas 375

BIOESTATISTICA_VOL02.indb 375 25/06/12 17:24


Tabela 10 - Valores críticos da distribuição H de Kruskal-Wallis
(continuação)

n1 n2 n3 a: 0,10 0,05 0,02 0,01 0,005 0,002 0,001

4 4 4 2 5,914 6,957 8,157 8,871 9,486 10,043 10,429


4 4 4 3 6,042 7,142 8,350 9,075 9,742 10,542 10,929
4 4 4 4 6,088 7,235 8,515 9,287 9,971 10,809 11,338
2 1 1 1 1 ---
2 2 1 1 1 5,786
2 2 2 1 1 6,250 6,750
2 2 2 2 1 6,600 7,133 (7,533) 7,533
2 2 2 2 2 6,982 7,418 8,073 8,291 (8,727) 8,727
3 1 1 1 1 ---
3 2 1 1 1 6,139 6,583
3 2 2 1 1 6,511 6,800 7,400 7,600
3 2 2 2 1 6,709 7,309 7,836 8,127 8,327 8,618
3 2 2 2 2 6,955 7,682 8,303 8,682 8,985 9,273 9,364
3 3 1 1 1 6,311 7,111 7,467
3 3 2 1 1 6,600 7,200 7,892 8,073 8,345
3 3 2 2 1 6,788 7,591 8,258 8,576 8,924 9,167 9,303
3 3 2 2 2 7,026 7,910 8,667 9,115 9,474 9,769 10,026
3 3 3 1 1 6,788 6,576 8,242 8,424 8,848 (9,455) 9,455
3 3 3 2 1 6,910 7,769 8,590 9,051 9,410 9,769 9,974
3 3 3 2 2 7,121 8,044 9,011 9,505 9,890 10,330 10,637
3 3 3 3 1 7,077 8,000 8,879 9,451 9,846 10,286 10,549
3 3 3 3 2 7,210 8,200 9,267 9,876 10,333 10,838 11,171
3 3 3 3 3 7,333 8,333 9,467 10,200 10,733 10,267 11,667

376 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 376 25/06/12 17:24


Tabela 11 - Valores críticos da distribuição Q para testes de comparações múltiplas não-
paramétricas

k α: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001

2 0,674 1,282 1,645 1,960 2,327 2,576 2,807 3,091 3,291

3 1,383 1,834 2,128 2,394 2,713 2,936 3,144 3,403 3,588

4 1,732 2,128 2,394 2,639 2,936 3,144 3,342 3,588 3,765

5 1,960 2,327 2,576 2,807 3,091 3,291 3,481 3,719 3,891

6 2,128 2,475 2,713 2,936 3,209 3,403 3,588 3,820 3,988

7 2,261 2,593 2,823 3,038 3,304 3,494 3,675 3,902 4,067

8 2,369 2,690 2,914 3,124 3,384 3,570 3,748 3,972 4,134

9 2,461 2,773 2,992 3,197 3,453 3,635 3,810 4,031 4,191

10 2,540 2,845 3,059 3,261 3,512 3,692 3,865 4,083 4,241

11 2,609 2,908 3,119 3,317 3,565 3,743 3,914 4,129 4,286

12 2,671 2,965 3,172 3,368 3,613 3,789 3,957 4,171 4,326

13 2,726 3,016 3,220 3,414 3,656 3,830 3,997 4,209 4,363

14 2,777 3,062 3,264 3,456 3,695 3,868 4,034 4,244 4,397

15 2,823 3,105 3,304 3,494 3,731 3,902 4,067 4,276 4,428

16 2,866 3,144 3,342 3,529 3,765 3,935 4,098 4,305 4,456

17 2,905 3,181 3,376 3,562 3,796 3,965 4,127 4,333 4,483

18 2,942 3,215 3,409 3,593 3,825 3,993 4,154 4,359 4,508

19 2,976, 3,246 3,439 3,622 3,852 4,019 4,179 4,383 4,532

20 3,008 3,276 3,467 3,649 3,878 4,044 4,203 4,406 4,554

21 3,038 3,304 3,494 3,675 3,902 4,067 4,226 4,428 4,575

22 3,067 3,331 3,519 3,699 3,925 4,089 4,247 4,448 4,595

23 3,094 3,356 3,543 3,722 3,947 4,110 4,268 4,468 4,614

24 3,120 3,380 3,566 3,744 3,968 4,130 4,287 4,486 4,632

25 3,144 3,403 3,588 3,765 3,988 4,149 4,305 4,504 4,649

tabelas 377

BIOESTATISTICA_VOL02.indb 377 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 378 25/06/12 17:24
Tabela 12 - Valores críticos para o coeficiente de correlação de Spearman (rS) para postos

α Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001
n
a Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
4 0,600 1,000 1,000
5 0,500 0,800 0,900 1,000 1,000
6 0,371 0,657 0,829 0,886 0,943 1,000 1,000
7 0,321 0,571 0,714 0,786 0,893 0,929 0,964 1,000 1,000
8 0,310 0,524 0,643 0,738 0,833 0,881 0,905 0,952 0,976
9 0,267 0,483 0,600 0,700 0,783 0,833 0,867 0,917 0,933
10 0,248 0,455 0,564 0,648 0,745 0,794 0,830 0,879 0,903

11 0,236 0,427 0,536 0,618 0,709 0,755 0,800 0,845 0,873


12 0,217 0,406 0,503 0,587 0,678 0,727 0,769 0,818 0,846
13 0,209 0,385 0,484 0,560 0,648 0,703 0,747 0,791 0,824
14 0,200 0,367 0,464 0,538 0,626 0,679 0,723 0,771 0,802
15 0,189 0,354 0,446 0,521 0,604 0,654 0,700 0,750 0,779
16 0,182 0,341 0,429 0,503 0,582 0,635 0,679 0,729 0,762
17 0,176 0,328 0,414 0,485 0,566 0,615 0,662 0,713 0,748
18 0,170 0,317 0,401 0,472 0,550 0,600 0,643 0,695 0,728
19 0,165 0,309 0,391 0,460 0,535 0,584 0,628 0,677 0,712
20 0,161 0,299 0,380 0,447 0,520 0,570 0,612 0,662 0,696

21 0,J56 0,292 0,370 0,435 0,508 0,556 0,599 0,648 0,681


22 0,1’52 0,284 0,361 0,425 0,496 0,544 0,586 0,634 0,667
23 0,148 0,278 0,353 0,415 0,486 0,532 0,573 0,622 0,654
24 0,144 0,271 0,344 0,406 0,476 0,521 0,562 0,610 0,642
25 0,142 0,265 0,337 0,398 0,466 0,511 0,551 0,598 0,630
26 0,138 0,259 0,331 0,390 0,457 0,501 0,541 0,587 0,619
27 0,136 0,255 0,324 0,382 0,448 0,491 0,531 0,577 0,608
28 0,133 0,250 0,317 0,375 0,440 0,483 0,522 0,567 0,598
29 0,130 0,245 0,312 0,368 0,433 0,4 75 0,513 0,558 0,589
30 0,128 0,240 0,306 0,362 0,425 0,467 0,504 0,549 0,580

tabelas 379

BIOESTATISTICA_VOL02.indb 379 25/06/12 17:24


Tabela 12 - Valores críticos para o coeficiente de correlação de Spearman (rS) para postos
(continuação)

α Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001
n
a Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
31 0,126 0,236 0,301 0,356 0,418 0,459 0,496 0,541 0,571
32 0,124 0,232 0,296 0,350 0,412 0,452 0,489 0,533 0,563
33 0,121 0,229 0,291 0,345 0,405 0,446 0,482 0,525 0,554
34 0,120 0,225 0,287 0,340 0,399 0,439 0,475 0,517 0,547
35 0,118 0,222 0,283 0,335 0,394 0,433 0,468 0,510 0,539
36 0,116 0,219 0,279 0,330 0,388 0,427 0,462 0,504 0,533
37 0,114 0,216 0,275 0,325 0,383 0,421 0,456 0,497 0,526
38 0,113 0,212 0,271 0,321 0,378 0,415 0,450 0,491 0,519
39 0,111 0,210 0,267 0,317 0,373 0,410 0,444 0,485 0,513
40 0,110 0,207 0,264 0,313 0,368 0,405 0,439 0,479 0,507

41 0,108 0,204 0,261 0,309 0,364 0,400 0,433 0,473 0,501


42 0,1 07 0,202 0,257 0,305 0,359 0,395 0,428 0,468 0,495
43 0,105 0,199 0,254 0,301 0,355 0,391 0,423 0,463 0,490
44 0,104 0,197 0,251 0,298 0,351 0,386 0,419 0,458 0,484
45 0,103 0,194 0,248 0,294 0,347 0,382 0,414 0,453 0,479
46 0,102 0,192 0,246 0,291 0,343 0,378 0,410 0,448 0,474
47 0,101 0,190 0,243 0,288 0,340 0,374 0,405 0,443 0,469
48 0,100 0,188 0,240 0,285 0,336 0,370 0,401 0,439 0,465
49 0,098 0,186 0,238 0,282 0,333 0,366 0,397 0,434 0,460
50 0,097 0,184 0,235 0,279 0,329 0,363 0,393 0,430 0,456

51 0,096 0,182 0,233 0,276 0,326 0,359 0,390 0,426 0,451


52 0,095 0,180 0,231 0,274 0,323 0,356 0,386 0,422 0,447
53 0,095 0,179 0,228 0,271 0,320 0,352 0,382 0,418 0,443
54 0,094 0,177 0,226 0,268 0,317 0,349 0,379 0,414 0,439
55 0,093 0,175 0,224 0,266 0,314 0,346 0,375 0,411 0,435
56 0,092 0,174 0,222 0,264 0,311 0,343 0,372 0,407 0,432
57 0,091 0,172 0,220 0,261 0,308 0,340 0,369 0,404 0,428

380 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 380 25/06/12 17:24


Tabela 12 - Valores críticos para o coeficiente de correlação de Spearman (rS) para postos
(continuação)

α Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001
n
a Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
58 0,090 0,171 0,218 0,259 0,306, 0,337 0,366 0,400 0,424
59 0,089 0,169 0,216 0,257 0,303 0,334 0,363 0,397 0,421
60 0,089 0,168 0,214 0,255 0,300 0,331 0,360 0,394 0,418

61 0,088 0,166 0,213 0,252 0,298 0,329 0,357 0,391 0,414


62 0,087 0,165 0,211 0,250 0,296 0,326 0,354 0,388 0,411
63 0,086 0,163 0,209 0,248 0,293 0,323 0,351 0,385 0,408
64 0,086 0,162 0,207 0,246 0,291 0,321 0,348 0,382 0,405
65 0,085 0,161 0,206 0,244 0,289 0,318 0,346 0,379 0,402
66 0,084 0,160 0,204 0,243 0,287 0,316 0,343 0,376 0,399
67 0,084 0,158 0,203 0,241 0,284 0,314 0,341 0,373 0,396
68 0,083 0,157 0,201 0,239 0,282 0,311 0,338 0,370 0,393
69 0,082 0,156 0,200 0,237 0,280 0,309 0,336 0,368 0,390
70 0,082 0,155 0,198 0,235 0,278 0,307 0,333 0,365 0,388

71 0,081 0,154 0,197 0,234 0,276 0,305 0,331 0,363 0,385


72 0,081 0,153 0,195 0,232 0,274 0,303 0,329 0,360 0,382
73 0,080 0,152 0,194 0,230 0,272 0,301 0,327 0,358 0,380
74 0,080 0,151 0,193 0,229 0,271 0,299 0,324 0,355 0,377
75 0,079 0,150 0,191 0,227 0,269 0,297 0,322 0,353 0,375
76 0,078 0,149 0,190 0,226 0,267 0,295 0,320 0,351 0,372
77 0,078 0,148 0,189 0,224 0,265 0,293 0,318 0,349 0,370
78 0,077 0,147 0,188 0,223 0,264 0,291 0,316 0,346 0,368
79 0,077 0,146 0,186 0,221 0,262 0,289 0,314 0,344 0,365
80 0,076 0,145 0,185 0,220 0,260 0,287 0,312 0,342 0,363

81 0,076 0,144 0,184 0,219 0,259 0,285 0,310 0,340 0,361


82 0,075 0,143 0,183 0,217 0,257 0,284 0,308 0,338 0,359
83 0,075 0,142 0,182 0,216 0,255 0,282 0,306 0,336 0,357

tabelas 381

BIOESTATISTICA_VOL02.indb 381 25/06/12 17:24


Tabela 12 - Valores críticos para o coeficiente de correlação de Spearman (rS) para postos
(continuação)

α Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001
n
a Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
84 0,074 0,141 0,181 0,215 0,254 0,280 0,305 0,334 0,355
85 0,074 0,140 0,180 0,213 0,252 0,279 0,303 0,332 0,353
86 0,074 0,139 0,179 0,212 0,251 0,277 0,301 0,330 0,351
87 0,073 0,139 0,177 0,211 0,250 0,276 0,299 0,328 0,349
88 0,073 0,138 0,176 0,210 0,248 0,274 0,298 0,327 0,347
89 0,072 0,137 0,175 0,209 0,247 0,272 0,296 0,325 0,345
90 0,072 0,136 0,174 0,207 0,245 0,271 0,294 0,323 0,343

91 0,072 0,135 0,173 0,206 0,244 0,269 0,293 0,321 0,341


92 0,071 0,135 0,173 0,205 0,243 0,268 0,291 0,319 0,339
93 0,071 0,134 0,172 0,204 0,241 0,267 0,290 0,318 0,338
94 0,070 0,133 0,171 0,203 0,240 0,265 0,288 0,316 0,336
95 0,070 0,133 0,170 0,202 0,239 0,264 0,287 0,314 0,334
96 0,070 0,132 0,169 0,201 0,238 0,262 0,285 0,313 0,332
97 0,069 0,131 0,168 0,200 0,236 0,261 0,284 0,311 0,331
98 0,069 0,130 0,167 0,199 0,235 0,260 0,282 0,310 0,329
99 0,068 0,130 0,166 0,198 0,234 0,258 0,281 0,308 0,327
100 0,068 0,129 0,165 0,197 0,233 0,257 0,279 0,307 0,326

382 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 382 25/06/12 17:24


Tabela 13 - Valores críticos para a distribuição de Friedman ( χr )
2

a b

(n) (M)* α: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001

3 2 3,000 4,000

3 3 2,667 4,667 (6,000) 6,000

3 4 2,000 4,500 6,000 6,500 (8,000) (8,000) 8,000

3 5 2,800 3,600 5,200 6,400 (8,400) 8,400 (10,000) (10,000) 10,000

3 6 2,330 4,000 5,330 7,000 8,330 9,000 (10,330) 10,330 12,000

3 7 2,000 3,714 5,429 7,143 8,000 8,857 10,286 11,143 12,286

3 8 2,250 4,000 5,2S0 6,250 7,750 9,000 9,750 12,000 12,250

3 9 2,000 3,556 5,556 6,222 8,000 9,556 10,667 11,556 12,667

3 10 1,800 3,800 5,000 6,200 7,800 9,600 10,400 12,200 12,600

3 11 4,636 3,818 4,909 6,545 7,818 9,455 10,364 11,636 13,273

3 12 1,500 3,500 5,167 6,167 8,000 9,500 10,167 12,167 12,500

3 13 1,846 3,846 4,769 6,000 8,000 9,385 10,308 11,538 12,923

3 14 1,714 3,571 5,143 6,143 8,143 9,000 10,429 12,000 13,286

3 15 1,733 3,600 4,933 6,400 8,133 8,933 10,000 12,133 12,933

4 2 3,600 5,400 (6,000) 6,000

4 3 3,400 5,400 6,600 7,400 8,200 (9,000) (9,000) 9,000

4 4 3,000 4,800 6,300 7,800 8,400 9,600 (10,200) 10,200 11,1 00

4 5 3,000 5,160 6,360 7,800 9,240 9,960 10,920 11,640 12,600

4 6 3,000 4,800 6,400 7,600 9,400 10,200 11,400 12,200 12,800

4 7 2,829 4,886 6,429 7,800 9,343 10371 11,400 12,771 13,800

4 8 2,550 4,800 6,300 7,650 9,450 10,350 11,850 12,900 13,800

4 9 6,467 7,800 9,133 10,867 12,067 14,467

4 10 6,360 7,800 9,120 10,800 12,000 14,640

tabelas 383

BIOESTATISTICA_VOL02.indb 383 25/06/12 17:24


Tabela 13 - Valores críticos para a distribuição de Friedman ( χr )
2

(continuação)

a b

(n) (M)* α: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001

4 11 6,382 7,909 9,327 11,073 12,273 14,891

4 12 6,400 7,900 9,200 11,100 12,300 15,000

4 13 6,415 7,985 7,369 11,123 12,323 15,277

4 14 6,343 7,886 9,343 11,143 12,514 15,257

4 15 6,440 8,040 9,400 11,240 12,520 15,400

5 2 7,200 7,600 8,000 8,000

5 3 7,467 8,533 9,600 10,133 10,667 11,467

5 4 7,600 8,800 9,800 11,200 12,000 13,200

5 5 7,680 8,960 10,240 11,680 12,480 14,400

5 6 7,733 9,067 10,400 11,867 13,067 15,200

5 7 7,771 9,143 10,514 12,114 13,257 15,657

5 8 7,800 9,300 10,600 12,300 13,500 16,000

5 9 7,733 9,244 10,667 12,444 13,689 16,356

5 10 7,76 9,280 10,720 12,480 13,840 16,480

6 2 8,286 9,143 9,429 9,714 10,000

6 3 8,714 9,857 10,810 11,762 12,524 13,286

6 4 9,000 10,286 11,429 12,714 13,511 15,286

6 5 9,000 10,486 11,743 13,229 14,2S7 16,429

6 6 9,048 10,571 12,000 13,619 14,762 17,048

6 7 9,122 10,674 12,061 13,857 15,000 17,612

6 8 9,143 10,714 12,214 14,000 15,286 18,000

6 9 9,127 10,778 12,302 14,143 15,476 18,270

6 10 9,143 10,800 12,343 14,299 15,600 18,514

Para o coeficiente de concordância de Kendall (W), grafadas entre parênteses

384 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 384 25/06/12 17:24


Tabela 14 - Valores críticos para a distribuição de Kolmogorov-Smirnov (D)

α α
n 0,20 0,10 0,05 0,02 0,01 n 0,20 0,10 0,05 0,02 0,01
1 0,900 0,95 0,975 0,990 0,995 21 0,226 0,259 0,287 0,321 0,344
2 0,684 0,776 0,842 0,900 0,929 22 0,221 0,253 0,281 0,314 0,337
3 0,565 0,636 0,708 0,785 0,829 23 0,216 0,247 0,275 0,307 0,330
4 0,493 0,565 0,624 0,689 0,734 24 0,212 0,242 0,269 0,301 0,323
5 0,447 0,509 0,563 0,627 0,669 25 0,208 0,238 0,264 0,295 0,317
6 0,410 0,468 0,519 0,577 0,617 26 0,204 0,233 0,259 0,290 0,311
7 0,381 0,436 0,483 0,538 0,576 27 0,200 0,229 0,254 0,284 0,305
8 0,358 0,410 0,454 0,407 0,542 28 0,197 0,225 0,250 0,279 0,300
9 0,339 0,387 0,430 0,480 0,513 29 0,193 0,221 0,246 0,275 0,295
10 0,323 0,369 0,409 0,457 0,489 30 0,190 0,218 0,242 0,270 0,290
11 0,308 0,352 0,391 0,437 0,468 31 0,187 0,214 0,238 0,266 0,285
12 0,296 0,338 0,375 0,419 0,449 32 0,184 0,211 0,234 0,262 0,181
13 0,285 0,325 0,361 0,404 0,432 33 0,182 0,208 0,231 0,258 0,277
14 0,275 0,314 0,349 0,390 0,418 34 0,179 0,205 0,227 0,254 0,273
15 0,266 0,304 0,338 0,377 0,404 35 0,177 0,202 0,224 0,251 0,269
16 0,258 0,295 0,327 0,366 0,392 36 0,174 0,199 0,221 0,247 0,265
17 0,250 0,286 0,318 0,355 0,381 37 0,172 0,196 0,218 0,244 0,262
18 0,244 0,279 0,309 0,346 0,371 38 0,170 0,194 0,215 0,241 0,258
19 0,237 0,271 0,301 0,337 0,361 39 0,168 0,191 0,213 0,238 0,255
20 0,232 0,265 0,294 0,329 0,352 40 0,165 0,189 0,210 0,235 0,252

- Os valores tabelados correspondem aos pontos Dn;α, tais que: P(Dn ≥ Dn;α ) = α.
- Para n > 40, os valores críticos de Dn podem ser aproximados pelas seguintes expressões:

α
0,20 0,10 0,05 0,02 0,01

1,07 1,22 1,36 1,52 1,63


n n n n n

tabelas 385

BIOESTATISTICA_VOL02.indb 385 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 386 25/06/12 17:24
Tabela 15.1 - Valores críticos para o teste de Durbin-Watson, com α = 0,05

k=1 k=2 k=3 k=4 k=5


n
dL du dL du dL du dL du dL du

15 1,08 1,36 0,95 1,54 0,82 1,75 0,69 1,97 0,56 2,21

16 1,10 1,37 0,98 1,54 0,86 1,73 0,74 1,93 0,62 2,15

17 1,13 1,38 1,02 1,54 0,90 1,71 0,78 1,90 0,67 2,10

18 1,16 1,39 1,05 1,53 0,93 1,69 0,92 I,R7 0,71 2,06

19 1,18 1,40 1,08 1,53 0,97 1,68 0,86 1,85 0,75 2,02

20 1,20 1,41 1,10 1,54 1,00 1,68 0,90 1,83 0,79 1,99

21 1,22 1,42 1,13 1,54 1,03 1,67 0,93 1,81 0,83 1,96

22 1,24 1,43 l,l5 1,54 1,05 1,66 0,96 1,80 0,96 1,94

23 1,26 1,44 1,17 1,54 1,08 1,66 0,99 1,79 0,90 1,92

24 1,27 1,45 1,19 1,55 1,10 1,66 1,01 1,18 0,93 1,90

25 1,29 1,45 1,21 1,55 1,12 1,66 1,04 1,77 0,95 1,89

26 1,30 1,46 1,22 1,55 1,]4 1,65 1,06 1,76 0,98 1,88

27 1,32 1,47 1,24 1,56 1,16 1,65 1,08 1,16 1,01 t86

28 1,33 1,48 1,26 1,56 1,18 1,65 1,10 1,75 1,03 1,85

29 1,34 1,48 1,27 1,56 1,20 1,65 1,12 1,74 1,05 1,84

30 1,35 1,49 1,28 1,57 1,21 1,65 1,14 1,74 1,07 1,83

31 1,16 1,50 1,30 1,51 1,23 1,65 1,16 1,74 1,09 1,83

32 1,37 1,50 1,31 1,57 1,24 1,65 1,18 1,73 1,11 1,82

33 1,38 1,51 1,32 1,58 1,26 1,65 1,19 1,73 1,13 1,81

34 1,39 1,51 1,33 1,58 1,27 1,65 1,21 1,73 l,t5 1,81

35 1,40 1,52 1,34 1,58 1,28 1,65 1,22 1,73 1,16 1,80

36 1,41 1,52 1,35 1,59 1,29 1,65 1,24 1,73 1,18 1,80

37 1,42 1,53 1,36 1,59 1,31 1,66 1,25 1,72 1,19 1,80

38 1,43 1,54 1,37 1,59 1,32 1,66 1,26 1,72 1,21 1,79

39 1,43 1,54 1,38 1,60 1,33 1,66 1,27 1,72 1,22 1,79

40 1,44 1,54 1,39 1,60 1,34 1,66 1,29 1,72 1,23 1,79

tabelas 387

BIOESTATISTICA_VOL02.indb 387 25/06/12 17:24


Tabela 15.1 - Valores críticos para o teste de Durbin-Watson, com α = 0,05
(continuação)

k=1 k=2 k=3 k=4 k=5


n
dL du dL du dL du dL du dL du

45 1,48 1,51 1,43 1,62 1,38 1,67 1,34 1,72 1,29 1,78

50 1,50 1,59 1,46 1,63 1,42 1,67 1,38 1,72 1,34 1,77

55 1,53 1,60 1,49 1,64 1,45 1,68 1,41 1,72 1,38 1,77

60 1,55 1,62 1,51 1,65 1,48 1,69 1,44 1,73 1,41 1,77

65 1,57 1,63 1,54 1,66 1,50 1,70 1,47 1,73 1,44 1,77

70 1,58 1,64 1,55 1,67 1,52 1,10 1,49 1,74 1,46 1,77

75 1,60 1,65 1,57 1,68 1,54 1,71 1,51 1,74 1,49 1,77

80 1,61 1,66 1,59 1,69 1,56 1,72 1,53 1,74 1,51 1,77

85 1,62 1,67 1,60 1,70 1,57 1,12 1,55 1,75 1,52 1,77

90 1,63 1,68 1,61 1,70 1,59 1,73 1,57 1,75 1,54 1,78

95 1,64 1,69 162 1,71 1,60 1,73 1,58 1,75 1,56 1,78

100 1,65 1,69 1,63 1,72 1,61 1,74 1,59 1,76 1,57 1,78

388 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 388 25/06/12 17:24


Tabela 15.2 - Valores críticos para o teste de Durbin-Watson, com α = 0,01

k=1 k=2 k=3 k=4 k=5


n
dL du dL du dL du dL, du dL du

15 0,81 1,07 0,70 1,25 0,59 1,46 0,49 1,70 0,39 1,96

16 0,84 1,09 0,74 1,25 0,63 1,44 0,53 l,66 0,44 1,90

17 0,87 1,10 0,77 1,25 0,67 1,43 0,57 1,30 0,48 1,85

18 0,90 1,12 0,80 1,26 0,71 1,42 0,61 1,60 0,52 1,80

19 0,93 1,13 0,83 1,26 0,74 1,41 0,65 1,58 0,56 1,77

20 0,95 1,15 0,86 1,27 0,77 1,41 0,68 1,57 0,60 1,74

21 0,97 1,16 0,89 1,27 0,80 1,41 0,72 1,55 0,63 1,71

22 1,00 1,17 0,91 1,28 0,83 1,40 0,75 1,54 0,66 1,69

23 1,02 1,19 0,94 1,29 0,86 1,40 0,77 1,53 0,70 1,67

24 1,04 1,20 0,96 1,30 0,88 1,41 0,80 1,53 0,72 1,66

25 1,05 1,21 0,98 1,30 0,90 1,41 0,83 1,52 0,75 1,65

26 1,07 1,22 1,00 1,31 0,93 1,41 0,85 1,52 0,78 1,64

27 1,09 1,23 1,02 1,32 0,95 1,41 0,88 1,51 0,81 1,63

28 1,10 1,24 1,04 1,32 0,97 1,41 0,90 1,51 0,83 1,62

29 1,12 1,25 1,05 1,33 0,99 1,42 0,92 1,51 0,85 1,61

30 1,13 1,26 1,07 1,34 1,01 1,42 0,94 1,51 0,88 1,61

31 1,15 1,27 1,08 1,34 1,02 1,42 0,96 1,51 0,90 1,60

32 1,16 1,28 1,10 1,35 1,04 1,43 0,98 1,51 0,92 1,60

33 1,17 1,29 1,11 1,36 1,05 1,43 1,00 1,51 0,94 1,59

34 1,18 1,30 1,13 1,36 1,07 1,43 1,01 1,51 0,95 1,59

35 l,19 1,31 1,14 1,27 1,08 1,44 1,03 1,51 0,97 1,59

36 1,21 1,32 1,15 1,38 1,10 1,44 1,04 1,51 0,99 1,59

37 1,22 1,32 1,16 1,38 1,11 1,45 1,06 1,51 1,00 1,59

38 1,23 1,33 1,18 1,39 1,12 1,45 1,07 1,52 1,02 1,58

39 1,24 1,34 1,19 1,39 1,14 1,45 1,09 1,52 1,03 1,58

40 1,25 1,34 1,20 1,40 1,15 1,46 l,l0 1,52 1,05 1,58

tabelas 389

BIOESTATISTICA_VOL02.indb 389 25/06/12 17:24


Tabela 15.2 - Valores críticos para o teste de Durbin-Watson, com α = 0,01
(continuação)

k=1 k=2 k=3 k=4 k=5


n
dL du dL du dL du dL, du dL du

45 1,29 1,38 1,24 1,42 1,20 1,48 1,16 1,53 1,11 1,58

50 1,32 1,40 1,28 1,45 1,24 1,49 1,20 1,54 1,16 1,59

55 1,36 1,43 1,32 1,47 1,28 1,51 1,25 1,55 1,21 1,59

60 1,38 1,45 1,35 1,48 1,32 1,52 1,28 1,56 1,25 1,60

65 1,41 1,47 1,38 1,50 1,35 1,53 1,31 1,57 1,28 1,61

70 1,43 1,49 1,40 1,52 1,37 1,55 1,34 1,58 1,31 1,61

75 1,45 1,50 1,42 1,53 1,39 1,56 1,37 1,59 1,34 1,62

80 1,47 1,52 1,44 1,54 1,42 1,57 139 1,60 1,36 1,62

8S 1,48 1,53 1,46 1,55 1,43 1,58 1,41 1,60 1,39 1,63

90 1,50 1,54 1,47 1,56 1,45 1,59 1,43 1,61 1,41 1,64

95 1,51 155 1,49 1,57 1,47 1,60 1,45 1,62 1,42 1,64

100 1,52 1,56 1,50 1,58 1,48 1,60 1,46 1,63 1,44 1,65

390 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 390 25/06/12 17:24


Tabela 16.1 - Valores dos coeficientes α N-i+1 para o teste de normalidade W de Shapiro-Wilk

i N: 2 3 4 5 6 7 8 9 10

1 0,7071 0,7071 0,6872 0,6646 0,6431 0,6233 0,6052 0,5888 0,5739

2 0,0000 0,1677 0,2413 0,2806 0,3031 0,3164 0,3244 0,3291

3 0,0000 0,0875 0,1401 0,1743 0,1976 0,2141

4 0,0000 0,0561 0,0947 0,1224

5 0,0000 0,0399

i N: 11 12 13 14 15 16 17 18 19 20

1 0,5601 0,5475 0,5359 0,5251 0,5150 0,5056 0,4968 0,4886 0,4808 0,4734

2 0,3315 0,3325 0,3325 0,3318 0,3306 0,3290 0,3273 0,3253 0,3232 0,3211

3 0,2260 0,2347 0,2412 0,2460 0,2495 0,2521 0,2540 0,2553 0,2561 0,2565

4 0,1429 0,1586 0,1707 0,1802 0,1878 0,1939 0,1988 0,2027 0,2059 0,2085

5 0,0695 0,0922 0,1099 0,1240 0,1353 0,1447 0,1524 0,1587 0,1641 0,1686

6 0,0000 0,0303 0,0539 0,0727 0,0880 0,1005 0,1109 0,1197 0,1271 0,1334

7 0,0000 0,0240 0,0433 0,0593 0,0725 0,0837 0,0932 0,1013

8 0,0000 0,0196 0,0359 0,0496 0,0612 0,0711

9 0,0000 0,0163 0,0303 0,0422

10 0,0000 0,0140

tabelas 391

BIOESTATISTICA_VOL02.indb 391 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 392 25/06/12 17:24
Tabela 16.2 – Valores críticos da estatística W de Shapiro-Wilk

Nível de significância α
N
0,01 0,02 0,05 0,10 0,50 0,90 0,95 0,98 0,99
3 0,753 0,756 0,767 0,789 0,959 0,998 0,999 1,000 1,000
4 0,0687 0,707 0,748 0,792 0,935 0,987 0,992 0,996 0,997
5 0,686 0,715 0,762 0,806 0,927 0,979 0,986 0,991 0,993

6 0,713 0,743 0,788 0,826 0,927 0,974 0,981 0,986 0,989


7 0,730 0,760 0,803 0,838 0,928 0,972 0,979 0,985 0,988
8 0,749 0,778 0,818 0,851 0.932 0,972 0,978 0,984 0,987
9 0,764 0,791 0,829 0,859 0,935 0,972 0,978 0,984 0,986
10 0,781 0,806 0,842 0,869 0,938 0,972 0,978 0,983 0,986

11 0,792 0,817 0,850 0,876 0,940 0,973 0,979 0,984 0,986


12 0,805 0,828 0,859 0,883 0,943 0,973 0,979 0,984 0,986
13 0,814 0,837 0,866 0,889 0,945 0,974 0,979 0,984 0,986
14 0,825 0,846 0,874 0,895 0,947 0,975 0,980 0,984 0,986
15 0,835 0,855 0,881 0,901 0,950 0,975 0,980 0,984 0,987

16 0,844 0,863 0,887 0,906 0,952 0,976 0,981 0,985 0,987


17 0,851 0,869 0,892 0,910 0,954 0,977 0,981 0,985 0,987
18 0,858 0,874 0,897 0,914 0,956 0,978 0,982 0,986 0,988
19 0,863 0,879 0,901 0,917 0,957 0,978 0,982 0,986 0,988
20 0,868 0,884 0,905 0,920 0,959 0,979 0,983 0,986 0,988

21 0,873 0,888 0,908 0,923 0,960 0,980 0,983 0,987 0,989


22 0,878 0,892 0,911 0,926 0,961 0,980 0.984 0,987 0,989
23 0,881 0,895 0,914 0,928 0,962 0,981 0,984 0,987 0,989
24 0,884 0,898 0,916 0,930 0,963 0,981 0,984 0,987 0,989
25 0,888 0,901 0,918 0,931 0,964 0,981 0,985 0,988 0,989

26 0,891 0,904 0,920 0,933 0,965 0,982 0,985 0,988 0,989


27 0,894 0,906 0,923 0,935 0,965 0,982 0,985 0,988 0,990
28 0,996 0,908 0,924 0,936 0,966 0,982 0,985 0,988 0,990
29 0,898 0,910 0,926 0,937 0,966 0,982 0,985 0,988 0,990
30 0,900 0,912 0,927 0,939 0,967 0,983 0,985 0,988 0,900

tabelas 393

BIOESTATISTICA_VOL02.indb 393 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 394 25/06/12 17:24
Tabela 17 - Números aleatórios

14835 07362 26733 66337 20020 46848 24360 67813 17531 96160
84156 22328 08704 06439 64789 19606 74597 42899 36235 91089
07439 84935 67799 78493 03976 72783 31131 60452 23680 88212
60562 06499 56274 89528 77248 82823 29149 02415 46849 34372
92554 02182 58212 23811 74399 01856 50828 05868 60178 36120
57154 33430 44547 19479 28029 98735 02523 07352 26115 05784
33592 35545 09878 39291 05498 20618 13325 88848 05151 10298
63113 59196 90890 52945 95027 82655 76150 00102 23247 38135
53456 15261 00582 37612 11971 92844 44112 48161 15426 26704
89202 77388 51468 91049 19894 02188 13318 22280 34959 55245
88891 23578 84958 96820 99600 94748 42738 57576 79063 07765
84885 80345 96016 01251 09348 28560 11147 01657 00755 43642
38697 69389 98345 73048 29507 18526 67736 56657 49748 02160
39871 02677 13729 60302 49365 36310 29226 52028 93731 58365
33006 74668 41831 49768 95000 21495 32144 09647 64404 36257
07154 82834 40799 10422 81214 26325 65495 48346 27304 76266
31432 17859 22968 94194 06884 34888 65166 25467 35774 61056
56960 26638 36632 91651 29180 98155 01805 51464 49138 05710
02355 56388 09067 75695 25493 97169 22686 21475 31110 53045
82103 63195 65527 66243 96807 69165 95289 62930 66343 83711
50825 82955 24147 75012 20103 60267 04051 11654 81456 02920
03628 55427 72771 11270 13391 42267 25646 96957 39640 34334
15891 95262 89450 10087 92371 99885 94941 46284 77397 40100
50811 44401 92573 84821 49314 34342 01290 91163 37248 35041
59943 24172 16959 76008 04121 99199 55271 38518 07155 97528
45342 34103 48817 53536 03630 80439 17091 77911 87900 91034
74881 27536 54074 82623 64322 32241 66784 14590 17966 72187
77329 75480 19058 91100 21175 87860 98479 87996 39068 14348
35196 84012 03780 47762 94498 89812 71238 54070 43360 61395
84371 38352 85742 01610 41863 59977 58513 79876 87152 50249
22980 08123 98993 35609 45406 57914 96884 23851 65979 03903
58486 17927 91107 83002 90223 04731 88063 95720 91892 01246
61376 95034 53865 29670 13302 67790 92887 69725 98265 90459
23756 35575 07730 38317 40512 95941 66943 68526 24235 38609
04044 43464 90762 94781 68427 50021 82905 33939 41037 54417
60047 50681 64384 42320 46016 51491 23656 55597 47347 18863
83531 86235 40884 45400 96397 37285 06290 04315 05773 18621
06544 92307 69731 53410 63161 31227 10973 87011 59483 09370
49791 25181 29805 45135 94955 77642 45637 28200 77295 40800
21295 61442 44858 73413 19594 59741 39278 78953 24769 77854

tabelas 395

BIOESTATISTICA_VOL02.indb 395 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 396 25/06/12 17:24
Referências Bibliográficas

ADES, A. E.; HIGGINS. J. P. T. The Interpretation of Random-Effects Meta-Analysis in


Decision Models. Medical Decision Making, v. 12, p. 646-654, 2005.
ARMITAGE, P.; BERRY, G. The planning statistical investigations. In: ______ Statistical
methods in medical research. 2. ed. Oxford, Blackwell, 1987.
ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR 10520: informação e docu-
mentação: apresentação de citações em documentos. Rio de Janeiro, 2002.
BANERJEE, M. et al. “Beyond Kappa: A Review of Interrater Agreement Measures”
The Canadian Journal of Statistics, vol. 27, n. 1, p. 3-23, 1999.
BEGHETTO, M. G.; ASSIS, M. C. S; LUFT, V.C.; Mello, E. D. Precisão e acurácia na afe-
rição do peso corporal em adultos hospitalizados. Rev Assoc Med Bras, v. 52,
n. 1, p. 23-7, 2006.
BEIGUELMAN, B. Curso prático de bioestatística. 5. ed. Ribeirão Preto: FUNPEC-
Editora, 2002.
BLAND, J. M.; ALTMAN, D. G. Measurement error and correlation coefficients. BMJ,
v. 313, p. 41-2, 1996.
BLAND, J. M.; ALTMAN, D. G. Measuring agreement in method comparison studies.
Statistical Methods in Medical Research. Stat Methods Med Res, v. 8, n. 2,
p.135-60, 1999.
BLAND, J. M.; ALTMAN, D. G. Statistical method for assessing agreement between two
methods of clinical measurement. The Lancet, v. 1, n. 8476, p. 307-10, 1986.

BIOESTATISTICA_VOL02.indb 397 25/06/12 17:24


BUSSAB, W. O.; MORETTIN, P. Estatística básica. 4 ed. São Paulo, Atual, 1987.
BUSTAMENTE-TEIXEIRA, M. T.; FAERSTEIN, E. LATORRE, M. R. Técnicas de análise
de sobrevida. Cadernos de Saúde Publica, Rio de Janeiro, v. 18, n. 3, p. 579-
594, 2002.
CALLEGARI-JACQUES, S. Bioestatística - princípios e aplicações. 1 ed. Porto Alegre:
Artmed Editora, 2003.
CHOEN, J. A coefficient of agreement for nominal scales. Educ Psychol Meas, v. 20,
p. 37-46, 1960.
DAWSON, B.; TRAPP, R. G. Bioestatística básica e clínica. 3 ed. Rio de Janeiro, RJ:
McGraw-Hill Interamericana do Brasil Ltda., 2003.
DERSIMONIAN, R.; LAIRD, N. Meta-analysis in Clinical Trials. Controlled Clinical
Trials, v. 7, p. 177-188, 1986.
DOWNING, D.; CLARK, J. Estatística Aplicada. 1 ed. São Paulo, SP: Editora Saraiva,
2000.
DUPONT, W. D. Power and sample size calculations. Controlled Clinical Trials, v. 11,
p. 116-128, 1990.
FERREIRA, A.B.H. Novo Dicionário Aurélio em CD-ROM. Versão 5.0. Curitiba, PR:
Editora Positivo, 2005
FLEISS, J. L. Statistical methods for rates and proportions. New York: John Wiley,
1981. p. 212-236.
FLEISS, J. L.; COHEN, J. “The equivalence of weighted kappa and the intraclass cor-
relation coefficient as measures of reliability”. Educational and Psychological
Measurement, v. 33, p. 613—619, 1973.
FLEISS, J. L.; GROSS, A. J. Meta-analysis in epidemiology, with special reference to
studies of the association between exposure to environmental tobacco smoke
and lung cancer: A critique. J Clin Epidemiol, v. 44, p. 127-39, 1991.
FLETCHER, R. H.; FLETCHER S. W.; WAGNER E. H. Epidemiologia Clínica: Elementos
Essenciais. 3 ed. Porto Alegre, RS: Artes Médicas, 1996.
FLETCHER, R. H.; FLETCHER S. W.; WAGNER, E. H. Epidemiologia Clínica: Bases
Científicas da Conduta Médica. 1 ed. Porto Alegre: Artes Médicas, 1989.
GAVAGHAN, D. J.; MOORE, A. R.; MCQAY, H. J. An evaluation of homogeneity tests in
meta-analysis in pain using simulations of patient data. Pain, v. 85, p. 415-24,
2000.

398 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 398 25/06/12 17:24


GREENLAND, S. A simple method to calculate the confidence interval of a stan-
dardized mortality ratio. American Journal of Epidemiology, v. 133, n. 2, p.
212-213, 1990.
GREENLAND, S.; ROBINS, J. M. Estimation of common effect parameter from sparse
follow up data. Biometrics, v. 41, p. 55-68, 1985.
GREENLAND, S.; SALVAN, A. Bias in the one-step method for pooling study results.
Statistics in Medicine, v. 9, p. 247-252, 1990.
HEDGES, L. V.; PIGOTT, T. D. The power of statistical tests in meta-analysis,
Psychological Methods, v. 6, p. 203-217, 2001.
HIGGINS, J. P. T.; THOMPSON, S. G. Quantifying heterogeneity in a meta-analysis.
Statistics in Medicine, v. 21, p. 1539-1558, 2002.
HIGGINS, J. P. T.; THOMPSON, S. G.; DEEKS, J. J.; et al. Measuring inconsistency in
meta-analyses. British Medical Journal, v. 327, p. 557-560, 2003.
HOUWELINGEN, H. C. V.; ARENDS, L. R.; STIJNEN, T. Advanced methods in meta-
-analysis: multivariate approach and meta-regression. Stat Med, v. 21, p.
589-624, 2002.
HULLEY, S. B.; CUMMINGS, S. R.; BROWNER, W. S. et al. Delineando a pesquisa clí-
nica – uma abordagem epidemiológica. 2 ed. Porto Alegre, RS: Artmed Editora,
2001.
IBGE: Normas de apresentação tabular. 3. ed. Rio de Janeiro, 1993.
JEKEL, J. F.; ELMORE, J. G.; KATZ, D. L. Epidemiologia, Bioestatística e medicina pre-
ventiva. 2 ed. Porto Alegre, RS: Artmed: Editora, 2004.
KAPLAN, E. L.; MEIER, P. Non parametric estimation from incomplete observation.
Journal of the American Statistics Association, v. 53, p. 457-481, 1958.
KIRKWOOD, B. R. Essentials of medical statistics. Oxford: Blackwell, 1988.
LACATOS, E. M.; MARCONE, M. A. Metodologia Científica. 2 ed. São Paulo: Atlas,
1991.
LEMESHOW, S.; HOSMER, DAVID. Adequacy of sample size in health studies.
Chichester, John Wiley, 1990.
LEVY, P.; LEMESHOW, S. Sampling for health professionals. Belmont, LLP, 1980.
LEWIS, S.; CLARKE, M. Forest plots: trying to see the wood and the trees. BMJ, v.
322, p.1479-80, 2001.
LOVATTO, P.A. et al. Meta-análise em pesquisas científicas: enfoque em metodolo-
gias. R Bras Zootec, v. 36, supl. 2008, p. 285-294, 2007.

tamanho da amostra e randomização 399

BIOESTATISTICA_VOL02.indb 399 25/06/12 17:24


LWANGA, S. K.; LEMESHOW, S. Sample size determination in health studies: a prac-
tical manual. Geneva, World Health Organization, 1991.
MARCANTONIO, A. T.; SANTOS, M. M.; LEHFELD, N. A. Elaboração e divulgação do
trabalho científico. São Paulo: Atlas, 1993.
MEDRONHO, R. A.; CARVALHO, D. M.; BLOCH, K. V.; LUIZ, R. R. et al. Epidemiologia.
1 ed. São Paulo, SP: Editora Atheneu, 2005.
MOTTA, V. T.; WAGNER, M. B. Bioestatística. 1 ed. Caxias do Sul, RG: Robe Editorial,
2003.
NETER, J.; WASSERMAN, W.; KUTNER, M. H. Planning sample sizes, nonprametric
tests, and random ANOVA model. In: _____ Applied linear statistical models:
regression, analysis of variance and experimental designs. 3. ed. Boston,
Irwin, 1990. p. 633-42.
NETO, B. B.; SCARMINO, I. S.; BRUNS, R. E. Como fazer experimento. 2 ed. Campinas
, São Paulo: Editora da Unicamp, 2002.
NETO, B. B.; SCARMINO, I. S.; BRUNS, R. E. Como fazer experimento. 3 ed. Campinas
, São Paulo: Editora da Unicamp, 2007.
OLIVEIRA, S. L. Tratado de metodologia científica: Projetos de pesquisas, TGI, TCC,
monografias, dissertações e teses. São Paulo: Pioneira, 1997.
PEREIRA, M. G. Epidemiologia, Teoria e Prática. 1 ed. Rio de Janeiro, RJ: Guanabara
Koogan, 1995.
RODRIGUES, M. I.; IEMMA, A. F. Planejamento de experimentos e otimização de pro-
cessos. 1 ed. Campinas, São Paulo: Casa do Pão Editora, 2005.
ROTHMAN, K. J. Modern Epidemiology. Boston, Little Brown, 1986. p.23-34.
SACKETT, D. L. Bias in analytic research. J Chron Dis, v. 32, p. 51-63, 1979.
SEVERINO, A. J. Metodologia do trabalho científico. 20 ed. São Paulo: Cortez, 1996.
SIEGEL, S. Estatística Não Paramétrica. São Paulo: 1 ed. Editora McGraw-Hill do
Brasil Ltda., 1975.
SIEGEL, S.; CASTELLAN, N. Nonparametric Statistics for the Behavioral Sciences. 2.
ed. New York: McGraw-Hill, 1988. p. 284-285.
SILVA, C. R. O. Metodologia e organização do projeto de pesquisa. 1 ed. Fortaleza,
CE: Centro Federal de Educação Tecnológica do Ceará, 2004.
SILVA, E. L.; MENEZES, E. M. Metodologia da pesquisa e elaboração de dissertação. 3
ed. Florianópolis, SC: Universidade Federal de Santa Catarina, 2001.

400 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 400 25/06/12 17:24


SIM, J.; WRIGHT, C. C. The Kappa Statistic in Reliability Studies: Use, Interpretation,
and Sample Size Requirements. Physical Therapy, v. 85, p. 257-268, 2005.
SNEDECOR, G. W.; COCHRAN, W. G. Statistical methods. 6th ed. Iowa: Iowa State
University Press, 1967. 505 p.
STEEL, R. G. D, TORRIE, J. H. Principles and procedures of statistics. 2nd ed. New
York: Mc Graw-Hill, 1980. 633 p.
STEVENSON, W. J. Estatística Aplicada à Administração.1 ed. São Paulo, SP: Editora
Harper & Row do Brasil Ltda., 1981.
TRIOLA, M. F. Introdução à Estatística. 7 ed. Rio de Janeiro, RJ: Livros Técnicos e
Científicos Editora S.A., 1999.
VELÁSQUEZ-MELÉNDEZ, G.; PIMENTA, A. M.; KAC G. Epidemiologia do sobrepeso
e da obesidade e seus fatores determinantes em Belo Horizonte (MG), Brasil:
estudo transversal de base populacional. Rev Panam Salud Publica, v. 16, n. 5,
p. 308-14, 2004.
VIEIRA, S. Metodologia científica para a área de saúde. São Paulo, Sarvier, 1984. p.
77-82.

tamanho da amostra e randomização 401

BIOESTATISTICA_VOL02.indb 401 25/06/12 17:24


402 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 402 25/06/12 17:24


Índice Remissivo

A do qui-quadrado 497
Acurácia 558 do resíduo ajustado 504
Ajuste do modelo de regressão 703 do resíduo padronizado 503
Aleatoriedade 469 dos efeitos dos fatores 702
Análise dos indicadores da correlação múltipla
da regressão 472 652
de resíduos 472 Codificação dummy 651, 661
de resíduos padronizados 503 Coeficiente
de sobrevida 671 angular 463
de variância 704 de correlação 472
de variância não-paramétrica 635 de correlação de Pearson 454
do quadro vital 673 de correlação de Spearman 587
multivariada 601 de correlação múltipla 652
ANOVA de correlação produto-momento 454
de dois critérios 613 de determinação 460
de múltiplos critérios 629 de determinação múltipla 653
de um critério 613 de determinação múltipla ajustado 653
Aplicação da regressão linear simples 471 de regressão 654
B kappa 593
Base da ANOVA 611 linear 650
Bases conceituais da estatística multivariada Combinação de múltiplos testes
602 diagnósticos 563
Behrens-Fisher 439 Condição
Bloco 614 de normalidade 468
C Condições para o uso da regressão linear
Cálculo 468
da razão de chance combinada 689 Contrabalanço 551, 552
da razão de risco 685 Correção
das contagens esperadas 496 de continuidade 508
das percentagens 497 de Welch-Satterthwaite 436
do coeficiente de regressão de Yates 508
padronizado 654 Covariância 454
do erro de estimação 430 Curva

Índice Remissivo 403

BIOESTATISTICA_VOL02.indb 403 25/06/12 17:24


de sobrevida 676 mutuamente excludentes 528
ROC 554 não-independentes 530
D Experimento 527
Determinação fatorial completo 710
da reta de regressão 463 fatorial incompleto 693
do coeficiente de spearman 588 fatorial no Minitab 709
do intervalo de confiança para a média Experimentos Fatoriais 691
de amostras pareadas 446 F
do intervalo de confiança para a média Fórmula
populacional 429 para calcular o teste t pareado 443
Diagrama para calcular o valor t 431
de dispersão 451, 452 H
de pontos 452 Homocedasticidade 469
Diferença de risco 538 I
Distribuição Indicadores de um teste diagnóstico 548
Qui-Quadrado 489 Interação entre fatores 694
t DE STUDENT 423 Interpretação do valor r 455
E Intervalo de confiança para a média 625
Efeito L
principal de um fator 698 Linearidade 469
simples de um fator 697 Linha
Ensaio 527 de melhor ajuste 461
Ensaio probabilístico 525 de regressão 461
Equação de regressão 461–470 M
Erro Matriz de correlação 652
falso-negativo 545 Medidas de Associação 530
falso-positivo 549 Método
padrão estimado 424 Atuarial 673
verdadeiro-negativo 545 de Kaplan-Meier 677
verdadeiro-positivo 545 de mínimos quadrados 462
Erro experimental 614 produto-limite de Kaplan-Meier 677
Escolha do teste estatístico 605 Modelo
Espaço amostral 528 de regressão logística múltipla 665
Especificidade 548 de regressão logística simples 662
combinada 565 de regressão múltipla escalonada 655
Estatística linear geral 604
do qui-quadrado de Mantel-Haenszel O
673 Objetivos da Estatística Multivariada 604
Durbin-Watson 653 Odds ratio 535
t 653 One way ANOVA 613
estimativa conjunta das variâncias 432 Operações com probabilidades 528
Estratégia de modelagem reduzida 667 P
Evento 527 Ponto de corte 551
Eventos Porcentagem
independentes 529 de Risco Atribuível 539

404 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 404 25/06/12 17:24


de Risco Atribuível na População 540 Combinada 565
Prevalência 558 Sinal da correlação 456
Probabilidade Superfície de resposta no Minitab 727
acumulada de sobrevida 674 T
anterior 530 Tabela de análise de variância 617
pós-teste 560 Tabelas de contingência 490
pré-teste 558, 560 de dupla entrada 490
Problema de Behrens-Fisher 439 Taxa de erro
Propriedades da distribuição t de student falso-negativo 548
427 falso-positivo 549
R Teorema de Bayes 570
Razão Teoria da probabilidade 525
crítica 436 Termo de erro 603
de chances 536 Teste
de Probabilidade Negativa 562 ANOVA 611
de Probabilidade Positiva 562 de Bonferroni 628
de probabilidades 561 de Cochran para variâncias iguais 438
de risco 685 de concordância Kappa 593
de verossimilhança 561 de Dunn 641
Regra de Friedman 644
da adição 528 de hipótese para a regressão linear 466
da multiplicação 529 de hipótese para correlação 458
Regressão de hipótese para o coeficiente de
em direção à média 461 spearman 591
escalonada 655 de homogeneidade 435
linear múltipla 649 de homogeneidade para duas variâncias
linear simples 461–476 435
logística múltipla 661 de Kolmogorov-Smirnov 478
logística simples 661 de Kruskal-Wallis 635
múltipla 649 de Shapiro-Wilk 482
para variável categórica 670 de Student-Newman-Keuls 626
Relação entre sensibilidade e especificidade do logrank 681
550 do qui-quadrado 495
Repetição 614 do qui-quadrado da homogeneidade
Requisitos 498
para usar o teste do qui-quadrado 511 do qui-quadrado da independência 498
para uso da ANOVA 616 do qui-quadrado de aderência 498
resíduos 462, 469 do qui-quadrado de McNemar 489
reta de regressão 463 exato de fisher 520
Risco Atribuível 538 f 611
na População 540 f para variâncias iguais 436
risk ratio 533 padrão-ouro 546
S paramétrico versus não-paramétrico
Screening test 544 596
Sensibilidade 548 Q 641

Índice Remissivo 405

BIOESTATISTICA_VOL02.indb 405 25/06/12 17:24


t de Student 423
t de Wilcoxon 582
t’ para amostras independentes com
variâncias desiguais 439
t para amostras independentes com
variâncias iguais 433
t para amostras pareadas 442
t pareado 442
Tukey 620
U de Wilcoxon-Mann-Whitney 576
Testes
de aderência 477
de bondade de ajuste 478
de comparações múltiplas 620
de rastreamento diagnóstico 543
de significância estatística 681
em paralelo 565
em série 567
para variáveis ordinais 575
Tipos de ANOVA 613
Tratamento 614
Two way ANOVA 616
V
Valor
crítico da distribuição 436
preditivo Negativo 559
preditivo Positivo 559
r 455
Valores preditivos 559
Variância
dentro dos grupos 611
entre grupos 611
média dentro dos grupos 614
residual 614
total 611
W
Welch-Satterthwaite 436

406 Bioestatística aplicada à Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 406 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 407 25/06/12 17:24
BIOESTATISTICA_VOL02.indb 408 25/06/12 17:24

Você também pode gostar