Você está na página 1de 408

BIOESTATSTICA

Aplicada Pesquisa Experimental


BIOESTATISTICA_VOL02.indb 1 25/06/12 17:20
BIOESTATISTICA_VOL02.indb 2 25/06/12 17:20
MAURO J OS FONTELLES
Doutor em Cirurgia pela Faculdade de Cincias Mdicas da Unicamp
Professor das Disciplinas de Anatomia Humana e Bioestatsca da
Universidade do Estado do Par (UEPA).
Membro Titular do Colgio Brasileiro de Cirurgies (TCBC).
Membro da Associao Brasileira de Educao Mdica (ABEM).
Membro da Associao Brasileira de Mdicos Escritores (SOBRAMES).
BIOESTATSTICA
Aplicada Pesquisa Experimental
VOLUME 2
BIOESTATISTICA_VOL02.indb 3 25/06/12 17:20
Copyright 2012 Editora Livraria da Fsica
1
a
edio
Direo editorial Jos Roberto Marinho
Editor-assistente Victor Pereira Marinho

Capa Ana Maria Hitomi/Typodesign
Projeto grfco e diagramao Typodesign
Edio revisada segundo o Novo Acordo Ortogrfco da Lngua Portuguesa
Dados Internacionais de Catalogao na Publicao (CIP)
(Cmara Brasileira do Livro, SP, Brasil)
Fontelles, Mauro Jos
Bioestatstica aplicada pesquisa experimental: volume 2/
Mauro Jos Fontelles. So Paulo:
Editora Livraria da Fsica, 2012.
Bibliografa
ISBN 978-85-7861-138-5

1. Bioestatstica 2. Pesquisa - Experincias I. Ttulo.
12-01764 CDD-570.15195
ndice para catlogo sistemtico
1. Bioetatstica e pesquisa experimental:
Cincias biolgicas 570.15195

Todos os direitos reservados. Nenhuma parte desta obra poder ser reproduzida
sejam quais forem os meios empregados sem a permisso da Editora.
Aos infratores aplicam-se as sanes previstas nos artigos 102, 104, 106 e 107
da Lei no 9.610, de 19 de fevereiro de 1998

Editora Livraria da Fsica
www.livrariadafsica.com.br
BIOESTATISTICA_VOL02.indb 4 25/06/12 17:20
BIOESTATISTICA_VOL02.indb 5 25/06/12 17:20
BIOESTATISTICA_VOL02.indb 6 25/06/12 17:20
querida esposa Marilda, companheira inseparvel, que
por sua dedicao incondicional famlia,
propiciou momentos tranquilos para que esta obra
pudesse ser concluda.
Aos filhos Gustavo e Renata.
Orgulhosos admiradores deste autor.
minha me Celina, corao bondoso a perdoar
os longos perodos de ausncia do filho, no por falta
de lembranas, mas escrever preciso.
BIOESTATISTICA_VOL02.indb 7 25/06/12 17:20
BIOESTATISTICA_VOL02.indb 8 25/06/12 17:20
Prefcio
Quando fui gentilmente convidado para fazer o prefcio deste livro, senti-me pres-
tigiado e contente, mas, conhecendo na sua plenitude o que pretendia a referida obra,
confesso que sofri. Uma vez que sempre enfrentei, de frente, as dificuldades da vida, e,
se era este, um grande desafio, dispus-me a enfrent-lo.
A histria deste livro teve incio h muitos anos atrs, quando o Professor Mauro
Fontelles veio at ns, na Universidade Estadual de Campinas, para realizar, sob minha
orientao, suas teses de Mestrado e Doutorado, as quais foram concludas e defendidas
com raro brilhantismo. Como seu orientador, pude, de perto, acompanhar o interesse e
a necessidade deste Professor em adquirir, em curto prazo, todo o aprendizado relativo
Bioestatstica, o qual era exigido para os seus estudos, nas suas teses. A poca, alm
de ter demonstrado ser um mdico detentor de vasto conhecimento clnico, a par de
suas excelentes qualidades como exmio cirurgio e pesquisador de mo cheia, dedi-
cou-se com muito afinco, adquirindo vasta experincia sobre o assunto, tornando-se,
consequentemente, um especialista na rea, o que lhe conferiu uma grande vanta-
gem sobre os estaticistas disponveis. Com este cabedal, soube muito bem aplicar seus
conhecimentos, quando, ento, passou a oferecer uma anlise crtica mais apurada
e minuciosa em seus trabalhos de pesquisa. Assim, ao apreciarmos o vasto contedo
desta obra, temos a certeza que ser de grande valia para estudantes, professores e
pesquisadores, pois, talvez nenhuma outra rea do saber tenha expandido tanto seus
horizontes quanto a Bioestatstica, a qual tem sido amplamente empregada no campo
da pesquisa e, em decorrncia desta grande expanso e do intercmbio com outras
BIOESTATISTICA_VOL02.indb 9 25/06/12 17:20
reas de conhecimento, vem contribuindo de forma decisiva para tornar a rotina do
pesquisador, atravs de leitura de livros como este que ora temos a rara oportunidade
de apreciar, um trabalho mais produtivo e interessante.
Desta forma, o valor altamente relevante desta obra esclarecer dvidas e apre-
sentar solues que a pesquisa nos impe, de modo a abrir um novo caminho que permita
sua aplicao direta em estudos de campo ou laboratoriais, sejam clnicos ou experi-
mentais. Nesta atividade, ocorre um fato notrio: quando os trabalhos de pesquisa so
concludos e, na nsia de comunicar os seus resultados em congressos ou publicaes,
existe sempre a necessidade de divulgar estes achados com uma preciso estatstica que
permita avaliaes mais acuradas e anlises justas dentro da metodologia cientfica.
Atualmente, em grande parte das publicaes, a Bioestatstica disposio muitas
vezes aplicada por profissional no mdico, o que, no entendimento do pesquisador,
torna-a frequentemente confusa ou no expressa a grandeza da avaliao clnica ou
experimental, da a necessidade de respaldo de algo mais profundo, sendo esta a carac-
terstica do livro em questo, o qual, dentro do esprito crtico do autor, passa a oferecer
uma tica diferente para o entendimento desta importante ferramenta de pesquisa.
Portanto, trata a presente obra, de um livro muito bem planejado e bastante did-
tico, pois aborda os aspectos da Bioestatstica mais utilizados em projetos de pesquisa
na rea das Cincias da Sade. Destarte, um de seus objetivos fornecer ao pesquisador
iniciante e alunos dos cursos de graduao e ps-graduao, um texto direto e de fcil
compreenso, tornando o aprendizado desta importante cincia uma tarefa mais sim-
ples e de maior aplicao. Assim, o lanamento deste livro a coroao dos esforos do
autor para a aplicao prtica da parte dos interessados pelo tema, sobre o qual tenho
a certeza que alcanar todos os seus objetivos, de modo a contribuir para a formao
dos profissionais dos cursos de graduao e como fonte de complementao de conheci-
mento das reas da sade e de outros profissionais de reas correlatas, sendo, portanto,
motivo de jbilo e muito orgulho para o autor, pois contribui de forma inegvel para
todos que se interessam pelo assunto por ele abordado.
A todos e a todas, fica aqui o convite para que a leitura deste livro seja um
estmulo ao consciente que traduza o conhecimento, em resposta s necessidades
acadmicas do nosso pas.
Dr. Mario Mantovani (in memorian).
Professor Titular do Departamento de Cirurgia da Unicamp.
BIOESTATISTICA_VOL02.indb 10 25/06/12 17:20
SUMRIO
VOLUME 2

Parte III TESTES DE HIPTESE PARAMTRICOS ................................................. 17
11. Teste t de Student ............................................................................................... 19
11.1. A distribuio t de Student ......................................................................... 19
11.2. O teste t de Student ................................................................................... 27
11.2.1. Teste t para amostras independentes com varincias iguais .............. 29
11.2.2. Teste t para amostras independentes com varincias desiguais ......... 35
11.2.3. Teste t para amostras pareadas (emparelhadas) ............................... 38
12. Correlao e regresso linear simples .................................................................. 45
12.1. Correlao linear simples ............................................................................ 46
12.1.1. Diagrama de disperso ..................................................................... 48
12.1.2. Coefciente de correlao produto-momento (r) ................................ 50
12.1.3. Teste de hiptese para correlao ..................................................... 54
12.1.4. Coefciente de determinao (r
2
) ........................................................ 56
12.2. Regresso linear simples ............................................................................ 57
12.2.1. Determinao da reta de regresso ................................................... 59
12.2.2. Teste de hiptese para regresso linear ............................................. 62
12.2.3. Anlise de resduos ........................................................................... 66
13. Testes de aderncia ............................................................................................ 73
13.1. Teste Kolmogorov-Smirnov (teste D) ........................................................... 75
13.2. Teste de Shapiro-Wilk (teste W) .................................................................. 78
Parte IV TESTES DE HIPTESE NO-PARAMTRICOS .......................................... 83
14. Distribuio qui-quadrado ................................................................................... 85
14.1. Tabelas de contingncia ............................................................................. 86
14.2. A distribuio qui-quadrado ........................................................................ 89
14.3. Teste do qui-quadrado ............................................................................... 91
14.3.1. Teste do qui-quadrado da independncia .......................................... 95
BIOESTATISTICA_VOL02.indb 11 25/06/12 17:20
14.3.2. Teste do qui-quadrado da homogeneidade ....................................... 97
14.3.3. Teste do qui-quadrado de aderncia (ajustamento) ............................ 101
14.4. Teste do qui-quadrado de McNemar ........................................................... 108
14.5. Teste exato de Fisher .................................................................................. 117
15. Probabilidade e medidas de associao .............................................................. 121
15.1. Teoria da probabilidade ............................................................................... 122
15.1.1. Operaes com probabilidades ......................................................... 124
15.2. Medidas de associao .............................................................................. 126
15.2.1. Razo de risco (RR) .......................................................................... 129
15.2.2. Razo de chances (odds ratio) .......................................................... 131
15.2.3. Risco atribuvel (RA) .......................................................................... 134
15.2.4. Porcentagem de Risco Atribuvel (RA%) ............................................. 135
15.2.5. Risco Atribuvel na Populao (RAP) .................................................. 136
15.2.6. Porcentagem de Risco Atribuvel na Populao (RAP) ....................... 136
16. Testes de rastreamento diagnstico .................................................................... 139
16.1. Bases para os testes de rastreamento diagnstico ..................................... 140
16.2. Indicadores de um teste diagnstico ........................................................... 144
16.2.1. Sensibilidade e especifcidade ........................................................... 144
16.2.2 Curva ROC ........................................................................................ 150
16.2.3. Acurcia e prevalncia ...................................................................... 154
16.3. Valores preditivos ....................................................................................... 155
16.4. Razo de probabilidades (verossimilhana) ................................................. 157
16.5. Combinaes de mltiplos testes diagnsticos ........................................... 159
16.5.1. Testes em paralelo ............................................................................ 161
16.5.2. Testes em srie ................................................................................. 163
16.6. Teorema de Bayes ...................................................................................... 166
17. Inferncia para variveis ordinais ......................................................................... 171
17.1. Teste U de Wilcoxon-Mann-Whitney ........................................................... 172
17.2. Teste T de Wilcoxon ................................................................................... 178
17.3.Coefciente de correlao de Spearman ....................................................... 183
17.4. Teste de concordncia kappa ..................................................................... 189
17.5. Teste paramtrico versus no-paramtrico .................................................. 192
Parte V ANALISE MULTIVARIADA ............................................................................ 195
18. Anlise conceitual multivariada ............................................................................ 197
18.1. Bases conceituais da estatstica multivariada .............................................. 198
18.2. Objetivos da estatstica multivariada ............................................................ 200
18.3. A escolha do teste estatstico ..................................................................... 201
19. Anlise de Varincia (ANOVA) .............................................................................. 205
19.1. Base conceitual da ANOVA (Teste F) ........................................................... 207
BIOESTATISTICA_VOL02.indb 12 25/06/12 17:20
19.2. Tipos de ANOVA ........................................................................................ 209
19.2.1. Requisitos para uso da ANOVA ......................................................... 212
19.3. ANOVA de um critrio ................................................................................. 213
19.4. Testes de comparaes mltiplas ............................................................... 216
19.4.1. Teste Tukey (HSD) ............................................................................. 216
19.4.2. Teste de Student-Newman-Keuls (SNK) ............................................ 222
19.4.3. Teste de Bonferroni ........................................................................... 224
19.5. ANOVA de mltiplos critrios ...................................................................... 225
20. Anlise de varincia no-paramtrica .................................................................. 231
20.1. Teste de Kruskal-Wallis ............................................................................... 232
20.1.1. Teste de Dunn (Teste Q) .................................................................... 237
20.2. Teste de Friedman ...................................................................................... 240
21. Regresso mltipla .............................................................................................. 245
21.1. Regresso linear mltipla ............................................................................ 245
21.1.1. Construo do modelo ...................................................................... 248
21.2. Regresso logstica simples e mltipla ........................................................ 256
22. Anlise de sobrevida ........................................................................................... 267
22.1. Mtodo atuarial .......................................................................................... 269
22.2. Mtodo de Kaplan-Meier ............................................................................ 273
22.3. Testes de signifcncia estatstica ................................................................ 277
22.3.1. Teste do logrank ............................................................................... 277
22.3.2. Estatstica do qui-quadrado de Mantel-Haenszel ............................... 282
23. Experimentos fatoriais ......................................................................................... 287
23.1. Noes bsicas sobre experimentos fatoriais .............................................. 288
23.2. Experimento fatorial 22 ............................................................................... 296
23.3. Experimento fatorial no MINITAB ................................................................. 305
23.4. Anlise de superfcie de resposta ................................................................ 323
TABELAS .................................................................................................................. 335
REFERNCIAS BIBLIOGRFICAS ............................................................................. 397
NDICE REMISSIVO .................................................................................................. 403
BIOESTATISTICA_VOL02.indb 13 25/06/12 17:20
BIOESTATISTICA_VOL02.indb 14 25/06/12 17:20
Volume I I
BIOESTATISTICA_VOL02.indb 15 25/06/12 17:20
BIOESTATISTICA_VOL02.indb 16 25/06/12 17:20
parte 3

TESTES DE HI PTESES
PARAMTRI COS
No interessa quem disse isso ou aquilo,
a natureza no d a menor bola para a autoridade.
O nico modo de aprender algo sobre
os fenmenos naturais mediante experimentos
cuidadosos.
Galileu Galilei (1564-1642)
BIOESTATISTICA_VOL02.indb 17 25/06/12 17:20
BIOESTATISTICA_VOL02.indb 18 25/06/12 17:20
11
Teste t de Student
11.1 A DISTRIBUIO T DE STUDENT
A distribuio t foi desenvolvida pelo matemtico ingls William Gosset
1
,
pesquisador da empresa de cerveja irlandesa Guinness, que, em 1908, publi-
cou seu trabalho com o pseudnimo de Student, trabalho este posteriormente
aperfeioado por Sir Ronald Fisher
2
, em 1926.
Semelhante distribuio z, a t de Student uma distribuio terica de
probabilidades, que tem sua aplicao direcionada para a inferncia estats-
tica que trabalha com mdias de pequenas amostras, quando o desvio padro
da populao () no conhecido. O fundamento da distribuio t de Student
tem por base o princpio no qual, em um teste de hiptese, geralmente a mdia
da populao tomada como referncia (
0
) conhecida, mas se desconhece o
desvio padro populacional () e, portanto, no se conhece, tambm, o erro
padro, situao esta que impede o teste de hiptese. Neste caso, a soluo
considerar que a variao da amostra semelhante da populao e, ento,
1. William Sealy Gosset (1876-1937) Qumico e matemtico ingls conhecido pelo pseudnimo
de Student, ficou famoso pelo seu trabalho no desenvolvimento da distribuio t de Student.
2. Sir Ronald Aylmer Fisher (1890-1962) Estatstico e bilogo ingls, criador das fundaes
para a cincia estatstica moderna.
BIOESTATISTICA_VOL02.indb 19 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 20
substituir o desvio padro da populao () pelo desvio padro amostral (s),
para que se possa obter o erro padro estimado (EP) para a mdia, o qual
dado pela frmula:


X
n
EP
s
n
= , onde: =
A restrio desta substituio que ela verdadeira somente para grandes
amostras aleatrias, no sendo verdade para pequenas amostras. Assim, a fim
de resolver esta questo, William Gosset props que, quando em um teste de
hiptese, desvio padro populacional () desconhecido, o valor crtico obtido
na curva normal z deve ser substitudo pelo valor crtico da distribuio por ele
idealizada, a distribuio t de Student, o qual calculado por:

z =
x
n
s

, onde substituindo por , temos: t


x
s
n
=

Assim, como o desvio padro populacional () substitudo pelo des-
vio padro da amostra (s), se tomarmos uma srie infinita de valores de t,
o histograma da distribuio mostrar uma forma semelhante curva nor-
mal gaussiana, com mdia igual a zero, porm com o pico ligeiramente mais
achatado e com as caudas mais elevadas. Ou seja, a distribuio t de Student
platicrtica em relao curva normal. A Figura 11.1 mostra a relao entre
as duas curvas.
Observe que as deformaes das duas curvas so diferentes, e que os pon-
tos de inflexo no so coincidentes. Como consequncia desta diferena, os
valores que correspondem ao ponto crtico o qual delimita a rea bilateral de
significncia de 0,05 tambm no so coincidentes, ficando o da distribuio t
de Student ligeiramente mais afastado de
0
quando comparado ao ponto cr-
tico da distribuio normal, aumentando, portanto, a probabilidade do erro
tipo I em um teste de hiptese. Para solucionar esta diferena, William Gosset
calculou novos valores crticos e criou uma nova tabela para a distribuio t,
cujos valores so maiores que os da distribuio normal z, em razo da subs-
BIOESTATISTICA_VOL02.indb 20 25/06/12 17:20
TESTE T DE STUDENT 21
tituio, na frmula, do desvio padro populacional () pelo desvio padro
da amostra (s).
Outra diferena importante entre as duas distribuies que, na distribui-
o normal z, o tamanho da amostra no interfere no clculo do valor crtico,
ao passo que, na distribuio t de Student, a diferena entre e s depende do
tamanho da amostra. por essa razo que os valores crticos, na distribuio t,
so calculados no somente com base no nvel de significncia () estipulado
na pesquisa, mas, tambm, com base no tamanho da amostra, o qual determi-
nado em graus de liberdade (gl), cujo valor igual a n 1. Assim, o valor de
t deve sempre ser indicado pela notao t
;gl
. Por exemplo: se tomarmos uma
amostra com n = 30 e considerarmos um nvel = 0,05, bicaudal, o valor crtico
na distribuio normal gaussiana ser z = 1,96, enquanto, na distribuio t, esse
valor passa para t
0,05;29
= 2,045(gl = 30 1 = 29), como mostrado na Figura 11.1.
Note que, para o exemplo acima citado, se for utilizada a distribuio t
para verificar se a diferena entre as mdias pode ser considerada como esta-
tisticamente significativa, necessrio que ela seja igual ou maior que 2,045
erros padro. Se fosse considerada a distribuio normal, esse valor deveria
ser igual ou maior que 1,96 erros padro. Ou seja, ao utilizar a distribuio t, o
pesquisador necessita, no teste de hiptese, de um valor crtico maior para que
a hiptese nula seja rejeitada. Na prtica, medida que o tamanho da amostra

Fig. 11.1 Comparao entre a distribuio normal e a distribuio t de Student
para uma amostra com n = 30. Notar a diferena dos valores crticos que delimitam a regio
de signifcncia de 0,05, bilateral
BIOESTATISTICA_VOL02.indb 21 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 22
aumenta, a diferena entre as duas distribuies diminui, sendo consideradas
iguais para valores de n > 30.
Em outras palavras: caso o desvio padro populacional seja desconhecido,
o pesquisador pode estim-lo pela utilizao do desvio padro amostral, desde
que a inferncia estatstica seja feita pela aplicao do teste t de Student e que
a distribuio de frequncia dos valores de x da amostra siga o padro da dis-
tribuio normal. Caso contrrio, o pesquisador dever converter os dados
para valores z ou utilizar testes no-paramtricos. De qualquer forma, caso o
pesquisador tenha alguma dvida quanto ao padro de normalidade dos seus
dados, ele dever utilizar o histograma ou aplicar um teste de aderncia, tal
como o teste de Smirnov-Kolmogorov ou o teste do qui-quadrado de ade-
rncia, os quais sero discutidos em outro captulo deste livro. A Figura 11.2
mostra o algoritmo para a aplicao da distribuio t de Student.
* Frmulas para
converter os dados
para uma distribuio
normal
(1) x = log x
(2) x =
(3) x = 1/x
(4) x = x
2
(1, 2, 3) Indicadas
para curvas com
inclinao direita.
(4) Indicada para
curvas inclinadas
esquerda.

Incio
N > 30
Sim
Pelo teorema do limite
central, pode-se
utilizar a distribuio t
de Student.
A populao tem
distribuio normal?
No
No
Converter os dados*
ou utilizar testes no-
paramtricos.
Sim
O desvio padro da
populao
conhecido?
Sim
Utilizar a distribuio
normal
Utilizar a distribuio t
de Student com o
desvio padro da
amostra.
No
Fig. 11.2 Algoritmo de deciso para a utilizao do teste t de Student
BIOESTATISTICA_VOL02.indb 22 25/06/12 17:20
TESTE T DE STUDENT 23
Propriedades da distribuio t de student
A mdia igual a zero;
Diferente da curva normal padronizada, a distribuio t no descrita
como uma distribuio nica, mas por uma famlia de distribuies, pois,
para cada grau de liberdade da amostra, h uma curva t diferente;
As curvas tm a forma de sino e so simtricas em torno da mdia, porm
so mais achatadas (platicrticas) em relao curva normal padronizada;
Quanto maior o tamanho da amostra, mais a distribuio t se aproxima da
distribuio normal padronizada, pois, quando n tende para , o desvio
padro da amostra (s) tender para . Para n > 30, a distribuio t consi-
derada, na prtica, igual distribuio normal
3
;
a distribuio indicada para se fazer inferncia com duas mdias amos-
trais e clculo da estimativa dos intervalos de confiana para a mdia
populacional, independentemente do tamanho da amostra, desde que os
valores sejam normalmente distribudos e desconhecido.
Embora tradicionalmente o teste t seja utilizado para fazer inferncias
entre as mdias conhecidas de duas amostras, a distribuio t pode ser til
quando se quer comparar a mdia de uma amostra com a mdia populacio-
nal, mesmo que seja desconhecido, como tambm til para a estimao da
mdia populacional atravs do intervalo de confiana, a partir da mdia amos-
tral. Essas determinaes sero mostradas a seguir.
Teste de hiptese entre a mdia amostral e a mdia da
populao ( desconhecido)
Em algumas situaes, o pesquisador precisa comparar uma mdia amos-
tral com uma mdia populacional j bem estabelecida. Isto acontece quando
uma amostra obtida de uma populao-base tratada com um procedimento
diferente daquele inerente prpria populao. Neste caso, a mdia
x
A
obtida
das observaes da amostra selecionada, apresentar um desvio em relao
mdia
0
da populao-base, por sorte que, o pesquisador est interessado
3. Quando o tamanho da amostra de dois grupos comparados maior que 120, a diferena entre
as duas distribuies desprezvel. Por esse motivo, na tabela da distribuio t de Student, os
valores crticos so calculados at 120 graus de liberdade.
BIOESTATISTICA_VOL02.indb 23 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 24
em saber se esta diferena observada entre a mdia amostral e a mdia popu-
lacional (
x
A

0
) , de fato, real, isto , se ocorreu em razo da modificao do
procedimento ou se ela decorrente do erro aleatrio, da variao decorrente
do processo de amostragem.
Por exemplo: um pesquisador deseja saber se o uso de contraceptivos orais
tem efeito sobre a temperatura corporal basal
4
(TCB) de mulheres na faixa etria
de 18 a 25 anos. Para tal finalidade, ele seleciona uma amostra de 20 mulheres
que usam contraceptivos orais, e encontra uma temperatura mdia
x
A
=36 7 , C
o
, com desvio
s
A
=0 5 , C
o
. Ele deseja comparar esses dados com aqueles da popu-
lao de mulheres na mesma faixa etria, mas que no usam contraceptivos orais,
para a quais a temperatura corporal basal mdia (
0
) admitida ser igual a 36,3
o
C. Considerando que os dados sejam normalmente distribudos, existe diferena
estatisticamente significativa entre a TCB de mulheres com uso de contracepti-
vos e a TCB de mulheres da populao, na mesma faixa etria?
Passo 1 Formular as hipteses estatsticas:
H x
A 0 0
36 3 : , = =
e
H x
A A
: , =
0
36 3
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%)
Passo 3 Determinar o valor crtico do teste:
gl n t = = = = 1 20 1 19 2 093
0 05 19 , ;
,
Passo 4 Calcular o valor do teste:

t
x
s
n
calc
A
=

=

=

=

0
36 7 36 3
0 5
20
0 4
0 09
4 44
, ,
,
,
,
,
Passo 5 Regra de deciso:
Se | , aceita-se
Se |
t t H
t
calc
calc
| .
|
, ;
<
0 05 19 0
, rejeita-se
Como | =
t H
t
calc
0 05 19 0
4 44
, ;
.
| , > > , rejeita-se t H
0 05 19 0
2 093
, ;
, . =
4. Temperatura do corpo medida imediatamente aps a pessoa acordar, antes que qualquer
atividade fsica seja realizada.
BIOESTATISTICA_VOL02.indb 24 25/06/12 17:20
TESTE T DE STUDENT 25
Passo 6 Concluso:
A mdia da temperatura corporal basal (TCB) das mulheres em uso de
contraceptivos orais significativamente maior do que a mdia da tempe-
ratura corporal basal das mulheres que no usam este tipo de anovulatrio.
Determinao do intervalo de confana para a mdia
populacional
O intervalo de confiana em torno da mdia
x
calculado para que se possa
fazer uma estimativa da verdadeira mdia populacional, pois, na maioria dos
casos, esta nunca verdadeiramente conhecida. Como j foi demonstrada no
captulo 10 desta obra, a estimativa de um parmetro pode ser pontual e inter-
valar. Na estimao pontual da mdia, o pesquisador admite que o valor da
mdia populacional seja igual ao valor da mdia amostral ( ) = x . Isto uma
idia errnea, pois sabemos que, na prtica, raramente a mdia amostral coin-
cide com a mdia populacional. Por outro lado, na estimativa intervalar, um
intervalo calculado em torno da mdia amostral
x
, no interior do qual se
acredita que esteja contida a verdadeira mdia da populao, com um nvel
de confiana 1- preestabelecido.
Assim, para construir um intervalo de confiana (IC) de uma mdia popu-
lacional, pode-se empregar tanto o valor z quanto a distribuio t. No primeiro
caso, o intervalo calculado quando o desvio padro conhecido. No segundo
caso, o intervalo pode ser calculado para pequenas amostras, especialmente
quando somente o desvio padro amostral (s) conhecido. Quando o desvio
padro conhecido, os intervalos de confiana de 95% e 99% so calculados
pelas frmulas:
IC x
n
IC x
n
95 1 96 99 2 58 %( ) , %( ) ,


= = e
Os valores 1,96 e 2,58 foram obtidos na tabela dos valores z da distribuio
normal. No caso da primeira frmula, existem 95% de chance de que o verda-
deiro valor de esteja situado no intervalo entre x n 1 96 , /

e
x n +/
.
Da mesma forma, h uma chance igual a 5% de que o intervalo no contenha
esta mdia.
BIOESTATISTICA_VOL02.indb 25 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 26
Porm, quando desconhecido, a soluo estimar a partir do desvio
padro da amostra (s). Para calcular este intervalo, utiliza-se a distribuio t
com n 1 graus de liberdade, em vez do valor z, cujas frmulas para 95% e 99%
de confiana so dadas por:

IC x t
s
n
IC x t
gl
95 99
0 05 0 01
%( ) %( )
, ; , ;
= = e
ggl
s
n
Exemplo: Selecionou-se uma amostra de 10 indivduos cujas estaturas, em
centmetros, esto expressas no quadro abaixo. Qual o intervalo de confiana
de 95% para a mdia populacional?
Estatura (cm):
178 180 185 176 186
183 179 182 178 184
Dados:
Clculo do erro padro


t t
EP
s
N
0 05 0 05 9
3 38
10
3 38
3 16
1
, ; , ;
, ,
,
gl
=
= = =
=2,262
= , ,
, ;
07
0 05
cm
Ento, =2,262 1,07 =2 t EP
gl
,,42 cm
Clculo do intervalo de confiana de 95% (IC95%)
IC x t EP
IC
IC
gl
95
95 181 10 2 42
95
0 05
%( )
%( ) , ,
%(
, ;

=
=
) , , , = = (limite inferior) 181 10 2 42 178 68
= (limite sup 181 10 2 42 183 52 , , , + = eerior)
cm cm IC95 178 68 183 52 %( ) , , = < <
n x s = = = 10 181 10 3 38 , , , cm e cm
BIOESTATISTICA_VOL02.indb 26 25/06/12 17:20
TESTE T DE STUDENT 27
Interpretao do resultado: a verdadeira mdia das estaturas dos indiv-
duos da populao, da qual a amostra foi retirada, est situada no intervalo
compreendido entre 178,68 cm e 183,52 cm, com 95% de certeza.
Em outras palavras, o nvel de confiana indica que, se o procedimento
for repetido para um grande nmero de mdias amostrais retiradas da mesma
populao, espera-se que 95% dos intervalos de confiana resultantes conte-
nham o verdadeiro valor da mdia populacional .
11.2 O TESTE T DE STUDENT
O teste t de Student, que pode ser unicaudal ou bicaudal, um dos testes
mais utilizados em estatstica inferencial para dados paramtricos, devendo ser
usado quando o objetivo do pesquisador comparar as mdias de duas amostras
retiradas de diferentes populaes, cujos parmetros populacionais, tal como a
mdia e o desvio padro, no sejam conhecidos. Para tal finalidade, importante
que as duas populaes sejam independentes, e que as amostras selecionadas
sejam diferentes entre si apenas em relao ao fator a ser estudado, devendo as
demais caractersticas dos indivduos das amostras, tais como a idade, sexo, esta-
tura etc, apresentarem-se o mais semelhante possvel, de maneira que qualquer
diferena, encontrada no resultado da comparao entre os grupos, possa ser
atribuda exclusivamente influncia da diferena do fator em estudo.
Frmula para calcular o valor t
Os valores crticos de t so calculados dividindo-se a diferena entre as
mdias observadas dos grupos estudados pelo erro padro da diferena (EPD)
entre as mdias dos dois grupos.


t =
Diferena entre as mdias
Erro padro da difereena
, onde: Erro padro =

= =
x x
EPD
n
n
A B

2
Por definio, EPD igual raiz quadrada da soma das varincias das
populaes estudadas, divididas pelo respectivo tamanho da populao.
Porm, como as varincias das populaes so geralmente desconhecidas, as
BIOESTATISTICA_VOL02.indb 27 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 28
varincias das amostras (s
2
) podem ser utilizadas na frmula, desde que o total
das duas amostras seja maior que 30 ou que seus valores estejam normalmente
distribudos. Assim temos:
EPD
N N
EPD x x
s
A B
A
A
B
B
A B
A
( ) ( )

= + =
2 2
, onde:
22 2
1 1 n
s
n
A
B
B

Como o teste t utilizado pra estimar a hiptese de nulidade (H


0
), ou seja,
que no h diferena entre as duas mdias
( ) x x
A B
=
, pressupe-se, ento, que
a variabilidade igual nas duas populaes, isto , que as varincias so iguais
( )
A B
2 2
=
. Deste modo, uma estimativa conjunta das varincias ( s
0
2
) das
duas populaes deve ser obtida pela mdia ponderada das varincias amos-
trais. A frmula para calcular s
0
2
a seguinte:

s
n s n s
n n
A A B B
A B
0
2
2 2
1 1
2
=

( )
+
( )
+
s
s
A
B
2
2
=Varincia da primeira amostra.
=Varinciia da segunda amostra.
=Tamanho da primeira n
A
aamostra.
=Tamanho da segunda amostra. n
B
, onde
No teste t de Student prefervel que as amostras comparadas tenham o
mesmo tamanho n, o que, geralmente, no possvel. Assim, quando se deseja
fazer comparaes entre amostras de tamanho diferentes, necessrio que
sejam atribudas ponderaes para cada uma das diferentes amostras, de tal
sorte que essas ponderaes possam ajustar o valor de
s
0
2
. Desta forma, o EPD
passa a ser determinado pela seguinte frmula:

EPD x x s
n n
A B
A B
( ) = +

0
2
1 1
Ento, quando o teste t de Student utilizado para verificar a hiptese de
nulidade em uma pesquisa envolvendo duas amostras provenientes de diferen-
tes populaes, a equao tem a seguinte frmula geral:
BIOESTATISTICA_VOL02.indb 28 25/06/12 17:20
TESTE T DE STUDENT 29
t
x x
s
n n
gl n n
A B
A B
A B
=

+

= +
0
2
1 1
2 , para
11.2.1 Teste t para amostras independentes com
varincias iguais
Este tipo de teste t deve ser utilizado para comparar dois subconjuntos
de uma populao, os quais foram selecionados de forma independente e
aleatria, podendo apresentar tamanhos iguais ou desiguais. No entanto,
existem duas condies que devem ser satisfeitas para que ele possa
ser utilizado:
Que as duas amostras apresentem distribuio normal, ou aproximada-
mente normal, quando individualmente analisadas. Esta condio garante
que a diferena entre as mdias amostrais tambm seja normalmente dis-
tribuda. Por outro lado, se o teste bicaudal e os tamanhos das amostras
so iguais, ou quase iguais, o teste pode ser aplicado mesmo que as amos-
tras apresentem-se bastante desviadas do padro de normalidade. Caso as
amostras no tenham distribuio normal, deve-se tentar transformar os
dados, como demonstrado na Figura 11.2, ou utilizar o teste no-param-
trico de Mann-Whitney;
Que as amostras sejam homocedsticas, ou seja, que haja homogeneidade
de suas varincias. Isto , que as varincias dos subconjuntos testados
sejam iguais, e, portanto, oriundas da mesma populao. A homocedasti-
cidade importante porque ela garante que, se o tratamento A diferir do
tratamento B, o seu efeito altera os valores uniformemente, de tal modo que
a disperso dos dados permanea a mesma. Caso esta condio de igual-
dade das varincias seja duvidosa, o pesquisador deve realizar o teste de
homogeneidade antes de aplicar o teste t, como ser mostrado adiante. A
seguir, demonstraremos, pela aplicao de um exemplo, os passos para a
realizao do teste t para amostras independentes.
BIOESTATISTICA_VOL02.indb 29 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 30
Exemplo: Um pesquisador deseja saber se a concentrao de lipdios da
espcie de peixe mapar (Hypophthalmus edentatus) influenciada por dois
diferentes mtodos de medio: Soxhlet e Bligh Dyer. Para tal intento, ele sele-
cionou 10 amostras medidas pelo mtodo Soxhlet e 12 amostras medidas pelo
mtodo Bligh Dyer. Para um nvel de significncia de 0,05, existe diferena esta-
tisticamente significativa entre os dois mtodos? Os resultados esto expressos
na Tabela 11.1.
Tabela 11.1 Valores da concentrao de lipdios da espcie de peixe mapar,
medidos por dois diferentes mtodos
Amostra
Mtodos utilizados
Soxhlet
(g/100g)
Bligh Dyer (g/100g)
01 14,8 15,8
02 15,2 16,7
03 16,8 15,9
04 15,9 17,2
05 16,9 16,2
06 15,2 15,3
07 16,5 15,1
08 15,4 15,7
09 17,2 16,6
10 16,9 17,1
11 15,5
12 16,7
Mdia x
S
=16 08 , x
B
=16 15 ,
Desvio padro s
S
=0 88 , s
B
=0 70 ,
Dados fctcios
Passo 1 Formular as hipteses estatsticas:
H x x
S B 0
: = e H x x
A S B
:
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%) bilateral
BIOESTATISTICA_VOL02.indb 30 25/06/12 17:20
TESTE T DE STUDENT 31
Passo 3 Determinar o valor crtico do teste:
gl n n t
S B
= + = + = = 2 10 12 2 20 2 086
0 05 20 , ;
,
Passo 4 Calcular o valor do teste:

t
x x
s
n n
s
n s
calc
S B
S B
S
=

+

=

0
2
0
2
1 1
1 ( )
SS B B
S B
n s
n n
2 2
1
2
+
+
( )
s
0
2
2
10 1 0 88 12
=
+ ( )( , ) (
+
=
1 0 70
10 12 2
0 62
2
)( , )
,
t
calc
=

+

=

=
16 08 16 15
0 62
1
10
1
12
0 070
0 337
, ,
,
,
,
0 207 ,
Passo 5 Regra de deciso:
Se t t aceita se H
Se t
calc
ca
| | , - .
|
, ;
<
0 05 20 0
llc
calc
t rejeita se H
Como t
| , - .
| |
, ;

0 05 20 0
= < = 0 207 2 086
0 05 20 0
, , , - .
, ;
t aceita se H
Passo 6 Concluso:
As mdias das duas amostras no diferem significativamente, e isto evi-
dencia que os dois mtodos no diferem quanto determinao das con-
centraes de lipdios na espcie de peixe mapar (Hypophthalmus edenta-
tus), pois t gl P
calc
= = = 0 207 20 0 8378 , ; ; , .
Teste de homogeneidade para duas varincias
Na literatura especializada, podemos encontrar vrios tipos de testes de
homogeneidade para varincias, cada um com sua particularidade de apli-
cao, dentre os quais citamos o teste F, o teste de Levene e o teste do qui-
BIOESTATISTICA_VOL02.indb 31 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 32
-quadrado da homogeneidade. Estes testes consistem em determinar se duas
ou mais amostras tm caractersticas parecidas, isto , eles consistem em
mtodos para avaliar se a variabilidade das amostras pode ser considerada
desprezvel quando comparada variabilidade resultante do procedimento
a ser testado. Como citado anteriormente, quando houver dvidas quanto
homogeneidade das amostras, o pesquisador dever aplicar um teste para
determinar a homogeneidade das varincias, pois isto garante um melhor de-
sempenho para os testes paramtricos, uma vez que estes exigem que as va-
rincias das amostras envolvidas na anlise sejam homogneas, porm, no
necessariamente idnticas. A seguir, mostraremos a aplicao do teste F e do
teste de homogeneidade de Cochran.
Teste F para varincias iguais
O teste F foi desenvolvido por Ronald Aylmer Fisher (1890-1962), da a
sua denominao, sendo, tambm, utilizado para comparar as varincias de
mais de dois grupos de estudo, quando conhecido como anlise de varincia
(ANOVA). Este teste calculado dividindo-se a maior varincia pela menor,
para, ento, obter-se a razo crtica, a qual comparada com o valor crtico
da distribuio F (ver tabela para distribuio F), conforme o nvel de signi-
ficncia (nvel alfa) preestabelecido pelo pesquisador. Assim, o raciocnio o
seguinte: caso as varincias sejam iguais, a razo entre elas ser 1, ou, se ligei-
ramente diferentes, ser aproximadamente 1. Por outro lado, caso a razo
entre as varincias seja significativamente maior que 1, pode-se concluir que
as varincias so desiguais. Porm, quanto maior que 1 o valor F precisa ser
para que as varincias sejam consideradas desiguais mais do que se poderia
esperar apenas por acaso? Para responder a esta questo, compara-se o valor
calculado para a razo crtica, com o valor crtico tabelado da distribuio
F, o qual determinado segundo o nvel de significncia e os graus de liber-
dade. Se o resultado calculado para o teste F for menor que o valor crtico da
tabela, no se rejeita a hiptese nula das varincias iguais; caso o valor F seja
maior que o valor da tabela, a hiptese nula deve ser rejeitada, afirmando-se,
ento, que a diferena entre as varincias estatisticamente diferente. No
primeiro caso, o teste t de Student pode ser empregado, pois as varincias
das amostras so homogneas; no segundo caso, a abordagem deve ser reali-
BIOESTATISTICA_VOL02.indb 32 25/06/12 17:20
TESTE T DE STUDENT 33
zada pela aplicao do teste t de Student para varincias desiguais (teste t), o
qual calculado mediante a reduo dos graus de liberdade pela aplicao da
frmula de correo de Welch-Satterthwaite (1946), como mostrado mais
adiante, ou, ento, aplicar um teste no-paramtrico. Assim, para calcular o
valor F, temos:
F
s
s
calc
Maior
Menor
=
2
2
Note que, por conveno, o numerador representado pela maior das duas
varincias, porm, no necessariamente a da maior amostra. Isso permite que o
valor calculado de F seja sempre um valor igual ou maior que 1.
A determinao do valor crtico na tabela da distribuio F depende do
nvel de significncia (valor ) estipulado pelo pesquisador e do nmero de
graus de liberdade(n 1) de cada amostra, sendo dado por:

F
g gl
N D
; l ;
, onde: gl
N
= Graus de liberdade da varincia do numerador.
gl
D
= Graus de liberdade da varincia do denominador.
Tomando-se como base os dados do exemplo anterior (exemplo 2), a se-
guir mostraremos a sequncia de passos para a aplicao do teste F. Lembre-se,
porm, que este teste de homogeneidade deve ser aplicado antes da realizao
do teste t de Student.

Passo 1 Formular as hipteses estatsticas:

H s s H
s
s
S B
S
B
0
2 2
0
2
2
1 : : = = ou H s s H
s
s
A S B A
S
B
:
2 2
2
2
ou : >1 e
Passo 2 Escolher o nvel de significncia (nvel alfa):

=0 05 , (5%) bilateral
BIOESTATISTICA_VOL02.indb 33 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 34
Passo 3 Determinar o valor crtico do teste:
gl n
gl n F
N s
D B
= = =
= = = =
1 10 1 9
1 12 1 11
0 05 9 11 , ; ;
33 59 ,
Passo 4 Calcular o valor do teste:
F
s
s
calc
Maior
Menor
= = =
2
2
2
2
0 88
0 70
1 58
( , )
( , )
,
Passo 5 Regra de deciso:
Se | , aceita-se
Se |
F F H
F
calc
calc
| .
, ; ;
<
0 05 9 11 0
|| .
|
, ; ;
, rejeita-se
Como | =1
F H
F
calc
0 05 9 11 0
,,58 < , aceita-se F H
0 05 9 11
3 059
, ; ;
, . =
0

Se | , aceita-se
Se |
F F H
F
calc
calc
| .
, ; ;
<
0 05 9 11 0
|| .
|
, ; ;
, rejeita-se
Como | =1
F H
F
calc
0 05 9 11 0
,,58 < , aceita-se F H
0 05 9 11
3 059
, ; ;
, . =
0
Passo 6 Concluso:
Como o valor do teste (F
calc
) menor que o valor crtico tabelado (F
0,05;9;11
),
aceita-se H
0
, pois no h evidncias que as varincias das amostras sejam
diferentes. Neste caso, o teste t de Student pode ser aplicado para verifi-
car se h diferena estatisticamente entre os mtodos Soxhlet e Bligh Dyer
para determinao da concentrao de lipdios na espcie de peixe mapar
(Hypophthalmus edentatus).
Note que nem sempre necessria a aplicao de um teste de homogenei-
dade, pois, na maioria das vezes, o bom senso mostra se existe ou no igualdade
entre as varincias. Por exemplo, valores de varincia muito prximos indicam
que elas so homogneas; por outro lado, valores bastante discrepantes mos-
tram que as varincias so desiguais. Na prtica, o teste necessrio quando a
diferena entre os valores das varincias no pequeno o suficiente para que
se possa afirmar com segurana que elas sejam iguais, como no exemplo citado,
cujos valores so
s
S
2
0 7744 = ,
e
s
B
2
0 4900 = ,
.
BIOESTATISTICA_VOL02.indb 34 25/06/12 17:20
TESTE T DE STUDENT 35
Teste de Cochran para varincias iguais
Simples e de fcil aplicao, o teste de Cochran utilizado para verificar a
homogeneidade das varincias de um grupo de amostras. calculado determi-
nando-se, inicialmente, as varincias envolvidas no experimento, para, ento,
dividir a maior delas pela soma de todas as outras. O resultado da diviso
ento comparado com os valores crticos de uma tabela estatstica apropriada,
que leva em conta o nmero de varincias envolvidas (k) e o nmero de graus
de liberdade (gl) utilizado nos clculos, nmero esse que deve ser o mesmo
para todas as varincias, pois a tabela construda dessa forma. A frmula do
teste de Cochran dada por:
C
s
s
i
i
i
n
=
=

max
2
2
1
Lembre que o tamanho deve ser igual para todas as amostras, e um valor
calculado maior que o valor crtico tabelado indica que as varincias so
significativamente diferentes, o que nega a hiptese de igualdade (ou de homo-
geneidade) das varincias envolvidas no experimento.
11.2.2 Teste t para amostras independentes com
varincias desiguais
Se aps aplicar o teste de homogeneidade, o pesquisador verificar que as
varincias das amostras no so homogneas, o teste t de Student tradicional
no deve ser utilizado. Neste caso, deve-se utilizar uma das solues propos-
tas pela estatstica, sendo a de mais fcil utilizao aquela que corrige os graus
de liberdade do teste t pela aplicao da frmula de Welch-Satterthwaite.
Em estatstica, essa comparao entre as mdias de duas amostras quando
s s
A B
2 2

, conhecida como o problema de Behrens-Fisher


5
.
5. Problema da estimao do intervalo e da aplicao do teste de hiptese sobre a diferena entre
as mdias de duas amostras independentes, retiradas de populaes normalmente distribudas,
porm com varincias desiguais. W. V. Behrens, em 1929, e Sir Ronald Aylmer Fisher, em 1935,
propuseram a soluo para o problema.
BIOESTATISTICA_VOL02.indb 35 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 36
Assim, as diferenas entre a aplicao da frmula tradicional e a frmula
corrigida so:
Na frmula corrigida, utilizam-se as varincias observadas nas duas amos-
tras, em vez de uma estimativa comum para as varincias
( ) s
0
2
, como na fr-
mula tradicional. Com isto, a frmula corrigida escrita da seguinte maneira.

t
x x
s
n
s
n
calc
A B
A
A
B
B
,
=

+
2 2
Para encontrar a razo crtica na tabela da distribuio t de Student, o cl-
culo do nmero de graus de liberdade deve ser modificado. Na frmula
tradicional, ele dado por (n
A
+ n
B
2). Na frmula corrigida, o nmero
de graus de liberdade (gl) deve ser determinado pela equao de Welch-
-Satterthwaite, cuja frmula :

gl
s
n
s
n
s
n
n
s
n
A
A
B
B
A
A
A
B
,
=
+

+
2 2
2
2
2
2
1
BB
B
n

2
1
A fim de mostrar a aplicao da frmula do teste t para amostras indepen-
dentes com varincias desiguais, utilizaremos o exemplo a seguir.
Exemplo: dois pesquisadores compararam o ganho de peso dirio de
ratos Wistar (Rattus norvegicus), com a utilizao de dois diferentes tipos
de dieta. Para tal finalidade, dois grupos de 10 animais foram selecionados.
Para o grupo CA, foi administrada dieta contendo protena do leite (casena),
durante um perodo de 14 dias. Para o grupo SO, dieta contendo protena
de soja, por igual perodo de tempo. As concentraes proticas e as quan-
tidades dirias ofertadas foram iguais para ambas as dietas. Os dados esto
expressos na Tabela 11.2.
BIOESTATISTICA_VOL02.indb 36 25/06/12 17:20
TESTE T DE STUDENT 37
Tabela 11.2 Valores do ganho de peso dirio de ratos submetidos a dois diferentes
tipos de dieta
Animal
Grupos estudados
Grupo CA
(g/dia)
Grupo SO
(g/dia)
01 13,1 10,8
02 15,2 10,7
03 15,8 9,9
04 13,9 10,2
05 12,9 9,6
06 15,2 10,3
07 15,5 9,1
08 15,4 10,1
09 16,2 10,6
10 15,9 10,1
Mdia x
CA
=14 91 , x
SO
=10 14 ,
Desvio padro s
CA
=1 180 , s
SO
=0 519 ,
Dados fctcios
Passo 1 Formular as hipteses estatsticas:
H x x
CA SO 0
: = e H x x
A CA SO
:

Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%) bilateral

Passo 3 Verificar a homogeneidade das varincias para escolher o teste:
F
s
s
calc
Maior
Menor
= = =
2
2
2
2
1 180
0 519
5 17
( , )
( , )
, Valor crtico ( ) ,
, ; ;
F F
tabelado
= =
0 05 9 9
4 03
Como
F F
calc tabelado
= > = 5 17 4 03 , ,
as varincias so estatisticamente di-
ferentes (heterocedsticas), ento, a escolha adequada o teste t para
varincias desiguais.
BIOESTATISTICA_VOL02.indb 37 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 38
Passo 4 Determinar o valor crtico do teste t:





gl
s
n
s
n
s
n
n
CA
CA
SO
SO
CA
CA
CA
,
=
+

2 2
2
2
2

=
+
1 1
0 139 0 027
0 139
9
2
2
2
2
s
n
n
SO
SO
SO
( . , )
.
++
= =
0 027
9
0 0276
0 0023
12
2
,
,
,
Como gl = 12, ento, o valor crtico ser:
t
0 05 12
2 179
, ;
,
, =
.
Passo 5 Calcular o valor do teste:

t
x x
s
n
s
n
calc
CA SO
CA
CA
SO
SO
,
, ,
,
=

+
=

+
2 2
14 91 10 14
0 139 00 027
4 770
0 407
11 72
,
,
,
, = =
Passo 6 Regra de deciso:
Se | , aceita-se
Se |
t t H
t
calc
calc
,
, ;
,
| . <
0 05 12 0
,,
, ;
,
,
| .
|
, rejeita-se
Como | =
t H
t
calc
0 05 12 0
111,72 > , rejeita-se t H
0 05 12
2 179
, ;
,
, . =
0

Passo 7 Concluso:
As mdias dos ganhos de peso dirio dos dois grupos de animais diferem
significativamente entre si, o que evidencia que a dieta base de protena
do leite mais eficaz quando comparada dieta base de protena de soja,
pois t gl P
calc
= = < 11 72 12 0 001 , ; ; , .
11.2.3 Teste t para amostras pareadas (emparelhadas)
O teste t pareado o ideal para ser aplicado quando se deseja detec-
tar pequenas diferenas em grupos cujos indivduos so muito heterogneos,
BIOESTATISTICA_VOL02.indb 38 25/06/12 17:20
TESTE T DE STUDENT 39
sendo, portanto, para estes casos, considerado um teste mais robusto que o t
de Student tradicional. Contudo, ao contrrio do teste t para amostras inde-
pendentes, que compara as mdias e varincias de duas diferentes amostras,
o teste t pareado compara as diferenas entre duas situaes distintas de uma
mesma amostra (ou populao). Essa comparao geralmente feita para
que se possa verificar se ocorreu, em decorrncia da aplicao de um pro-
cedimento experimental, uma mudana significativa nos valores da varivel
estudada. Como exemplo, para verificar se houve uma reduo nos nveis da
presso sangunea sistlica aps administrao de uma nova droga para tra-
tamento da hipertenso arterial, o pesquisador precisa medir os valores da
presso arterial dos indivduos, antes e depois da administrao da droga, e,
ento, compar-los, na tentativa de detectar alguma possvel alterao. Nesse
caso, o melhor teste a ser empregado o t pareado, pois qualquer mudana
nos valores da presso arterial detectada pelo teste, pode ser atribuda
interveno.
A tcnica de pareamento tradicional aquela em que apenas uma amos-
tra randomicamente selecionada, e cada indivduo o seu prprio controle,
tal como mostrado no exemplo anteriormente citado, sendo esta a tcnica que
proporciona melhor sensibilidade ao teste estatstico. Uma outra maneira de
emparelhar a amostra selecionar, dois a dois, os participantes da pesquisa,
isto , aos pares, sendo um deles aleatoriamente designado ao grupo tra-
tamento, e o outro, para o grupo controle. Neste processo, os sujeitos que
compem cada um dos pares selecionados devem ser o mais semelhante pos-
svel, especialmente no que tange s caractersticas que possam influenciar
no resultado da pesquisa, tais como a idade, sexo, raa, estatura, tempo de
doena etc.
Frmula para calcular o teste t pareado
Os valores do teste t pareado no so calculados com os dados originais
das observaes (x) obtidas de cada uma das duas amostras ou nos momentos
antes e depois da interveno, mas com as diferenas (d) entre as observa-
es de cada par. Este teste considera como hiptese nula (H
0
) aquela em que
a mdia das diferenas ( d ) igual a 0 (
d
= 0), isto , quando no h diferena
entre os valores medidos antes (x
A
) e depois (x
D
) da interveno, o que seria
BIOESTATISTICA_VOL02.indb 39 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 40
esperado caso a interveno no apresentasse qualquer efeito nos indivduos
da amostra. A frmula dada por:
t
d
EPd
d
s
n
p
d
= = , onde: d = d / n
s
d
= Erro padro da mdia das diferenas.
n - Nmero de pares ou de repeties (no o
nmero total de indivduos ou observaes).
Obs.: A mdia das diferenas tambm pode ser
dada por: d x x
A B
=
s
d d
n
d
d
n
n
n
d
i
i
i
=



( )
( )
2
2
2
1 1
1 , onde: GGraus de liberdade
Interpretao para o teste t pareado Para a realizao do teste t pare-
ado, calcula-se a diferena, em termos de desvio padro, entre valor calculado
de d e
d
= 0. O valor encontrado ento comparado o com valor crtico da
tabela da distribuio t de Student, conforme o nvel de significncia prees-
tabelecido (nvel alfa) e com n 1 graus de liberdade, tal como foi feito para
os outros testes. A diferena ser considerada estatisticamente significativa
quando o valor de t
P
calculado for maior que o valor crtico da tabela. Neste
caso, conclui-se que h diferena entre os grupos pareados estudados ou que
h diferena entre as mdias das medidas antes e depois da interveno. Caso
contrrio, conclui-se que a diferena no significante, ou seja, que ela decor-
rente do erro aleatrio, do acaso.
Para efeito de ilustrao, tomaremos como exemplo um teste t com parea-
mento do tipo antes e depois.
Exemplo: a fim de testar a eficcia de uma nova droga para tratamento da
hipercolesterolemia, um pesquisador selecionou, aleatoriamente, um grupo de 10
pacientes hipercolesterolmicos, entre aqueles atendidos no ambulatrio de um
determinado hospital pblico. Para efeito de comparao, os valores do colesterol
total plasmtico foram medidos antes e depois da administrao da droga por um
perodo de duas semanas. Os dados esto expressos na Tabela 11.3, abaixo.
BIOESTATISTICA_VOL02.indb 40 25/06/12 17:20
TESTE T DE STUDENT 41
Tabela 11.3 Valores do colesterol total plasmtico antes e depois da administrao da droga
por um perodo de duas semanas
Paciente
Dosagem do colesterol total (mg/dL)
d = x
A
x
D
d
2
Antes (x
A
) Depois (x
D
)
01 248 202 46 2.116
02 257 183 74 5.476
03 264 176 88 7.744
04 252 198 54 2.916
05 278 168 110 12.100
06 246 187 59 3.481
07 271 182 89 7.921
08 268 194 74 5.476
09 246 198 48 2.304
10 254 204 50 2.500
Total x
A
=258 40 , x
D
=189 20 , 692 52.034
Dados fctcios
Passo 1 Formular as hipteses estatsticas:
H
d 0
: =0
e
H
A d
: 0
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%) bilateral
Passo 3 Determinar o valor crtico do teste t:
gl n t = = = = 1 10 1 9 2 262
0 05 9 , ;
,
Passo 4 Calcular o valor do teste:


t
d
s
n
s
d
d
n
n
P
d
d
i
i
= =


, onde:
2
2
1
52 034
6
( )
.
( 992
10
10 1
21 47
2
)
,

=
t
P
= = =
69 2
21 47
10
69 2
6 79
10 191
,
,
,
,
.
BIOESTATISTICA_VOL02.indb 41 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 42
Passo 5 Regra de deciso:
Se , aceita-se
Se |
| | .
|
, ;
,
t t H
t t
P
P
<

0 05 9
0 05
0
;;
, ;
.
|
9
0 05 9
, rejeita-se
Como | =10,191 >
H
t t
P
0
==2 262 , . , rejeita-se H
0

Passo 6 Concluso:
As mdias dos valores do colesterol total plasmtico, medidas antes e
depois da administrao da nova droga, diferem significativamente en-
tre si, o que evidencia ter a droga se mostrado eficaz em reduzir os valo-
res do colesterol total plasmtico no grupo de pacientes estudados, pois
t gl
P
= = 10 191 9 , ; ;
P < 0 0001 , .
Determinao do intervalo de confana para a mdia de
amostras pareadas
O intervalo de confiana para a mdia de amostras pareadas dado pela
seguinte frmula:
IC d t EP
gl
95
0 05
%( ) ,
, ;
= onde: EP s n
d
= /


- Diferena.
d - Mdia das diferenas.
s
d
- Desvio padro das diferenas.
Para calcular o intervalo de confiana de 95%, utilizaremos os dados do
exemplo anterior.
Dados:

n =10

d =69 2 , mg/dL

s
d
=21 47 , mg/dL
Clculo do erro padro
t t
EP
s
N
gl
d
0 05 0 05 9
2 262
21 47
10
21 47
3 1
, ; , ;
,
, ,
,
= =
= = =
66
6 80
2 262 6
0 05
=
=
, /
, , ,
, ;
mg dL
Ento t EP
gl
880 15 38 = , / mg dL
BIOESTATISTICA_VOL02.indb 42 25/06/12 17:20
TESTE T DE STUDENT 43
Clculo do intervalo de confiana de 95% (IC95%)
IC d t EP
IC
IC
gl
95
95 69 2 15 38
95
0 05
%( )
%( ) , ,
%(
, ;

=
=
)) , , , = = 69 (limite inferior) 2 15 38 53 82
=69 (limite superior) , , , 2 15 38 84 58 + =
ICC d 95 53 82 84 58 %( ) , , = < < mg/dL mg/dL
Interpretao do resultado: a verdadeira mdia das diferenas dos va-
lores do colesterol total plasmtico dos indivduos da populao da qual a
amostra foi retirada, est situada no intervalo compreendido entre 53,82
mg/dL e 84,58 mg/dL, com 95% de certeza.
Assim, ao aplicar o teste t de Student, lembre-se sempre que as observaes
de cada grupo devem seguir a distribuio normal. Para pequenas amostras, o
no cumprimento dessa regra resulta em valores P menores do que deveriam ser,
o que pode levar o pesquisador a rejeitar a hiptese nula e afirmar que h uma
diferena real entre as mdias comparadas, quando, na verdade, esta diferena
no existe (erro tipo I). De igual maneira, os intervalos de confiana so mais
estreitos, o que tambm pode levar a concluses erradas. Nestes casos, o teste
no-paramtrico da soma de postos de Wilcoxon deve ser a escolha. O Quadro
11.1 mostra as opes de teste para comparar as mdias de duas amostras.
Quadro 11.1 Opo de testes para comparao entre as mdias de duas amostras
Tipo de dados Tipo de distribuio Teste apropriado
No-pareados
Normal com varincias iguais - Teste t de Student tradicional.
Normal com varincias diferentes
- Teste t com varincias desiguais
(Welch-Satterthwaite).
No-gaussiana - Teste de Mann-Whitney.
Pareados
Normal das diferenas - Teste t pareado.
No-gaussiana - Teste de Wilcoxon.
BIOESTATISTICA_VOL02.indb 43 25/06/12 17:20
BIOESTATISTICA_VOL02.indb 44 25/06/12 17:20
CORRELAO E REGRESSO LINEAR SIMPLES 45
12
Correlao e Regresso
Linear Simples
Em certos delineamentos, muitas vezes, um pesquisador se depara
com situaes em que ele precisa avaliar o comportamento simultneo de
duas variveis quantitativas normalmente distribudas, coletadas em uma
mesma amostra, no sentido de tentar estabelecer uma relao (ou associao)
entre elas. Da mesma forma, alm de estabelecer uma relao, o pesquisa-
dor geralmente deseja fazer previses a respeito do comportamento de uma
delas em relao outra, assim como quantificar o quanto de alterao de
uma determina pela alterao da outra. Por exemplo: se um pesquisador
deseja estudar a relao entre a idade (em anos) e os valores da presso
arterial sistlica (em mmHg), provavelmente ele estar interessado em
saber se, de fato, essas duas variveis esto associadas, isto , se elas esto
correlacionadas. Da mesma maneira, ele desejar saber se medida
que aumentam os valores da idade, os valores da presso arterial sistlica
aumentam ou diminuem concomitantemente. Caso isto ocorra, o quanto
de aumento ou diminuio nos valores da presso arterial sistlica
explicado pela variao dos valores da idade. Em estatstica, as respostas
a todas essas questes devem ser examinadas pelo estudo da correlao
e da regresso linear, as quais sero mostradas neste captulo.
BIOESTATISTICA_VOL02.indb 45 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 46
Assim, em qualquer uma dessas anlises, seja de correlao ou de
regresso, uma das duas variveis considerada a varivel independente
(varivel preditora), a qual, por conveno, representada por x, enquanto
que a outra, a varivel dependente (varivel-resposta), representada
por y. Em geral, a varivel preditora a varivel explicativa, que capaz de
modificar o comportamento da varivel-resposta. Por outro lado, impor-
tante saber a diferena entre as anlises de correlao e regresso linear,
diferena esta que toma como base o objetivo da anlise. Na correlao
linear, o investigador apenas est interessado em estabelecer e medir o
grau de uma associao entre as duas variveis x e y, assim como verificar
se ela positiva ou negativa, ao passo que, na regresso linear, ele tenta
quantificar o efeito de uma sobre a outra, alm de estabelecer uma equao
matemtica que possa prever o valor da varivel-resposta a partir dos valo-
res da varivel preditora.
Portanto, para melhor entendimento, iniciaremos a discusso pela anlise
de correlao linear.
12.1 CORRELAO LINEAR SIMPLES
Define-se como correlao linear simples a relao entre duas vari-
veis quantitativas normalmente distribudas, sendo os dados da amostra
representados por pares ordenados (x, y), onde x a varivel independente
(preditora) e y a varivel-resposta. Portanto, interessante notar que,
neste tipo de anlise, as informaes devem ser coletadas aos pares e de uma
mesma amostra, de tal maneira que seja pertinente o estabelecimento de uma
associao entre as variveis.
Assim que os dados quantitativos de um determinado estudo so coletados,
a maneira mais fcil de organiz-los, disp-los em uma tabela de distribui-
o de frequncia e calcular os parmetros de interesse para anlise, tal como
mostrado no Tabela 12.1, a qual relaciona as medidas das presses arteriais
sistlica e diastlica em 12 pacientes.
BIOESTATISTICA_VOL02.indb 46 25/06/12 17:20
CORRELAO E REGRESSO LINEAR SIMPLES 47
Tabela 12.1 Valores das presses arteriais sistlica e diastlica de 12 pacientes
Paciente
Valores da presso arterial
(mmHg)
Sistlica (x) Diastlica (y)
01 108 65
02 125 74
03 100 64
04 108 68
05 112 72
06 102 66
07 112 68
08 122 70
09 116 70
10 116 70
11 120 72
12 108 70
x s 112,417,71 69,082,99
Deste modo, ao fazer a anlise dos dados, o pesquisador pode estar inte-
ressado em responder a algumas questes importantes, tais como:
Existe ou no uma relao entre as variveis estudadas?
Se a relao existe, ela positiva ou negativa?
Caso exista, qual a fora desta associao?
Ela real, verdadeira, ou ocorreu por acaso?
Porm, ao analisar a tabela de distribuio de frequncia, verifica-se que
ela no se presta para uma anlise mais acurada no que tange ao estabeleci-
mento de uma correlao entre os valores das variveis estudadas, e, portanto,
no responde s questes anteriormente formuladas, posto que, praticamente
impossvel estabelecer qualquer tipo de associao entre os dados coletados.
Assim, no sentido de responder s questes relativas associao entre as
duas variveis, os dados devem ser agora dispostos em um grfico chamado de
diagrama de disperso e, posteriormente, submetidos a uma anlise estats-
tica, o coeficiente de correlao, os quais sero mostrados a seguir.
BIOESTATISTICA_VOL02.indb 47 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 48
12.1.1 Diagrama de disperso
O diagrama de disperso um grfico cartesiano de pontos (diagrama de
pontos), onde cada ponto representa, concomitantemente, os valores das duas
variveis x e y, coletadas a partir de cada indivduo da amostra. A Figura 12.1
mostra o diagrama de disperso para o exemplo anteriormente citado.

Fig. 12.1 Diagrama de disperso dos valores da presso arterial de 12 indivduos
Observando-se o diagrama, algumas informaes podem ser, de pronto,
verificadas. Por exemplo:
Os pontos esto distribudos tomando uma mesma direo, ao longo de
uma reta imaginria que vai da esquerda para a direita e de baixo para
cima. Esta distribuio mostra que existe uma relao, mesmo imperfeita,
entre as duas variveis estudadas (x e y). Esta informao responde pri-
meira questo formulada, entretanto, visualmente, no se pode afirmar o
quo forte a fora desta relao, como, da mesma maneira, no se pode
dizer se ela ocorreu ou no por acaso. Essas questes somente sero res-
pondidas pelo clculo do coeficiente de correlao e pela aplicao do
teste de hiptese para calcular a probabilidade de a correlao ter ocorri-
do por acaso, os quais sero mostrados mais adiante.
Pode-se observar, tambm, medida que aumentam os valores de x, os va-
lores de y aumentam concomitantemente, demonstrando existir uma cor-
BIOESTATISTICA_VOL02.indb 48 25/06/12 17:20
CORRELAO E REGRESSO LINEAR SIMPLES 49
relao linear positiva entre as variveis estudadas. Porm, somente com
esta informao, no se podem fazer previses para valores de y a partir
de outros valores de x. Isto somente possvel pela aplicao da regresso
linear, a qual ser demonstrada item 12.2 deste captulo.
A Figura 12.2 mostra exemplos de diagrama de disperso com outras pos-
sveis associaes entre as variveis.

Correlao linear
positiva
Correlao linear negativa

Sem correlao Correlao no-linear
Sem correlao Correlao no-linear
Correlao linear positiva
Correlao linear negativa
Fig. 12.2 Diagramas de disperso mostrando quatro diferentes tipos de correlao
BIOESTATISTICA_VOL02.indb 49 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 50
12.1.2 Coefciente de correlao produto-momento (r)
Como podemos verificar, a interpretao da correlao a partir do dia-
grama de disperso uma avaliao puramente subjetiva e pouco precisa,
o que torna necessria uma maneira mais consistente de analis-la. Para
tanto, a aplicao do coeficiente de correlao produto-momento (r), tambm
conhecido como coeficiente de correlao de Pearson, por ter sido inicial-
mente proposto por Karl Pearson em 1896, o mtodo mais utilizado para
avaliar esta correlao. Esse coeficiente, que uma medida da associao
entre duas variveis quantitativas, mostra o grau de dependncia linear entre
elas, com a grande vantagem de ser representado por um nmero adimensio-
nal, independentemente da unidade de medida das duas variveis analisadas,
podendo ser calculado pela seguinte equao:
r
s s
Cov
x x y y
n
xy
x y
xy
=

cov
( )( )
, onde:
1
Sendo Cov
xy
igual soma das covarincias das variveis x e y.
Deste modo, define-se como covarincia entre duas variveis aleatrias
x e y, o somatrio do produto dos desvios das observaes em relao mdia
da varivel x e os mesmos desvios das observaes em relao mdia da
varivel y. Portanto, a frmula mais simplificada para calcular r dada pela
seguinte equao:

r
x y
x y
n
x
x
n
y
y
i i
i i
i
i
i
i
=

( )

( )


2
2
2
2
nn
n

= , onde: nmero de pares de dados..


Assim, tomando-se os dados do exemplo anterior, temos:
BIOESTATISTICA_VOL02.indb 50 25/06/12 17:20
CORRELAO E REGRESSO LINEAR SIMPLES 51
Tabela 12.2 Valores das presses arteriais sistlica e diastlica de 12 pacientes
Paciente
Valores da presso arterial (mmHg)
Sistlica (x) Diastlica (y) x.y x
2
y
2
01 108 65 7.020 11.664 4.225
02 125 74 9.250 15.625 5.476
03 100 64 6.400 10.000 4.096
04 108 68 7.344 11.664 4.624
05 112 72 8.064 12.544 5.184
06 102 66 6.732 10.404 4.356
07 112 68 7.616 12.544 4.624
08 122 70 8.540 14.884 4.900
09 116 70 8.120 13.456 4.900
10 116 70 8.120 13.456 4.900
11 120 72 8.640 14.400 5.184
12 108 70 7.560 11.664 4.900
1.349 829 93.406 152.305 57.369
r =

93 406
1 349 829
12
152 305
1 349
12
2
.
( . )
.
( . )
x

=

57 369
829
12
93 406 93 193 42
1
2
.
( )
. . ,
(
r
552 305 151 650 08 57 369 57 270 08
212 58
6
. . , )( . . , )
,
(

= r
554 92 98 92
212 58
254 53
0 8352
. )( , )
,
.
, = =
Interpretao do valor r
Valor r O coeficiente de correlao indica a intensidade da relao line-
ar entre as duas variveis estudadas. Este valor pode variar de 1 a + 1
( 1 r +1). Valor de r = 0 indica uma ausncia total de correlao entre as
variveis, indicando que elas no esto associadas, enquanto o valor de r = |1|,
indica uma relao linear perfeita, chamada de relao determinstica.
BIOESTATISTICA_VOL02.indb 51 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 52
O sinal da correlao Uma correlao positiva indica uma relao direta
entre as duas variveis, isto , quando os valores da varivel x aumentam,
os valores da varivel y aumentam concomitantemente ou quando os valo-
res da varivel x diminuem, os valores da varivel y diminuem na mesma
proporo. Ao contrrio, uma correlao negativa indica uma relao do
tipo inversa, ou seja, quando os valores da varivel x aumentam, os valores
da varivel y diminuem (ou vice-versa). Valores mximos positivos e nega-
tivos (r = +1 ou r = 1) so obtidos quando todos os pontos do diagrama
esto dispostos em uma reta inclinada (Figura 12.3 A e B), ao passo que
valores intermedirios so obtidos quando os pontos do diagrama apre-
sentam uma distribuio elptica, inclinada, sendo mais estreita quanto
maior for a correlao (Figura 12.3 C). Entretanto, se a elipse for paralela a
um dos eixos do grfico, ou se todos os pontos esto dispostos ao longo de
uma reta horizontal, a correlao nula (Figura 12.3 D).
Fig. 12.3 Diagramas de disperso mostrando quatro diferentes valores de r
De qualquer maneira, pelo simples fato de duas variveis apresentarem uma
forte correlao entre si, no , necessariamente, uma indicao de que haja
uma relao de causa e efeito entre elas, uma vez que o coeficiente de corre-
lao mede a existncia de uma associao, no de uma relao de causa e
efeito entre as variveis. Portanto, se o valor de r for diferente de zero, uma
das quatro situaes abaixo descritas deve ser considerada pelo pesquisador:
A varivel x influencia o comportamento da varivel y So os valo-
res da varivel x que determinam as variaes na varivel y, isto , qual-
Correlao linear perfeita
positiva
Correlao linear perfeita
negativa
Correlao linear
intermediria
Ausncia de correlao
BIOESTATISTICA_VOL02.indb 52 25/06/12 17:20
CORRELAO E REGRESSO LINEAR SIMPLES 53
quer alterao em x causa modificaes no comportamento da varivel y.
Por exemplo, considere os dados do exemplo citado. razovel concluir
que os valores da presso arterial sistlica influenciam positivamente
nos valores da presso arterial diastlica. Neste caso, a presso arterial
sistlica a varivel preditora, enquanto que a presso arterial diastlica
a varivel-resposta.
A varivel y influencia o comportamento da varivel x - So os valores
da varivel y que determinam as variaes na varivel x, isto , qualquer
alterao em y causa modificaes no comportamento da varivel x. Para o
exemplo dado, seria a presso arterial diastlica que determinaria o com-
portamento da presso sistlica.
As variveis no so correlacionadas Neste caso, qualquer relao
entre as variveis estudadas se deve exclusivamente ao acaso, pura
coincidncia, sem qualquer significado clnico, mesmo que o diagrama
de disperso mostre, em relao aos pontos do grfico, uma distribuio
tpica de uma correlao perfeita, pois, nesse caso, o coeficiente apenas
demonstra que as duas variveis esto variando concomitantemente,
sem que isto indique que uma influencia a outra. Neste caso, os valores
das presses sistlica e diastlica no apresentam qualquer relao de
causa e efeito.
As variveis x e y so influenciadas por uma terceira varivel No
fenmeno observado, pode haver a influncia de uma terceira varivel,
desconhecida ou no considerada na anlise, cuja ao modifica, simulta-
neamente, o comportamento tanto da varivel x quanto da varivel y. Ou,
talvez, vrias outras variveis estejam afetando o comportamento de x e y.
Desta maneira, pode ser que, para o exemplo em questo, a resistncia vas-
cular perifrica e/ou o volume de sangue circulante estejam modificando,
de maneira semelhante, o comportamento das presses arteriais sistlica
e diastlica, simultaneamente.
Assim, afirmar qual das condies acima descritas aquela vlida para o
estudo, pode ser uma tarefa bastante difcil. Porm, uma vez que tenha sido
determinada a correlao entre as duas variveis, pode-se, agora, mensurar a
intensidade da mesma, com base na seguinte tabela:
BIOESTATISTICA_VOL02.indb 53 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 54
Tabela 12.3 Avaliao do grau de intensidade da correlao entre duas variveis x e y
Valor de |r| Intensidade da correlao
0 Sem correlao
0 0,3 Fraca
0,3 0,6 Mdia
0,6 0,9 Forte
0,9 1 Muito forte
1 Perfeita
12.1.3 Teste de hiptese para correlao
Sempre que um coeficiente de correlao r calculado, preciso verificar
se a associao entre as duas variveis analisadas real, isto , se ela verda-
deira ou se ocorreu somente em razo do erro amostral aleatrio, em razo do
acaso. Ou seja, se ela, de fato, pode ser inferida ou no para a populao de onde
a amostra foi retirada. Para tal objetivo, necessria a aplicao de um teste de
hiptese, para o qual se usa o mesmo raciocnio aplicado nos testes de hiptese
para mdias.
O raciocnio do teste o seguinte: o verdadeiro coeficiente de corre-
lao populacional
1
(l-se r) somente poderia ser calculado caso todos
os possveis pares x e y, da populao, pudessem ser obtidos. Como isto
geralmente no possvel, a inferncia para a populao feita a partir do
coeficiente de correlao amostral r, o qual representa uma estimativa por
ponto de . Assim, temos que o coeficiente um parmetro geralmente
desconhecido, para o qual os valores podem variar de 1 a +1, sendo a rela-
o linear considerada direta quando for positivo, e inversa quando for
negativo. O valor de ser zero quando as duas variveis no forem linear-
mente correlacionadas.
Para realizar o teste de hiptese, supe-se, inicialmente, que = 0, isto
, no existe correlao entre as variveis x e y. Se isto for verdade, para um
conjunto de vrias amostras aleatrias, os valores de r obtidos devem ser, na
1. = ro (l-se r) Letra r minscula, no alfabeto grego.
BIOESTATISTICA_VOL02.indb 54 25/06/12 17:20
CORRELAO E REGRESSO LINEAR SIMPLES 55
sua maioria, prximos de zero, com somente alguns poucos valores mais afas-
tados do centro da distribuio. Caso contrrio, se 0, espera-se que a maior
parte dos valores de r esteja bastante afastada de zero, alm do que seria de
se esperar somente por acaso. Assim, para avaliar a significncia estatstica do
coeficiente de correlao r, testa-se a hiptese nula (H
0
) que = 0, utilizando-se
a distribuio t com n 2
2
graus de liberdade, sendo n o nmero de pares das
observaes de x e y. O valor de t
calc
dado pela seguinte frmula:
t
r
EP
r
r
n
calc
r
=

=

1
2
0
2
, onde: (por supossio)
Portanto, se o valor de t
calc
for menor que o valor crtico de t tabelado, para
um nvel de significncia predeterminado e n 2 graus de liberdade, a correla-
o no apresenta significncia estatstica e, portanto, H
0
no deve ser rejeitado.
Por outro lado, quando t
calc
for maior que o valor de t tabelado, rejeita-se H
0
e a
correlao dita estatisticamente significativa. A seguir, utilizando-se os dados
do exemplo da Tabela 12.2, mostraremos as etapas para o teste de hiptese
para correlao.
Passo 1 Formular as hipteses estatsticas:
H
0
: =0 e H
A
: 0
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%) bilateral
Passo 3 Determinar o valor crtico do teste t:
gl n t = = = = 2 12 2 10 2 228
0 05 10 , ;
,
Passo 4 Calcular o valor do teste t para r = 0,8352:
t
r
r
n
calc
=

=
1
2
0 8352
1 0 8352
12 2
0 8352
0 17 2 2
,
( , )
,
, 440
4 80 = ,

2. Considera-se n 2 graus de liberdade, porque um grau de liberdade perdido para cada
varivel.
BIOESTATISTICA_VOL02.indb 55 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 56
Passo 5 Regra de deciso:

Se , aceita-se
Se |
| | .
|
, ;
t t H
t
calc
calc
<
0 05 10 0
, rejeita-se
Como | =4,80
t H
t
calc
0 05 10 , ;
.
|
0
>> , rejeita-se t H
0 05 10
2 228
, ;
, . =
0
Passo 6 Concluso:
Existe, portanto, uma forte evidncia que as variveis presso arterial
sistlica e presso arterial diastlica estejam diretamente relacionadas,
isto , que existe uma correlao linear significante entre elas, na popula-
o de onde a amostra foi retirada, pois t gl P
calc
= = = 4 80 10 0 0007 , ; ; , .
12.1.4 Coefciente de determinao (r
2
)
O coeficiente de determinao r
2
uma boa maneira de medir a associao
linear entre duas variveis quantitativas, pois ele representa a proporo da
variabilidade de uma varivel, no caso a varivel y, que explicada pela variabi-
lidade da outra varivel, no caso, a varivel x. Este coeficiente oscila entre 0 e 1,
assim, quanto maior for o valor de r
2
, maior ser a dependncia de uma varivel
em relao a outra, isto , melhor ser o ajuste da reta em relao aos dados
coletados. Assim, para os dados do exemplo anterior, temos:
r r r = = 0 8352 0 6976 70
2 2
, , % ou
Com base no valor de r
2
,
pode-se concluir que 70% da variao da pres-
so arterial diastlica podem ser explicados pelos valores da presso arterial
sistlica. Com base neste raciocnio, os 30% restantes da variao da presso
arterial diastlica devem ser explicados por outros fatores, alm da presso
arterial sistlica, os quais no foram includos nos estudos, tais como o volume
sistlico ou a frequncia cardaca, por exemplo.
Note que, antes de realizar o clculo do coeficiente de correlao (r),
para, ento, calcular o coeficiente de determinao (r
2
), o pesquisador pre-
cisar definir qual das duas variveis ser a varivel preditora (x) e qual ser
BIOESTATISTICA_VOL02.indb 56 25/06/12 17:20
CORRELAO E REGRESSO LINEAR SIMPLES 57
a varivel resposta (y). Essa escolha deve ser feita a fim de que a pesquisa
apresente uma lgica de raciocnio para o coeficiente de determinao,
embora os valores de r, r
2
e valor P no sofram alterao, independen-
temente de qual das variveis seja x ou y. Por exemplo, se o pesquisador
estiver correlacionando a idade com a estatura de crianas, a idade dever
ser considerada a varivel preditora x, ao passo que a estatura, a varivel
resposta y, uma vez que, em crianas, ser sempre a idade a influenciar na
estatura e no o contrrio, pois no faz sentido que variaes da estatura
modifiquem a idade da criana. Note, tambm, que, em algumas situaes,
a definio de qual das variveis ser x e qual ser y no tem importn-
cia para o raciocnio do coeficiente de determinao, uma vez que elas se
influenciam mutuamente, como o caso de um experimento que correla-
cione presso e temperatura, por exemplo. Do mesmo modo, pode ocorrer
que variveis no apresentem qualquer relao de causa e efeito entre elas,
sendo a correlao, apenas uma coincidncia.
12.2 REGRESSO LINEAR SIMPLES
Aps a verificao de que a correlao entre duas variveis significa-
tiva, o prximo passo determinar a equao da linha que melhor modela
os dados. Este procedimento, que em estatstica chamado de regresso
linear, pode ser definido como a tentativa de se estabelecer uma equao
matemtica simples que descreva a relao entre duas variveis aleatrias
quantitativas, normalmente distribudas, sendo uma delas, a varivel inde-
pendente x, e a outra, a varivel dependente y. O termo foi introduzido por
sir Francis Galton
3
, em 1886, em trabalho por ele publicado, que tentou
explicar a variao das estaturas dos filhos em relao s estaturas dos pais,
quando, ento, descreveu o fenmeno conhecido como regresso em dire-
o mdia. Na prtica, na regresso linear simples, o pesquisador cria um
modelo matemtico com o objetivo de descrever o comportamento da vari-
3. Francis Galton (1822-1911) Estatstico, matemtico e meteorologista ingls, foi o criador do
conceito estatstico de correlao e regresso em direo mdia. Aplicou mtodos estatsticos
para o estudo das diferenas e herana humanas de inteligncia, e fundou a psicometria e a
psicologia diferencial.
BIOESTATISTICA_VOL02.indb 57 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 58
vel resposta y (dependente) em funo das variaes da varivel preditora
x (independente), na tentativa de utilizar uma delas para fazer previses a
respeito da outra.
Matematicamente, o procedimento da regresso linear consiste em cal-
cular uma reta que, no diagrama de disperso, melhor represente todos os
pontos do grfico, de tal maneira que a relao existente entre as duas variveis
possa ser expressa por meio de uma equao de regresso, cujos coeficientes
reflitam a intensidade desta relao. Ou seja, neste procedimento, o objetivo
buscar a equao matemtica de uma reta (da o termo linear) na qual a vari-
vel resposta y possa ser expressa como uma funo da varivel preditora x.
Assim, a linha reta calculada por essa equao, chamada de linha de regresso
ou linha de melhor ajuste, pode ser usada a fim de predizer o valor de y para
um dado valor de x. A equao da reta dada por:
y a bx = +
Onde: y = Valor da varivel resposta (dependente).
x = Valor da varivel preditora (independente).
a = Coeficiente linear (corresponde ao ponto onde a reta intercepta
o eixo y, isto , onde x = 0).
b = Coeficiente angular ou coeficiente de regresso (mostra a incli-
nao da reta, isto , a variao de y para cada acrscimo de uma
unidade em x).
A Figura 12.4, abaixo, mostra a reta de melhor ajuste para os valores das
variveis presso arterial sistlica e diastlica. Note que no diagrama, um
conjunto de linhas pode ser desenhado atravs de um conjunto de pontos,
porm a linha de regresso determinada de modo a obedecer a critrios
especficos, pois ela representa os valores mdios esperados de y para distin-
tos valores de x. Isto , a reta contm os valores esperados para y medida
que os valores de x aumentam. Portanto, o diagrama contm os valores obser-
vados, ao passo que a reta contm os valores que se esperariam encontrar se
a correlao fosse perfeita, com r =1.
BIOESTATISTICA_VOL02.indb 58 25/06/12 17:20
CORRELAO E REGRESSO LINEAR SIMPLES 59



Fig. 12.4 Diagrama de disperso dos valores da presso arterial de 12 indivduos
Note, tambm, que, em um experimento, todos os pontos observados difi-
cilmente se posicionaro exatamente sobre uma linha reta perfeita, embora,
se a correlao existe (r 0), eles sempre tendero para o alinhamento, sendo
estes desalinhamentos atribudos ao acaso, ao desvio aleatrio. Assim, para
cada ponto observado de x, d
i
representa a diferena (desalinhamento) entre o
valor observado e o valor esperado de y, sendo estas diferenas chamadas de
erros ou resduos, os quais podem ser positivos, negativos ou iguais a zero.
Quando o ponto est acima da linha de regresso, d > 0; quando est abaixo da
linha, d < 0; e quando o valor y observado igual ao valor y esperado, o ponto
coincide com a linha de regresso, sendo, portanto, d = 0. Com base neste racio-
cnio, a linha de regresso aquela que melhor se ajusta aos valores observados
de y, ou seja, a reta para a qual a soma dos quadrados dos resduos (d
2
)
mnimo. A este processo d-se o nome de mtodo de mnimos quadrados.
12.2.1 Determinao da reta de regresso
A verdadeira reta de regresso para uma dada populao somente seria
obtida caso todos os valores de x e y fossem conhecidos. Porm, como normal-
mente isso impossvel de ser feito, o mais comum que a regresso entre
as variveis estudadas seja calculada tomando-se uma amostra n de pontos,
aleatoriamente coletados, da populao e, a partir desses pontos, determi-
BIOESTATISTICA_VOL02.indb 59 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 60
nar os valores do coeficiente linear (a) e do coeficiente angular (b), de tal
maneira que a reta encontrada possa ser ajustada aos pontos do diagrama de
disperso. Assim, como explicado no item anterior, os valores dos parmetros
a e b so calculados de modo que a soma dos quadrados dos desvios dos valo-
res y observados e a reta seja mnima. As frmulas so as seguintes:
b
x y
x y
n
x
x
n
x x y y
x
i i
i i
i
i
i i
=

( )( )

( )
=

2
2
( )( )
(
ii
x

)
a y bx =
Onde:

x x
y
=
=
Mdia dos valores de
Mdia dos valores de
.
y.
Assim, tomando-se os dados do exemplo anterior, temos:
Tabela 12.4 Valores das presses arteriais sistlica e diastlica de 12 pacientes
Paciente
Valores da presso arterial (mmHg)
Sistlica (x) Diastlica (y) x.y x
2
y
2
01 108 65 7.020 11.664 4.225
02 125 74 9.250 15.625 5.476
03 100 64 6.400 10.000 4.096
04 108 68 7.344 11.664 4.624
05 112 72 8.064 12.544 5.184
06 102 66 6.732 10.404 4.356
07 112 68 7.616 12.544 4.624
08 122 70 8.540 14.884 4.900
09 116 70 8.120 13.456 4.900
10 116 70 8.120 13.456 4.900
11 120 72 8.640 14.400 5.184
12 108 70 7.560 11.664 4.900
1.349 829 93.406 152.305 57.369
BIOESTATISTICA_VOL02.indb 60 25/06/12 17:20
CORRELAO E REGRESSO LINEAR SIMPLES 61
b
x y
x y
n
x
x
n
i i
i i
i
i
=

( )( )

( )
=


2
2
93 406
1 349
.
( . )(8829
12
152 305
1 349
12
93 406 93 193 41
152
2
)
.
( . )
. . ,
.

=

b
3305 151 650 08
212 59
654 92
0 32

= =
. .
,
,
,
a y bx = = = = 69 08 0 32 112 41 69 08 35 97 33 11 , , , , , ,
Portanto, aps calcular os valores estimados para a = 0,32 e b = 33,11,
possvel, agora, determinar o traado da reta de regresso. Para isso, utiliza-se
a equao de regresso, na qual, para cada um dos valores de x, pode-se calcular
o respectivo valor de y. Assim, a reta estimada para a regresso linear dada por:

y a bx = +
Onde

y representa o valor estimado de y para um especfico valor de x.


Deste modo, a equao da reta estimada para os dados da Tabela 12.4
dada por

, , y x = + 33 11 0 32 . Assim, para um valor de x igual a 116 mmHg, temos:

, ,

, , , y y = + = + = 33 11 0 32 116 33 11 37 12 70 23 mmmHg .
Desta forma, para se desenhar a reta de regresso estimada, sobre o
grfico de disperso, utiliza-se a frmula de regresso com valores calcula-
dos de a e b. Para tal finalidade, dois valores extremos observados de x so
escolhidos, de tal maneira que erros no traado possam ser minimizados. A
seguir, calculam-se os correspondentes valores esperados para(

) y . Como
exemplo, temos:
Para mmHg mm x y = = + = 100 33 11 0 32 100 65 11 ,

, , , H Hg.
Para mmHg x y = = + = 125 33 11 0 32 125 73 1 ,

, , , 11 mmHg.
BIOESTATISTICA_VOL02.indb 61 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 62
Isto feito, e de posse dos pares ordenados (100; 65,11) e (125; 73,11),
marcam-se os pontos no grfico e traa-se a reta que une esses pontos.
A Figura 12.4 mostra os pontos observados no experimento e a reta ajus-
tada. Note que, no grfico, os pontos no esto posicionados sobre a reta de
ajustamento, mas um pouco afastados em relao a ela. Isto indica que os
valores observados de y no so iguais aos valores esperados(

) y . A Tabela
12.5 mostra os valores observados e esperados de y, para cada um dos
valores de x.
Tabela 12.5 Valores das presses arteriais sistlica e diastlica de 12 pacientes
Paciente
Valores da presso arterial (mmHg)
Sistlica (x) Diastlica (y) Diastlica ( y)
01 108 65 67,67
02 125 74 73,11
03 100 64 65,11
04 108 68 67,67
05 112 72 68,95
06 102 66 65,75
07 112 68 68,95
08 122 70 72,15
09 116 70 70,23
10 116 70 70,23
11 120 72 71,51
12 108 70 67,67
No dia-a-dia da pesquisa, a reta de ajuste traada pelos programas de
estatstica para computadores.
12.2.2 Teste de hiptese para a regresso linear
Para que se possa utilizar a reta de regresso a fim de fazer previ-
ses para y, com base em valores determinados de x, deve-se realizar um
teste de hiptese com o objetivo de verificar se a regresso de x sobre y
verdadeira, isto , se a dependncia de y em relao a x real, se no
ocorreu por acaso, em razo do erro aleatrio. Assim, como a dependncia
de y em relao a x dada pelo coeficiente de regresso (b), o qual geral-
mente calculado com base em uma amostra, o teste de hiptese serve
BIOESTATISTICA_VOL02.indb 62 25/06/12 17:20
CORRELAO E REGRESSO LINEAR SIMPLES 63
para verificar se existe uma diferena estatisticamente significativa entre
o coeficiente calculado b e o verdadeiro coeficiente da populao (B) de
onde a amostra foi retirada.
O teste segue o mesmo raciocnio utilizado para a correlao linear: o
verdadeiro valor do coeficiente de regresso populacional B somente
poderia ser calculado caso todos os possveis valores de x e y, da populao,
pudessem ser conhecidos. Como isto geralmente no possvel, a infern-
cia para a populao feita a partir do coeficiente de regresso amostral b,
o qual representa uma estimativa por ponto de B. Para realizar o teste de
hiptese, supe-se, inicialmente, que B = 0, isto , no existe dependncia de
y em relao x. Se isto for verdade, para um conjunto de vrias amostras
aleatrias, os valores de b obtidos devem ser, na sua maioria, prximos de
zero, com somente alguns poucos valores mais afastados. Caso contrrio, se B
0, espera-se que a maior parte dos valores de b esteja bastante afastada de
zero, alm do que seria de se esperar somente por acaso. Assim, para avaliar a
significncia estatstica do coeficiente de regresso b, testa-se a hiptese nula
(H
0
) que B = 0, utilizando-se a distribuio t com n 2 graus de liberdade,
sendo n o nmero de pares das observaes de x e y. O valor de t
calc
dado
pela seguinte frmula:
t
b B
EP
b
EP
b
y y
n x x
calc
b b
=

=

= , ond
(

)
( ) ( )
2
2
2
ee (por suposio) B =0
O EP
b
tambm pode ser calculado pela seguinte frmula:
EP
y a y b xy
n x
x
n
b
=
2
2
2
2


( )
( )
Portanto, se o valor de t
calc
for menor que o valor crtico de t tabelado,
para um nvel de significncia predeterminado e n 2 graus de liberdade,
a regresso no apresenta significncia estatstica e, portanto, H
0
no deve
BIOESTATISTICA_VOL02.indb 63 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 64
ser rejeitado. Por outro lado, quando t
calc
for maior que o valor de t tabelado,
rejeita-se H
0
e a regresso dita estatisticamente significativa. A seguir, utili-
zando-se os dados do exemplo da Tabela 12.4, mostraremos as etapas para o
teste de hiptese para regresso.
Passo 1 Formular as hipteses estatsticas:
H B
0
: =0

e

H B
A
: 0
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%) bilateral
Passo 3 Determinar o valor crtico do teste t:
gl n t = = = = 2 12 2 10 2 228
0 05 10 , ;
,
Passo 4 Calcular o valor do teste t para b = 0,32:



EP
y a y b xy
n x
x
n
b
= =
2
2
2
2
57 369


( )
( )
. ( ( , ) ( , . )
( )( .
.
33 11 829 0 32 93 406
12 2 152 305
1 349
2
x x

112
30 89
6 549 20
0 0048 0 069 =
,
. ,
, , = =
t
b
EP
calc
b
= = =
0 32
0 069
4 63
,
,
,
Passo 5 Regra de deciso:
Se | , aceita-se
Se |
t t H
t
calc
calc
| .
|
, ;
<
0 05 10 0
, rejeita-se
Como | =4,63
t H
t
calc
0 05 10 , ;
.
|
0
>> , rejeita-se t H
0 05 10
2 228
, ;
, . =
0
BIOESTATISTICA_VOL02.indb 64 25/06/12 17:20
CORRELAO E REGRESSO LINEAR SIMPLES 65
Passo 6 Concluso:
Existe, portanto, na populao de onde a amostra foi retirada, uma depen-
dncia positiva da presso arterial diastlica em relao presso arterial
sistlica. Isto , para cada acrscimo de um mmHg no valor da presso arterial
sistlica, espera-se que a presso arterial diastlica aumente em 0,32 mmHg,
pois

t gl P
calc
= = = 4 63 10 0 0007 , ; ; , .
Condies para o uso da regresso linear
Antes que o investigador decida utilizar a reta de regresso para fazer infe-
rncias sobre as variveis analisadas, ele deve observar os seguintes pontos
(pressuposies):
Condio de normalidade Ao menos, a varivel dependente y deve
apresentar-se normalmente distribuda ou aproximadamente normal.
Como os valores da varivel independente so geralmente escolhidos pelo
pesquisador, esta condio de normalidade no exigida para x, diferente-
mente da anlise de correlao, em que as duas variveis devem apresen-
tar distribuio normal.
Homocedasticidade A variao da varivel dependente y deve ser a
mesma para cada valor da varivel independente x. Caso esta condio no
seja cumprida, deve-se tentar transformar os dados.
Linearidade O diagrama de disperso deve apresentar os pontos dis-
tribudos com uma tendncia linear, de modo que indique a existncia
de uma correlao entre as variveis. Caso os pontos do diagrama se
apresentem de maneira muito dispersa, a equao no ser uma reta, de-
vendo, o pesquisador, tentar transformar os dados de maneira que possa
obt-la.
Aleatoriedade Os valores das variveis devem ser obtidos ao acaso na
populao, sendo, portanto, independentes.
De qualquer forma, mesmo que os requisitos acima citados tenham sido
cumpridos, alguns cuidados devem ser observados:
Se no h correlao estatisticamente significativa, no se deve utilizar a
equao de regresso para fazer predies;
Ao utilizar a equao de regresso para fazer predies, o pesquisador
BIOESTATISTICA_VOL02.indb 65 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 66
deve-se manter no mbito dos dados amostrais, pois no correto utilizar
a equao para fazer predies sobre uma populao diferente daquela de
onde os dados foram coletados;
Para uma determinada populao, a equao de regresso baseada em
dados do passado no necessariamente vlida para dados do presente,
pois as caractersticas da populao podem ter mudado com o passar do
tempo;
Para calcular os coeficientes da equao de regresso, devem ser utilizados
os dados individualmente coletados, de cada uma das variveis estudadas.
No utilizar mdias nem valores outliers, pois eles podem distorcer a cor-
relao e, tambm, os coeficientes da regresso.
12.2.3 Anlise de resduos ()
Uma outra maneira de avaliar a regresso linear pela aplicao do
mtodo grfico da anlise de resduos, os quais so definidos como erros
observados, isto , eles correspondem s diferenas entre os valores observa-
dos de y e os valores

y previstos pela equao de regresso.


= (

) y y
Para aplicao do mtodo, desenha-se um grfico de disperso, no qual
os valores dos resduos so colocados no eixo vertical e os valores de

y no
eixo horizontal. Traa-se, na altura do resduo zero, uma linha horizontal
paralela ao eixo x. Os pontos do diagrama devem apresentar uma distribui-
o equilibrada acima e abaixo da reta horizontal, de maneira semelhante
a uma faixa horizontal. A Figura 12.5 mostra o teste grfico para validar as
pressuposies da regresso linear dos valores das presses arteriais do
exemplo anterior.
Caso o grfico de resduos mostre uma distribuio em forma de curva, isto
indica falta de linearidade dos pontos do diagrama de disperso. Do mesmo
modo, se o grfico de resduos apresentar uma distribuio de seus pontos, em
forma de um megafone (cone deitado), isto indica falta de homocedasticidade
entre os valores de x e y.
BIOESTATISTICA_VOL02.indb 66 25/06/12 17:20
CORRELAO E REGRESSO LINEAR SIMPLES 67

Fig. 12.5 Teste grfco da anlise de resduos para a regresso linear dos valores da presso
arterial de 12 indivduos
Aplicao da regresso linear simples
A anlise de regresso linear simples tem ampla aplicao na pesquisa
experimental, alm de ser um dos mtodos estatsticos mais utilizados quando
se deseja estudar a relao entre duas variveis quantitativas normalmente
distribudas. Para ilustrar sua aplicao, mostraremos dois exemplos de an-
lise de regresso em modelos experimentais. O primeiro exemplo mostra uma
anlise isolada, ao passo que, no segundo exemplo, o objetivo comparar dois
conjuntos de dados para verificar se existem diferenas entre eles.
Exemplo 1: Um pesquisador estudou a relao entre o comprimento total
e o peso da espcie de peixe bagre (Arius passany). Para tal, selecionou uma
amostra de 20 exemplares adultos da espcie. Os dados e os grficos da corre-
lao esto representados abaixo. Existe associao entre o comprimento e o
peso na espcie estudada?
Comprimento
(cm)
710 715 770 790 730 800 780 705 740 775 870 710 725 860 760 820 720 770 785 860
Peso (kg) 3,70 3,35 3,65 5,10 4,00 5,00 4,70 3,35 3,55 4,10 5,70 3,55 3,85 5,50 4,20 5,90 3,05 4,20 4,85 5,55
BIOESTATISTICA_VOL02.indb 67 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 68

Fig. 12.7 Diagrama de disperso da regresso linear e da anlise de resduos da correlao
entre o comprimento e o peso da espcie bagre (Arius passany)
Anlise da regresso:
Coeficiente de correlao (r = 0,9180) Indica que existe correlao li-
near fortemente positiva entre o comprimento total e o peso da espcie
de peixe avaliada. Isto , a variao do peso est diretamente associada
variao do comprimento do corpo.
Coeficiente de determinao (r
2
= 0,8428) Mostra que, em mdia,
84,28% da variao do peso da espcie bagre explicada pela variao do
comprimento total do corpo. Isto , 84,28% do peso corporal dependem
BIOESTATISTICA_VOL02.indb 68 25/06/12 17:20
CORRELAO E REGRESSO LINEAR SIMPLES 69
diretamente do comprimento do corpo. Os 15,72% restantes do peso do
corpo so explicados por outros fatores no estudados na pesquisa, tais
como a circunferncia abdominal, o comprimento das nadadeiras etc.
Valor P < 0,0001 Indica que a regresso linear no ocorreu ao acaso,
existindo, portanto, na espcie estudada, uma dependncia verdadeira en-
tre as variveis peso e comprimento total do corpo, ou seja, existe re-
gresso do peso sobre o comprimento do corpo.
Equao de regresso (

, , y x = + 7 55 0 01 ) Pela anlise do coeficiente
de regresso da equao (b = 0,01), pode-se concluir que, para cada acrs-
cimo de 1,0 cm no comprimento total do corpo, espera-se que ocorra, em
mdia, um aumento de 10 g no peso do peixe. A equao pode ser utilizada
para se fazer predies sobre o peso em relao ao comprimento total do
corpo, para a espcie estudada.
Anlise de resduos O grfico mostra os pontos com uma distribuio
equilibrada acima e abaixo da reta horizontal. Isto indica que as pressupo-
sies para a homocedasticidade e linearidade dos dados foram cumpridas.
Concluso H evidncias para se afirmar que existe associao entre o
comprimento total e o peso na espcie estudada?
Exemplo 2: Um pesquisador desejava estudar o valor biolgico da protena
da soja e compar-lo com a protena do leite (casena), tomada como valor de
referncia. Para tal finalidade, selecionou duas amostras de 10 de ratos adultos,
da espcie Wistar (Rattus norvegicus). Ambos os grupos receberam dietas de
composio idnticas, exceto para o tipo de protena. Para o grupo CA, foi admi-
nistrada dieta contendo a protena do leite (casena), durante um perodo de
14 dias. Para o grupo SO, dieta contendo a protena de soja, por igual perodo de
tempo. Os valores mdios da ingesto de protena e do ganho de peso, dirios,
foram registrados para avaliao da correlao nos grupos estudados. Os dados
e os grficos esto representados a seguir. O valor biolgico da protena da soja
difere daquele da protena do leite?
Grupo
CA
Consumo protico (g) 14,31 13,63 14,89 14,60 13,42 16,25 14,59 16,35 13,50 15,75
Ganho de peso (g) 54,93 50,53 55,03 51,13 51,73 60,33 56,43 61,33 52,33 52,73
Grupo
SO
Consumo protico (g) 9,70 8,52 11,73 8,64 9,30 10,14 9,92 11,44 8,49 11,34
Ganho de peso (g) 55,10 50,82 57,32 51,12 51,74 57,84 56,18 58,20 52,34 52,20
BIOESTATISTICA_VOL02.indb 69 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 70

Fig. 12.8 Diagrama de disperso da regresso linear e da anlise de resduos da correlao
entre a ingesto de casena e o ganho de peso de ratos Wistar

Fig. 12.9 Diagrama de disperso da regresso linear e da anlise de resduos da correlao
entre a ingesto de protena da soja e o ganho de peso de ratos Wistar
Anlise das regresses:
Coeficientes de correlao (r = 0,7839 e r = 0,6827) Comparando os
dois coeficientes, verifica-se que tanto a protena do leite quanto a prote-
na da soja apresentaram uma forte correlao com o ganho de peso dos
animais.
Coeficientes de determinao (r
2
= 0,6145 e r
2
= 0,4661) Mostram que,
para o primeiro grupo, a ingesto da casena explica, na mdia, 61,45% da
variao de peso dos animais, ao passo que, no segundo grupo, a prote-
BIOESTATISTICA_VOL02.indb 70 25/06/12 17:20
CORRELAO E REGRESSO LINEAR SIMPLES 71
na da soja responsvel somente por 46,61% desta variao. Tomando-se
como base este raciocnio, pode-se concluir que, no experimento, a pro-
tena do leite mostrou-se mais efetiva em aumentar o peso dos animais
quando comparada protena da soja.
Valores P (0,0073 e 0,0295) Indica que, em ambas as dietas, a regresso
linear no ocorreu ao acaso, e que existe, portanto, uma dependncia ver-
dadeira entre as dietas estudadas e o ganho de peso dos animais, ou seja,
existe regresso do ganho de peso sobre o consumo de protena.
Equaes de regresso (

, ,

, , y x y x = + = + 14 74 2 70 38 13 1 63 e ) Pela
anlise dos coeficientes de regresso das equaes (b
1
= 2,70 e b
2
= 1,63),
pode-se concluir que, para o primeiro grupo, para cada acrscimo de 1,0
g na ingesto de casena, espera-se que ocorra, em mdia, um aumento
de 2,70 g/dia no peso dos animais, ao passo que, para o segundo grupo,
para cada acrscimo de 1,0 g na ingesto da protena da soja, espera-se
que ocorra, em mdia, um aumento de peso de 1,63 g/dia. Esta compa-
rao mostra que a casena produz um ganho de peso dirio maior que a
protena da soja, embora o teste de comparao dos coeficientes de regres-
so no tenha mostrado diferena estatisticamente significativa, pois valor
P = 0,2826 (calculado pelo programa BioEstat).
Anlises de resduos Os grficos mostram, nos dois casos, que os pontos
apresentam uma distribuio equilibrada, acima e abaixo da reta horizon-
tal. Isto indica que as pressuposies para a homocedasticidade e lineari-
dade dos dados foram cumpridas
Concluso No h evidncias para se afirmar que o valor biolgico da pro-
tena da soja difere daquele da protena do leite, pois os coeficientes de re-
gresso no mostraram diferena estatisticamente significativa (P = 0,2826).
BIOESTATISTICA_VOL02.indb 71 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 72
BIOESTATISTICA_VOL02.indb 72 25/06/12 17:20
13
Testes de Aderncia
Os testes de hipteses para inferncias estatsticas univariadas so aqueles
que correlacionam um parmetro amostral com o mesmo parmetro da popu-
lao estudada. Geralmente, esta correlao ocorre pela comparao dos valo-
res dos dados amostrais com os valores que se esperaria obter em uma distri-
buio terica, sendo, por este motivo, denominados de testes de aderncia,
os quais pertencem a uma classe de teste de hiptese cuja funo verificar
se a distribuio de frequncia dos dados da amostra estudada segue a forma
da curva de uma distribuio hipottica. Na prtica, como qualquer teste de
hiptese, eles tm o objetivo de verificar se existe uma diferena estatistica-
mente significativa entre os dados observados e aqueles que se esperaria obter
atravs de uma distribuio terica, casos esses dados tenham sido obtidos da
mesma populao hipottica.
Por exemplo, um pesquisador que deseja comparar os dados de duas
amostras, supe que estes dados apresentem uma distribuio normal, pois
isto permite que ele possa escolher a maioria das tcnicas de inferncia es-
tatstica conhecidas. Para avaliar se sua suposio est correta, ele deve es-
colher, dentre os diversos existentes, um teste de aderncia, para verificar
se a distribuio dos seus dados amostrais adere, isto , segue o modelo da
distribuio normal.
BIOESTATISTICA_VOL02.indb 73 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 74
Isso sempre possvel, porque uma varivel aleatria, seja ela a estatura
ou a idade de um determinado grupo de indivduos, por exemplo, sempre as-
sume um tipo de distribuio de frequncia especfica dentre as diversas das
muitas distribuies tericas citadas na literatura. Essas distribuies so mo-
delos que procuram representar o comportamento de um determinado even-
to em funo da frequncia de sua ocorrncia, sendo, portanto, distribuies
de probabilidades, nas quais, para um determinado evento, podemos prever a
probabilidade de sua ocorrncia. Em outras palavras, podemos inferir com que
probabilidade determinado evento pode ocorrer novamente. Assim, quando
um pesquisador assume que um determinado grupo de dados se distribui con-
forme um modelo probabilstico, isso permite que ele realize estimativas sem
precisar da totalidade das informaes da populao de onde os dados foram
retirados. Porm, muito frequentemente, surge uma dvida: como estimar se a
distribuio de um conjunto de dados segue um determinado modelo terico?
Para que possa responder sua pergunta, o pesquisador dever aplicar um
teste de aderncia, muitas vezes chamados de Testes de Bondade de Ajuste
(goodness of fit test), uma vez que estes testes tentam verificar se os dados
amostrais se ajustam bem ou no a uma distribuio terica.
Por sua vez, interessante notar que existem testes de aderncia que ser-
vem para avaliar hipteses mais gerais sobre a distribuio dos dados, enquan-
to que outros so especficos para determinados modelos tericos. Assim, na
rea das cincias biolgicas e da sade, os testes de aderncia mais utilizados
so: o teste de Kolmogorov-Smirnov
1
e o teste do qui-quadrado da adern-
cia, sendo o primeiro, o teste no-paramtrico mais apropriado para quando se
trabalha com dados ordinais, e ideal para variveis contnuas, e o segundo, ide-
al para variveis dicotmicas. Outros testes, tais como o de Anderson-Darling
e o de Shapiro-Wilk, tambm podem ser utilizados e constituem uma alterna-
tiva para os testes de Kolmogorov-Smirnov e do qui-quadrado, pois apresen-
tam, como vantagem, maior sensibilidade, sendo o de Shapiro-Wilk o teste de
normalidade preferido em razo de ser mais poderoso para amostras menores
1. Andrei Nikolaevich Kolmogorov (1903-1987) - Matemtico russo, autor das principais
descobertas cientficas do sculo XX nas reas de probabilidade e estatstica. Vladimir
Ivanovich Smirnov (1887-1974) Matemtico russo, autor de significativas contibuies para
matemtica pura e aplicada, assim como para a histria da matemtica.
BIOESTATISTICA_VOL02.indb 74 25/06/12 17:20
TESTE DE ADERNCIA 75
ou iguais a 50, enquanto que o teste de Anderson-Darling tem mais poder para
amostras maiores de 50.
Assim, para qualquer tipo de teste de aderncia, o princpio bsico que,
para uma dada amostra de tamanho n, observada a partir de uma varivel
aleatria x, o objetivo testar a hiptese nula (H
0
) de que x segue uma dis-
tribuio terica, contra a hiptese alternativa (H
1
), na qual x no segue a
distribuio. Portanto, neste captulo, abordaremos os testes de Kolmogorov-
-Smirnov e o teste de Shapiro-Wilk, ao passo que, para melhor compreenso,
o teste do qui-quadrado da aderncia ser discutido no captulo que trata dos
testes no-paramtricos.
13.1 TESTE DE KOLMOGOROV-SMIRNOV (TESTE D)
Teste de aderncia no-paramtrico, com base em amostras finitas, utili-
zado para determinar se duas distribuies de probabilidade subjacentes dife-
rem uma da outra, ou se uma distribuio de probabilidade observada difere
de uma distribuio terica. uma prova aplicada para testar a hiptese de que
um conjunto de dados amostrais provm ou no de uma determinada distribui-
o. Neste caso, a comparao feita para se verificar o grau de concordncia
entre a distribuio acumulada de um conjunto de valores de uma amostra ale-
atria e a distribuio terica esperada.
Neste teste, de execuo simples quando comparado ao qui-quadrado, cal-
cula-se o mdulo da maior diferena (D
mx
) entre a funo de distribuio nor-
mal acumulada esperada (F
esp
)
2
e a funo da distribuio da frequncia relativa
observada acumulada e ajustada (F
obs
) dos valores amostrais observados. Para
tal, necessrio, inicialmente, que os valores observados sejam normalizados. A
seguir, esta diferena comparada com o desvio mximo tabelado (D
t
), o qual
encontrado na tabela dos valores crticos da distribuio Kolmogorov-Smirnov.
Caso a diferena mxima calculada seja maior que o desvio mximo tabelado,
rejeita-se H
0
e afirma-se que no h concordncia entre os valores observados e
esperados. Isto , conclui-se que os dados amostrais no seguem a distribuio
2. conveno usar um F maisculo para a funo de distribuio acumulada.
BIOESTATISTICA_VOL02.indb 75 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 76
terica esperada, para um determinado nvel de significncia. Caso contrrio, se
a diferena mxima calculada for menor que o desvio mximo tabelado, se aceita
H
0
e conclui-se que os dados seguem a distribuio terica esperada.
Na prtica, a maneira mais fcil de executar o teste de Kolmogorov-Smir-
nov construir uma tabela de distribuio de frequncias (Tabela 13.1), na
qual sero colocados todos os dados calculados. A frmula para realizar o teste
a seguinte:

D F x F x
n
F x
esp obs obs mx
= + m x| ( ) ( )| ( ) , sendo:
1
2
==
( , ) i
n
0 5
Para n 100 o desvio mximo tabelado (D
t
) obtido diretamente da tabela.
Para n > 100, o valor D
t
calculado pela seguinte equao:

D
n
t
=

ln
1
2
2

, onde: ln = Logaritmo natural.


= Nvel de significncia estabelecido.
n = Tamanho da amostra.
Exemplo: Em um estudo para avaliar a funo hormonal da glndula pa-
ratireide, um pesquisador dosou o clcio srico em uma amostra aleatria de
oito pacientes atendidos no ambulatrio de um hospital pblico. Os valores
esto expressos no quadro abaixo. Estes resultados tm distribuio normal,
sabendo-se que na populao, em geral, os valores do clcio srico apresentam-
-se normalmente distribudos, com mdia igual a 9,4 mg/dL e desvio padro de
0,8 mg/dL?
Clcio srico (mg/dL) 8,8 9,7 9,2 9,3 8,6 9,1 8,9 8,4
Passo 1 Formular as hipteses estatsticas:


H F x F x
esp obs 0
: ( ) ( ) =
e
H F x F x
A esp obs
: ( ) ( )
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%) bilateral
Passo 3 Determinar o valor crtico do teste:
D
0 05 8
0 4570
. ;
, =
BIOESTATISTICA_VOL02.indb 76 25/06/12 17:20
TESTE DE ADERNCIA 77
Passo 4 Calcular o valor do teste:
Tabela 13.1 Valores da dosagem do clcio, em mg/dL, de oito pacientes
i x
i
z
x x
s
i
i
=

F x
esp
( )
F x
i
n
obs
( )
( )
=
05
| ( ) ( )| F x F x
esp obs

1 8,4 1,5 0,0668 0,0625 0,0043


2 8,6 1 0,1587 0,1875 0,0288
3 8,8 0,5 0,3085 0,3125 0,0040
4 8,9 0,25 0,4013 0,4375 0,0362
5 9,1 0,25 0,5987 0,5625 0,0362
6 9,2 0,5 0,6915 0,6875 0,0040
7 9,3 0,75 0,7734 0,8125 0,0391
8 9,7 1,75 0,9599 0,9375 0,0224
x = 9 0 ,
s =0 4 ,
Quando o valor de z
i
for negativo, deve-se subtrair o valor tabelado (da
tabela da distribuio normal) do valor 0,5. Assim, para z
i
= 1,5 o valor
tabelado 0,4332. Ento, F x
esp
( ) , , , .
1
0 5 0 4332 0 0668 = =
Quando o valor de z
i
for positivo, deve-se somar 0,5 ao valor tabelado (da
tabela da distribuio normal). Assim, para z
8
= 1,75 o valor tabelado
0,4599. Ento,
F x
esp
( ) , , , .
8
0 5 0 4599 0 9599 = + =

D
max
= + = 0 0391
1
16
0 1016 , ,
Passo 5 Regra de deciso:
Se , aceita-se
Se
D D H
D D
mx 0
mx
<

0 05 8
0 05
, ;
,
.
;;
, ;
.
8
0 05 8
, rejeita-se
Como =0,1016 <
H
D D
0
mx
==0 4570 , . , aceita-se H
0
BIOESTATISTICA_VOL02.indb 77 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 78
Passo 6 Concluso:
Como o valor calculado para D
mx
menor que o valor crtico tabelado D
t
,
se aceita H
0
e conclui-se que os valores do clcio srico da amostra seguem
a distribuio normal.
A Figura 13.1 mostra a relao entre as duas curvas de funo dos valores
esperados e observados. Observar que as diferenas entre elas so pequenas, o
que mostra que ambas possuem distribuio normal.

Fig. Relao entre as curvas dos valores esperados e observados

13.2 TESTE DE SHAPIRO-WILK (TESTE W)
Publicado em 1965 por Samuel Shapiro
3
e Martin Wilk
4
, um teste utili-
zado para verificar se os dados seguem a distribuio normal, sendo o mais
indicado quando o tamanho da amostra menor que 50. Igualmente ao teste
de Kolmogorov-Smirnov, o teste de Shapiro-Wilk considera como hiptese nula
(H
0
), aquela em que a amostra foi retirada de uma populao normalmente
3. Samuel Harvey Shapiro (1907-1987) Estatstico russo que emigrou para os Estados Unidos,
estudou na Universidade de Illinois, onde foi governador em 1960 e 1964.
4. Martin Bradbury Wilk (1922) Engenheiro qumico e estatstico canadense que, juntamente
com Samuel Shapiro, desenvolveu o teste de aderncia Shapiro-Wilk.
BIOESTATISTICA_VOL02.indb 78 25/06/12 17:20
TESTE DE ADERNCIA 79
distribuda, sendo obtido pela diviso entre o quadrado da combinao linear
apropriada dos valores ordenados da amostra e a varincia simtrica estimada.
dado pela equao:

W
b
SQD
b a x x
calc N i N i i
i
N
= =
+ +
=
2
1 1
1
, .( ) onde:
//
( )
2
2
1

=
=
e SQD x x
i
n
SQD = Soma dos quadrados dos desvios.
Constante a determinada por: (a a
m V
m V V m
n 1
1
1 1 1 2
,..., )
( )
/
=

Sendo: m os valores esperados da estatstica de ordem da normal padro


para uma amostra de tamanho n.
m = (m
1
,, m
n
)
T
onde m = n/2 se n par e m = (n 1)/2 se n for
mpar.
V - Matriz de covarincia correspondente.
Obs.: Os coeficientes a
N-i+1
podem ser obtidos diretamente da tabela para o tes-
te W de normalidade de Shapiro-Wilk, no final deste livro.
Assim, se o valor de W
calc
for menor que o valor crtico W
t
obtido na tabela
dos valores crticos para o teste de Shapiro-Wilk, em funo do tamanho da
amostra (n) e do nvel de significncia preestabelecido, rejeita-se a hiptese
H
0
e conclui-se que os dados no seguem a distribuio normal; caso contr-
rio, aceita-se H
0
.
Exemplo: Com o objetivo de estudar o comportamento da presso arterial
aps a prtica de atividades fsicas, um pesquisador mediu os valores da pres-
so arterial diastlica de 10 indivduos frequentadores de uma academia. Os
dados esto dispostos no quadro abaixo. Os valores da presso arterial diast-
lica apresentam-se normalmente distribudos?
Presso arterial (mmHg) 80 100 90 70 80 100 90 70 90 100
BIOESTATISTICA_VOL02.indb 79 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 80
Passo 1 Formular as hipteses estatsticas:
H
0
: A amostra provm de uma populao normal.
H
A
: A amostra no provm de uma populao normal.
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%) bilateral
Passo 3 Determinar o valor crtico do teste:

W
0 05 10
0 8420
, ;
, =
Passo 4 Calcular o valor do teste:
Ordenar as observaes 70 70 80 80 90 90 90 100 100 100
Calcular b
2
(utilizar tabela de distribuio).
Tabela 13.2 Valores da dosagem do clcio, em mg/dL, de oito pacientes
i N-i+1 a
N-i+1
x
N-i+1
x
i
a
N-i+1
(x
N-i+1
-x
i
)
1 10 0,5739 100 70 17.2170
2 9 0,3291 100 70 9.8730
3 8 0,2141 100 80 4.2820
4 7 0,1224 90 80 1.2240
5 6 0,0399 90 90 0.0000
= 32, 5960
Ento: b
2 2
32 5960 1 062 50 = = ( , ) . ,

Calcular:

SQD x x
i
n
= =
=

( ) . ,
2
1
1 210 00
W
b
SQD
calc
= = =
2
1 062 50
1 210 00
0 8781
. ,
. ,
,
Passo 5 Regra de deciso:
Se , rejeita-se
Se
W W H
W W
calc
calc
<

0 05 10
0
, ;
.
0
,, ;
,
.
05 10
0
, aceita-se
Como =0,8781 >
H
W W
calc
0
005 10
0 8420
;
, . = , aceita-se H
0
BIOESTATISTICA_VOL02.indb 80 25/06/12 17:20
TESTE DE ADERNCIA 81
Passo 6 Concluso:
Como o valor calculado para W
calc
maior que o valor crtico tabelado W
0,05;10
,
aceita-se H
0
e conclui-se que os valores da presso arterial diastlica dos
indivduos da amostra seguem a distribuio normal, pois W
calc
=0 8781 , ;
P =0 1527 , .
BIOESTATISTICA_VOL02.indb 81 25/06/12 17:20
BIOESTATISTICA_VOL02.indb 82 25/06/12 17:20
parte 4

TESTES DE HI PTESES
NO-PARAMTRI COS
Uma distino importante entre cincia e religio
que, em cincia, as hipteses
precisam ser comprovadas experimentalmente.
Marcelo Gleiser (1959 - )
Autor do livro Poeira das Estrelas.
BIOESTATISTICA_VOL02.indb 83 25/06/12 17:20
BIOESTATISTICA_VOL02.indb 84 25/06/12 17:20
14
Distribuio Qui-Quadrado
Em um processo de anlise bivariada, alm do estudo com variveis
contnuas, para as quais o teste mais utilizado o t de Student, muitas vezes
o pesquisador se depara com testes de hipteses que utilizam variveis no-
-paramtricas do tipo nominal ou dicotmica, como por exemplo, quando
quer comparar variveis qualitativas arranjadas em duas ou mais categorias
bem definidas, tal como doena ou cura, sobrevida ou morte, hipertenso ou
normotenso. Nestes casos, em que cada indivduo do estudo classificado
em somente uma das categorias, as frequncias relativas ou absolutas po-
dem ser analisadas pela aplicao da distribuio qui-quadrado (
2
), sendo
o teste do qui-quadrado, o teste de probabilidade exata de Fisher e o
teste do qui-quadrado de McNemar os mais utilizados na anlise dados
no-paramtricos na rea das cincias da sade, os quais sero objetos de
estudo neste captulo.
Embora de grande versatilidade e de fcil interpretao, a aplicao de
cada um destes testes requer a utilizao da tabela de contingncia, na
qual sero colocados os valores observados das variveis estudadas. Isto
permite que os grupos em estudo possam ser comparados, de tal maneira
que se possa verificar a existncia ou no de associao entre eles, alm de
BIOESTATISTICA_VOL02.indb 85 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 86
tornar os clculos mais simples e mais fceis de interpretar. Assim, antes de
iniciarmos a discusso sobre cada um destes testes, necessrio que o lei-
tor se familiarize com o uso da tabela de contingncia, que descreveremos
a seguir.
14.1 TABELAS DE CONTINGNCIA
Tambm conhecidas como tabelas de dupla entrada, as tabelas de
contingncia so amplamente utilizadas para registrar e analisar o rela-
cionamento entre duas ou mais variveis qualitativas do tipo categricas
dicotmicas, de tal modo que se possam comparar as frequncias das cate-
gorias de uma das variveis em relao s categorias da outra. Neste tipo de
tabela, alm dos testes de hiptese que sero aqui descritos, outros testes
tambm podem ser executados, tais como o clculo da razo de risco (risk
ratio) e da razo de chance (odds ratio), assim como vrias outras anlises
de interesse frequentemente utilizadas em estatstica, dentre as quais se
destacam as anlises de sensibilidade e de especificidade para os testes de
rastreamento de diagnstico. Sua denominao advm do fato de que ela
utilizada para determinar se a distribuio de uma varivel dependente
(contingente) da outra, cujo objetivo testar a hiptese nula de que as vari-
veis so independentes.
Uma tabela clssica constituda por duas linhas (l) e duas colunas (c),
as quais formam, pelas suas interseces, quatro clulas ou caselas que, por
conveno, so designadas pelas letras a, b, c, e d. Na prtica, as caselas for-
mam uma matriz 2 x 2 e, na tabela, os dados podem ser registrados, tomando-
-se por base as linhas ou as colunas, da o termo tabela de dupla entrada.
Tradicionalmente, nas linhas, so registrados os valores referentes aos gru-
pos que sero comparados, ao passo que, nas colunas, so registrados os va-
lores referentes ao desfecho estudado. A Tabela 14.1 mostra um exemplo de
uma tabela de contingncia padro.
BIOESTATISTICA_VOL02.indb 86 25/06/12 17:20
DISTRIBUIO QUI-QUADRADO 87
Tabela 14.1 Tabela de contingncia 2 x 2 padro
Desfecho
Total
Presente Ausente
Fator de risco
Presente a b a + b
Ausente c d c + d
Total a + c b + d a + b + c + d
a - Indivduos com fator de risco e com a doena
b - Indivduos com fator de risco, sem a doena
c - Indivduos sem o fator de risco, mas com a doena
d - Indivduos sem fator de risco e sem a doena
a + b - Todos os Indivduos com fator de risco
c + d - Todos os Indivduos sem fator de risco
a + c - Todos os Indivduos com a doena
b + d - Todos os Indivduos sem a doena
a + b + c + d - Todos os indivduos do estudo

Note que utilizao da tabela muito verstil e, como foi referido anterior-
mente, serve para vrios propsitos, alm do teste do qui-quadrado. Visualizar
a distribuio dos dados e montar a tabela de contingncia o primeiro desafio
para um pesquisador menos experiente, pois o que se coloca nas linhas e nas
colunas depende do estudo que ser realizado. Por exemplo, na Tabela 14.1,
somente dois grupos so comparados, sendo um deles o grupo constitudo pe-
los indivduos expostos a um dado fator de risco, enquanto que o outro grupo
constitudo por indivduos no-expostos ao mesmo fator. No exemplo em tela,
a varivel preditora um fator de risco, mas poderia ser uma interveno te-
raputica, um fator de proteo, tal como uma vacina, ou outra caracterstica
qualquer que pudesse ser testada em um experimento. Tradicionalmente, os
valores dos grupos testados so distribudos nas linhas da tabela e, a ordem
de alocao, seja na primeira ou na segunda linha, no altera o valor do teste.
Por outro lado, os valores para o desfecho esperado no estudo devem ser
alocados, tomando-se como referncia as colunas da tabela. Os indivduos que,
ao final do estudo, apresentam o desfecho esperado devem ser colocados na
primeira coluna, ao passo que o grupo de pacientes cujo desfecho no foi ob-
BIOESTATISTICA_VOL02.indb 87 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 88
servado, deve ocupar a segunda coluna. Esta disposio, apesar de tambm no
influenciar no resultado do teste, pode facilitar a interpretao dos resultados
do mesmo. Do mesmo modo, o desfecho pode ser qualquer evento esperado re-
lacionado varivel preditora, tal como a evoluo de uma doena, o resultado
de um tratamento etc. Na margem lateral direita da tabela, sero colocados os
totais das linhas, e na margem inferior, os totais das colunas; no canto inferior
direito, o total dos indivduos participantes do estudo. Este valor muito im-
portante, pois ele deve corresponder ao somatrio das linhas que, obrigatoria-
mente, igual ao somatrio das colunas. A Tabela 14.2 mostra, para o exemplo
a seguir, a distribuio dos dados em um estudo caso-controle que compara
dois grupos segundo suas exposies ao fator de risco tabagismo.
Exemplo: Em um estudo caso-controle, dois grupos de pacientes foram
acompanhados quanto incidncia de cncer do pulmo associado ao tabagis-
mo. No grupo de fumantes, constitudo por 100 indivduos, a incidncia de cn-
cer ocorreu em 28 pacientes, enquanto que, no grupo controle (no-fumantes),
constitudo por 200 pacientes, a incidncia foi igual a 16 casos. Qual a distribui-
o na tabela de contingncia?
Tabela 14.2 Tabela de contingncia para um estudo do tipo caso-controle
Desfecho
Cncer sim Cncer no Total
Fator de risco
Tabagismo sim 28 (28%) 72 (72%) 100 (100%)
Tabagismo no 16 (8%) 184 (92%) 200 (100%)
Total 44 (14,7%) 256 (85,3%) 300 (100%)

Observe que, na tabela, alm do valor absoluto de cada uma das caselas,
podem ser colocadas as porcentagens dos valores observados em cada um dos
grupos comparados no estudo. Isto facilita o entendimento, pois simplifica a
comparao em relao s incidncias nos diferentes grupos. Do mesmo modo,
deve-se colocar a soma das porcentagens (100%) nos totais marginais de cada
categoria, para que fique claro ao leitor, em relao a que total a porcentagem
foi calculada. Na margem inferior, colocam-se as porcentagens relacionadas ao
BIOESTATISTICA_VOL02.indb 88 25/06/12 17:20
DISTRIBUIO QUI-QUADRADO 89
desfecho, que, igualmente, deve somar 100%. Observe tambm que, na tabela,
a incidncia de cncer parece ter sido maior no grupo de pacientes sujeitos ao
fator de risco tabagismo, porm so necessrios testes estatsticos para que
essas concluses iniciais possam ser confirmadas. Esses testes, assim como os
mtodos para calcular as porcentagens, sero discutidos mais adiante.
Note, ainda, que a tabela de dupla entrada pode ser expandida para que
trs ou mais grupos possam ser simultaneamente comparados em relao a
um mesmo tipo de desfecho. Neste caso, criam-se matrizes l x c, de tal modo
que o total das clulas da tabela pode ser descrito como 3 x 3, 4 x 4 etc., sendo
o modelo mais empregado a matriz 2 x 2. A Tabela 14.3 mostra um exemplo de
uma tabela do tipo 4 x 2.
Tabela 14.3 Tabela de contingncia 4 x 2
Desfecho
Fumante No-fumante Total
Faixa etria
20 a 30 anos 18 32 50
31 a 40 anos 15 35 50
41 a 50 anos 17 33 50
51 a 60 anos 15 35 50
Total 65 135 200
14.2 A DISTRIBUIO QUI-QUADRADO (

2
)
Desenvolvida por Karl Pearson, em 1899, a distribuio do qui-quadrado ,
sem dvida, a mais apropriada para ser utilizada quando o objetivo comparar
variveis qualitativas distribudas em duas ou mais categorias. A distribuio
geralmente empregada para verificar, mediante a aplicao do teste do qui-
-quadrado (

2
), se existe diferena estatisticamente significante entre os valo-
res da frequncia observada (O) de um determinado evento e a frequncia com
que ele esperado (E), segundo uma determinada teoria. Isto , a distribuio
do qui-quadrado fornece a probabilidade com que as diferenas entre os valo-
res observados e esperados ocorreriam somente em razo do acaso.
BIOESTATISTICA_VOL02.indb 89 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 90
Essa distribuio corresponde a uma famlia de curvas cuja forma varia
de acordo com o nvel de significncia (nvel ) estipulado para o teste e com o
nmero de grupos comparados. Porm, na prtica, geralmente representada
por uma curva assimtrica, inclinada direita, cuja assimetria diminui me-
dida que aumenta o nmero de categorias comparadas, as quais determinam
os graus de liberdade (gl) do teste. A curva comea sempre no valor zero e
apresenta somente valores positivos, sendo a mdia da distribuio igual ao
nmero de graus de liberdade, o qual calculado, para o teste do qui-quadrado
da independncia, pela equao gl = (l -1)(c -1). A Figura 14.1 mostra a forma
da curva da distribuio do

2
considerando gl = 1.

Fig. 14.1 Forma geral da curva da distribuio

2
para gl = 1, com regio de signifcncia
=0,05
Assim, medida que aumentam os graus de liberdade, a mdia desloca-
da para a direita, aumentando, tambm, o desvio padro da distribuio, de
forma que a curva se torna cada vez mais simtrica. Deste modo, medida que
os graus de liberdade ficam muito grandes, a distribuio do qui-quadrado as-
sume a forma semelhante distribuio normal gaussiana, de tal forma que a
regio de significncia ou de rejeio da hiptese nula sempre unilateral e
deslocada para a cauda direita da curva, uma vez que valores do

2
prximos de
zero, por indicarem diferenas pequenas entre os valores observados e espera-
dos, caem na zona de aceitao, no interessando, portanto, para a rejeio da
hiptese de nulidade. O valor crtico para o teste deve ser procurado na tabela

2
BIOESTATISTICA_VOL02.indb 90 25/06/12 17:20
DISTRIBUIO QUI-QUADRADO 91
da distribuio qui-quadrado, considerando-se o nmero de graus de liberdade
e o nvel alfa preestabelecido no delineamento.
Portanto, para utilizar a distribuio do qui-quadrado para o teste de
hiptese, o valor do teste calculado e comparado com o valor crtico encon-
trado na tabela. Como o valor calculado depende das diferenas entre os valo-
res observados e esperados (O E), o

2
ser igual a zero quando no houver
diferena entre os grupos comparados, crescendo medida que aumentam as
discrepncias entre eles. Com base neste raciocnio, diferenas muito grandes
so pouco provveis de acontecer somente por acaso. Assim, se o valor calcula-
do (

calc
2
) for maior que o valor crtico tabelado (

;gl
2
), a hiptese nula a qual
afirma que as frequncias dos valores observados so iguais s frequncias dos
valores esperados (O = E) dever ser rejeitada. Caso contrrio, a hiptese nula
dever ser aceita.
14.3 TESTE DO QUI-QUADRADO (
2
)
Teste no-paramtrico, geralmente empregado para comparar as caracte-
rsticas entre duas ou mais populaes, no intuito de verificar se a frequncia
ou proporo com que um determinado evento observado em uma delas se
desvia significativamente da frequncia ou proporo com que o mesmo even-
to ocorre nas demais. Na prtica, o teste do qui-quadrado um modelo estats-
tico que compara o comportamento de uma varivel dependente com base no
conhecimento de uma ou mais variveis independentes, mediante a aplicao
de um processo de comparao das contagens observadas (O) com as conta-
gens esperadas (E). Isto , se as contagens observadas para o evento se ajus-
tam s contagens esperadas para o mesmo evento, com base em um modelo
predefinido, no qual a hiptese nula (H
0
) aquela que afirma que as variveis
comparadas so independentes. Em outras palavras, o teste compara os valores
observados com os valores esperados, para verificar o quanto das diferenas
entre eles pode ser atribudo ao acaso, em razo do erro aleatrio decorrente
do processo de amostragem. O valor do

2
calculado pela seguinte equao:

calc
O E
E
2
2
=

( )
BIOESTATISTICA_VOL02.indb 91 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 92
Observe que, para calcular o valor do

2
, necessrio calcular as diferenas
entre as frequncias dos valores observados (O) e as frequncias dos valores
esperados (E), o que implica, a princpio, que os valores esperados sejam calcu-
lados. Observe, tambm, que as diferenas so elevadas ao quadrado, para que
a soma no seja igual a zero. Cada diferena (O E)
2

deve ser dividida pelo valor
esperado (E) para ajustar, na tabela de contingncia, as ponderaes entre os
valores observados e esperados nos diferentes grupos comparados. Para mos-
trar a maneira como calculado o valor do

2
, utilizaremos o exemplo a seguir.
Exemplo: Objetivando testar uma nova droga para o tratamento da AIDS,
um investigador realizou um estudo experimental para o qual selecionou, ale-
atoriamente, 300 pacientes. Para 240 dos pacientes selecionados, foi adminis-
trada a droga A, ao passo que para os outros 60 pacientes, foi administrada a
droga B. A taxa de mortalidade em dois anos foi de 88 e 12 pacientes, para a
droga A e B, respectivamente. Qual o valor do

2
para o estudo em questo?
Tabela 14.4 Tabela de contingncia para um estudo experimental com 300 pacientes
Mortalidade
Total
Sim No
Droga
A 88 152 240
B 12 48 60
Total 100 200 300
Clculo das contagens esperadas Para cada casela da tabela de con-
tingncia, a contagem esperada (E
l,c
) dada pela seguinte equao:

Assim, para cada casela, temos os seguintes valores esperados:
E
l c ,
=
Total da linha
Total do estudo
Total da cooluna
E E
11 1 2
300
80
240
300
, ,
=

= =
240 100 200
==
=

= =

160
60
300
20
60
21 22
E E
, ,
100 200
3300
40 =
BIOESTATISTICA_VOL02.indb 92 25/06/12 17:20
DISTRIBUIO QUI-QUADRADO 93
Clculo das percentagens Para cada casela da tabela de contingncia, a
percentagem (P
l,c
) deve ser calculada, de tal maneira que se possam com-
parar as frequncias relativas dos desfechos estudados. A percentagem
calculada pela seguinte equao:

Assim, para cada casela, temos as seguintes percentagens:
Clculo do qui-quadrado
A Tabela 14.5 mostra as frequncias dos valores observados e esperados
para o estudo em questo.
Tabela 14.5 Valores do clculo do

2
para um estudo experimental com 300 indivduos
Caselas O E O - E (O E)
2
(O E)
2
/E
a 88 80 8 64 0,8
b 152 160 -8 64 0,4
c 12 20 -8 64 3,2
d 48 40 8 64 1,6
300 300 0,0 256
calc
2
6 0 = ,
interessante notar que o teste do qui-quadrado (

2
) usado para avaliar
a relao entre duas ou mais variveis qualitativas, sem que seja preciso a
suposio de normalidade das mesmas para que se possa analisar o grau
P
l c ,
=
Total da casela
Total da linha
100
P P
11 1 2
240
36 7
2
, ,
, % =

= =
88 100 152 100
440
63 3
60
20 0
21 22
=
=

= =
, %
, %
, ,
P P
12 100 48 100
=
60
80 0 , %

calc
2
2 2 2
88 80
80
152 160
160
12 20
20
48
=

+

+

+
( ) ( ) ( ) ( 440
40
0 8 0 4 3 2 1 6 6 0
2
)
, , , , , = + + + =
BIOESTATISTICA_VOL02.indb 93 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 94
de associao entre elas. De qualquer maneira, o qui-quadrado pode ser
empregado em trs diferentes tipos de anlise estatstica, as quais definem
o tipo de teste e que passaremos a descrever a seguir.
Teste do qui-quadrado da independncia Ou teste de associao, uti-
lizado para verificar se duas variveis qualitativas apresentam associao
estatstica entre si.
Teste do qui-quadrado da homogeneidade Serve para comparar duas
ou mais populaes com relao a uma determinada varivel categrica.
Teste do qui-quadrado de aderncia Tambm chamado de teste de
ajustamento, utilizado para verificar se uma distribuio de um conjunto
de dados amostrais ajusta-se a uma determinada distribuio terica es-
perada.
Para que o leitor possa entender a lgica do teste do qui-quadrado e saiba
diferenciar um teste de independncia de um teste de homogeneidade, traba-
lharemos com o exemplo a seguir: suponhamos que uma fazenda de piscicul-
tura queira analisar se existe diferena estatisticamente significativa entre as
taxas de crescimento de trs diferentes espcies de peixe, quando mantidas
juntas em um mesmo tipo de lago artificial, por um perodo de seis meses. Nes-
te experimento, o melhor tipo de teste seria uma anlise paramtrica do tipo
anlise de varincia (ANOVA), mas, por questes prticas, suponhamos, tam-
bm, que os pesos das espcies foram categorizados em baixo, mdio e alto, e
que uma amostra de 600 peixes seria necessria para a anlise. Neste caso, a
fazenda poder conduzir a pesquisa com base em dois tipos de delineamento,
conforme seus objetivos:
Delineamento tipo 1 O pesquisador poder selecionar uma amostra ale-
atria de 600 peixes e verificar em que casela da tabela de contingncia cada
um dos peixes estar alocado. Note que o nico valor fixo ser o total geral igual
a 600 peixes, enquanto que os valores totais das colunas e das linhas (totais
marginais) variaro livremente conforme a aleatoriedade. Neste caso, estare-
mos falando de um teste do qui-quadrado da independncia.
Delineamento tipo 2 Neste delineamento, o pesquisador selecionar
uma amostra aleatria de 200 peixes de cada uma das trs diferentes espcies.
Note que os totais das linhas sero fixos, ao passo que os totais das colunas
BIOESTATISTICA_VOL02.indb 94 25/06/12 17:20
DISTRIBUIO QUI-QUADRADO 95
variaro conforme os valores aleatrios das caselas. Neste caso, estaremos fa-
lando de um teste do qui-quadrado da homogeneidade.
Assim, quando os totais das linhas e das colunas variam livremente, o teste
de associao chamado qui-quadrado da independncia, e quando um dos
totais marginais, seja das linhas ou das colunas, fixado, o teste dito qui-
-quadrado da homogeneidade.
14.3.1 Teste do qui-quadrado da independncia
Este tipo de teste utilizado para verificar se existe uma correlao entre
as duas variveis categricas a serem comparadas. Aqui, a hiptese a ser tes-
tada que as duas variveis so estatisticamente independentes. Para tal, os
indivduos selecionados para compor a amostra so alocados em uma tabela
de contingncia conforme as categorias das duas variveis analisadas, sendo
as caselas preenchidas pelas frequncias observadas. Como relatado anterior-
mente, neste tipo de teste, o total da amostra o nico valor fixado pelo pesqui-
sador, e a hiptese de nulidade aquela que afirma que no h associao entre
as variveis estudadas. Isto , que a variveis so independentes. O exemplo a
seguir mostra a aplicao do teste do qui-quadrado da independncia.
Exemplo: Uma indstria de panificao queria testar a qualidade da con-
servao de seus produtos com a utilizao de trs diferentes tipos de emba-
lagem, aps um perodo 20 dias de prateleira. O critrio utilizado para compa-
rao foi a formao ou no de fungos no interior da embalagem. Para tal, os
investigadores estudaram uma amostra de 300 unidades de um determinado
produto, colhida aleatoriamente em trs diferentes supermercados da regio.
Os dados esto relacionados na Tabela 14.6. Existe associao entre o tipo de
embalagem e a presena de fungo no produto aps um perodo de 20 dias?
Tabela 14.6 Presena de fungo conforme o tipo de embalagem
Presena de
fungo
Tipo de embalagem
Total
Tipo A Tipo B Tipo C
Sim 48 (34,5%) 42 (43,3%) 28 (43,8%) 118 (39,3%)
No 91 (65,5%) 55 (56,7%) 36 (56,2%) 182 (60,7%)
Total 139 (100%) 97 (100%) 64 (100%) 300
BIOESTATISTICA_VOL02.indb 95 25/06/12 17:20
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 96
Passo 1 Formular as hipteses estatsticas:
H O E
0
: =
(as variveis so independentes, isto , no existe associao en-
tre o tipo de embalagem e a presena de fungo).
H O E
A
:
(existe associao entre as variveis estudadas, isto , a presen-
a de fungo depende do tipo de embalagem utilizada).
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%)
Passo 3 Determinar o valor crtico do teste:
Passo 4 Calcular o valor do teste:
Caselas O E O - E (O E)
2
(O E)
2
/E
a 48 54,67 -6,67 44,49 0,81
b 42 38,15 3,85 14,82 0,39
c 28 25,17 2,83 8,01 0,32
d 91 84,33 6,67 44,49 0,53
e 55 58,85 -3,85 14,82 0,25
f 36 38,83 -2,83 8,01 0,21
300 300 0,0 134,64
calc
2
2 51 = ,
Ento:
Passo 5 Regra de deciso:

Passo 6 Concluso:
Como o valor calculado para

calc
2
menor que o valor crtico tabelado

0 05 2
2
, ;
, aceita-se H
0
e conclui-se que as variveis so independentes, isto
gl(l - 1)(c - 1)=(2- 1)(3- 1)=2
=
0 05 2
2
, ;
5,99

calc
2
2 51 = ,
Se , aceita-se
Se

calc
calc
H
2
0 05 2
2
2
<

, ;
.
0


0 05 2
2
2
0
, ;
. , rejeita-se
Como =2,51 <
H
calc
0
,, ;
, .
05 2
2
5 99 = , aceita-se H
0
BIOESTATISTICA_VOL02.indb 96 25/06/12 17:21
DISTRIBUIO QUI-QUADRADO 97
, no existe associao entre o tipo de embalagem e a presena de fungo,
pois
calc
P
2
2 51 0 285 = = , ; , .
14.3.2 Teste do qui-quadrado da homogeneidade
Tambm chamado de teste qui-quadrado de comparao, este tipo de teste
utilizado quando se deseja comparar as propores de uma varivel qualitativa em
duas ou mais populaes. Os dados devem ser introduzidos em uma tabela de con-
tingncia, onde as linhas contm as amostras a ser comparadas e as colunas, as dife-
rentes categorias da varivel estudada. Neste teste, o pesquisador fixa, a priori, os ta-
manhos das amostras, isto , o total das linhas, ao passo que os valores das categorias
so aleatrios. Neste caso, a hiptese nula a ser testada aquela em que a proporo
de indivduos em cada categoria igual nas diferentes populaes estudadas. Isto ,
que as populaes no diferem entre si em relao varivel estudada. O exemplo a
seguir mostra a aplicao do teste do qui-quadrado da homogeneidade.
Exemplo: Em uma localidade, uma rede de supermercados queria ve-
rificar o padro de vendas para um determinado produto, segundo o poder
aquisitivo da populao dos bairros onde suas lojas esto instaladas. Para
tal finalidade, trs lojas foram selecionadas, sendo cada uma delas localizada
em um bairro classificado como de classe A, B e C. O produto em anlise es-
tava sendo vendido em trs diferentes tamanhos de embalagem, classificados
como pequeno, mdio e grande. Para realizar o estudo, uma amostra de 100
consumidores do produto foi aleatoriamente selecionada em cada uma das
trs lojas da rede. Os dados esto dispostos na Tabela 14.7. Existe diferena
estatisticamente significativa no padro de vendas do produto conforme o
poder aquisitivo da populao e o tamanho da embalagem?
Tabela 14.7 Padro de venda do produto conforme o tamanho da embalagem e o poder
aquisitivo da populao
Bairro
Tamanho da embalagem
Total
Grande Mdio Pequeno
Classe A 12 (11,5%) 29 (34,9%) 59 (52,2%) 100
Classe B 28 (26,9%) 34 (40,9%) 38 (33,6%) 100
Classe C 64 (61,6%) 20 (24,2%) 16 (14,2%) 100
Total 104 (100%) 83 (100%) 113 (100%) 300
BIOESTATISTICA_VOL02.indb 97 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 98
Note que, neste tipo de teste, a varivel tamanho da embalagem no
uma varivel dicotmica, que aceita dois nveis de resposta, como observado
na tabela do exemplo anterior. Aqui, o que se deseja, realmente, comparar as
propores (P) de venda para cada tamanho de embalagem conforme a classe
econmica do bairro onde a loja est localizada, sendo a hiptese nula (H
0
)
aquela que pressupe no existir diferena nas propores observadas, isto
que P
classeA
= P
classeB
= P
classeC
. Neste caso, o teste do qui-quadrado da homogenei-
dade compara as propores das trs amostras simultaneamente, sem que haja
necessidade de dicotomizar os dados, evitando-se, com isso, que as informa-
es sejam perdidas. Assim, temos:

Passo 1 Formular as hipteses estatsticas:

H O E
0
: =
(no existe diferena no padro das vendas relativas
aos tamanhos das embalagens e as classes dos bairros analisados).

H O E
A
:
(o padro das vendas relativas aos tamanhos das em
balagens est relacionado s classes dos bairros analisados).
Passo 2 Escolher o nvel de significncia (nvel alfa):

=0 05 , (5%)
Passo 3 Determinar o valor crtico do teste:

Passo 4 Calcular o valor do teste:
Caselas O E O - E (O E)
2
(O E)
2
/E
a 12 34,67 -22,67 513,93 14,82
b 29 27,67 1,33 1,77 0,06
c 59 37,66 21,34 455,40 12,09
d 28 34,67 -6,67 44,49 1,28
e 34 27,67 6,33 40,07 1,45
f 38 37,66 0,34 0,12 0,00
g 64 34,67 29,33 860,25 24,81
h 20 27,67 -7,67 58,83 2,13
i 16 37,66 -21,66 469,16 12,46
300 300 0,0 2.444,00
calc
2
69 11 = ,
gl(l - 1)(c - 1)=(3- 1)(3- 1)=4
=
0,05;4

2
9,49
BIOESTATISTICA_VOL02.indb 98 25/06/12 17:21
DISTRIBUIO QUI-QUADRADO 99
Ento:

calc
2
69 11 = ,
Passo 5 Regra de deciso:

Passo 6 Concluso:
Como o valor calculado para

calc
2
maior que o valor crtico tabelado

0 05 4
2
, ;
, rejeita-se H
0
e conclui-se que as frequncias observadas diferem
significativamente das frequncias esperadas, isto , existe diferena esta-
tisticamente significativa para o padro de consumo entre as trs classes
de bairros analisadas, com o bairro classe A apresentando preferncia pela
embalagem de tamanho pequeno; o bairro classe B, pela embalagem de
tamanho mdio, e o bairro classe C, pela embalagem de tamanho grande,
pois

calc
2
69 11 0 0001 = < , ; , P
.
Anlise de resduos padronizados (tabelas l x c)
No teste do qui-quadrado, assim como em qualquer outro tipo de teste de
hiptese, a determinao do valor P fundamental para que se possa verificar a
significncia estatstica. Porm, no teste do qui-quadrado, em particular, no se
pode concluir como se d a relao, uma vez que ele testa apenas a hiptese ge-
ral de que as variveis estudadas sejam independentes. Assim, em tabelas l x c,
uma interpretao mais robusta dos resultados deve ser realizada pela anlise
de resduos, a qual mostra como as diversas caselas da tabela contribuem para
o valor final do qui-quadrado calculado (

calc
2
). , portanto, uma ferramenta
estatstica til para a elaborao de uma anlise mais detalhada de cada uma
das variveis consideradas no estudo.
A anlise feita em trs etapas sucessivas:
Clculo do resduo padronizado (R
p
) O qual dado pela seguinte
equao:
Se , aceita-se
Se

calc 0,05;4
calc
2 2
2
<

H
0
.


0,05;4
calc
2
2
, rejeita-se
Como =69,11 >
H
0
.
00,05;4
2
9 49 = , . , rejeita-se H
0
BIOESTATISTICA_VOL02.indb 99 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 100
Clculo do resduo ajustado (R
aj
) Corresponde a cada resduo padroni-
zado, corrigido pela equao a seguir:

Comparao dos valores calculados Os valores calculados para R
aj
so,
ento, comparados com o valor crtico da distribuio normal, segundo o
nvel de significncia previamente estabelecido para o teste. Por exemplo:
para um nvel de significncia estabelecido em 0,05, o valor crtico ser z

=
1,96. Assim, se em uma dada casela o valor de R
aj
for maior do que z

= + 1,96
ou menor que z

= 1,96, conclui-se que o valor observado (O) desvia-se sig-


nificativamente do valor esperado (E), para mais ou para menos, conforme o
sinal. Desconsiderando o sinal, quanto maior for o valor do R
aj
em relao ao
valor z

, maior ser o desvio em relao ao valor esperado E, mostrando que,


naquela casela, a variao entre os grupos foi estatisticamente significativa.
A Tabela 14.8 mostra, entre os parnteses, os valores dos resduos padro-
nizados para o exemplo anterior da Tabela 14.7. O clculo ser mostrado para
a casela a.
Tabela 14.8 Resduos padronizados para o padro de venda do produto conforme o tamanho
da embalagem e o poder aquisitivo da populao
Bairro Tamanho da embalagem Total
Grande Mdio Pequeno
Classe A 12 ( 5,83) 29 (0,36) 59 (5,39) 100
Classe B 28 (1,71) 34 (1,73) 38 (0,08) 100
Classe C 64 (7,54) 20 ( 2,09) 16 ( 5,47) 100
Total 104 83 113 300
R
O E
E
p
=

R
R
TC
TG
TL
TG
aj
p
=

1 1
, onde: TC = Total da coluna.
TL = Total da linha.
TG = Total geral.
BIOESTATISTICA_VOL02.indb 100 25/06/12 17:21
DISTRIBUIO QUI-QUADRADO 101
Observando-se o valor do resduo ajustado da casela a (R
aj
= 5,83), con-
clui-se que o nmero de vendas da embalagem grande, na classe A, foi signifi-
cativamente menor do que o esperado se as variveis fossem independentes,
indicando existir uma associao positiva entre a classe do bairro e o tamanho
da embalagem vendida. Por outro lado, quando consideramos a casela g (R
aj
=
7,54), verificamos que a venda da embalagem de tamanho grande, na classe C,
foi significativamente maior do que o esperado. Porm, na casela f (R
aj
= 0,08),
a venda de embalagem de tamanho pequeno, na classe B, no foi significativa-
mente maior do que o valor esperado, pois R
aj
< z
.

14.3.3 Teste do qui-quadrado de aderncia
(ajustamento)
Tambm chamado de teste de ajustamento, o teste do qui-quadrado de
aderncia utilizado para verificar se uma distribuio de frequncias obser-
vadas (O) de um conjunto de dados amostrais ajusta-se a uma determinada
distribuio de valores esperados (E), segundo uma determinada teoria. Ou
seja, este teste verifica se um conjunto de dados observados se adequa a um
determinado modelo probabilstico, e a hiptese de nulidade (H
0
) a ser testada
aquela que afirma que a distribuio da varivel de interesse comporta-se
conforme a distribuio terica adotada. Portanto, se o modelo probabilstico
testado for compatvel com a distribuio amostral, as frequncias observadas
no iro diferir significativamente das frequncias esperadas.
Para tornar o entendimento mais fcil ao leitor, inicialmente, utilizaremos
o arremesso de dados como exemplo, sendo este o mais caracterstico para o
modelo. Assim, temos: um jogador deseja verificar se um dado honesto. Para
tal intento, ele arremessa o dado 600 vezes e anota os resultados observados.
Se o dado honesto, os valores observados para cada face no sero estatisti-
camente diferentes dos valores esperados (E = 100).
R
O E
E
TC
TG
TL
TG
aj11
1 1
12 34 67
34
,
,
,
=

667
1
104
300
1
100
300
3 85
0 66
5 83

=

=
,
,
,
BIOESTATISTICA_VOL02.indb 101 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 102
Valor da face 1 2 3 4 5 6 Total
Frequncia Observada 88 103 96 101 104 108 600
Frequncia esperada 100 100 100 100 100 100 600

Passo 1 Formular as hipteses estatsticas:

H P
i 0
: / = = 1 6 (i 1, 2, 3, ...)
- A distribuio de frequncia observada
igual distribuio de frequncia esperada.
H P
A i
: / . ao menos uma probabilidade 1 6
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%)
Passo 3 Determinar o valor crtico do teste:

Passo 4 Calcular o valor do teste:
Passo 5 Regra de deciso:

Passo 6 Concluso:
Como o valor calculado para

calc
2
menor que o valor crtico tabelado

0 05 4
2
, ;
, aceita-se H
0
e conclui-se que a distribuio de frequncia dos va-
gl(l - 1)(c - 1)=(2- 1)(6 - 1)=
=
5
11,07
0 05 5
2
, ;
Se , aceita-se
Se

calc
calc
H
2
0 05 5
2
2
<

, ;
.
0


0 05 5
2
2
0
, ;
. , rejeita-se
Como =2,50 <
H
calc
0
,, ;
, .
05 5
2
11 07 = , aceita-se H
0

calc
2
2 2 2
88 100
100
103 100
100
96 100
100
=

+

+

+
( ) ( ) ( ) (( ) ( ) ( ) 101 100
100
104 100
100
108 100
100
2 2 2

+

+

calcc
2
250
100
25 = = ,
BIOESTATISTICA_VOL02.indb 102 25/06/12 17:21
DISTRIBUIO QUI-QUADRADO 103
lores observados no difere da distribuio esperada, isto , as diferenas
foram casuais. Portanto, no h razo para discordar que o dado seja ho-
nesto, pois
calc
P
2
2 50 0 776 = = , ; , .
A seguir, mostraremos outro exemplo relacionado rea da pesquisa.
Exemplo: Uma escola pblica queria verificar o padro racial dos seus alu-
nos e compar-lo com o padro normal da populao. Para uma amostra alea-
tria de 400 alunos, os resultados obtidos foram os seguintes: Brancos = 128;
Negros = 62; Pardos = 186; Outros = 24. Os resultados obtidos concordam com
o padro racial determinado para a cidade estudada (Brancos = 51,5%; Negros
= 5,6%; Pardos = 40,4%; e Outros = 2,5%)?
Passo 1 Formular as hipteses estatsticas:


H O E
A
: (B=206,0; N=22,4; P=161,6; O=10,0)

Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%)
Passo 3 Determinar o valor crtico do teste:


Passo 4 Calcular o valor do teste:
Categoria O E O - E (O E)
2
(O E)
2
/E
Brancos 128 206,0 -78.0 6084.0 29.53
Negros 62 22.4 39.6 1568.1 70.01
Pardos 186 161.6 24.4 595.3 3.68
Outros 24 10,0 14.0 196.0 19.60
400 400 0,0 8.443,52
calc
2
122 82 = ,
gl(l - 1)(c - 1) = (2 - 1)(4 - 1) =
=
3
7,81
0 05 3
2
, ;
H O E
0
: = (B=128; N=62; P=186; O=24)
BIOESTATISTICA_VOL02.indb 103 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 104
Passo 5 Regra de deciso:

Passo 6 Concluso:
Como o valor calculado para

calc
2
maior que o valor crtico tabelado

0 05 4
2
, ;
, rejeita-se H
0
e conclui-se que a distribuio de frequncia dos
valores observados difere significativamente da distribuio esperada.
Portanto, o padro racial dos alunos da escola diferente daquele encon-
trado na populao, pois
calc
2
122 82 0 0001 = < , ; , P .
Correo de continuidade (correo de Yates)
Originalmente descrita por Frank Yates
1
em 1934, a correo de continui-
dade deve ser aplicada nos casos em que o teste do qui-quadrado for realizado
em tabelas de contingncia com apenas um grau de liberdade (gl = 1) e com
amostras menores que 40 (n < 40). Esta correo efetuada subtraindo-se 0,5
do valor absoluto da diferena entre os valores observados e esperados, antes
de calcular o quadrado desta diferena. Deste modo, a frmula para obteno
do

2
corrigido a seguinte:

Yates
O E
E
2
2
0 5
=

(| | , )
Com aplicao da correo de Yates, o teste do qui-quadrado fica mais
robusto, pois a frmula reduz o tamanho do valor calculado, o que, de cer-
ta maneira, reduz a chance de encontrar uma diferena estatisticamente
significativa. Assim, tomando-se a tabela de clculo do exemplo anterior,
1. Frank Yates (1902-1994) Matemtico e estatstico ingls que introduziu a correo de
continuidade para o teste do qui-quadrado.
Se , aceita-se
Se

calc
calc
H
2
0 05 3
2
2
<

, ;
.
0

0 05 3
2
2
, ;
. , rejeita-se
Como =122,82 >
H
calc
0

0 05 3
2
7 81
, ;
, . = , rejeita-se H
0
BIOESTATISTICA_VOL02.indb 104 25/06/12 17:21
DISTRIBUIO QUI-QUADRADO 105
podemos verificar o novo valor do qui-quadrado calculado com a correo
de Yates, mesmo sabendo-se que, neste caso, no seria necessrio aplicar a
correo, pois n > 40. Note que, com a correo, o valor do teste passa de
122,82 para 119,17.
Categoria O E O E (|O E| 0,5) (|O E| 0,5)2/E
Brancos 128 206,0 -78.0 77,50 29,16
Negros 62 22.4 39.6 39,10 68,25
Pardos 186 161.6 24.4 23,90 3,53
Outros 24 10,0 14.0 13,50 18,23
400 400 0,0 154
calc
2
119 17 = ,

Frmula alternativa em tabela 2 x 2
Quando o objetivo for a anlise de dados em tabela de contingncia 2 x 2,
a frmula para calcular o valor do

2
pode ser simplificada de modo a torn-la
mais facilmente aplicvel, desde que se tenha certeza que nenhum dos valores
esperados menor que cinco (E < 5). Para o clculo com a correo de Yates,
acrescenta-se ao numerador da frmula, o valor n/2, sendo n o nmero de su-
jeitos participantes do estudo, conforme mostrado abaixo:
Exemplo: Em um estudo de coorte, um pesquisador investigou 40 pa-
cientes com ferida penetrante no trax, atendidos em um hospital pblico,
com o objetivo de avaliar a associao entre o fator de risco hemotrax coa-
gulado e a ocorrncia de infeco do espao pleural, ps-drenagem torcica
fechada. Os pacientes foram divididos em dois grupos: com hemotrax coa-
gulado e sem hemotrax. Os pacientes foram acompanhados por um pero-
do de 30 dias, e as ocorrncias de infeco ps-operatria foram registradas
conforme a Tabela 14.9, a seguir:

2
2
=

+ + + +
n ad bc
a b c d a c b d
Yates
( )
( )( )( )( )
e
22
2
2
=

+ + + +
n ad bc
n
a b c d a c b d
| |
( )( )( )( )
BIOESTATISTICA_VOL02.indb 105 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 106
Tabela 14.9 Presena de infeco do espao pleural ps-drenagem pleural fechada
com e sem hemotrax coagulado
Grupos de pacientes
Infeco do espao pleural
Total
Sim No
Com hemotrax coagulado 13 07 20
Sem hemotrax coagulado 06 14 20
Total 19 21 40
Resoluo sem a correo de Yates
Resoluo com a correo de Yates
Observe que, no exemplo acima, para = 0,05 e gl = 1, o valor crtico
tabelado

0 05 1
2
3 84
, ;
, =
. Assim, se for considerado o valor do qui-quadrado
no corrigido (
2
4 91 = , ), pode-se verificar que a hiptese nula deve ser
rejeitada, pois

2
0 05 1
2
4 91 3 84 = = , ,
, ;
>
. Ou seja, que existe uma associao
positiva entre o fator de risco estudado e a incidncia de infeco do espa-
o pleural, concluindo-se, ento, que os pacientes com hemotrax coagulado
apresentam uma incidncia maior de complicao ps-operatria (13/20
ou 65%). Por outro lado, se considerarmos o valor do qui-quadrado com a
correo de Yates (

Yates
2
3 61 = ,
), a hiptese nula no deve ser rejeitada, pois

Yates
2
0 05 1
2
3 61 3 84 = = , ,
, ;
< . Isto , que no h relao entre o fator de risco he-
motrax coagulado e a incidncia de infeco do espao pleural em pacientes
submetidos drenagem pleural fechada.
Note, tambm, que, neste caso, pode-se usar o teste

2
, uma vez que, na
tabela de contingncia, nenhum dos valores esperados menor que cinco

2
2
40 13 7
=

+ + + +
=
n ad bc
a b c d a c b d
( )
( )( )( )( )
( 14 6
20 19 21
) .
.
,
2
20
784 000
159 600
4 91

= =

Yates
n ad bc
n
a b c d a c b d
2
2
2
=

+ + + +
=
| |
( )( )( )( )
440 13 7
40
2
20
576 0
2
(| )
.
14 6|
20 19 21


=
000
159 600
3 61
.
, =
BIOESTATISTICA_VOL02.indb 106 25/06/12 17:21
DISTRIBUIO QUI-QUADRADO 107
(E < 5), sendo a melhor opo a frmula corrigida, pois n = 40. Os requisitos
para a utilizao do teste do qui-quadrado so apresentados a seguir.
Requisitos para usar o teste do qui-quadrado
A aplicao do teste do qui-quadrado exige, da parte do pesquisador, que
alguns cuidados sejam observados, em especial referentes ao tamanho das
amostras e aos valores esperados em cada uma das caselas da tabela de contin-
gncia. Estes cuidados decorrem do fato da distribuio terica do
2
se apre-
sentar como um mtodo aproximado, baseado na distribuio z, e quando o
nmero de graus de liberdade for igual a 1 (gl = 1), a distribuio dos valores
observados (
calc
2
) difere da distribuio terica, de tal modo que a correo
de continuidade deve ser introduzida ao teste para melhor aproximar as duas
distribuies. Assim, de modo geral, as condies para uso do teste do qui-qua-
drado so as seguintes:
O teste deve ser realizado com frequncias observadas e expressadas em va-
lores absolutos, isto , em nmero de casos. Porm, caso o qui-quadrado seja
calculado com os valores das caselas expressados em percentuais, o valor
final do teste deve ser corrigido. Para isto, basta multiplicar o valor calculado
pelo tamanho amostral (n) dividido por 100. Para facilitar o entendimento,
vamos considerar o seguinte exemplo: um jogador deseja verificar se uma
moeda honesta. Para tanto, ele executa 60 arremessos e obtm 27 (45%)
caras e 33 (55%) coroas. Os clculos do qui-quadrado de aderncia, com
valores absolutos e, em percentagem, so mostrados a seguir.
Clculo com valores absolutos Clculo com valores em percentagem

2
2 2
27 30
30
33 30
30
0 60 =

+

=
( ) ( )
,

2
2 2
2
45 50
50
55 50
50
1 0
1 0
60
100
0 60
=

+

=
= =
( ) ( )
,
, , x

Em tabelas de contingncia do tipo 2 x 2, deve-se sempre utilizar a corre-
o de Yates se n < 40. Porm, se em alguma casela o valor esperado for
BIOESTATISTICA_VOL02.indb 107 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 108
menor que 5 (E < 5), o teste do qui-quadrado dever ser substitudo pelo
teste exato de Fisher.
Em tabelas de contingncia do tipo 2 x c, o qui-quadrado pode ser calcula-
do se em todas as caselas o valor esperado for maior ou igual a 1 (E 1).
Em tabelas de contingncia do tipo l x c, o teste do qui-quadrado pode ser
calculado com segurana se a mdia dos valores esperados for 6 para
testes com nvel de significncia = 0,05, e 10 para testes com = 0,01.
A mdia dos valores esperados pode ser obtida dividindo-se o total de in-
divduos do estudo pelo nmero de caselas da tabela.
Existem algumas outras exigncias relacionadas aplicao do teste do qui-
-quadrado de aderncia (ajustamento). Porm, na prtica do dia-a-dia da pesqui-
sa, a utilizao de programas computacionais mais sofisticados torna mais simples
a obteno exata dos valores do qui-quadrado para amostras com pequenos valo-
res esperados, o que, de certa forma, tem facilitado a atuao do pesquisador.
interessante notar que, no teste do qui-quadrado, o que de fato interessa
so os valores esperados (E) e no os valores observados (O). Assim, se tomar-
mos a frmula utilizada para calcular o teste, podemos observar que valores
pequenos de E, no denominador de um dos termos da equao, faz com que
este termo se torne muito grande, o que, por sua vez, aumenta o valor do qui-
-quadrado, e isto pode levar a erros falso-positivos, pois o valor calculado ten-
der a cair na zona de rejeio da hiptese nula. Essa questo, frequentemente
mal interpretada, tem levado alguns pesquisadores a pensar que o teste no
pode ser calculado quando em alguma das caselas da tabela ocorra um valor
observado muito pequeno ou igual a zero.
14.4 TESTE DO QUI-QUADRADO DE MCNEMAR
(

McNemar
2
)
Em algumas situaes de pesquisa, o investigador pode estar interessado
em testar dois diferentes procedimentos em um mesmo grupo de sujeitos para
saber o quanto as medidas da primeira interveno concordam com as medi-
das da segunda, ou, ainda, pode estar interessado em comparar dois grupos pa-
BIOESTATISTICA_VOL02.indb 108 25/06/12 17:21
DISTRIBUIO QUI-QUADRADO 109
reados em um estudo do tipo caso-controle (anlise pareada). Outras vezes,
porm, o que se deseja conhecer se houve alguma mudana entre as medidas
antes e depois de uma dada interveno aplicada no mesmo grupo de sujeitos
(anlise tipo antes e depois). Em ambos os casos, se as variveis estudadas
so dicotmicas, nominais ou ordinais, e as amostras a serem comparadas so
dependentes entre si, o teste a ser empregado o teste no-paramtrico de
McNemar, o qual a alternativa para o teste do qui-quadrado da independn-
cia. Aqui, vlido enfatizar que ocorre dependncia entre as amostras quando
cada indivduo controle de si mesmo ou quando realizado um pareamento
indivduo a indivduo entre os sujeitos de duas amostras.
Assim, com base no raciocnio explicitado acima, podemos distinguir trs
situaes prticas para as quais o teste de McNemar a melhor opo:
Teste de McNemar para comparar dois tipos de tratamento uti-
lizado a fim de avaliar o grau de discordncia de dois diferentes tipos de
tratamento institudos para o mesmo grupo de indivduos. Ou seja, o quan-
to as medidas de uma interveno concordam com as medidas da outra.
Teste de McNemar para comparao tipo antes e depois o teste
no-paramtrico apropriado para comparar as medidas coletadas em um
mesmo grupo de indivduos, antes e depois de uma determinada interven-
o a que foram submetidos, com o objetivo de detectar se ocorreu alguma
mudana em razo da interveno instituda.
Teste de McNemar para comparar grupos pareados utilizado para
comparar dois diferentes grupos de pacientes, cujas amostras foram pa-
readas indivduo a indivduo, com base em alguma caracterstica da po-
pulao, tal como a idade, sexo, raa etc. Este tipo de teste de McNemar
frequentemente utilizado em estudos do tipo caso-controle, nos quais os
grupos so comparados para verificar a importncia de um determinado
fator de risco.
Na prtica, o teste de McNemar uma modificao do teste do qui-quadra-
do com 1 grau de liberdade, pois s existem duas categorias a serem estudadas,
sendo, portanto, um teste de ajustamento que compara as frequncias obser-
vadas (O) com as frequncias esperadas (E), supondo a igualdade das medidas
BIOESTATISTICA_VOL02.indb 109 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 110
em ambas as medies. Tal como no teste do qui-quadrado da independncia,
os dados devem ser colocados em tabelas de contingncia 2 x 2, com a diferen-
a que, no teste de McNemar, os resultados devem ser analisados par a par, com
os dados organizados quanto concordncia ou discordncia dentro do par,
conforme o exemplo mostrado na Tabela 14.10, que abrange os trs tipos de
aplicaes para o teste. Note que a organizao da tabela difere daquela usada
para o teste do qui-quadrado da independncia.
Tabela 14.10 Tabela-padro 2 x 2 para o teste de McNemar
Tratamento B
Medidas Depois
Grupo Controle
Sim No Total
Tratamento A
Medidas Antes
Grupo Caso
Sim a (+ +) b (+ ) a + b
No c ( +) d ( ) c + d
Total a + c b + d a + b + c + d
a - Indivduos que responderam aos tratamentos A e B
b - Indivduos que responderam somente ao tratamento A
c - Indivduos que responderam somente ao tratamento B
d - Indivduos que no responderam aos tratamentos A e B
a e d - Pares concordantes
b e c - Pares discordantes
De clculo fcil e rpido, este teste foi introduzido na estatstica por Quinn
McNemar
2
, em 1947, e tem como hiptese nula (H
0
) a ser testada, a afirmativa
a qual considera que as propores dos valores medidos nos dois momentos
temporais no diferem entre si. Caso a hiptese nula seja negada, a hiptese
alternativa (H
A
) que as propores pareadas sejam diferentes. A frmula para
calcular o valor do teste dada pela seguinte equao:


2. Quinn McNemar (1900-1986) Matemtico e estatstico americano que ficou conhecido
por seus trabalhos sobre coeficiente de inteligncia e pela publicao do livro Psychological
Statistics, em 1949.

McNemar
b c
b c
2
2
1
=

( )
+
| |
BIOESTATISTICA_VOL02.indb 110 25/06/12 17:21
DISTRIBUIO QUI-QUADRADO 111
Por se tratar de um teste com 1 grau de liberdade, a correo de con-
tinuidade de Yates introduzida na frmula em razo das mesmas exign-
cias aplicadas para o teste do qui-quadrado de aderncia. A correo
feita subtraindo-se 1 do valor absoluto do numerador antes de o elevar ao
quadrado. Observe, tambm, que a frmula considera apenas as caselas b
e c da tabela 2 x 2, isto , as caselas onde houve discordncia entre dois
momentos temporais avaliados, uma vez que os valores das caselas a e d
no se alteram, e, portanto, no fornecem informaes que permitam uma
deciso a respeito se houve ou no alguma mudana em razo da interven-
o instituda. Assim, se a hiptese nula (H
0
) verdadeira, espera-se que o
nmero de pares discordantes da casela b (+ ) seja igual ou muito prximo
ao nmero de pares discordantes da casela c ( +). Por outro lado, se hou-
ver uma diferena significativa entre os pares discordantes, alm do que se
esperaria ocorrer por puro acaso, em razo do erro amostral aleatrio, a
hiptese nula ser rejeitada e a hiptese alternativa (H
A
) ser tomada como
verdadeira.
Por conseguinte, para que a hiptese nula possa ser testada, o valor calcu-
lado para o

McNemar
2
comparado ao valor crtico da tabela do qui-quadrado,
segundo o nvel de significncia estabelecido para o teste. Se o valor calculado
para o

McNemar
2
for menor que o valor crtico tabelado (

0 05 1
2
, ;
), a hiptese nula
ser verdadeira. Caso contrrio, rejeita-se H
0
e conclui-se que h diferena es-
tatisticamente significante entre os pares discordantes.
A seguir, mostraremos um exemplo para cada uma das trs situaes de
aplicao do teste do qui-quadrado de McNemar.
Comparao entre dois tipos de tratamentos
Exemplo: Uma indstria alimentcia conduziu um estudo no sentido de
avaliar a inteno de compra de um determinado produto elaborado com
duas diferentes formulaes. Para tal experimento, selecionou-se, aleatoria-
mente, 80 clientes de uma rede de supermercados, aos quais foram oferecidos
os dois produtos em estudo, em ordem previamente escolhida por sorteio,
de modo a evitar qualquer efeito indutivo na preferncia dos clientes. Cada
provador deveria manifestar sua inteno de compra respondendo sim ou
no. Os dados esto relacionados na Tabela 14.11.
BIOESTATISTICA_VOL02.indb 111 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 112
Tabela 14.11 Resultado da preferncia de clientes quanto inteno de compras para um
produto elaborado com duas diferentes formulaes
Formulao B
Total Sim No
Formulao A
Sim 22 10 32
No 27 21 48
Total 49 31 80
a - Comprariam ambos os produtos A e B
b - Comprariam o produto A e no comprariam B
c - Comprariam o produto B e no comprariam A
d - No comprariam ambos os produtos A e B
Passo 1 Formular as hipteses estatsticas:
H
0
: No h discordncia nos resultados das opes pelos produtos A e B.
H
A
: H discordncia nos resultados das opes pelos produtos A e B.
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%)
Passo 3 Determinar o valor crtico do teste:

Passo 4 Calcular o valor do teste:

Passo 5 Regra de deciso:

gl(l - 1)(c - 1) = (2 - 1)(2 - 1) = 1
=
0,05;1

2
3,84

McNemar
b c
b c
2
2 2
1 10 27 1
10 27
256
37
=

( )
+
=

( )
+
=
| | | |
==6 92 ,
Se , aceita-se
Se

McNemar 0,05;1
McNem
2 2
< H
0
.
aar 0,05;1
McNemar
2 2
2
, rejeita-se
Como =

H
0
.
66,92 > , rejeita-se
0,05;1
2
3 84 = , . H
0
BIOESTATISTICA_VOL02.indb 112 25/06/12 17:21
DISTRIBUIO QUI-QUADRADO 113
Passo 6 Concluso:
Como o valor calculado para

McNemar
2
maior que o valor crtico tabelado

0 05 1
2
, ;
, rejeita-se H
0
e conclui-se existir discordncia quanto s opes de
compra para os dois produtos oferecidos, pois
McNemar
2
6 92 0 008 = = , ; , P .
O produto com a formulao B foi mais aceito do que o produto com a for-
mulao A, uma vez que, considerando as 37 vezes em que apenas um dos
produtos foi escolhido, em 27 (72,9%) a opo foi pelo produto B e somente
10 (27,1%) dos clientes optaram pelo produto A.
Comparao tipo antes e depois
Exemplo: Com o objetivo de testar sua diviso de marketing, uma loja
de departamentos selecionou, aleatoriamente, 90 clientes e solicitou que os
mesmos manifestassem sua inteno de compra de determinado produto,
antes e depois que lhes fosse exibido um folheto publicitrio sobre o referido
produto. Cada cliente deveria manifestar sua inteno de compra respon-
dendo sim ou no, antes e depois de analisar o folheto. Os dados esto
relacionados na Tabela 14.12.
Tabela 14.12 Resultado da inteno de compra de clientes, antes e depois
de uma campanha publicitria
Inteno depois
Sim No Total
Inteno antes
Sim 26 12 38
No 27 25 52
Total 53 37 90
a Comprariam antes e depois
b Comprariam antes e no comprariam depois
c Comprariam depois e no comprariam antes
d No comprariam nem antes nem depois
Passo 1 Formular as hipteses estatsticas:
H
0
: No h discordncia nos resultados das opes antes e depois.
H
A
: H discordncia nos resultados das opes antes e depois.
BIOESTATISTICA_VOL02.indb 113 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 114
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 01 , (1%)
Passo 3 Determinar o valor crtico do teste:

Passo 4 Calcular o valor do teste:

Passo 5 Regra de deciso:

Passo 6 Concluso:
Como o valor calculado para

McNemar
2
menor que o valor crtico tabela-
do

0 01 1
2
, ;
, no se rejeita H
0
e conclui-se que no existe discordncia quan-
to inteno de compra antes e depois da campanha publicitria, pois

McNemar
P
2
5 02 0 025 = = , ; , . Isto , no h evidncia suficiente para se afir-
mar que a campanha publicitria instituda tenha influenciado na inteno
de compra dos clientes selecionados para o estudo, ao nvel de significn-
cia de 1% ( = 0,01).
Comparao entre grupos pareados
Observe que, diferente do qui-quadrado da independncia, no qual os gru-
pos so escolhidos separadamente, neste tipo de teste, os sujeitos so escolhi-
dos par a par, isto , um indivduo de cada grupo. Somente aps a escolha dos
pares, verifica-se se ambos, se um ou o outro, ou se nenhum dos indivduos de
Se , aceita-se
Se

McNemar 0,01;1
McNem
2 2
< H
0
.
aar 0,01;1
McNemar
2 2
2
, rejeita-se
Como =

H
0
.
55,02 < , aceita-se
0,01;1
2
6 63 = , . H
0
gl(l - 1)(c - 1) = (2 - 1)(2 - 1) = 1
=
0,01;1

2
6,63

McNemar
b c
b c
2
2 2
1 12 27 1
12 27
196
39
=

( )
+
=

( )
+
=
| | | |
==5 02 ,
BIOESTATISTICA_VOL02.indb 114 25/06/12 17:21
DISTRIBUIO QUI-QUADRADO 115
cada par foi exposto, no passado, ao fator de risco estudado. A seguir, os dados
so anotados na tabela de contingncia, tal como no modelo a seguir.
Exemplo: Um estudo caso-controle foi conduzido no sentido de verifi-
car a associao entre a exposio prolongada ao fator de risco irradiao
solar e a ocorrncia de neoplasia da cutnea do tipo carcinoma basocelular.
Para tal finalidade, foram pareados 100 indivduos portadores da neoplasia
(grupo caso) com 100 indivduos no-portadores da doena (grupo contro-
le). Todos os indivduos do estudo foram investigados quanto exposio
prolongada ou no ao fator de risco, no passado. Os dados esto expressos na
Tabela 14.13, abaixo.
Tabela 14.13 Resultado do estudo caso-controle com 400 indivduos
Grupo controle
Com
exposio
Sem
Exposio
Total
Grupo caso
Com exposio 29 25 54
Sem exposio 8 38 46
Total 37 63 100
a Expostos no grupo caso e no grupo controle
b Expostos no grupo caso e no-expostos no grupo controle
c No-expostos no grupo caso e expostos no grupo controle
d No-expostos no grupo caso e no grupo controle
Passo 1 Formular as hipteses estatsticas:
H
0
: A exposio prolongada irradiao solar no est associada neoplasia.
H
A
: A exposio prolongada irradiao solar est associada neoplasia.
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 01 , (1%)
Passo 3 Determinar o valor crtico do teste:
gl(l - 1)(c - 1)=(2- 1)(2- 1)=1
=
0,01;1

2
6,63
BIOESTATISTICA_VOL02.indb 115 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 116
Passo 4 Calcular o valor do teste:

Passo 5 Regra de deciso:

Passo 6 Concluso:
Como o valor calculado para

McNemar
2
maior que o valor crtico tabelado

0 01 1
2
, ;
, rejeita H
0
e conclui-se que existe discordncia quanto exposio
irradiao solar nos grupos estudados, pois

McNemar
2
7 75 0 005 = = , ; , P
. Isto
, que os indivduos do grupo caso apresentaram maior propenso do que
o esperado pelo acaso de terem sido expostos irradiao solar quando
comparados aos indivduos do grupo controle, ao nvel de significncia de
1% ( = 0,01).
Observe, ainda, que, na tabela do teste de McNemar para estudos pareados,
a odds ratio (razo de chance) pode ser calculada pela frmula OR = b /c.
No exemplo em questo, temos:
OR
b
c
= = =
25
8
3 12 ,
O resultado encontrado indica que a chance da ocorrncia de neoplasia
cutnea associada exposio prolongada radiao solar 3,12 vezes maior
nos indivduos do grupo caso quando comparada incidncia nos indivduos
do grupo controle.
Se , aceita-se
Se

McNemar 0,01;1
McNem
2 2
< H
0
.
aar 0,01;1
McNemar
2 2
2
, rejeita-se
Como =

H
0
.
77,75 > , rejeita-se
0,01;1
2
6 63 = , . H
0

McNemar
b c
b c
2
2 2
1 25 8 1
25 8
256
33
7 =

( )
+
=

( )
+
= =
| | | |
,,75
BIOESTATISTICA_VOL02.indb 116 25/06/12 17:21
DISTRIBUIO QUI-QUADRADO 117
14.5 TESTE EXATO DE FISHER ( P
Fisher
)
Como explicado anteriormente, quando em uma tabela de contingncia
2 x 2, uma ou mais caselas apresentam contagens esperadas (E) menores que
5 ou o nmero total de indivduos estudados menor do que 20, o teste do
qui-quadrado no pode ser usado, devendo ser substitudo pelo teste de pro-
babilidade exata de Fisher, o qual calcula a probabilidade exata de se obter, ao
acaso, os valores observados nas caselas.
Inicialmente proposto por Sir Ronald Fisher
3
, em 1930, o teste baseado na
distribuio hipergeomtrica
4
originada quando as propores de duas amostras
independentes so inseridas numa tabela 2 x 2 com valores marginais fixos. Ele
considera, como hiptese nula (H
0
), a independncia entre as variveis estuda-
das, sendo realizado pelo clculo da probabilidade de ocorrer a distribuio veri-
ficada para os dados observados na tabela de contingncia. Essa probabilidade ,
na realidade, o nvel crtico amostral ou o valor P, o qual traduz a probabilidade
de rejeitar a hiptese nula admitindo-se a suposio de independncia, ou seja,
a probabilidade de se estar errado em afirmar que existe dependncia entre as
variveis quando, de fato, elas so independentes. O valor calculado para o teste
deve ser comparado com o nvel de significncia (valor ) estipulado para a pes-
quisa. Assim, se a probabilidade calculada for inferior ao valor preestabelecido,
rejeita-se a hiptese nula, pois a distribuio observada no deve ter ocorrido
por puro acaso. Caso contrrio, a hiptese de nulidade no deve ser rejeitada.
A frmula para calcular o teste a seguinte:

A probabilidade calculada pela frmula acima no o resultado final para
o teste, pois a hiptese nula tambm seria rejeitada caso os resultados obser-
vados na tabela de contingncia fossem ainda mais extremos, tal como o valor
zero em uma das caselas. Da porque se devem calcular as probabilidades rela-
3 Sir Ronald Aylmer Fisher (1890-1962) Estatstico e bilogo ingls, criador das fundaes
para a cincia estatstica moderna.
4 Mtodo de amostragem sem reposio.
P
a b c d a c b d
n a b c d
Fisher
=
+ + + + ( )!( )!( )!( )!
! ! ! ! !
BIOESTATISTICA_VOL02.indb 117 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 118
tivas a esses resultados mais extremos, as quais sero somadas probabilidade
inicialmente calculada, de modo que se obtenha a rea da cauda da distribui-
o. Assim, designando-se por P
1
a probabilidade calculada para a tabela de
dados observada, os valores das probabilidades calculadas para os resultados
mais extremos sero designados por P P P
n 2 3
, ,... etc. Deste modo, para calcular
as demais probabilidades, uma nova tabela de contingncia deve ser constru-
da, subtraindo-se uma unidade dos valores das caselas da diagonal com me-
nor nmero de casos. A seguir, adicionam-se aos valores das caselas da outra
diagonal, as duas unidades subtradas, de maneira que os totais marginais no
sejam alterados. A partir dessa nova tabela, calcula-se a probabilidade
P
2
. O
processo se repete at que, em uma das caselas, o valor zero seja atingido. Para
um teste unicaudal, a probabilidade final P
Fisher

consiste da soma de todas as
probabilidades calculadas ( P P P P
Fisher n
= + +
1 2
... ). Para um teste bicaudal, a pro-
babilidade final deve ser multiplicada por dois.
O exemplo, a seguir, ilustra a aplicao do teste exato de Fisher.
Exemplo: Suponha que um pesquisador queira verificar a associao en-
tre o tipo de acidulante adicionado e a presena de contaminao por fungo
no interior de embalagens de alimentos. Para tal experimento, dois grupos
de 10 embalagens so selecionados. Ao primeiro grupo, ele adiciona o aci-
dulante A, e ao segundo grupo, o acidulante B. A contaminao por fungo
categorizada como presente e ausente. Os dados esto relacionados na
Tabela 14.14, abaixo.
Tabela 14.14 Resultado do estudo com 20 embalagens de alimentos
Fungo
Total
Presente Ausente
Tipo de
acidulante
Acidulante A 6 4 10
Acidulante B 3 7 10
Total 9 11 20
Passo 1 Formular as hipteses estatsticas:
H
0
: A proporo de fungos a mesma com os dois tipos de acidulante.
BIOESTATISTICA_VOL02.indb 118 25/06/12 17:21
DISTRIBUIO QUI-QUADRADO 119
H
A
: A proporo de fungos diferente para os dois tipos de acidulante.
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%)- Bicaudal.
Passo 3 Calcular o valor do teste:
6 4 10
P
1
10 10 9 11
20
1
6 4 3 7
0 1500 = =
! ! ! !
! ! ! ! !
, 3 7 10
9 11 20
7 3 10
P
2
10 10 9 11
20
1
7 3 2 8
0 0321 = =
! ! ! !
! ! ! ! !
, 2 8 10
9 11 20
8 2 10
P
3
10 10 9 11
20
1
8 2 1 9
0 0026 = =
! ! ! !
! ! ! ! !
, 1 9 10
9 11 20
9 1 10
P
4
10 10 9 11
20
1
9 1 0 10
0 0001 = =
! ! ! !
! ! ! ! !
, 0 10 10
9 11 20
P
Fisher
= + + + = 2 0 1500 0 0321 0 0026 0 0001 2 ( , , , , ) 0,184 48=0,3696
Passo 4 Regra de deciso:
Passo 5 Concluso:
Como o valor calculado para P
Fisher
=0 3696 ,

maior que o nvel de signi-
ficncia = 0,05, no se rejeita H
0
e conclui-se que a proporo de embalagens
Se , rejeita-se
Se , a
P H
P
Fisher
Fisher
<

0
.
cceita-se
Como =0,3696 > , ace
H
P
Fisher
0
.
, =0 05 iita-se H
0
.
BIOESTATISTICA_VOL02.indb 119 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 120
com fungo no grupo tratado com o acidulante A no difere da proporo das
embalagens tratadas com acidulante B.
Note que o clculo da probabilidade exata de Fisher envolve o clculo de
fatoriais, o que torna a operao bastante complexa e trabalhosa. O uso de cal-
culadoras mais sofisticadas ou de programas computacionais de estatstica tem
facilitado a determinao do valor P. Uma outra maneira mais simples atravs
da transformao logartmica da equao, cujo valor P corresponde ao anti-
logaritmo do resultado obtido. A seguir, demonstraremos o clculo de
1
P , do
exemplo anterior, obtido pela transformao logartmica da equao.


Sendo: (a + b) = Total da linha 1 (TL
1
)
(c + d) = Total da linha 2 (TL
2
)
(a + c) = Total da coluna 1 (TC
1
)
(b + d) = Total da coluna 2 (TC
2
)
log(AxB) = log A + log B
log(A/B) = log A log B
Ento:
Observe que o resultado de
P
1
0 1500 = ,
, calculado com a transformao lo-
gartmica, igual ao resultado calculado com a frmula original do teste exato
de Fisher.
P
a b c d a c b d
n a b c d
a b c
1
=
+ + + +
=
+ + ( )!( )!( )!( )!
! ! ! ! !
( )!( dd a c b d n
a b c d
)!( )!( )!/ !
! ! ! !
+ +
log log ! log ! log ! log ! log ! l P TL TL TC TC n
1 1 2 1 2
= + + +
( )
oog ! log ! log ! log ! a b c d + + +
( )
log log ! P
1
10 = +log10! +log9! +log11! log20!
(( )

( )
log ! 6 +log4! +log3! +log7!
log , , , , , , , P
1
6 560 6 560 5 560 7 601 18 386 2 857 1 = + + +
( )
+ 3380 0 778 3 702 + +
( )
, ,
log ( , ) ( , ) , P
1
7 894 8 718 0 824 = =
P
1
0 824
0 824 =

antilog ( =10 =0,1500 , )
,
BIOESTATISTICA_VOL02.indb 120 25/06/12 17:21
15
Probabilidade e Medidas
de Associao
A principal razo para a realizao de pesquisas experimentais genera-
lizar, a toda uma populao, os achados ocorridos em um conjunto de
observaes verificadas nos indivduos participantes do estudo. Ou seja,
fazer inferncias para um grupo maior de sujeitos, com base nos achados do
estudo de uma amostra retirada da populao. No entanto, sempre que isto
feito, o pesquisador no pode estar totalmente seguro ao fazer afirmaes
sobre possveis desfechos na populao estudada, uma vez que a ocorrncia
de inmeros acontecimentos do dia-a-dia podem ser determinados apenas
pelo efeito do acaso. Porm, mesmo que existam situaes de incerteza, nas
quais no se sabe o que de fato pode ocorrer, na maioria dos casos, o pesqui-
sador pode conhecer todos os resultados possveis da pesquisa, e prever, com
razovel margem de acerto, a frequncia com que cada resultado pode ser
esperado no estudo, com base na probabilidade conhecida para a ocorrncia
do evento na populao estudada. A esta previso para a ocorrncia de eventos
possveis esperados, chamamos de ensaio probabilstico.
Assim, alguns conceitos da teoria da probabilidade so realmente impor-
tantes a fim de que se possa compreender o que, de fato, significa a inferncia
estatstica quando se estuda a associao de causa e efeito entre um possvel
fator de risco (ou de proteo) e um desfecho de interesse, tal como uma doena
BIOESTATISTICA_VOL02.indb 121 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 122
ou um evento qualquer. Desta forma, o objetivo do presente captulo descrever
as principais medidas de efeito e associao mais utilizadas em pesquisa
experimental, assim como discutir suas aplicabilidades com base na teoria da
probabilidade.
15.1 TEORIA DA PROBABILIDADE
Em estatstica, o estudo da teoria da probabilidade tem ajudado os
pesquisadores a compreender e interpretar os dados obtidos atravs de seus
experimentos, alm de permitir que afirmativas mais confiveis possam ser
feitas, especialmente no que tange aos estimadores calculados a partir de
estudos de amostras, tal como a determinao das medidas de associao
do tipo razo de risco e razo de chance. Do mesmo modo, conhecer seus
conceitos pea fundamental a fim de que se possam entender as regras
elementares para o clculo das probabilidades dos desfechos estudados.
Assim, facilitando o entendimento do leitor, algumas definies sero aqui
apresentadas.
Suponhamos que um dado experimento possa ser repetido inmeras
vezes, e que cada repetio seja denominada de ensaio. Suponha, ainda, que,
em cada repetio (ensaio), um ou mais eventos mutuamente excludentes
possam ocorrer. Assim, a probabilidade para esse evento dada pela diviso
entre o nmero de vezes que ele ocorre no experimento e o nmero total de
ensaios do experimento. Portanto, para a ocorrncia do evento A, a probabi-
lidade de A dada por:
P A ( ) =
Nmero de eventos de A
Nmero total de eventtos do experimento
Com base nessa linha de raciocnio, podemos deduzir que a probabilidade
para um determinado evento varia de 0 a 1, sendo 0 a probabilidade para um
evento impossvel e 1 a probabilidade para um evento certo. Do mesmo modo,
se os eventos forem mutuamente excludentes, a soma das probabilidades de
todos os eventos possveis para um experimento sempre igual a 1.
BIOESTATISTICA_VOL02.indb 122 25/06/12 17:21
PROBABILIDADE E MEDIDAS DE ASSOCIAO 123
Portanto, para a aplicao da teoria da probabilidade em estatstica, vamos
considerar o seguinte exemplo: um estudo para verificar a resposta de pacientes
portadores de uma determinada doena, ao de uma nova droga a ser testada.
Os possveis desfechos podem ser caracterizados como piora, inalterado,
melhora e cura. Os dados esto representados na Tabela 15.1, abaixo.
Tabela 15.1 Resultados para o teste de uma nova droga
Tipo de resposta
N de casos
Homens Mulheres
Piora 5 6
Inalterado 10 8
Melhora 42 35
Cura 53 61
Total 110 110
Experimento definido como qualquer processo planejado que permita
ao pesquisador fazer observaes, cuja finalidade a coleta de dados. O
exemplo acima constitui um experimento. A probabilidade de cura no gru-
po dos homens dada por:
P( ) , cura = =
53
110
0 48
Ensaio cada uma das repeties independentes que compem um de-
terminado experimento. Para o exemplo anterior, cada ensaio consiste em
testar a droga em cada um dos 110 indivduos selecionados para o estudo.
Evento Corresponde ao desfecho obtido em cada um dos ensaios de um
experimento. Um evento dito simples quando no pode ser desdobrado.
Um evento denominado complementar quando ele o oposto ao evento
estudado, podendo ser calculado como 1 menos a probabilidade do evento
em questo. Ou seja, a probabilidade do evento estudado no ocorrer.
Para o exemplo dado, o evento pode ser qualquer um dos desfechos con-
BIOESTATISTICA_VOL02.indb 123 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 124
siderados no estudo, de acordo com a resposta individual droga testada.
Ou seja, pode ser a piora, o estado inalterado, a melhora ou a cura do
paciente. A probabilidade complementar para a cura no grupo das mulhe-
res dada por:
P P ( ( complementar para cura) cura) = 1
= 1
661
110
=0 45 ,
Espao amostral Consiste no conjunto de todos os eventos simples pos-
sveis de um experimento. No caso em tela, o espao amostral constitudo
por quatro eventos simples: piora, inalterado, melhora e cura.
15.1.1 Operaes com probabilidades
A seguir, mostraremos as regras bsicas para operaes com probabilidades.
A Regra da adio
Eventos mutuamente excludentes Dois ou mais eventos so ditos exclu-
dentes quando a ocorrncia de um impedir a ocorrncia do outro. Tome-
-se, como exemplo, o sexo; uma criana no pode nascer com os dois sexos,
masculino e feminino, ao mesmo tempo. Com base nesse princpio, todos os
eventos complementares so mutuamente excludentes, embora os eventos
possam ser mutuamente excludentes sem que sejam complementares. Isto
ocorre quando o espao amostral constitudo por trs ou mais eventos.
Assim, a probabilidade da ocorrncia de dois ou mais eventos mutuamente
excludentes igual soma das probabilidades de suas ocorrncias no mes-
mo experimento. Para o exemplo da Tabela 15.1, qual a probabilidade de um
paciente do sexo masculino evoluir com melhora ou cura?
P P P ( ( ( melhora ou cura) melhora) cura) = +
= + =
42
110
53
110
0 8 , 66
BIOESTATISTICA_VOL02.indb 124 25/06/12 17:21
PROBABILIDADE E MEDIDAS DE ASSOCIAO 125
Eventos no mutuamente excludentes Eventos no mutuamente ex-
cludentes so aqueles cuja ocorrncia de um no impede a ocorrncia
do outro, tal como o sexo e grupo sanguneo, pois o nascimento de uma
criana do sexo masculino sempre ter um dos grupos sanguneos tpi-
cos da espcie humana. Deste modo, regra da adio de probabilidades
deve ser modificada, de tal maneira que a probabilidade da ocorrncia
de ambos os eventos no seja acrescentada duas vezes no mesmo clculo
final. Portanto, a probabilidade da ocorrncia de dois ou mais eventos
no mutuamente excludentes igual soma das probabilidades de suas
ocorrncias no mesmo experimento, menos a probabilidade de que os
eventos ocorram simultaneamente. No Quadro 15.1, a probabilidade do
paciente ser do sexo feminino 0,50 e a probabilidade de cura 0,55
(61/110). Entretanto a probabilidade de pertencer ao sexo feminino ou
evoluir com cura no igual a 0,50 + 0,55, pois nessa soma, as mulheres
com evoluo para cura foram contadas duas vezes. Assim, a proba-
bilidade conjunta de pertencer ao sexo feminino e de ter evoludo para
cura deve ser subtrada do clculo. O valor a ser subtrado calculado
pela regra da multiplicao para eventos independentes, a qual ser mos-
trada no prximo item. O clculo dado por:

P P P P ( ( ( ( mulher ou cura) mulher) cura) mulher e = + ccura)
= + 0 5 0 , ,, ( , 55 0 5 0,55)
= = 1 05 0 27 0 77 , , ,
B Regra da multiplicao
Eventos independentes Dois ou mais eventos so ditos independentes
se a ocorrncia de um no tiver efeito sobre a ocorrncia do outro, tal como
o sexo e o tipo sanguneo, pois o tipo sanguneo de um indivduo no est
relacionado ao fato deste indivduo ser homem ou mulher. Assim, a proba-
bilidade conjunta de que dois ou mais eventos ocorram simultaneamente
igual ao produto da ocorrncia de suas probabilidades isoladamente. Para
o exemplo da Tabela 15.1, a probabilidade conjunta do paciente ser ho-
mem e evoluir para a cura dada por:
BIOESTATISTICA_VOL02.indb 125 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 126
P em e cura P em P cura (hom ) (hom ) ( ) =
= = 0 5 0 48 0 24 , , ,
Eventos no-independentes Tambm ditos associados ou correlacionados,
so aqueles cuja probabilidade da ocorrncia de um deles depende da ocorrn-
cia do outro, isto , a ocorrncia de um deles altera a probabilidade da ocor-
rncia do outro. Por exemplo: para dois eventos A e B
1
considerados no-inde-
pendentes, se quisermos saber a probabilidade do evento A, supondo-se que o
evento B tenha ocorrido, ou vice-versa, a probabilidade condicional dada por:
Como:
Ento:
P P P P P ( ( ( ( ( A e B) A | B) B) ou B e A) B = = || A) A) P(
A e B) = B e A); A | B) B) B | A P P P P P ( ( ( ( ( = ) ) A) P(
P
P P
P
P (
( (
(
( A | B)
B | A) A)
B)
ou B | A) =

=
PP P
P
( (
(
A | B) B)
A)

As duas equaes resultantes so derivadas da frmula do teorema de Bayes,


que ser discutido mais adiante, sendo o termo P(A), direita da equao P(A | B),
denominado probabilidade anterior, uma vez que o seu valor conhecido antes
do clculo, ao passo que o termo P(A | B), da mesma equao, denominado proba-
bilidade posterior, pois seu valor somente conhecido aps o clculo.
15.2 MEDIDAS DE ASSOCIAO
De modo geral, na maioria dos estudos estatsticos, o principal objetivo
verificar se existe uma relao de causa e efeito entre duas ou mais variveis,
sempre no sentido de avaliar o quanto a ao de uma influencia sobre o
desfecho da outra. Estes mtodos, frequentemente chamados de medidas
de fora de associao, tm sido amplamente utilizados em pesquisas
epidemiolgicas, cujo intuito mensurar a magnitude da associao entre
a exposio a um dado fator de risco e o desfecho de interesse, sendo as
1. A grafia P(A | B) lida como a probabilidade do evento A dado o evento B.
BIOESTATISTICA_VOL02.indb 126 25/06/12 17:21
PROBABILIDADE E MEDIDAS DE ASSOCIAO 127
variveis apresentadas sob a forma categrica (dicotmica) ou contnua.
Nesta parte do livro, abordaremos apenas as medidas de fora de associao
com variveis categricas, pois aquelas com variveis contnuas j foram
discutidas em outros captulos.
De qualquer forma, as medidas de fora de associao podem ser calcu-
ladas tanto em termos relativos, do tipo razo, como em termos absolutos,
do tipo diferena, e a escolha de um ou de outro mtodo depende do tipo
de estudo realizado. Porm, seja um ou outro o mtodo escolhido, o nvel de
significncia deve ser previamente estabelecido, de tal maneira que a signifi-
cncia estatstica possa ser testada para se verificar se a diferena encontrada
no tenha ocorrido em razo do acaso. O Quadro 15.1, abaixo, mostra a classi-
ficao das medidas de fora de associao mais utilizadas em estatstica.
Quadro 15.1 Classifcao geral das medidas de fora de associao
Medidas de associao Tipos
Relativas (tipo razo)
- Risco Relativo (RR)
- Razo de Chances (OR)
Absolutas (tipo diferena)
- Risco Atribuvel (RA)
- Porcentagem de Risco Atribuvel (RA%)
- Risco Atribuvel na Populao (RAP)
- Porcentagem de Risco Atribuvel na Populao (RAP%)
Outras
- Coefciente de correlao
- Tamanho de efeito padronizado (TEP)
As medidas de associao relativas (tipo razo) so utilizadas quando
o objetivo mensurar a associao entre a exposio ao fator de risco e a
ocorrncia de uma doena. Isto , quando queremos medir quantas vezes a
ocorrncia da doena no grupo dos expostos maior em relao ocorrncia
no grupo dos no-expostos. Portanto, as medidas de associao relativas
podem variar entre 0 e , de modo que, quando o valor igual a 1, isto
significa que as frequncias da doena entre os expostos e no-expostos so
iguais, no existindo, portanto, associao entre o fator de risco incriminado
e a doena estudada. Por sua vez, quando o valor for maior que 1, significa que
a frequncia no grupo dos expostos maior que no grupo dos no-expostos,
BIOESTATISTICA_VOL02.indb 127 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 128
indicando, portanto, que a exposio ao fator de risco est associado a um
aumento na ocorrncia da doena. Por outro lado, valores entre 0 e 1 indicam
que a frequncia da doena no grupo dos expostos menor em relao aos
no-expostos, sugerindo que a exposio um fator de proteo.
Por sua vez, as medidas de associao absolutas (tipo diferena)
so utilizadas quando o objetivo mensurar o quanto a frequncia de
uma doena no grupo dos expostos excede a frequncia no grupo dos
no-expostos, de tal modo que se possa determinar o nmero de casos
atribuveis exposio ao fator de risco estudado. Assim, com base nesta
relao, se a doena acomete igualmente os dois grupos, a diferena entre
as frequncias ser igual a zero, logo se conclui que no h associao
entre o fator de risco incriminado e a doena estudada. Porm, se alguma
diferena verificada, isto sugere que pode existir uma associao entre o
fator de risco e a doena em questo. Assim, com base neste raciocnio, as
medidas absolutas podem variar de uma associao fortemente positiva,
situao em que muitos expostos adoecem e poucos no-expostos adoecem,
a uma associao fortemente negativa, quando poucos expostos adoecem
e muitos no-expostos adoecem.
De qualquer maneira, seja para calcular as medidas de fora de associao
relativas ou absolutas, necessitamos utilizar a tabela de contingncia 2 x 2
padro, a qual mostrada, a seguir, com os dados hipotticos de um estudo
de coorte que ser tomado como exemplo para que se possam demonstrar os
clculos das diferentes mediadas de associao. Nas linhas, sero colocadas
as categorias relativas exposio ao fator de risco estudado; nas colunas,
estaro as categorias relativas doena de desfecho.
Exemplo: Um estudo de coorte prospectivo foi conduzido no sentido de
verificar a associao entre o fator de risco consumo de gordura saturada
e incidncia de hipercolesterolemia. Parar tal experimento, dois grupos de
200 pacientes, com nvel de colesterol srico normal, foram selecionados.
Ao grupo dos expostos, foi administrada dieta rica em gordura saturada; ao
grupo dos no-expostos, foi administrada dieta normal. O ponto de corte
considerado para a dosagem de colesterol total foi de 200 mg/dL.
BIOESTATISTICA_VOL02.indb 128 25/06/12 17:21
PROBABILIDADE E MEDIDAS DE ASSOCIAO 129
Tabela 15.2 Resultados de um estudo de coorte com 400 indivduos
Doena
Presente Ausente Total
Exposio ao fator
de risco
Exposto (a) 36 (b) 164 200
No-exposto (c) 12 (d) 188 200
Total 48 352 400
a - Indivduos expostos ao fator de risco e com a doena
b - Indivduos expostos ao fator de risco e sem a doena
c - Indivduos no-expostos ao fator de risco, mas com a doena
d - Indivduos no-expostos ao fator de risco e sem a doena
a + b - Todos os Indivduos expostos ao fator de risco
c + d - Todos os Indivduos no-expostos ao fator de risco
a + c - Todos os Indivduos com a doena
b + d - Todos os Indivduos sem a doena
a + b + c + d - Todos os indivduos do estudo
15.2.1 Razo de Risco (RR)
Tambm conhecida como risco relativo ou risk ratio, a razo de risco
corresponde razo entre o risco de adoecer em um grupo de indivduos
expostos ao fator de risco e o risco de adoecer em um grupo de indivduos
no-expostos ao mesmo fator de risco. A razo de risco pode ser calculada pela
seguinte frmula:
RR
Risco
Risco
onde
Expostos
No ostos
=
( )
( -exp )
, Risco
a
a b
e Risco
Expostos No ostos ( ) ( -exp
=
+
))
=
+
c
c d
Para o exemplo dado, temos:
RR
a
a b
c
c d
=
+
+
= =
36
200
12
200
3 0 ,
O risco relativo fornece uma estimativa da magnitude da associao entre
a exposio ao fator de risco e o desfecho estudado, isto , ele mostra quantas
vezes o risco de desenvolver a doena nos indivduos expostos maior em
BIOESTATISTICA_VOL02.indb 129 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 130
relao aos indivduos no-expostos. Assim, para o exemplo em questo, o risco
no grupo exposto foi trs vezes maior que no grupo no-exposto. Ou seja, os
indivduos que consumiram dieta rica em gordura saturada apresentaram uma
probabilidade trs vezes maior de evoluir com hipercolesterolemia quando
comparados aos indivduos com consumo de dieta normal.
Observe que este resultado foi calculado com base em um estudo amostral
e, portanto, deve ser avaliado para que se possa verificar a sua significncia
estatstica, a qual pode ser testada pela aplicao do teste do qui-quadrado
(
2
), j discutido no captulo anterior. Para o exemplo dado, importa
saber que o resultado para o teste foi estatisticamente significante, pois

calc
e valor P
2
13 64 0 0002 = = , , .
Uma outra maneira de testar a significncia estatstica atravs da anlise
do intervalo de confiana (IC), o qual pode ser calculado por diferentes mtodos
estatsticos, todos eles bastante complexos, porm com resultados muito
semelhantes, de modo que a utilizao de programas estatsticos tem facilitado
este tipo de anlise. No caso do exemplo da Tabela 15.2, o intervalo de confiana
de 95% (IC95%) calculado pelo programa Epi Info 3.5.1 (sries de Taylor)
igual a 1,61 - 5,59, indicando que na populao de onde a amostra foi retirada, a
verdadeira razo de risco pode ser qualquer valor entre 1,61 e 5,59, com 95% de
confiana. Assim, uma vez que o referido intervalo no contm a razo de risco
igual a 1, isto significa que, em nenhum momento, os riscos so iguais, e que,
portanto, o resultado encontrado (RR = 3,0) estatisticamente significante, fato
este que confirma o achado do teste de significncia do qui-quadrado.
De qualquer maneira, o intervalo de confiana para a razo de risco (RR)
pode ser determinado pela seguinte frmula:
IC95% para Razo de Risco
IC RR
a a b
a
c c d
95 1 96
1 1
% exp ln( ) ,
/( ) /( )
=
+

+
+

=

+
c
IC95 3 0 1 96
1 36 200
36
% exp ln( , ) ,
( / ) 11 12 200
12
95 1 098 1 96 0 101

( /
% exp , , , IC

=
IC
IC
95 1 098 0 623
95 1 61
% exp , ,
% , (limite i inferior)
(limite superior) =5 59 ,
ICC RR 95 1 61 5 59 % , , = < <
BIOESTATISTICA_VOL02.indb 130 25/06/12 17:21
PROBABILIDADE E MEDIDAS DE ASSOCIAO 131
IC RR
a a b
a
c c d
95 1 96
1 1
% exp ln( ) ,
/( ) /( )
=
+

+
+

=

+
c
IC95 3 0 1 96
1 36 200
36
% exp ln( , ) ,
( / ) 11 12 200
12
95 1 098 1 96 0 101

( /
% exp , , , IC

=
IC
IC
95 1 098 0 623
95 1 61
% exp , ,
% , (limite i inferior)
(limite superior) =5 59 ,
ICC RR 95 1 61 5 59 % , , = < <
Observe, ainda, que o risco relativo no pode ser calculado para um
estudo do tipo caso-controle. Este tipo de medida de associao somente deve
ser utilizado para um estudo de coorte ou para um ensaio clnico, nos quais
um grupo de indivduos com o fator de risco e um grupo sem o fator de risco
so selecionados e acompanhados ao longo do tempo, para determinar quais
indivduos desenvolvero o desfecho de interesse.
15.2.2 Razo de Chance (RC)
Tambm conhecida como odds ratio (OR), a razo de chance dada pela
razo entre chance de exposio no grupo de indivduos doentes e a chance
de exposio no grupo de indivduos no-doentes. A razo de chance pode ser
calculada pela seguinte frmula:

OR
Chance
Chane
onde Cha
Doena
No doena
=
( )
( - )
, nnce
a
a b
b
a b
a
b
e Chance
Doena No doena ( ) ( - )
=
+
+
= ==
+
+
=
c
c d
d
c d
c
d
Para o exemplo dado, temos:
OR
a
c
b
d
a d
b c
= =

= =
36 188
164 12
6 768
1 968
3 44
.
.
,
BIOESTATISTICA_VOL02.indb 131 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 132
Observe que dada a disposio de sua frmula na tabela de contingncia,
a razo de chances tambm conhecida como razo dos produtos cruzados,
sendo usada quando o objetivo avaliar se a chance de ocorrer a doena no
grupo de expostos maior ou menor que no grupo de no-expostos. Assim,
para o exemplo em questo, a chance no grupo exposto foi 3,4 vezes maior
que no grupo no-exposto. Ou seja, os indivduos que consumiram dieta rica
em gordura saturada apresentaram uma chance 3,4 vezes maior de evoluir
com hipercolesterolemia quando comparados aos indivduos com consumo
de dieta normal.
Portanto, embora a razo de risco no possa ser calculada em um estudo
caso-controle, a razo de chances pode, sendo esta medida de associao uma
boa estimativa da razo de risco que seria obtida neste tipo de estudo, especial-
mente quando a frequncia da doena na populao muito baixa.
Por outro lado, erroneamente, comum a utilizao do termo risco
relativo para designar as medidas calculadas pela razo de chance. Em termos
prticos, as duas medidas apresentam frmulas matemticas diferentes.
Mas, afinal, por que nos estudo caso-controle no pode ser utilizada a razo
de risco? A questo simples. Se fssemos calcular a chance de doena no
grupo exposto ao fator de risco, a frmula seria a/b; ao passo que a chance
de doena no grupo no-exposto seria c/d, e a razo de chance entre os
dois grupos seria OR = (a/b)/(c/d). Matematicamente, no teria diferena
se a razo de chance fosse calculada desta maneira ou pela frmula tradi-
cionalmente correta, OR = (a/c)/(b/d), pois a multiplicao cruzada, em
cada caso, seria sempre OR = ad/bc. Porm, em termos conceituais, no tem
sentido usar a frmula OR = (a/b)/(c/d), pois os valores das clulas a e b
vm de diferentes grupos estudados, isto , a vem do grupo caso, enquanto
b vem do grupo controle.
Note que, neste tipo de estudo, as nicas medidas disponveis so
as propores de pessoas expostas entre os casos e entre os controles.
No temos dados sobre o nmero de pessoas expostas e no-expostas na
populao que produziu os casos e que, tambm, produziu os controles, pois
o nmero de casos e controles definido arbitrariamente pelo pesquisador
e no reflete a proporo real entre o nmero de casos, ou controles, e o
total de pessoas na populao. Por este motivo, a apresentao dos dados
BIOESTATISTICA_VOL02.indb 132 25/06/12 17:21
PROBABILIDADE E MEDIDAS DE ASSOCIAO 133
tabulares nos estudos caso-controle no inclui a coluna de total, que soma
casos e controles nos grupos expostos e no-expostos ao fator de risco. Por
isso, no podemos calcular os riscos de doena em expostos e no-expostos,
nem, tampouco, a razo de risco, da porque, em estudos caso-controle,
os grupos so comparados quanto frequncia de exposio pela
aplicao da razo de chance de exposio, que corresponde ao valor de
quanto a exposio mais frequente em um grupo em relao ao outro.
Como a razo de chance (OR) de exposio e a razo de chance de doena,
em expostos e no-expostos, so, matematicamente, iguais, esta ltima
tambm pode ser calculada em estudos caso-controle, pois ela semelhante
razo de risco de doena, quando esta relativamente rara, em especial,
quando sua incidncia na populao menor que 5%, sendo a razo
de chance uma boa estimativa da razo de risco. Nestes casos, a razo de
chance semelhante razo de risco, e isso explica o uso do termo razo de
risco ou risco relativo, quando a razo de chance calculada em estudos do
tipo caso-controle.
Outro ponto importante a ser considerado no clculo das medidas de
associao do tipo razo a disposio dos grupos na tabela de contingncia
2 x 2. Como j explicado anteriormente, para o clculo do qui-quadrado, a
posio dos grupos no altera o resultado final, porm, nos clculos da razo
de risco (RR) e da razo de chances (RC), essa disposio importante para
a interpretao do resultado. Tradicionalmente, o grupo exposto colocado
no numerador, uma vez que, quase sempre, o risco, neste grupo, maior que
no grupo no-exposto, o que leva a um valor maior que 1, tal como ocorreu
no exemplo mostrado na Tabela 15.2, onde o risco para hipercolesterolemia
3 vezes maior no grupo exposto em relao ao no-exposto. Por outro
lado, nada impede que o grupo exposto seja colocado no denominador. Nesta
disposio, o risco seria 1/3, isto , 0,33, o que significa que os indivduos
os quais consumiram dieta normal tm um tero do risco dos indivduos
com dieta rica em gordura saturada. Neste caso, poderamos dizer que no
consumir gordura saturada um fator de proteo para a hipercolestero-
lemia. De qualquer forma, as duas maneiras fazem sentido, e a interpretao
matematicamente compreensvel, esteja o grupo exposto no numerador ou
no denominador da equao.
BIOESTATISTICA_VOL02.indb 133 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 134
IC95% para Razo de Chances
IC OR
a b c d
IC
951 1 96
1 1 1 1
95
% exp ln( ) ,
% e
= + + +

= xxp ln( , ) ,
%
3 44 1 96
1
36
1
164
1
12
1
188
95
+ + +

= IC eexp( , , , )
% exp( , , )
1 235 1 96 0 122
95 1 235 0 684
95

= IC
IC %% , , =1 73 6 81 (limite inferior) e (limite supperior)
IC OR 95 1 73 6 81 % , , = < <
15.2.3 Risco Atribuvel (RA)
Tambm conhecido como diferena de risco, o risco atribuvel dado
pela diferena entre o risco em um grupo exposto e o risco em um grupo
no-exposto.

RA
RA
= Risco Risco
=
(Expostos) (No-expostos)
a
a++

+
=
= =
b
c
c d
36
200
12
200
0 18 0 06 0 12 RA , , ,
O risco atribuvel fornece uma estimativa do efeito da exposio ao fator de
risco sobre o excesso de risco da doena no grupo exposto em relao ao grupo
no-exposto. Isto , mostra a quantidade de risco que atribuda ao fator de
risco estudado, desde que a relao entre a exposio e a doena no ocorra
por acaso. Isto significa que, para cada 100 indivduos expostos ao fator de
risco, em mdia 18 (36/200) deles apresentam hipercolesterolemia, e desses
18, a exposio ao consumo excessivo de gordura saturada responsvel pela
hipercolesterolemia em 12 indivduos. Assim, caso a exposio fosse eliminada
BIOESTATISTICA_VOL02.indb 134 25/06/12 17:21
PROBABILIDADE E MEDIDAS DE ASSOCIAO 135
e a doena fosse reversvel, o risco no grupo dos expostos reduziria de 0,18
para 0,06, o que evitaria que, de cada 100 pessoas expostas ao fator de risco,
12 indivduos apresentassem a doena.
15.2.4 Porcentagem de Risco Atribuvel (RA%)
Corresponde ao risco atribuvel (RA) expresso em porcentagem em relao
incidncia no grupo dos expostos. dada pela equao:
RA%
Risco Risco
Risco
(Expostos) (No-expostos)
(E
=

xxpostos)
100
% 100
%
x
x RA
RA
=

=
0 18 0 06
0 18
66 66
, ,
,
, %%
A porcentagem de risco atribuvel reflete que porcentagem de risco total
para hipercolesterolemia devido ao consumo de gordura saturada. Assim,
para o exemplo em questo, 66,6% do risco entre os expostos so atribudos
exposio ao fator de risco estudado.
Uma outra maneira de calcular o RA% tomar como base o risco relativo
(RR). Esta maneira deve ser considerada quando, no estudo, no for possvel
calcular o risco absoluto. A frmula :
RA
RR
RR
RA RA
%
% % , %
=

=

=
1
100
3 1
3
100 66 66
Nos estudos do tipo caso-controle, nos quais no se pode estimar a
incidncia da doena, ou nas pesquisas em que a doena estudada de baixa
frequncia e, portanto, com baixo risco na populao, a razo de chances (OR)
pode ser usada como um estimador aproximado do risco relativo (RR). Nestes
casos, a frmula da RA% pode ser escrita substituindo-se o RR pelo OR.
BIOESTATISTICA_VOL02.indb 135 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 136

RA
OR
OR
RA
RA
%
%
,
,
% , %
=

=
1
100
3 44 1
3 44
100
70 93
15.2.5 Risco Atribuvel na Populao (RAP)
calculado pela diferena entre o risco total na populao menos o risco
no grupo no-exposto. Estima, na populao em geral, o quanto do risco total
para a doena em questo decorrente do fator de risco estudado. dado
pela frmula:
RAP Risco Risco
RAP
a c
a b
Total No ostos
=
=
+
+ +
( ) ( -exp )
cc d
c
c d
RAP
+

+
=
= =
48
400
12
200
0 12 0 06 0 06 , , ,
Portanto, se no houvesse o consumo de gordura saturada na populao, o
total de indivduos com hipercolesterolemia seria somente de 6 para cada 100
pessoas avaliadas, sendo o excesso sobre esse nmero, isto , de 6 indivduos
hipercolesterolmicos, atribudo ao fator de risco estudado.
15.2.6 Porcentagem de Risco Atribuvel na
Populao (RAP%)
Igualmente ao RA%, a porcentagem de risco atribuvel na populao
(RAP%) tambm pode ser calculada com base na diferena de risco absoluto
ou no risco relativo. A frmula que utiliza a diferena de risco a seguinte:
RAP
Risco Risco
Risco
total No osto
Total
%
( ) ( -exp )
(
=

))
%
, ,
,
% %

=
100
0 12 0 06
0 12
100
50
RAP
RAP
BIOESTATISTICA_VOL02.indb 136 25/06/12 17:21
PROBABILIDADE E MEDIDAS DE ASSOCIAO 137
RAP
Risco Risco
Risco
total No osto
Total
%
( ) ( -exp )
(
=

))
%
, ,
,
% %

=
100
0 12 0 06
0 12
100
50
RAP
RAP
A RAP% informa, na populao em geral, que porcentagem de risco total
para a doena devido ao fator de risco estudado. No caso em questo, 50%
do risco de hipercolesterolemia decorrente do consumo de gordura saturada.
Portanto, as medidas de associao, sejam do tipo razo ou do tipo
diferena, tm sido amplamente utilizadas para avaliao de custos e benefcios
de programas de sade pblica para investigao e controle de riscos que
podem causar doenas na populao em geral. O perfeito entendimento de suas
aplicaes e a correta interpretao dos resultados constituem importantes
pontos a serem considerados pelos pesquisadores envolvidos com estudos na
rea da epidemiologia.
BIOESTATISTICA_VOL02.indb 137 25/06/12 17:21
BIOESTATISTICA_VOL02.indb 138 25/06/12 17:21
16
Testes de Rastreamento
Diagnstico
No dia-a-dia da prtica da pesquisa clnica, o mdico e outros profis-
sionais da rea da sade so frequentemente chamados a decidir quanto ao
diagnstico e ao tipo mais indicado de tratamento para as mais diversas varie-
dades de doenas. Neste complexo processo de tomada de decises, estes
profissionais se deparam com situaes que exigem no apenas a escolha
correta dos exames diagnsticos, mas, tambm, a perfeita interpretao e
minuciosa avaliao da preciso dos resultados fornecidos, sejam eles positivos
ou negativos. Entretanto, como geralmente existem diferentes exames, sejam
clnicos ou laboratoriais, a fim de que se possa diagnosticar uma determinada
doena, o pesquisador sempre dever buscar aquele que fornea um resultado
mais confivel, escolha esta que, certamente, depender de vrios fatores, tais
como a acurcia, a sensibilidade e a especificidade do teste solicitado, assim
como do espectro da doena na populao e do estgio em que a ela se encontra
no momento do estudo.
De qualquer maneira, antes de se decidir por um ou por outro tipo exame,
ou at mesmo antes que um novo exame de diagnstico seja implantado como
um bom teste de rastreamento para uma determinada doena, um pesqui-
sador dever submet-lo a uma srie de anlises no sentido de verificar sua
efetividade. Estas anlises, geralmente realizadas comparativamente com
BIOESTATISTICA_VOL02.indb 139 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 140
outros testes j bem estabelecidos pela cincia, so embasadas em princpios
estatsticos e teorias probabilsticas anteriormente explanadas neste livro,
as quais tm assumido grande destaque na rea da pesquisa mdica, pois
constituem uma importante ferramenta de orientao e de avaliao de
polticas de sade pblica. Assim, o objetivo do presente captulo orientar
o pesquisador quanto correta aplicao do processo de tomada de decises
teraputicas, com base no mtodo de anlise e validao de teste de
diagnstico e de rastreamento.
16.1 BASES PARA OS TESTES DE RASTREAMENTO
DIAGNSTICO
Tambm conhecidos como screening test, os testes de rastreamento
tm sido largamente empregados como estimadores de doenas em estudos
de pesquisas epidemiolgicas e clnicas, de modo a oferecer uma forma
segura para o processo de tomada de deciso se um determinado proce-
dimento diagnstico deve ou no ser aplicado para uma dada populao.
Como o diagnstico condio fundamental para o planejamento teraputico,
essencial que o profissional envolvido possa dispor de mtodos seguros
para avaliar a efetividade do exame solicitado, de maneira que o tratamento
indicado tenha mais chances de sucesso. Assim, a escolha do instrumento
utilizado para a tomada de deciso assume grande importncia, uma vez
que, dos dados obtidos a partir de sua aplicao, depende todo um planeja-
mento teraputico.
Na prtica clnica, um teste de rastreamento diagnstico utilizado
para a deteco de uma doena especfica ou de um agravo sade em uma
populao exposta a um determinado fator de risco, mesmo que na ausncia
de queixas, isto , ainda na fase pr-clnica da doena, podendo, porm,
ser ampliado para toda a populao de acordo com critrios tcnicos bem
definidos, tal como a alta prevalncia da doena na populao em questo,
a faixa etria ou o sexo acometido, sempre no sentido de contribuir com o
prognstico da doena estudada. Com base neste raciocnio, um bom teste
de rastreamento diagnstico, alm de outras caractersticas, deve detectar
BIOESTATISTICA_VOL02.indb 140 25/06/12 17:21
TESTES DE RASTREAMENTO DIAGNSTICO 141
o maior nmero possvel de casos da doena investigada na populao
alvo, de modo que possa distinguir, com preciso, as pessoas que esto
aparentemente bem, mas que se encontram doentes, daquelas que no
apresentam a doena investigada. Ou seja, um bom teste deve ser preciso
quando separa os casos positivos (com a doena) dos casos negativos
(sem a doena).
Porm, como no existe um teste diagnstico perfeito no que tange
identificao da doena estudada, o pesquisador sempre ir incluir, em
sua avaliao, uma razovel margem de erro quanto ao resultado obtido,
seja ele positivo ou negativo. Essa margem de erro pode ser aumentada ou
diminuda segundo algumas caractersticas assumidas para o teste, tal como
a sensibilidade, a especificidade e o ponto de corte definido como limite
de normalidade para os valores encontrados no exame diagnstico, assim
como um bom juzo crtico baseado na experincia do avaliador. Por essa
razo, ao solicitar um determinado exame diagnstico, o pesquisador dever
considerar que o resultado obtido poder incluir uma das seguintes possi-
bilidades: teste positivo (alterado) para um paciente portador da doena
investigada (teste verdadeiro-positivo); teste positivo (alterado) para um
paciente sem a doena investigada (teste falso-positivo); teste negativo
(normal) para um paciente com a doena investigada (teste falso-negativo);
teste negativo (normal) para um paciente sem a doena investigada
(teste verdadeiro-negativo).
Assim, diante destas quatro possibilidades acima expostas, o pesquisador
dever decidir qual aquela que melhor se aplica para a situao em estudo. Esta
tomada de deciso requer, alm do conhecimento das particularidades clnicas
inerentes doena investigada, a determinao das medidas de sensibilidade
e especificidade que definem a qualidade intrnseca do teste utilizado, assim
como a anlise dos parmetros que refletem a sua capacidade de produzir
decises clnicas corretas, dentre as quais se destacam os valores de predio
positiva e negativa, todas elas embasadas nos princpios da teoria da probabi-
lidade, j anteriormente demonstradas.
No entanto, para que um teste seja considerado efetivo como instrumento
de diagnstico clnico ou de rastreamento para uma determinada doena ou
agravo populao, necessrio submet-lo a um processo de avaliao, de
BIOESTATISTICA_VOL02.indb 141 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 142
modo que se possa verificar a sua sensibilidade e especificidade em sujeitos
com caractersticas semelhantes s da populao em que o teste ser usado.
Para tal, deve-se comparar a proporo de resultados corretos para o teste
a ser avaliado, quando aplicado em dois grupos distintos: a) um grupo de
sujeitos sabidamente saudveis e que, portanto, os resultados do teste devem
ser negativos; b) um grupo de sujeitos no qual se tem a certeza que a doena
esta presente e que, portanto, os resultados do teste devem ser positivos.
Note que, nesta avaliao, a presena da doena no segundo grupo tambm
foi confirmada por um teste diagnstico, o qual utilizado como referncia.
Este teste, geralmente chamado padro-ouro
1
(gold standard), deve
ser teoricamente melhor que o teste avaliado e, de preferncia, totalmente
isento de erros.
Em resumo, para um exame de diagnstico clnico ou de rastrea-
mento poder ser utilizado correntemente, de forma a produzir resultados
confiveis, h de se proceder a sua validao com base em um teste consi-
derado teoricamente melhor no momento da execuo da pesquisa, mesmo
que este no oferea uma certeza absoluta a respeito do diagnstico.
Assim, o desafio do pesquisador encontrar um teste o mais prximo possvel
do ideal, mais rpido, com menor custo e menos invasivo.
De qualquer maneira, para executar a validao de um teste diagnstico
ou de rastreamento, a maneira mais didtica a utilizao da tabela de
contingncia 2 x 2, j amplamente discutida no captulo 14 deste livro.
Nesta tabela, so comparados os resultados do teste avaliado e do teste
padro-ouro tomado como referncia. A partir destes resultados,
possvel calcular as medidas que caracterizam as qualidades intrnsecas e
os parmetros de decises do teste em anlise. Um modelo para a tabela-
-padro 2 x 2, que compara os resultados do teste analisado e a verdadeira
condio de doena nos indivduos testados, mostrada a seguir. Note que
os pacientes so classificados apenas como doentes e no-doentes, no se
admitindo estgios intermedirios.
1. Termo utilizado para designar testes com satisfatria exatido diagnstica, tal como bipsias,
inspees cirrgicas e outros.
BIOESTATISTICA_VOL02.indb 142 25/06/12 17:21
TESTES DE RASTREAMENTO DIAGNSTICO 143
Tabela 16.1 Tabela-padro 2 x 2 para a validao de um teste de rastreamento diagnstico
Resultado do teste padro ouro
Doente No-doente Total
Resultado do teste
analisado
Positivo a b a + b
Negativo c d c + d
Total a + c b + d a + b +c + d
a - Indivduos com resultado verdadeiro-positivo para o teste
b - Indivduos com resultado falso-positivo para o teste
c - Indivduos com resultado falso-negativo para o teste
d - Indivduos com resultado verdadeiro-negativo para o teste
a + b - Todos os Indivduos com resultado positivo para o teste
c + d - Todos os Indivduos com resultado negativo para o teste
a + c - Todos os Indivduos com a doena (teste padro ouro)
b + d - Todos os Indivduos sem a doena (teste padro ouro)
a + b + c + d - Todos os indivduos do estudo
Note, tambm, que apenas nas caselas a e d o teste em anlise est
correto. Isto ocorre porque, na prtica, no existem testes diagnsticos
perfeitos, capazes de identificar todos os indivduos portadores da doena
investigada. Assim, com o objetivo de demonstrar todos os clculos envol-
vidos no processo de avaliao de um teste diagnstico, tomaremos como
base o seguinte exemplo:
Exemplo: Suponha que um laboratrio queira realizar um estudo para
verificar a confiabilidade de um teste rpido para gravidez com o uso de
um kit caseiro. Para tal finalidade, os autores compararam os resultados do
teste realizado pela deteco qualitativa de gonadotrofina corinica humana
(hCG) na urina de mulheres supostamente grvidas. O diagnstico definitivo de
gravidez foi feito pela dosagem da gonadotrofina corinica humana no sangue
(padro ouro). Os resultados esto expressos na Tabela 16.2, a seguir.
BIOESTATISTICA_VOL02.indb 143 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 144
Tabela 16.2 Resultado da avaliao do teste rpido para gravidez em 800 mulheres
supostamente grvidas
Resultado do teste padro ouro
Grvida No-grvida Total
Resultado do teste
rpido
Positivo 416 105 521
Negativo 48 231 279
Total 464 336 800
16.2 INDICADORES DE UM TESTE DIAGNSTICO
16.2.1 Sensibilidade e Especifcidade
A preciso de um teste diagnstico mais frequentemente medida atravs
de dois importantes indicadores, a sensibilidade e a especificidade, os quais
sero descritos a seguir:
Sensibilidade (S)
Refere-se capacidade do teste em detectar a doena que est sendo inves-
tigada quando ela est de fato presente. Ou seja, de ser positivo nos pacientes
que realmente tm a doena. A sensibilidade expressa a porcentagem dos
pacientes com a doena, cujos resultados do exame foram positivos. calculada
pela seguinte frmula:
Se o teste apresentar alta sensibilidade, raramente deixar de diagnos-
ticar indivduos com a doena. Por outro lado, se o teste no sensvel, ele no
detectar a doena em alguns dos indivduos doentes, os quais iro aparecer
na casela c. A proporo destes indivduos chamada de taxa de erro falso-
-negativo (EFN), cujo denominador inclui todos os indivduos doentes, pois
somente eles podem ser falsamente chamados de no-doentes. A EFN
calculada por:
S
a
a c
S =
+
= = , onde, para o exemplo dado:
416
464
00 897 , (89,7%)
BIOESTATISTICA_VOL02.indb 144 25/06/12 17:21
TESTES DE RASTREAMENTO DIAGNSTICO 145

EFN
c
a c
=
+
= =
48
464
0 103 , (10,3%)
Importa saber que a sensibilidade e a taxa de erro falso-negativo somam
1,0 (100%).
Especificidade (E)
Refere-se capacidade do teste em identificar os indivduos que no tm
a doena investigada quando, de fato, ela no est presente. Ou seja, de ser
negativo nos pacientes que realmente no tm a doena. A especificidade
expressa a porcentagem dos pacientes sem a doena, cujos resultados do exame
foram negativos. calculada pela seguinte frmula:
E
d
b d
E =
+
= = , onde, para o exemplo dado:
231
336
00 687 , (68,7%)
Se o teste apresentar alta especificidade, raramente classificar como
doente um indivduo sem a doena. Por outro lado, se o teste no especfico,
ele indicar, erroneamente, a presena da doena em alguns dos indivduos
no-doentes, os quais iro aparecer na casela b. A proporo destes indivduos
chamada de taxa de erro falso-positivo (EFP), cujo denominador inclui
todos os indivduos no-doentes, pois somente eles podem ser falsamente
chamados de doentes. A EFP calculada por:
EFP
b
b d
=
+
= =
105
336
0 313 , (31,3%)
Importa saber que a especificidade e a taxa de erro falso-positivo somam
1,0 (100%).
De maneira geral, para a deteco de uma determinada condio clnica,
o ideal seria a escolha de um teste com alta sensibilidade e especificidade. No
entanto, nem sempre existem testes que combinem estas duas caractersticas,
simultaneamente. Na prtica clnica, o mais comum se encontrar mais de um
BIOESTATISTICA_VOL02.indb 145 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 146
teste para a mesma doena, da a necessidade da comparao entre eles, de
modo que a escolha recaia sobre aquele mais adequado para a situao. Assim,
suponha que dois diferentes testes estejam disponveis: um com alta sensibi-
lidade e baixa especificidade, e outro com alta especificidade, porm com baixa
sensibilidade. Qual seria a escolha mais apropriada? Neste caso, alguns pontos
devem ser considerados, dentre eles as indicaes pertinentes condio clnica
do paciente e o tipo de doena a ser diagnosticada, assim como a capacidade
do teste em fazer previses diagnsticas (valores preditivos), que dependem
conjuntamente da sensibilidade e especificidade. A seguir, citaremos algumas
indicaes clnicas para a escolha do melhor teste. Os valores preditivos e a
razo de probabilidades sero descritas mais adiante.
Quando o objetivo rastrear uma doena ou agravo sade em grupos
populacionais, como por exemplo, traar o perfil epidemiolgico da soropre-
valncia
2
de uma determinada doena infecciosa, como a hepatite B e C, a
escolha deve recair sobre um teste de alta sensibilidade. Igualmente, os testes
mais sensveis devem ser utilizados para diagnosticar condies clinicamente
graves, especialmente na fase inicial da doena, quando o objetivo fazer
diagnstico diferencial.
Por sua vez, os testes mais especficos dever ser escolhidos quando o
objetivo for confirmar um diagnstico indicado por um teste mais sensvel,
pois raramente ele mostrar um resultado positivo na ausncia de doena.
Do mesmo modo, a especificidade deve ser prioritria nos casos em que um
resultado falso-positivo possa comprometer a sade do paciente pela indicao
de um tratamento desnecessrio, por exemplo.
Assim, para o exemplo mostrado na Tabela 16.2, o teste rpido para
diagnstico da gravidez apresenta alta sensibilidade (89,7%), porm com
razovel especificidade (68,7%).
Relao entre sensibilidade e especifcidade
Como referido anteriormente, o teste ideal seria aquele em que a sensibi-
lidade e a especificidade fossem iguais a 100%. Porm, como na prtica isto no
ocorre, os valores da sensibilidade e da especificidade devem ser combinados a
2. Refere-se aos indivduos que tm positividade para anticorpos contra um dado agente
infeccioso. O surgimento da soropositividade chamado de soroconverso.
BIOESTATISTICA_VOL02.indb 146 25/06/12 17:21
TESTES DE RASTREAMENTO DIAGNSTICO 147
fim de que se possa determinar a utilidade do exame como meio de diagnstico
para uma determinada doena. Entretanto, o que frequentemente existe um
equilbrio (contrabalano ou trade-off) entre estas duas propriedades, de tal
modo que, quando aumenta a sensibilidade, a especificidade tende a diminuir
e vice-versa. Assim, esses indicadores tambm devem ser combinados com o
ndice de suspeita (ou probabilidade anterior) do mdico de que o indivduo
pesquisado tenha ou no a doena investigada, visando a determinar a proba-
bilidade da doena (ou sua ausncia), tendo em vista o conhecimento do
resultado do exame.
Quando o resultado do teste expresso de forma dicotmica, isto , como
positivo ou negativo, normal ou anormal, por exemplo, muito pouco se pode
fazer para ajustar a sensibilidade ou a especificidade. Porm, para um teste
diagnstico cujo resultado determinado por uma escala contnua de valores,
como o mtodo enzimtico para a dosagem de colesterol srico, expressa em
mg/dL, por exemplo, necessrio que se estabelea um limite (ponto de corte
ou cutoff point) entre os valores considerados normais e os anormais. Neste
caso, alterando-se o ponto de corte para mais ou para menos, pode-se modificar
as propriedades do teste, de modo que a sensibilidade somente poder ser
aumentada se ocorrer uma diminuio considervel da especificidade e
vice-versa. Assim, como a escolha envolve uma deciso entre aumentar a sensi-
bilidade custa de reduo da especificidade, ou vice-versa, deve-se optar por
um ponto de corte para o qual ocorra o menor erro possvel, tanto para falsos-
-positivos quanto para falsos-negativos.
O exemplo a seguir mostra a importncia da determinao do melhor
ponto de corte. A dosagem srica do hormnio triiodotironina (T
3
) pelo mtodo
enzima-imuno-fluorimtrico usada para diagnosticar o hipertireoidismo,
cujo ponto de corte 200 ng/100 ml. O ideal seria que todos os indivduos com
dosagem acima deste valor fossem considerados com hipertireoidismo, e os
indivduos com dosagem abaixo fossem considerados normais (Figura 16.1A).
Contudo, na prtica clnica, podemos encontrar indivduos com sintomas
de hipertireoidismo mesmo apresentando valores de T3 dentro dos limites
da normalidade, assim como indivduos clinicamente normais, porm com
elevados nveis hormonais, existindo, portanto, uma sobreposio dos sintomas
em relao aos valores definidos para o exame (Figura 16.1B).
BIOESTATISTICA_VOL02.indb 147 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 148
A
T3 (ng/100ml)
200
B
T3 (ng/100ml)
200

Fig. 16.1 Distribuio dos valores sricos da triiodotironina (T3) em indivduos normais
e com hipertireoidismo. A Distribuio ideal em relao ao ponto de corte. B Sobreposio
de sintomas em relao aos valores hormonais
De qualquer maneira, a critrio do pesquisador, o ponto de corte para um
determinado exame poder ser modificado para mais ou para menos, de modo a
torn-lo mais sensvel ou mais especfico. Entretanto, essa mudana acarretar
uma alterao no equilbrio (contrabalano) entre estas duas propriedades, o
que leva a uma diminuio (ou aumento) na sensibilidade ou na especificidade,
respectivamente, conforme mostrado na Figura 16.2. Assim, se um ponto de corte
mais baixo for selecionado, isso acarretar um aumento na sensibilidade do teste,
e todos os indivduos com hipertireoidismo sero detectados pelo exame, porm,
muitos dos indivduos normais (assintomticos) podero ser taxados como
portadores da doena (falsos-positivos). Por outro lado, se for selecionado um
ponto de corte mais elevado, isso aumentar a especificidade do teste, e todos
os indivduos sem a doena sero classificados como normais, embora muitos
pacientes com hipertireoidismo no sejam detectados pelo exame (falsos-
-negativos). As reas sombreadas na Figura 16.2 representam, respectivamente,
a taxa de erro falso-positivo para um ponto de corte reduzido (Figura 16.2A) e a
taxa de erro falso-negativo quando o ponto de corte aumentado (Figura 16.2B).
Portanto, uma questo importante que sempre deve ser considerada o
ponto de corte que positivar o teste avaliado. Como a escolha sempre envolve
a deciso entre aumentar a sensibilidade custa de reduo da sensibilidade
e vice-versa, o pesquisador deve avaliar, com muita cautela, a importncia
relativa da sensibilidade e especificidade do teste, de modo que possa estabe-
BIOESTATISTICA_VOL02.indb 148 25/06/12 17:21
TESTES DE RASTREAMENTO DIAGNSTICO 149
lecer o ponto de transio diagnstica mais adequada. Assim, como regra geral,
quando o objetivo evitar resultado falso-negativo, o ponto de corte deve buscar
o mximo de sensibilidade, e se o objetivo for evitar o resultado falso-positivo,
o ponto de corte deve objetivar o mximo de especificidade. Na prtica, o
pesquisador dever buscar um equilbrio para o ponto de corte, de maneira
que possa ajustar a sensibilidade e a especificidade do teste diagnstico, otimi-
zando tanto o erro falso-positivo quanto o falso-negativo. A Figura 16.3 mostra
o ponto de corte com o mnimo de erro para o teste de diagnstico do hiperti-
reoidismo, enquanto que a Tabela 16.3 mostra a relao entre a sensibilidade e
a especificidade para diferentes pontos de corte em relao ao teste utilizado.

T3 (ng/100ml)
200
Fig. 16.3 Ponto de corte ideal para o teste da triiodotironina
Figura 16.2 Variaes da sensibilidade e especifcidade conforme as alteraes
no ponto de corte do teste para a dosagem da triiodotironina

A
T3 (ng/100ml)
180
B
T3 (ng/100ml)
220
BIOESTATISTICA_VOL02.indb 149 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 150
Tabela 16.3 Relao entre sensibilidade e especifcidade (diferentes pontos de corte)
T3
(ng/100ml)
Sensibilidade
(%)
Especifcidade
(%)
150 99,2 9,7
160 97.9 17,7
170 95,8 29,4
180 92,9 43,8
190 85,1 60,9
200 69,6 77,6
210 51,2 86,8
220 28,5 95,4
230 9,1 98,6
240 2,3 100,0
Em resumo, um bom teste de rastreamento deve ter alta sensibilidade para
no perder os casos da doena presentes na populao testada, bem como alta
especificidade a fim de reduzir o nmero de pessoas com resultados falsos-
-positivos que necessitem de posterior investigao.
16.2.2 Curva ROC
Originalmente desenvolvida pela rea de engenharia eltrica, na Inglaterra,
a curva ROC (receiver operating characteristic curve) foi primeiramente
utilizada em programas para analisar a sensibilidade na deteco de sinais de
radar durante a batalha da Gr-Bretanha, na segunda Guerra Mundial. Porm,
somente a partir de 1950, o modelo foi empregado na rea da sade, inicial-
mente na rea da psicofsica e, mais recentemente, na medicina, onde tem
sido amplamente empregada no campo da epidemiologia para avaliao de
testes diagnsticos. Assim com base no modelo inicialmente desenvolvido, a
curva ROC (curva de operadores recebedores de caractersticas) um mtodo
estatstico e grfico utilizado para determinar o melhor ponto de corte de um
teste diagnstico. Neste mtodo, a relao entre a sensibilidade e a especi-
ficidade determinada pela construo de uma curva a partir dos pontos
marcados em um grfico binrio.
BIOESTATISTICA_VOL02.indb 150 25/06/12 17:21
TESTES DE RASTREAMENTO DIAGNSTICO 151
Para construir uma curva ROC, devem-se marcar, no grfico, os pares
ordenados constitudos pelos valores da sensibilidade e da especificidade,
calculados a partir de diferentes pontos de corte determinados para o teste
diagnstico avaliado. Sobre o eixo das ordenadas (eixo y) colocam-se os valores
da sensibilidade (proporo de verdadeiros positivos) e sobre o eixo das
abscissas (eixo x) so colocados os valores do complemento da especificidade
(1 especificidade), isto , a proporo de falsos-positivos. A seguir, os pontos
so conectados entre si por uma linha, conforme demonstrado na Figura 16.4,
abaixo, que representa a curva ROC para diferentes pontos de corte da triiodo-
tironina srica.


Fig. 16.4 Curva ROC para determinar o melhor ponto de corte para os valores da dosagem
da triiodotironina, conforme mostrado na Tabela 16.3
Raciocnio para o modelo
Suponhamos que um pesquisador quisesse determinar o melhor ponto
de corte para a triiodotironina (T3) em um programa de rastreamento para o
hipertireoidismo. Inicialmente, ele deveria dosar o hormnio em uma grande
amostra representativa da populao, e, ento, executar uma avaliao clnica
(padro ouro) para definir quais os indivduos que, de fato, apresentam
a doena. Assim, cada indivduo teria um valor para a dosagem de T3 e um
diagnstico, presente ou ausente, para a doena investigada. A seguir, o
BIOESTATISTICA_VOL02.indb 151 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 152
pesquisador deveria definir diferentes valores limtrofes (pontos de corte)
que separariam os indivduos sadios dos doentes, e, ento, verificar, com base
no diagnstico clnico, quais aqueles em que os diagnsticos laboratorial e
clnico foram coincidentes ou no. Aps esse procedimento, os valores da
sensibilidade e da especificidade do teste seriam calculados para cada um dos
diferentes pontos de corte previamente estabelecidos. Com base nas infor-
maes coletadas, uma curva ROC seria construda.
Portanto, com base neste raciocnio, se o ponto de corte para T3 fosse
estabelecido em 0,0 ng/100ml, todos os indivduos com hipertireoidismo
seriam detectados, e a sensibilidade do exame seria de 100%. Neste caso,
porm, todas as pessoas sem a doena tambm seriam detectadas como
portadoras do hipertireoidismo, o que levaria a uma taxa de erro falso-
-positivo igual a 100%, com o ponto da curva situado no canto superior
direito do grfico. Por outro lado, se fosse estabelecido para T3 um ponto de
corte muito elevado, algo em torno de 400 ng/100ml, nenhuma pessoa seria
detectada pelo exame como portadora de hipertireoidismo, pois raramente o
pesquisador encontraria algum com a dosagem hormonal acima deste valor,
logo, a sensibilidade do teste seria 0%. Nesta condio, a taxa de erros falsos-
-positivos tambm seria igual a 0%, com o ponto da curva situado no canto
inferior esquerdo do grfico. Posteriormente, o pesquisador marcaria, no
grfico, os valores da sensibilidade e da especificidade (1 especificidade)
calculados para os demais pontos de corte estabelecidos, tais como 160
ng/100ml, 170 ng/100ml, 180 ng/100ml, e assim, sucessivamente. A seguir,
os pontos seriam unidos pela linha que desenharia a curva ROC para o teste
de rastreamento em questo.
Note que, medida em que o ponto de corte se torna maior, o ponto da
curva, que corresponde sensibilidade e especificidade, desloca-se para
baixo e para a esquerda, pois o teste fica menos sensvel e mais especfico. Do
mesmo modo, se o ponto de corte diminudo, o ponto da curva deslocado
para cima e para a direita, ficando, o teste, mais sensvel e menos especfico.
Assim, quanto mais prxima a curva ROC estiver do canto superior esquerdo
do grfico, onde a taxa de verdadeiros-positivos 100% e a taxa de falsos-
-positivos 0%, mais exata ela ser, e melhor ser o poder discriminatrio do
teste diagnstico. Da mesma maneira, quanto mais distante estiver do canto
BIOESTATISTICA_VOL02.indb 152 25/06/12 17:21
TESTES DE RASTREAMENTO DIAGNSTICO 153
superior esquerdo, at o limite mximo da diagonal do grfico, menor ser o
poder discriminatrio do teste estudado.
Em outras palavras, a curva ideal para um teste seria aquela que subiria
quase verticalmente a partir do canto inferior esquerdo e, ento, na parte
superior do grfico, mover-se-ia horizontalmente em direo ao canto
superior direito. Por outro lado, uma curva sem qualquer poder discrimina-
trio (curva ruim) seria aquela que coincidiria com a diagonal do grfico,
traada do canto inferior esquerdo at canto superior direito. Na prtica, a
curva ROC para um teste diagnstico estar sempre situada entre a curva
boa e a curva ruim, e o melhor ponto de corte seria aquele mais prximo do
canto superior esquerdo do grfico. A Figura 16.5 mostra os trs diferentes
exemplos de curva ROC.
Fig. 16.5 Exemplos de curva ROC para trs diferentes teste
vlido ressaltar que a curva ROC pode ser utilizada com o objetivo comparar
a acurcia entre dois ou mais exames diagnsticos para uma mesma doena. O
mtodo realizado pela comparao das reas localizadas sob as curvas ROC.
Assim, quanto maior for a rea, melhor ser o teste diagnstico. Porm, um teste
estatstico dever ser aplicado para decidir se as reas diferem significativa-
mente entre si. Neste caso, deve-se utilizar o teste da soma de Wilcoxon.
BIOESTATISTICA_VOL02.indb 153 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 154
16.2.3 Acurcia e prevalncia
Outras medidas para um teste diagnstico tambm podem ser determi-
nadas a partir da tabela de contingncia 2 x 2.
Acurcia (A)
Refere-se proporo de acertos de um teste diagnstico. Ou seja, mostra
a proporo dos indivduos verdadeiros-positivos e verdadeiros-negativos em
relao a todos os resultados possveis para o teste. calculada pela seguinte
frmula:

A
a d
a b c d
A =
+
+ + +
= , onde, para o exemplo dado:
6447
800
0 808 = , (80,7%)
Prevalncia (P)
Tambm chamada de probabilidade pr-teste, a prevalncia corresponde
proporo de casos da doena existentes antes da realizao do teste em
relao ao total de indivduos da populao. Isto , ela expressa a probabilidade
da doena antes do teste ser realizado. calculada pela seguinte frmula:
P
a c
a b c d
P =
+
+ + +
= , onde, para o exemplo dado:
4664
800
0 580 = , (58,0%)
A acurcia do teste diagnstico utilizado depende, no apenas da sensi-
bilidade e da especificidade, mas, tambm, da prevalncia da doena na
populao na qual o mesmo est sendo utilizado. Assim, quanto mais baixa a
prevalncia da doena, mais especfico deve ser o teste de rastreamento para
que ele seja passvel de detectar os casos presentes na populao, pois, nesse
caso, um teste positivo pode refletir um resultado falso, aumentando o nmero
de casos falsos-positivos para o teste em questo. Do mesmo modo, quando
a prevalncia da doena muito alta, o teste deve ser muito sensvel, porque,
nessa situao, um teste negativo ter uma razovel probabilidade de ser falso,
o que aumentaria o nmero de falsos-negativos para o teste.
Ainda em relao prevalncia, note que a taxa calculada pela frmula
acima citada representa apenas a prevalncia determinada para a populao
em estudo, ou seja, para a qual o teste foi aplicado, no significando, portanto,
BIOESTATISTICA_VOL02.indb 154 25/06/12 17:21
TESTES DE RASTREAMENTO DIAGNSTICO 155
que o valor seja considerado o mesmo para a prevalncia na populao em
geral, uma vez que este indicador pode apresentar grandes variaes entre
diferentes localidades, municpios, estados, pases etc.
16.3 VALORES PREDITIVOS
Ao aplicar um teste de rastreamento diagnstico, alm da sensibilidade e
da especificidade, o pesquisador tambm dever estar interessado em deter-
minar a capacidade do mesmo em fazer previses quanto s probabilidades
de um indivduo ter ou no a doena investigada. A estas probabilidades da
ocorrncia ou no da doena, calculadas a partir dos resultados de um teste
diagnstico, d-se o nome de valores preditivos, os quais so expressos como
mostrado a seguir:
Valor Preditivo Positivo (VPP)
Refere-se proporo de verdadeiros-positivos entre todos os indivduos
com resultado positivo para o teste diagnstico. Ou seja, expressa a probabi-
lidade de um paciente com o teste positivo ter, de fato, a doena. calculado
pela seguinte frmula:
VPP
a
a b
VPP =
+
= , onde, para o exemplo dado:
416
5221
0 798 = , (79,8%)
Valor Preditivo Negativo (VPN)
Refere-se proporo de verdadeiros-negativos entre todos os indivduos
com resultado negativo para o teste diagnstico. Ou seja, expressa a probabi-
lidade de um paciente com o teste negativo no ter, de fato, a doena. calculado
pela seguinte frmula:
VPN
d
c d
VPN =
+
= , onde, para o exemplo dado:
231
2779
0 828 = , (82,8%)
Em resumo: o VPP mostra a probabilidade de o paciente estar realmente
doente quando o resultado do teste positivo, enquanto que o VPN reflete
BIOESTATISTICA_VOL02.indb 155 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 156
a probabilidade do paciente no estar doente quando o resultado do teste
negativo. No entanto, note que a sensibilidade e a especificidade embora repre-
sentem bons indicadores da qualidade de um teste diagnstico, na prtica,
apresentam limitaes quanto s suas aplicaes, pois pouco auxiliam no
critrio de deciso do pesquisador que, diante de um teste positivo, ainda
precisa avaliar se o indivduo tem ou no a doena investigada. Isto ocorre
porque tanto a sensibilidade quanto a especificidade so indicadores calcu-
lados a partir de uma situao em que h certeza total sobre o diagnstico, o
que, no dia-a-dia do consultrio, isto no acontece. Assim, como no se pode
depender apenas destes dois indicadores, necessrio que se calculem os
valores preditivos para o teste em anlise.
Contudo, importante ressaltar que os valores preditivos de um teste
diagnstico refletem probabilidades cujos valores esto condicionados ao
resultado do prprio teste que, na prtica, acontece primeiro. Deste modo,
como os resultados do teste dependem da prevalncia da doena na populao
estudada, a qual tambm denominada de probabilidade pr-teste, os
valores preditivos tambm variam com a prevalncia da doena na populao
estudada. Assim, como os valores preditivos estimam as probabilidades de
ter ou no a doena nos indivduos com teste positivo ou negativo, esses
estimadores so tambm chamados de probabilidade ps-teste, podendo
ser calculados para qualquer prevalncia, conforme as frmulas mostradas
no exemplo abaixo.
Exemplo: Tomando-se como referncia o exemplo anterior, cujos resultados
so mostrados na Tabela 16.2, quais os valores preditivos para o teste de rastre-
amento, supondo-se que a prevalncia de gravidez na populao igual a 5%?
Valor Preditivo Positivo
VPP
S P
S P E P
VPP
=
+
=
x
x x (
x 0,05
( ) ( ) )
,
(
1 1
0 897
00 897 0 05 1 0 687 1 0 05
0 0449
0 342 , , ) ( , ) ( , )
,
, x x +
=
33
0 131 = , (13,1%)
BIOESTATISTICA_VOL02.indb 156 25/06/12 17:21
TESTES DE RASTREAMENTO DIAGNSTICO 157
Valor Preditivo Negativo
VPN
E P
S P E P
VPN
=


=
x
x + x
x
( )
( ) ( )
, (
1
1 1
0 687 11 0 05
1 0 897 1 0 05
0 6

=
, )
( , ) ( , )
,
x 0,05 +0,687 x
5527
0 6579
0 992
,
, = (99,2%)
Observe que se a prevalncia da doena na populao for muito baixa, o
valor preditivo positivo tambm ser baixo, mesmo que a sensibilidade e a
especificidade do teste sejam altas. Assim, ao escolher um teste de rastrea-
mento diagnstico, o investigador dever considerar os seguintes pontos:
Quanto mais sensvel for o teste diagnstico, melhor ser o seu valor pre-
ditivo negativo. Isto , maior ser a certeza de que um paciente com resul-
tado negativo no tenha a doena investigada;
Quanto mais especfico for o teste diagnstico, melhor ser o seu valor pre-
ditivo positivo. Isto , maior ser a certeza de que um paciente com resul-
tado positivo tenha a doena investigada;
Para um mesmo teste diagnstico, quanto maior for a prevalncia da do-
ena na populao estudada, maior ser o valor preditivo positivo e menor
ser o valor preditivo negativo do teste.
16.4 RAZO DE PROBABILIDADES
(VEROSSIMILHANA)
Tambm chamada de razo de verossimilhana
3
, a razo de probabili-
dades (likelihood ratio) constitui um mtodo alternativo para avaliar um
teste diagnstico. O mtodo expressa a razo entre a probabilidade de que um
determinado resultado de um exame ocorra nos pacientes com a doena e a
probabilidade do mesmo resultado nos pacientes sem a doena. Assim, com
3. Verossimilhana - Qualidade ou carter de verossmil. Semelhante verdade; que parece
verdadeiro (Dicionrio Aurlio).
BIOESTATISTICA_VOL02.indb 157 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 158
base neste raciocnio, os exames positivos e negativos tm razes de probabili-
dades diferentes, as quais sero demonstradas a seguir:
Razo de Probabilidade Positiva (RV+)
Refere-se razo entre probabilidade de um teste ser positivo nos
pacientes com a doena (sensibilidade) e a probabilidade do mesmo teste
ser positivo nos pacientes sem a doena (falsos-positivos). A RV+ expressa
quantas vezes mais provvel encontrar um resultado positivo em pessoas
doentes quando comparado com pessoas no doentes. calculada pela
seguinte frmula:
RV
S
E
RV ++ ++ =

=
1
0 89
, onde, para o exemplo dado:
, 77
1 0 687
2 86

=
,
,
Razo de Probabilidade Negativa (RV-)
Refere-se razo entre a probabilidade de um teste ser negativo nos
pacientes com a doena (falsos-negativos) e a probabilidade do mesmo teste
ser negativo nos pacientes sem a doena (especificidade). A RV- expressa
quantas vezes mais provvel encontrar um resultado negativo em pessoas
doentes quando comparado com pessoas no doentes. calculada pela
seguinte frmula:
RV
S
E
RV =

=
1 1 0
, onde, para o exemplo dado:
,8897
0 687
0 15
,
, =
Observando-se o resultado obtido para RV+, pode-se concluir que a chance
do teste positivo ser verdadeiro 2,8 vezes maior que a chance de ser falso.
Isto , que a chance de se encontrar um resultado positivo entre os pacientes
doentes (verdadeiros-positivos) 2,8 vezes maior que a chance de se encontrar
um resultado positivo entre os pacientes no doentes. Neste caso, um resultado
positivo ter apenas uma chance muito pequena para discriminar uma paciente
grvida de uma no grvida.
Do mesmo modo, o resultado de RV- indica que a chance do teste
negativo ser falso 0,15 (15:100) vezes maior que a chance de ser
BIOESTATISTICA_VOL02.indb 158 25/06/12 17:21
TESTES DE RASTREAMENTO DIAGNSTICO 159
verdadeiro. Isto , que a chance de se encontrar um resultado negativo
entre os pacientes doentes 0,15 vezes maior que a de se encontrar um
resultado positivo entre os pacientes no doentes. Em outras palavras:
a chance do teste negativo ser verdadeiro 6,66 (100:15) vezes maior
do que a de ser falso. No caso em questo, um resultado negativo para o
teste ir discriminar, de forma bastante segura, as mulheres no grvidas
das grvidas.
Note que a razo de probabilidade pode ser utilizada a fim de comparar
diferentes pontos de corte para um teste de rastreamento diagnstico, e definir,
a partir dos resultados encontrados, qual aquele que melhor discrimina os
pacientes doentes dos no doentes em uma populao.
16.5 COMBINAO DE MLTIPLOS TESTES
DIAGNSTICOS
No dia-a-dia dos consultrios, o mdico, frequentemente, levado a
solicitar mais de um teste diagnstico para identificar, com segurana, uma
determinada doena. Esta opo por mltiplos testes decorrente do fato de
que, na prtica, no existe um nico teste perfeito, com 100% de sensibilidade
e especificidade, ou, se existe, este muito dispendioso ou oferece grande
risco e/ou muito desconforto ao paciente. Nestas circunstncias, a opo
mais frequente a utilizao de testes mais simples que, quando combinados,
aumentam a acurcia e a preciso diagnstica, diminuindo a ocorrncia de
resultados falso-positivos ou falso-negativos.
Desta forma, quando os resultados dos testes solicitados so coinci-
dentes, isto , todos positivos ou negativos, o processo de deciso diagnstica
quanto presena ou ausncia da doena investigada muito fcil. Contudo,
quando os resultados so discordantes, o mtodo requer um critrio mais
apurado para o processo de deciso, devendo o profissional lanar mo de
um conjunto de probabilidades associadas a cada um dos testes solicitados.
Assim, ao optar por associar os resultados de mltiplos testes, o mdico dever
decidir como solicit-los, se todos ao mesmo tempo (testes em paralelo) ou
de forma sequencial (testes em srie), com a escolha por um ou por outro
BIOESTATISTICA_VOL02.indb 159 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 160
mtodo recaindo sobre aquela mais apropriada para a situao em anlise.
Como a forma mais simples combinar os resultados de dois testes, impor-
tante saber que, no caso de testes em paralelo, considera-se o resultado da
combinao como positiva (evidncia da doena) se um dos dois testes solici-
tados positivo. Por outro lado, no caso de testes em srie, o resultado da
combinao considerado positivo se os dois testes forem positivos quando
individualmente analisados. O mesmo raciocnio aplicado para o caso de
mais de dois testes.
A seguir, ser demonstrada a combinao de dois testes, em paralelo e em
srie, os quais sero chamados de teste A e teste B. As frmulas sero apresen-
tadas conforme o quadro de notao mostrado abaixo:
Teste em paralelo Teste em srie
T
P+
- Teste em paralelo positivo.
A
+
- Resultado positivo para o teste A
B
+
- Resultado positivo para o teste B
S
P
- Sensibilidade combinada em paralelo
S
A
- Sensibilidade para o teste A
S
B
- Sensibilidade para o teste B
E
P
- Especifcidade combinada em paralelo
E
A
- Especifcidade para o teste A
E
B
- Especifcidade para o teste B
T
S+
- Teste em srie positivo.
A
+
- Resultado positivo para o teste A
B
+
- Resultado positivo para o teste B
S
S
- Sensibilidade combinada em srie
S
A
- Sensibilidade para o teste A
S
B
- Sensibilidade para o teste B
E
S
- Especifcidade combinada em srie
E
A
- Especifcidade para o teste A
E
B
- Especifcidade para o teste B

O exemplo a seguir ser utilizado para ilustrar os clculos.
Exemplo: Suponha, agora, que o mesmo laboratrio queira verificar qual a
melhor associao, se em paralelo ou em srie, entre os resultados obtidos para
o diagnstico da gravidez com o uso do teste rpido (teste A) e os resultados
obtidos pela dosagem da gonadotrofina corinica humana no sangue (teste
B). O diagnstico definitivo de gravidez foi feito pela presena de batimentos
cardacos fetais constatados na quinta semana da provvel gestao (padro
ouro). Os resultados esto expressos a seguir.
BIOESTATISTICA_VOL02.indb 160 25/06/12 17:21
TESTES DE RASTREAMENTO DIAGNSTICO 161
Teste A: S
A
= 89,7% e E
A
= 68,7%
Teste B: S
B
= 96,8% e E
B
= 92,4%
16.5.1 Testes em paralelo
A associao de testes em paralelo deve ser utilizada pelo mdico quando
a situao requer um diagnstico rpido, como, por exemplo, nos casos de
urgncia ou emergncia, ou em outra situao, como para pacientes com difcil
acesso ao atendimento. Neste caso, a interao entre os testes A e B pode ser
representada da seguinte maneira:

T A B
P+ + +
=
Sensibilidade Combinada (SP)
Admitindo-se que os resultados dos dois testes so conhecidos, a sensi-
bilidade combinada em paralelo pode ser calculada pela aplicao das regras
para o clculo de probabilidades para a unio de dois eventos independentes.
A frmula a seguinte:

S S S S S
S
P A B A B
P
= +
= +
( )
, , ( , 0,968 0 897 0 968 0 897 ))
(99,7%) S
P
=0 997 ,
Especificidade Combinada (EP)
Admitindo que o resultado negativo do teste em paralelo somente ser
considerado se ambos os testes apresentarem resultados negativos, a especifi-
cidade combinada pode ser calculada, utilizando-se as regras para o clculo da
probabilidade condicional. A frmula a seguinte:
E E E
E
E
P A B
P
P
=
=
= (63,5%)
0 687 0 924
0 635
, ,
,
BIOESTATISTICA_VOL02.indb 161 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 162
Valores Preditivos
A partir da sensibilidade e da especificidade combinadas, os valores
preditivos positivo (VPP
P
) e negativo (VPN
P
) para o teste em paralelo podem
ser calculados. Para tal, utiliza-se a prevalncia da doena na populao em
estudo. No caso em questo, P = 5%. As frmulas e os respectivos clculos so
mostrados a seguir.
VPP
S P
S P E P
VPP
P
P
P P
P
=

+
=

( ) ( ) ( )
,
1 1
0 997 00 05
0 997 1 0 635 1 0 05
0
,
( , ( , ) ( , )
,
0,05) +
= VPP
P
00499
0 3967
0 126
,
, = (12,6%)
VPN
E P
S P E P
VPN
P
P
P P
P
=

+
=
( )
( ) ( )
,
1
1 1
0 635
+
( , )
( , ) , , ( , )
1 0 05
1 0 997 0 05 0 635 1 0 05
VPN
PP
= =
0 6033
0 6034
0 999
,
,
, (99,9%)
Os valores da sensibilidade e da especificidade para cada um dos testes A
e B, individualmente e combinados em paralelo, assim como os resultados dos
valores preditivos (VPP e VPN), para uma prevalncia de 5%, so mostrados na
Tabela 16.4, a seguir.
BIOESTATISTICA_VOL02.indb 162 25/06/12 17:21
TESTES DE RASTREAMENTO DIAGNSTICO 163
Tabela 16.4 Sensibilidade, Especifcidade e Valores Preditivos Positivo e Negativo
para os testes A e B, individuais e combinados em paralelo
Testes S (%) E (%) VPP (%) VPN (%)
Teste A 89,7 68,7 13,1 99,2
Teste B 96,8 92,4 40,9 99,9
Teste A U B 99,7 63,5 12,6 99,8
Observando-se os valores da Tabela 16.4, pode-se constatar que para uma
mesma prevalncia, o uso dos testes em paralelo aumentou a sensibilidade e
o valor preditivo negativo, enquanto que a especificidade e o valor preditivo
positivo diminuram.
16.5.2 Testes em srie
A associao de testes em srie deve ser utilizada pelo mdico quando a
situao no requer um diagnstico rpido, de urgncia, como nos casos de
pacientes ambulatoriais que podem ser acompanhados por um tempo mais
prolongado, ou naqueles internados para investigao diagnstica. Tambm
pode ser utilizada nos casos em que os exames so muito dispendiosos ou
oferecem risco ao paciente. Neste caso, o mdico deve inicialmente optar por
exames mais seguros e de baixo custo, ficando a solicitao dos exames de
maior risco ou mais caros somente quando ele necessite confirmar a presena
da doena, caso o primeiro exame seja sugestivo. Assim, como regra geral, o
segundo exame somente ser solicitado se o primeiro apresentar um resultado
positivo, pois se for negativo, no justificada a realizao do segundo exame.
Lembre-se que o teste em srie somente ser considerado positivo se o segundo
teste tambm for positivo. A interao entre os testes A e B pode ser repre-
sentada da seguinte maneira:
T A B
S+ + +
=
Sensibilidade Combinada (S
S
)
Admitindo-se que os resultados dos dois testes so conhecidos, a sensi-
bilidade combinada em srie pode ser calculada pela aplicao das regras do
BIOESTATISTICA_VOL02.indb 163 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 164
clculo de probabilidades para a interseo de dois eventos independentes. A
frmula a seguinte:
S S S
S
S
S A B
S
S
=
=
= (86,8%)
0 897 0 968
0 868
, ,
,
Especificidade Combinada (ES)
Considerando-se as regras para o clculo da probabilidade condicional, a
especificidade combinada pode ser calculada pela seguinte frmula:
E E E E E
E
S A B A B
S
= +
= +
( )
, , ( , , 0 687 0 924 0 687 0 924))
, E
S
=0 976 (97,6%)
Valores Preditivos
A partir da sensibilidade e da especificidade combinadas, os valores
preditivos positivo (VPP
S
) e negativo (VPN
S
) para o teste em srie podem
ser calculados. Para tal, utiliza-se a prevalncia da doena na populao em
estudo. No caso em questo, P = 5%. As frmulas e os respectivos clculos so
mostrados a seguir.
VPP
S P
S P E P
VPP
S
S
S S
S
=

+
=

( ) ( ) ( )
,
1 1
0 868 00 05
0 868 1 0 976 1 0 05
0
,
( , ( , ) ( , )
,
0,05) +
= VPP
S
00434
0 0640
0 678
,
, = (67,8%)
BIOESTATISTICA_VOL02.indb 164 25/06/12 17:21
TESTES DE RASTREAMENTO DIAGNSTICO 165
VPN
E P
S P E P
VPN
S
S
S S
S
=

+
=
( )
( ) ( )
,
1
1 1
0 976
+
( , )
( , ) , , ( , )
1 0 05
1 0 868 0 05 0 976 1 0 05
VPN
SS
= =
0 9272
0 9335
0 993
,
,
, (99,3%)
Os valores da sensibilidade e da especificidade para cada um dos testes
A e B, individualmente e combinados em srie, assim como os resultados dos
valores preditivos (VPP e VPN), para uma prevalncia de 5%, so mostrados na
Tabela 16.5, abaixo.
Tabela 16.5 Sensibilidade, Especifcidade e Valores Preditivos Positivo e Negativo para os
testes A e B, individuais e combinados em srie
Testes S (%) E (%) VPP (%) VPN (%)
Teste A 89,7 68,7 13,1 99,2
Teste B 96,8 92,4 40,9 99,9
Teste A B 86,8 97,6 67,8 99,3
Comparando-se os valores da Tabela 16.5, pode-se constatar que para
uma mesma prevalncia, o uso dos testes em srie aumentou a especificidade
combinada e o valor preditivo positivo, enquanto que a sensibilidade e o valor
preditivo negativo diminuram.
Visto que a combinao de dois ou mais testes diagnsticos uma conduta
frequentemente adotada, o mdico, ao solicitar os exames, dever observar os
seguintes pontos:
A combinao em paralelo melhora a sensibilidade diagnstica, mas a sua
especificidade menor que a dos testes quando analisados isoladamente;
A combinao em srie apresenta alta especificidade, ao passo que a sensi-
bilidade relativamente baixa quando comparada com a dos testes isolados;
BIOESTATISTICA_VOL02.indb 165 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 166
Os valores preditivos negativos so bastante elevados, tanto para os tes-
tes isolados quanto para as formas combinadas em paralelo e em srie,
enquanto que os valores preditivos positivos no so to altos, com a com-
binao em srie, apresentando melhor resultado quando comparada
combinao em paralelo;
Para o clculo da sensibilidade e da especificidade, tanto para a combi-
nao em paralelo quanto em srie, pressupe-se que os testes sejam
independentes entre si, pois, caso contrrio, os valores combinados da
sensibilidade e da especificidade tendero a superestimar o verdadeiro
valor do parmetro.
16.6 TEOREMA DE BAYES
Como citado anteriormente, todas as vezes que o mdico recebe o resultado
de um exame diagnstico, ele se depara com duas importantes questes as
quais devem ser bem definidas: se o resultado for positivo, qual a probabi-
lidade de que o paciente tenha a doena? Ou, se o resultado for negativo, qual a
probabilidade de que esse paciente no tenha a doena? Um mtodo alternativo
para responder tais questes envolve a utilizao de uma frmula matemtica
conhecida como teorema de Bayes
4
, um corolrio
5
do teorema da probabilidade
total que permite calcular o valor preditivo positivo de um teste diagnstico, ou
a chance de que um paciente com resultado positivo tenha, de fato, a doena. A
frmula do teorema de Bayes a seguinte:
P D T
P T D P D
P T D P D P T D
( | )
( | ) ( )
( | ) ( ) ( |
+ +
+ + +
+ + + +
=

+ )) ( ) P D

Onde: P = Probabilidade que um determinado evento acontea.


4. Thomas Bayes (1702-1761) - Matemtico ingls e pastor presbiteriano, conhecido por ter
formulado o caso especial do teorema de Bayes, o qual deu origem estatstica bayesiana.
5. Proposio que imediatamente se deduz de outra que pode ser demonstrada a partir de um
teorema, o qual uma afirmao que pode ser provada.
BIOESTATISTICA_VOL02.indb 166 25/06/12 17:21
TESTES DE RASTREAMENTO DIAGNSTICO 167
P(D
+
|T
+
) = Probabilidade que a doena esteja presente, sendo o
teste positivo.
D
+
- O paciente tem a doena.
D
-
- O paciente no tem a doena.
T
+
- Teste diagnstico positivo para a doena.
T
-
- Teste diagnstico negativo para a doena.
A referida frmula, na verdade, refere-se quela utilizada para calcular
o valor preditivo positivo, citada anteriormente. Ou seja, ela mostra a proba-
bilidade da ocorrncia da doena, na presena de um teste positivo. Observe
que as duas probabilidades expressas no numerador da equao do teorema
de Bayes correspondem, respectivamente, probabilidade de que o exame
seja positivo, considerando que a doena est presente (sensibilidade); e
a probabilidade anterior de que o paciente tenha a doena (prevalncia).
Essas duas probabilidades, em conjunto, descrevem os resultados verda-
deiro-positivos para o teste.
J o denominador da equao expressa duas probabilidades: a primeira,
que igual ao numerador, descreve os resultados verdadeiro-positivos (sensi-
bilidade x prevalncia), enquanto que a segunda representa a probabilidade
do teste ser positivo, tendo em vista que a doena est ausente, multiplicado
pela probabilidade de que a doena no esteja presente. Nessa segunda parte
do denominador, o primeiro termo representa a taxa de erro falso-positivo,
enquanto o segundo representa 1 menos a probabilidade de que a doena
esteja presente (1 - prevalncia). Assim, podemos reescrever o teorema de
Bayes considerando a sensibilidade e especificidade para o teste em questo,
tornando-o mais compreensvel ao leitor, tal como mostrado a seguir:
P D T ( | )
( )(
(
+ +
=
Sensibilidade Prevalncia)
Sensibiliddade Prevalncia) Taxa de erro falso-pos )( (

+ iitivo)( Prevalncia) 1

Portanto, como foi relatado anteriormente, se a prevalncia da doena na


populao for muito baixa, o valor preditivo positivo tambm ser baixo, mesmo
que a sensibilidade e a especificidade do teste sejam altas. Neste caso, a maioria
dos resultados positivos encontrados para a doena em questo podem ser
BIOESTATISTICA_VOL02.indb 167 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 168
falso-positivos. Embora isto no invalide o programa de rastreamento, outras
providncias podem ser tomadas no sentido de ajustar a sensibilidade e a especi-
ficidade para o teste, de maneira que melhore o valor preditivo positivo e diminua
a taxa de erro falso-positivo. Esta melhora pode ser conseguida pela aplicao do
teorema de Bayes em diferentes pontos de corte para o teste utilizado.
Assim, suponha que um programa de rastreamento foi implantado para
detectar uma determinada doena cuja prevalncia na populao igual a 5%.
O teste diagnstico empregado apresenta uma sensibilidade de 89,7% e uma
especificidade de 68,7%, com uma taxa de erro falso-positivo igual a 31,3%.
Se a sensibilidade e a especificidade do teste em questo e a prevalncia da
doena na populao so conhecidas, o teorema de Bayes pode ser utilizado
para predizer que proporo de pessoas com resultado positivo para o teste
est realmente doente.
Dados: S = 89,7%; P = 0,05%; EFP = 31,3
P D T ( | )
( , )( , )
( , )( , ) ( , )
+ +
=

+
0 897 0 05
0 897 0 05 0 313 (( , )
( | )
,
,
,
1 0 05
0 0449
0 3423
0 131

= =
+ +
P D T (13,1% %)
Portanto, se o teste empregado tem uma sensibilidade de 89,7% e uma
especificidade de 68,7%, e se a prevalncia da doena na populao estudada
igual a 5%, pode-se prever que, apenas 13,1% das pessoas com teste positivo
esto realmente doentes.
Observe que uma frmula para o teorema de Bayes, semelhante primeira,
pode ser utilizada para prever o valor de um resultado negativo. A frmula a
seguinte:
P D T
P T D P D
P T D P D P T
( | )
( | )( ( )
( | )( ( ) ( |



=

+ DD P D
+ +

)( ( )
Quando escrita em termos de sensibilidade, especificidade e prevalncia,
assume a seguinte forma:
BIOESTATISTICA_VOL02.indb 168 25/06/12 17:21
TESTES DE RASTREAMENTO DIAGNSTICO 169
P D T ( | )
( )(
(

=
Especificidade Prevalncia)
Especi
1
fficidade Prevalncia) Taxa de erro fal )( ( 1

+ sso-negativo)(Prevalncia)

De qualquer forma, ao solicitar um teste de rastreamento diagnstico, o


mdico deve sempre atentar para trs pontos que so muito importantes:
Para excluir a possibilidade de uma determinada doena, ele precisa da
certeza de que um resultado negativo para o teste , de fato, negativo, isto
, que o resultado no seja um falso-negativo. Para tal deciso, a escolha de
um teste de alta sensibilidade a melhor opo, pois o aumento da sensi-
bilidade reduz o nmero de falso-negativos e ajuda a excluir a doena se o
resultado do teste for negativo;
Para detectar a presena de uma doena, ele precisa da certeza de que um
resultado positivo para o teste , de fato, positivo, isto , que o resultado
no seja um falso-positivo. Para tal deciso, a escolha dever recair sobre
um teste de alta especificidade, pois o aumento da especificidade reduz o
nmero de falso-positivos e ajuda a detectar a doena se o resultado for
positivo;
Para confirmar o diagnstico, o mdico precisa conhecer a importncia da
prevalncia da doena (probabilidade anterior). Se a prevalncia for ex-
tremamente baixa, um resultado positivo tem pouco significado e deve ser
seguido de um exame de alta especificidade, ao passo que a importncia
de um resultado negativo depender da sensibilidade do exame solicitado.
BIOESTATISTICA_VOL02.indb 169 25/06/12 17:21
BIOESTATISTICA_VOL02.indb 170 25/06/12 17:21
17
Testes para Variveis Ordinais

Como citado nos captulos anteriores, as tcnicas estatsticas classicamente
utilizadas para a estimao de parmetros e testes de hipteses compreendem
os chamados testes paramtricos, cujos modelos mais utilizados so o teste
t de Student e a anlise de varincia (ANOVA), os quais pressupem que a
varivel estudada seja medida numa escala dimensional contnua e apresente,
a princpio, uma distribuio normal e varincias iguais (homocedasticidade)
entre os grupos estudados. Porm, na prtica, em muitas pesquisas os dados
no obedecem a estes princpios, pois se apresentam distribudos em uma
escala ordinal de valores ou sem nenhuma distribuio previsvel, violando,
portanto, os pressupostos bsicos necessrios para a utilizao de um teste
paramtrico. Nestes casos, a opo pela utilizao de testes no-param-
tricos, os quais no exigem a estimao da varincia, da mdia populacional
ou da distribuio da varivel estudada, alm de outros pr-requisitos, embora
apresentem menor robustez quando comparados aos testes paramtricos.
Assim, em razo de sua pouca exigncia, estes testes so chamados de testes
de distribuio livre, entre os quais se destaca o teste do qui-quadrado, o qual
j foi abordado no captulo 14 deste livro. Aqui, neste captulo, sero discutidos
outros testes no-paramtricos bivariados para dados ordinais, os quais sero
descritos a seguir.
BIOESTATISTICA_VOL02.indb 171 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 172
17.1 TESTE U DE WILCOXON-MANN-WHITNEY
(WMW)
Tambm chamado de teste da soma de postos (Wilcoxon rank-sum
test), na estatstica inferencial o teste U de Wilcoxon-Mann-Whitney um
dos mais conhecidos entre todos os testes de significncia no-param-
tricos, sendo utilizado para comparar se duas amostras independentes e
de tamanhos iguais provm de uma mesma populao. O teste foi inicial-
mente proposto por Frank Wilcoxon
1
, em 1945, como uma alternativa para
o teste t de Student para amostras independentes. Posteriormente, foi
aperfeioado por H. B. Mann
2
e D. R. Whitney, da a origem do nome e a sigla
WMW, que o generalizaram para que pudesse ser aplicado em amostras de
tamanhos diferentes,
Para que o teste possa ser utilizado, necessrio que as duas amostras
sejam aleatrias e as observaes independentes, tanto dentro de cada
amostra como entre as amostras estudadas, ao mesmo tempo em que a
varivel considerada seja mensurada em escala ordinal, isto , que seja
apresentada do menor para o maior valor. Para tal, necessrio que cada
valor da mostra corresponda a um posto (escore ou rank), o qual deve ser
representado por um nmero natural que indicar sua posio no conjunto
de dados amostrais, quando ordenados. Assim, o menor valor da amostra
receber o posto de nmero 1, e assim sucessivamente, at que o maior valor
receba o posto de maior nmero. Quando ocorre a presena de valores iguais
na amostra, considera-se a mdia dos postos que seriam ocupados por eles,
de tal modo que no afete o posto seguinte. Tome-se, como exemplo, um
conjunto de seis valores j ordenados: {9; 15; 17; 17; 21; 23}. Os respectivos
postos sero: {1; 2; 3,5; 3,5; 5; 6}.
1 Frank Wilcoxon (1892-1965) Qumico e estatstico irlands que publicou mais de 70 trabalhos,
dos quais o mais conhecido descreve dois novos testes estatsticos: o teste da soma de Wilcoxon
e o teste de Wilcoxon.
2 Henry Berthold Mann (1905-2000) Renomado matemtico austraco responsvel por
significativas contribuies no campo da lgebra, da teoria dos nmeros e da estatstica,
particularmente na anlise de varincia.
BIOESTATISTICA_VOL02.indb 172 25/06/12 17:21
TESTES PARA VARIVEIS ORDINAIS 173
Raciocnio do teste
Para ilustrar o raciocnio, consideremos a comparao entre duas amostras,
A e B. Se os valores para os indivduos da amostra A forem, em geral, menores
que os valores para os indivduos da amostra B, quando se ordenam, do menor
para o maior, todos os valores das duas amostras consideradas conjuntamente,
os postos ocupados pelos indivduos da amostra A sero, em geral, menores do
que os postos ocupados pelos indivduos da amostra B. Como consequncia,
o posto mdio (mediana) da amostra A ser menor do que o posto mdio
(mediana) da amostra B. Neste caso, se a diferena encontrada for grande o
suficiente para que possa ser explicada alm do que se esperaria encontrar
somente pelo acaso, a diferena entre os dois postos mdios dita estatistica-
mente significativa, o que indica que a populao A diferente da populao B.
O teste envolve o clculo de um valor estatstico, usualmente chamado de
valor U, cuja distribuio testada contra a hiptese de nulidade. No caso de
pequenas amostras, isto , nenhuma delas maior do que 20 indivduos, a distri-
buio pode ser tabulada, mas para grandes amostras, das quais ao menos uma
delas maior que 20, existe uma boa aproximao com a distribuio normal.
Assim, importa saber que os procedimentos para a utilizao do teste U de
Wilcoxon-Mann-Whitney diferem de acordo com o tamanho amostral, todos
facilmente calculados. Os procedimentos sero mostrados a seguir:
Inicialmente, denomina-se a amostra menor como amostra 1 e a maior
como amostra 2;
Determinam-se os tamanhos amostrais, os quais so designados por n
1
e n
2
;
A seguir, ordenam-se, do menor para o maior, os valores das duas amostras
e anota-se, ao lado de cada valor, o nmero de ordem (ou posto) correspon-
dente. No esquea que quando houver empate, o posto para cada valor
empatado corresponde mdia dos postos que seriam ocupados por eles;
Obtm-se os valores para R
1
e R
2
que correspondem s somas dos postos
para as amostras 1 e 2, respectivamente. Se a ordenao estiver correta,
teremos:

R R
N N
N n n
1 2 1 2
1
2
+ =
+
= +
( )
; para
BIOESTATISTICA_VOL02.indb 173 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 174
Em seguida, calculam-se os valores de U
1
e U
2
conforme mostrado abaixo.
Para o teste de hiptese, o menor destes dois valores ser denominado
como U calculado (U
calc
), o qual ser comparado ao valor crtico U tabelado
(
U
a n n ; ;
1 2
), encontrado na tabela de valores crticos da distribuio U de
Mann-Whitney (ver tabelas dos valores crticos no final deste livro).


U n n
n n
R
U n n
n n
R
1 1 2
1 1
1
2 1 2
2 2
2
1
2
1
2
= +
+

= +
+

( )
( )
ou U n n U
2 1 2 1
=
Finalmente, o teste de hiptese realizado conforme mostrado abaixo:
H
0
: as duas populaes no diferem entre si quanto locao;
H
A
: as duas populaes diferem entre si quanto locao.
Para demonstrar a aplicao do teste de WMW, utilizaremos o seguinte exemplo:
Exemplo: A Escala de coma de Glasgow (ECG) uma escala neurolgica
que constitui um mtodo confivel para avaliar o nvel de conscincia de uma
pessoa, aps um traumatismo cranienceflico. Ela compreende trs testes que
avaliam a abertura ocular, a resposta verbal e a melhor resposta motora, cujos
escores obtidos variam de trs a 15 pontos. Quanto menor o escore, mais grave
o comprometimento da funo cerebral. Um pesquisador, que queria verificar
se o uso de capacete diminui a gravidade da leso craniana em motociclistas
acidentados, comparou os escores obtidos em dois grupos de pacientes, com e
sem uso de capacete. Os escores (j ordenados) so apresentados nas tabelas
17.1 e 17.2, abaixo.
Tabela 17.1 Ordem, escore da escala de coma de Glasgow e posto de cada um dos 18
pacientes do estudo
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Escore 5 6 6 7 7 8 8 8 8 9 9 10 10 11 12 13 14 14
Posto 1 2,5 4,5 7,5 10,5 12,5 14 15 16 17,5
BIOESTATISTICA_VOL02.indb 174 25/06/12 17:21
TESTES PARA VARIVEIS ORDINAIS 175
Tabela 17.2 Ordem, escore da escala de coma de Glasgow e posto de 10 pacientes com uso
de capacete e 8 pacientes sem uso de capacete
Pacientes com capacete Pacientes sem capacete
Paciente Escore Posto Paciente Escore Posto
5 7 4,5 1 5 1
6 8 7,5 2 6 2,5
7 8 7,5 3 6 2,5
11 9 10,5 4 7 4,5
13 10 12,5 8 8 7,5
14 11 14 9 8 7,5
15 12 15 10 9 10,5
16 13 16 12 10 12,5
17 14 17,5
18 14 17,5
n
2
= 10 md = 10,5 R
2
= 122,5 n
1
= 8 md = 7,5 R
1
= 48,5
Uma vez que no existe um padro de distribuio para a escala de coma de
Glasgow na populao estudada, e o nmero de indivduos nas duas amostras
pequeno, a melhor maneira de compar-las utilizar um teste no-param-
trico. Neste caso, o teste WMW o mais adequado, pois as duas amostras so
independentes e a varivel estudada do tipo ordinal.
WMW para pequenas amostras (n 20)
Passo 1 Formular as hipteses estatsticas:
H U U
0
:
1 2
=
(As duas populaes no diferem entre si quanto aos escores
da escala de coma de Glasgow, com e sem uso do capacete).
H U U
A
:
1 2

(As duas populaes diferem entre si quanto aos escores da


escala de coma de Glasgow, com e sem uso do capacete).
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%)
Passo 3 Calcular os valores para U
1
e U
2
:


U U
1 2
8
8 8 1
2
48 5 67 5 8
10
= +
+
= = + 10 e 10
( )
, ,
(110 1
2
122 5 12 5
+
=
)
, ,
BIOESTATISTICA_VOL02.indb 175 25/06/12 17:21
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 176

Sendo ento R R
N N
1 2
1
2
48 5 122 5 171
18
+ =
+
+ = =
( )
; ( , , )
(( ) 18 1
2
+

A ordenao est correta.


Como U U U U
calc calc
= = mn{ tem-se que:
1 2
12 5 ; }; ,
Passo 4 Determinar o valor crtico do teste:
U U
n n ; ; , ; ;
1 2
0 05 8 10
17 = =
Passo 5 Regra de deciso:

Se , rejeita-se
Se >
U U
0 calc
calc
H
U

0 05 8 10 , ; ;
.
, aceita-se
Como =12,5 <
U H
U U
calc
0 05 8 10 , ; ;
.
0
00 05 8 10
17
, ; ;
. = , rejeita-se H
0
Passo 6 Concluso:
Como o valor para
calc
U menor que o valor crtico tabelado
0,05;8;10
U ,
rejeita-se H
0
e conclui-se que os escores da escala de coma de Glasgow
observados para os pacientes que usavam capacete so significativa-
mente maiores que escores dos pacientes que no usavam capacete.
Portanto, o uso do capacete diminuiu a gravidade da leso, pois
12, 5; 0, 0145
calc
U P = = .
WMW para grandes amostras (n > 20)
Quando a maior das duas amostras apresenta mais de 20 observaes
(n
2
> 20), a estatstica U aproxima-se da distribuio normal gaussiana, cuja
significncia estatstica verificada na tabela dos valores crticos da distri-
buio z. O valor de z
calc
dado por:
z
U
calc
U
U
=

, onde:
BIOESTATISTICA_VOL02.indb 176 25/06/12 17:21
TESTES PARA VARIVEIS ORDINAIS 177
onde:
U
- Mdia de U. Tanto U
1
como U
2
podem ser utilizados para o
clculo de z
calc
.
a
U
- Desvio padro de U.
Sendo e en
U U
n n n n n n
= =
+ +
1 2 1 2 1 2
2
1
12
( )
, tto:
ento: z
U
n n
n n n n
calc
=

+ +
1 2
1 2 1 2
2
1
12
( )
Assim, supondo-se n > 20 para o exemplo mostrado na Tabela 17.2, temos:
Passo 1 Formular as hipteses estatsticas:
H U U
0
:
1 2
= (As duas populaes no diferem entre si quanto aos escores
da escala de coma de Glasgow, com e sem uso do capacete).
H U U
A
:
1 2
(As duas populaes diferem entre si quanto aos escores da
escala de coma de Glasgow, com e sem uso do capacete).
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%)
Passo 3 Determinar o valor crtico do teste:
z
0 05
1 96
,
, =
Passo 4 Calcular o valor do teste:
z
U
n n
n n n n
calc
=

+ +
=

=
1 2
1 2 1 2
2
1
12
12 5 40
11 25
196
39
( )
,
,
== 2 44 ,
Passo 5 Regra de deciso:

Se | | , aceita-se
Se | |
z z
0 calc
calc
H
z z
<

0 05 ,
.
00 05
0 05
,
,
. , rejeita-se
Como | |=2,44 >
H
z z
calc
0
==1 96 , . , rejeita-se H
0
BIOESTATISTICA_VOL02.indb 177 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 178
Se | | , aceita-se
Se | |
z z
0 calc
calc
H
z z
<

0 05 ,
.
00 05
0 05
,
,
. , rejeita-se
Como | |=2,44 >
H
z z
calc
0
==1 96 , . , rejeita-se H
0
Passo 6 Concluso:
Como o valor para z
calc
maior que o valor crtico tabelado

z
0 05 ,
, rejeita-
-se H
0
e conclui-se que os escores da escala de coma de Glasgow observados
para os pacientes que usavam capacete so significativamente maiores do que
os escores dos pacientes que no usavam capacete. Portanto, o uso do capacete
diminuiu a gravidade da leso, pois z P
calc
= = 2 44 0 0145 , ; , .
Quando n
2
> 20 e ocorrerem empates, o denominador de z
calc
deve ser
substitudo por:

U
n n
N N
N N CE
=

1 2
2
3
12
, onde: CCE t t =

( )
3
Sendo t o nmero de observaes empatadas em cada posto. Por exemplo:
se hover dois empates com o posto 2,5 e outros quatro empates com o posto
7,5, o clculo para CE ser:
CE = + = ( ) ( ) 2 2 4 4 66
3 3
17.2 TESTE T DE WILCOXON
um teste de hiptese no-paramtrico utilizado para amostras pareadas,
isto , para comparar dois tratamentos em duas amostras relacionadas
(amostras pareadas) ou para comparar os resultados de uma mesma medida
quando esta repetida em uma mesma amostra (teste pareado). Este teste
pode ser usado como uma alternativa ao teste t de Student pareado quando
a populao estudada no assume o padro da distribuio normal gaussiana,
sendo a varivel medida em uma escala intervalar ou ordinal.
BIOESTATISTICA_VOL02.indb 178 25/06/12 17:22
TESTES PARA VARIVEIS ORDINAIS 179
Tal como o teste WMW, a prova de Wilcoxon (signed-rank test) tambm
foi idealizada por Frank Wilcoxon em 1945 e tem como princpio ordenar os
postos das diferenas intrapares, com nfase para a maior diferena, para a
qual se atribui o maior valor (posto), diminuindo-se este valor de acordo com
as menores diferenas encontradas. Para a utilizao do teste, pressupe-se que
as duas amostras sejam aleatrias e que as diferenas intrapares constituem
uma varivel contnua, de distribuio simtrica em torno da mediana.
Raciocnio do teste
Para ilustrar o raciocnio, consideremos a comparao entre duas
amostras, A e B. Se o tratamento para A produz valores maiores que aqueles
encontrados para o tratamento B, as diferenas entre os pares de A e B (A B),
de sinal positivo, sero em maior nmero e graus do que as diferenas de sinal
negativo. Caso ambos os tratamentos tenham o mesmo efeito, as diferenas
positivas e negativas devem se anular. Assim, se a diferena encontrada for
grande o suficiente para que possa ser explicada alm do que se esperaria
encontrar somente pelo acaso, a diferena entre os dois postos mdios dita
estatisticamente significativa, o que indica que a populao A diferente da
populao B.
O teste envolve o clculo de um valor estatstico usualmente chamado
de valor T, cuja distribuio testada contra a hiptese de nulidade. No caso
de pequenas amostras (n 25), o valor T deve ser comparado ao valor crtico
encontrado na tabela de valores crticos da distribuio T de Wilcoxon, que
consta no final deste livro, mas para grandes amostras (n > 25), a distribuio
da estatstica T aproxima-se da distribuio normal gaussiana e o teste de
significncia pode ser realizado, usando-se essa distribuio. Na prtica, como
a tabela da distribuio T de Wilcoxon possui valores crticos para amostras
com at 100 diferenas intrapares, somente ser necessrio calcular o valor
z quando o tamanho amostral for superior a este nmero. Os procedimentos
sero mostrados a seguir:
Inicialmente, calcula-se a diferena (d) em cada um dos pares, conser-
vando-se o sinal da diferena. As diferenas iguais a zero so desprezadas.
Assim, como se pressupe que as diferenas constituem uma varivel
contnua, poucos zeros devem aparecer nos clculos dessas diferenas;
BIOESTATISTICA_VOL02.indb 179 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 180
As diferenas restantes so designadas por n;
A seguir, ordenam-se, do menor para o maior, os valores das diferenas,
ignorando-se o sinal. No esquea que, quando houver empate, o posto
para cada valor empatado corresponde mdia dos postos que seriam
ocupados por eles. Se a ordenao estiver correta, teremos:

| |
( )
postos

=
+ n n 1
2
Transfere-se o sinal da diferena ao posto correspondente e somam-se
os postos conforme o sinal seja positivo ou negativo. Denomina-se T
+

soma dos postos com sinal positivo e T

soma dos postos com sinal


negativo. Para o teste de hiptese, o menor destes dois valores, em
valor absoluto, ser denominado como T calculado (T
calc
), o qual ser
comparado ao valor crtico T tabelado (T
;n
), encontrado na tabela de
valores crticos da distribuio T de Wilcoxon (ver tabelas dos valores
crticos no final deste livro). Semelhante ao teste WMW, a hiptese nula
ser rejeitada se T
calc
T
;n
.
Finalmente, o teste de hiptese realizado conforme mostrado abaixo:
H
0
: as medidas antes e depois no diferem entre si;
H
A
: as medidas antes e depois diferem entre si.
Para demonstrar a aplicao do teste de T de Wilcoxon, utilizaremos o
seguinte exemplo:
Exemplo: Anlise Sensorial uma cincia que utiliza os sentidos humanos
para avaliar as caractersticas organolpticas de um alimento, constituindo
uma poderosa ferramenta frequentemente utilizada pelas indstrias alimen-
tcias para o desenvolvimento e otimizao da qualidade de seus produtos.
Uma empresa realizou uma anlise sensorial para comparar o sabor de duas
diferentes formulaes para um determinado produto. Foram realizadas duas
anlises para cada provador: a primeira, com a formulao normal; a segunda,
com a frmula modificada. Os escores, medidos de zero a 10, esto apresen-
tados na Tabela 17.3, abaixo.
BIOESTATISTICA_VOL02.indb 180 25/06/12 17:22
TESTES PARA VARIVEIS ORDINAIS 181
Tabela 17.3 - Ordem, escore e posto de 10 anlises antes e aps a modifcao da formulao
Provador
Escores
d = A B Posto
Antes (A) Depois (B)
1 7,40 7,10 0,3 2,5
2 9,30 8,30 1,0 8
3 6,80 7,40 0,6 6
4 7,50 8,70 1,2 9
5 8,10 9,40 1,3 10
6 8,80 9,10 0,3 2,5
7 9,20 8,40 0,8 7
8 7,20 7,60 0,4 4,5
9 7,50 7,90 0,4 4,5
10 9,40 9,20 0,2 1
md
A
= 8,45 md
B
= 9,25 = |55|
Teste t para pequenas amostras (n 25)
Passo 1 Formular as hipteses estatsticas:
H
0
: os valores dos escores no diferem nas duas formulaes;
H
A
: os valores dos escores so diferentes para as duas formulaes.
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%)
Passo 3 Calcular os valores para T
+
e T

:
T T
+
= + = 18 5 36 5 , , e
Sendo postos | |
( ) ( )

=
+
=
+
=
n n 1
2
10 10 1
2
55 , a ordenao est correta.
Como
T T T T
calc A B calc
= = + mn{ tem-se que: | ; }; , | 18 5 = 18 5 ,
Passo 4 Determinar o valor crtico do teste:
T T
n ; , ;
= =
0 05 10
8
BIOESTATISTICA_VOL02.indb 181 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 182
Passo 5 Regra de deciso:

Se T T rejeita se H
Se T T
calc
calc

>
0 05 10 0 , ;
, - .
00 05 10 0
0 05
18 5
, ;
,
, - .
,
aceita se H
Como T T
calc
= >
;;
, - .
10 0
8 = aceita se H
Passo 6 Concluso:
Como o valor para
T
calc
maior que o valor crtico tabelado
T
0 05 10 , ;
, se
aceita H
0
e conclui-se que os escores da anlise sensorial relatados pelos
provadores para a formulao normal no diferiram dos escores relatados
para a formulao modificada. Portanto, as formulaes do produto so
equivalentes quanto ao sabor, pois
T P
calc
= = 18 5 0 386 , ; ,
.
Teste t para grandes amostras (n > 25)
A frmula utilizada para o teste T de Wilcoxon para grandes amostras a
seguinte:
z
T
n n
n n n
CE
CE
calc
=

+
+ +
( )
( )( )
,
1
4
1 2 1
2
24
onde: = =

( ) t t
3
Sendo t o nmero de observaes empatadas em cada posto. Por exemplo:
se hover dois empates com o posto 2,5 e outros quatro empates com o posto
7,5, o clculo para CE ser:
CE = + = ( ) ( ) 2 2 4 4 66
3 3
Assim, supondo-se n > 25 para o exemplo mostrado na Tabela 17.3, temos:
Passo 1 Formular as hipteses estatsticas:
H
O
: os valores dos escores no diferem nas duas formulaes;
H
A
: os valores dos escores so diferentes para as duas formulaes.
BIOESTATISTICA_VOL02.indb 182 25/06/12 17:22
TESTES PARA VARIVEIS ORDINAIS 183
Passo 2 Escolher o nvel de significncia (nvel alfa):
0, 05 (5%) a =
Passo 3 Determinar o valor crtico do teste:
0,05
1, 96 z =
Passo 4 Calcular o valor do teste:
z
T
n n
n n n
CE
calc
=

+
+ +
=

+ ( )
( )( )
,
( ) 1
4
1 2 1
2
24
18 5
10 10 1
44
10 10 1 20 1
12
2
24
9 0
9 8
0 918
( )( )
,
,
,
+ +
= =

Passo 5 Regra de deciso:
Se | | , aceita-se
Se | |
z z
0 calc
calc
H
z z
<

0 05 ,
.
00 05
0 0
,
,
. , rejeita-se
Como | |=0,918 <
H
z z
calc
0
55
1 96 = , . , aceita-se H
0
Passo 6 Concluso:
Como o valor para z
calc
menor que o valor crtico tabelado
z
0 05 ,
, acei-
ta-se H
0
e conclui-se que os escores da anlise sensorial relatados pelos
provadores para a formulao normal no diferiram dos escores relatados
para a formulao modificada. Portanto, as formulaes do produto so
equivalentes quanto ao sabor, pois z P
calc
= = 0 918 0 386 , ; , .
17.3 COEFICIENTE DE CORRELAO DE
SPEARMAN (TESTE RHO)
Tambm chamado de coeficiente de correlao de postos de Spearman,
o teste foi inicialmente idealizado por Charles Spearman
3
, em 1904, e constitui
3 Charles Edward Spearman (1863-1945) - Psiclogo ingls conhecido pelo seu trabalho na rea
da estatstica, como um pioneiro da anlise fatorial e pelo coeficiente de correlao de postos
de Spearman.
BIOESTATISTICA_VOL02.indb 183 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 184
uma alternativa para o teste do coeficiente produto-momento de Pearson
quando este apresenta variveis que no satisfazem as condies exigidas para
o teste, tais como a homocedasticidade e a distribuio normal.
No teste rho, para que as variveis possam ser ordenadas, necessrio que
sejam medidas em escala ordinal e, tal como no teste de Pearson, o coeficiente
de Spearman (r
s
) varia de +1, que indica uma correlao perfeita positiva, a 1,
uma correlao perfeita negativa. O valor 0 indica ausncia de correlao. A
interpretao semelhante ao teste de Pearson.
Raciocnio para o teste
Para calcular o valor r
s
, necessrio que as duas variveis supostamente
correlacionadas tenham sido medidas para cada um dos indivduos da amostra.
Deste modo, cada indivduo ter um par ordenado determinado por (x, y), sendo x
os valores da varivel tomada como preditora e y os valores da varivel resposta,
se for o caso. Note que r
s
indica a correlao entre postos e no entre os valores
medidos para as variveis. Assim, x e y devem ser ordenados em separado para
que seus postos possam ser comparados. Neste caso, se as variveis estiverem
correlacionadas positivamente, os postos mais baixos de x sero acompanhados
dos postos mais baixos de y, enquanto que os postos altos de x correspondero
aos postos altos de y. Por outro lado, se a correlao for negativa, os postos altos
de uma varivel estaro relacionados aos postos baixos da outra varivel e vice-
-versa. Porm, se no houver correlao entre x e y, no haver coerncia na
associao entre os postos das duas variveis estudadas, uma vez que os postos
altos de x podem corresponder a postos altos, mdios ou baixos de y, indistinta-
mente. Portanto, tem-se como hiptese nula para o teste, aquela em que os postos
de uma varivel no se alteram de igual maneira com os postos da outra varivel;
em outras palavras, enquanto os postos de uma varivel aumentam, os postos
da outra varivel podem aumentar ou diminuir sem qualquer relao entre elas.
Determinao do coefciente de spearman (rs)
O teste envolve o clculo do valor estatstico r
s
, cujos procedimentos sero
mostrados a seguir:
Inicialmente, ordenam-se, do menor para o maior, os valores das duas
amostras x e y, e anota-se, ao lado de cada valor, o nmero de ordem (ou
BIOESTATISTICA_VOL02.indb 184 25/06/12 17:22
TESTES PARA VARIVEIS ORDINAIS 185
posto) correspondente. No esquea que, quando houver empate, o pos-
to para cada valor empatado corresponde mdia dos postos que seriam
ocupados por eles;
A seguir, calculam-se as diferenas (d) entre os postos de x e de y determi-
nados para cada um dos indivduos da amostra. O sinal da operao deve
ser conservado, pois o somatrio das diferenas deve ser igual a zero;
O valor de r
s
calculado pela seguinte frmula:
r
d
n n
n
s
=

1
6
2
3
, onde o nmero de pares.
Quando ocorrerem empates nos postos, deve-se usar a frmula corrigida,
a qual mostrada a seguir:
r
A A d
A A
A
n n
s
x y
x y
x y
=
+
=

( )
2
3
2
,
( )
onde:
ou
(( ) t t
3
12

Sendo t o nmero de observaes empatadas em cada posto. Por exemplo:


se hover dois empates com o posto 2,5 e outros quatro empates com o posto
7,5, o clculo para (t
3
t) ser:
( ) ( ) ( ) t t
3 3 3
2 2 4 4 66 = + =

Para demonstrar a aplicao do teste de correlao de Spearman, utiliza-


remos o seguinte exemplo:
Exemplo: Na indstria alimentcia, a densidade aparente de um sorvete
dada pela multiplicao entre a quantidade de ar incorporado (overun), a
massa do produto e uma constante igual a 0,2. Essa medida constitui um impor-
tante parmetro de qualidade, pois sua variao influencia na relao entre
a textura e a palatibilidade do produto. Simes et al (2008) realizaram uma
anlise sensorial com 10 diferentes formulaes de um sorvete de fruta, com
o objetivo de verificar se a sua densidade aparente est relacionada ao grau de
BIOESTATISTICA_VOL02.indb 185 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 186
aceitao quanto palatibilidade do mesmo. As densidades (g/L) e os respec-
tivos escores, medidos de zero a 10, esto apresentados na Tabela 17.4, abaixo.
Tabela 17.4 Variao do escore atribudo pela anlise sensorial em funo da densidade
relativa (g/L) de um tipo de sorvete de fruta
Provador Densidade
(x)
Posto de
x
Escore
(y)
Posto de
y
d
(x y)
d
2
01 480 1 8.1 5,5 -4.5 20,25
02 500 2 9.4 9 -7 49,00
03 520 3 9.8 10 -7 49,00
04 540 4 8.1 5,5 -1.5 2.25
05 560 5 8.8 7 -2 4,00
06 580 6 8.9 8 -2 4,00
07 600 7 7.6 3,5 3.5 12.25
08 620 8 7.6 3,5 4.5 20.25
09 640 9 7.2 1 8 64,00
10 660 10 7.4 2 8 64,00
= 0 = 289
Uma vez que as duas variveis correlacionadas so medidas por postos,
o uso do coeficiente de Spearman (r
s
), em vez do coeficiente de correlao de
Pearson (r), justificado. Assim, para os dados do exemplo apresentado na
Tabela 17.4, o valor de r
s
calculado como mostrado a seguir:
r
d
n n
s
=

= =

1
6
1
6
10 10
1
1 734
990
1 1 75
2
3 3
x 289 .
, 115 0 7515 = ,
Como apenas os postos da varivel anlise sensorial apresentam empates,
no necessria a aplicao da frmula corrigida. Assim, com base no resultado
calculado, o coeficiente de correlao de Spearman indica uma forte correlao
negativa entre a densidade aparente e o grau de aceitao quanto palatibi-
lidade do sorvete de frutas analisado, pois r
s
= 0,7515. No entanto, para que se
possa concluir com segurana, necessrio realizar um teste de hiptese para
verificar se essa correlao foi um achado casual ou se, de fato, ela estatistica-
mente significante. Esse procedimento ser demonstrado a seguir.
BIOESTATISTICA_VOL02.indb 186 25/06/12 17:22
TESTES PARA VARIVEIS ORDINAIS 187
Teste de hiptese para o coefciente de spearman
O teste de hiptese realizado comparando-se o valor calculado de r
s(calc)

com o valor verificado na tabela dos valores crticos para o coeficiente de corre-
lao de Spearman (ver tabela no final do livro). Nesta tabela, esto indicados
todos os valores significativos para r
s(;n)
conforme o nvel de significncia ()
preestabelecido e os diferentes tamanhos amostrais para n 100. Para testar
a hiptese, aplica-se o seguinte raciocnio: se o valor obtido para r
s(calc)
for igual
ou superior ao tabelado, a correlao estatisticamente significativa para o
nvel preestabelecido para a pesquisa, caso contrrio, aceita-se a hiptese
nula de que no h correlao entre as variveis estudadas. Assim, para o
exemplo apresentado na Tabela 17.4, o valor calculado para r
s(calc)
foi igual a
0,7515, enquanto que o valor tabelado para um teste bilateral, com = 0,05 e
n = 10, r
s(0,05;10)
= 0,648. Deste modo, o coeficiente de correlao obtido para o
teste realizado entre os valores da densidade aparente e do grau de satisfao
quanto palatibilidade do sorvete analisado estatisticamente significativo,
pois r
s(calc)
= 0,7515 > r
s(0,05;10)
= 0,648, com valor P = 0,0104.
No entanto, para valores de n maiores que 30 e menores ou iguais a 100
(30 < n 100), podemos usar tanto a tabela dos valores crticos para o coefi-
ciente de correlao de Spearman quanto um teste t, tal como foi utilizado para
avaliar a significncia do coeficiente de correlao de Pearson (ver captulo 12).
Neste caso, o valor obtido para t
calc
comparado com o valor crtico da tabela t
de Student (ver tabela no final do livro), com (n 2) graus de liberdade. A regra
de deciso a mesma para o teste t: se |t
calc
| for igual ou maior que o t crtico
tabelado (t
;n-2
), a correlao estatisticamente significativa, caso contrrio,
aceita-se que no h correlao entre as variveis estudadas. A frmula para
calcular t a seguinte:
t
r
r
n
calc
s
s
=

1
2
2
Exemplo: Uma indstria de alimentos congelados realizou uma anlise
para verificar se existe uma correlao significativa entre a densidade aparente
e o tempo de derretimento de seus sorvetes de frutas. Para tal, foram selecio-
BIOESTATISTICA_VOL02.indb 187 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 188
nadas 32 amostras de diferentes sabores de sorvete. Pela anlise da simetria
das variveis, verificou-se que os valores do tempo de derretimento no se
apresentavam normalmente distribudos, enquanto que, no grfico de distri-
buio conjunta (grfico de disperso), os pontos no apresentavam uma
nuvem de formato elptico. Por este motivo, a opo da anlise recaiu sobre o
coeficiente de correlao de Spearman. O valor obtido foi r
s
= 0,7842.
Passo 1 Formular as hipteses estatsticas:
H r
s 0
: =0
(No existe correlao entre a densidade aparente e tempo de
derretimento dos sorvetes analisados).
H r
A s
: 0
(A densidade aparente e o tempo de derretimento esto corre-
lacionados).
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 01 , (1%) bilateral
Passo 3 Determinar o valor crtico do teste t:
gl n t = = = = 2 32 2 30 2 750
0 01 30 , ;
,
Passo 4 Calcular o valor do teste t para r
s
= 0,7842:

t
r
r
n
calc
s
s
=

=

1
2
0 6842
1 0 6842
32 2
0 684
2 2
,
( , )
, 22
0 0156
43 859
,
, =

Passo 5 Regra de deciso:

Se , aceita-se
Se |
| | .
|
, ;
t t H
t
calc
calc
<
0 01 30 0
, rejeita-se
Como | =43,85
t H
t
calc
0 01 30 , ;
.
|
0
99 > , rejeita-se t H
0 01 30
2 750
, ;
, . =
0
Passo 6 Concluso:
Existe, portanto, uma forte evidncia de que as variveis densidade apa-
rente e tempo de derretimento estejam inversamente relacionadas, isto
, que existe uma correlao linear estatisticamente significante entre elas,
pois t gl P
calc
= = = 43 859 30 0 001 , ; ; , .
BIOESTATISTICA_VOL02.indb 188 25/06/12 17:22
TESTES PARA VARIVEIS ORDINAIS 189
17.4 TESTE DE CONCORDNCIA KAPPA
Tambm chamado de coeficiente kappa, o teste, inicialmente sugerido
por Jacob Cohen
4
, em 1960, tem a finalidade de medir o grau de concor-
dncia entre as propores encontradas para a mesma varivel mensurada
em duas diferentes ocasies. O teste baseado no nmero de resultados
concordantes, ou seja, no nmero de casos cujo resultado o mesmo entre
os avaliadores, sendo, portanto, uma medida interobservador, que mede
o grau de concordncia alm do esperado to somente pelo acaso. Esse
teste, que pressupe que as variveis sejam medidas em escala dicotmica,
tem o valor mximo igual a 1, que representa total concordncia entre os
tratamentos, ao passo que os valores prximos ou abaixo de zero indicam
ausncia de concordncia, ou que a concordncia ocorreu em razo do
acaso. Por outro lado, um valor de kappa eventualmente menor que zero
sugere que a concordncia encontrada foi menor do que aquela que seria
esperada somente por acaso, isto , que existe discordncia entre os trata-
mentos, embora este valor no tenha interpretao como intensidade de
discordncia. Em outras palavras, testa-se a reprodutibilidade dos resul-
tados, admitindo-se que haver concordncia entre eles em relao s
propores medidas nas duas ocasies consideradas.
Neste teste, os dados devem ser introduzidos em uma tabela de contin-
gncia conforme mostrado abaixo:
Tabela 17.5 Tabela de contingncia para a concordncia entre os diagnsticos de dois
diferentes avaliadores
Avaliador 1
Presente (+) Ausente () Total
Avaliador 2
Presente (+) a (++) b (+) n
1
= a + b
Ausente () c (+) d () n
2
= c + d
Total m
1
= a + c m
2
= b + d n
4. Jacob Cohen (1923-1998) Psiclogo e estatstico americano melhor conhecido pelo seu
trabalho sobre poder estatstico e medidas de efeito de tratamento.
BIOESTATISTICA_VOL02.indb 189 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 190
O clculo do coeficiente de kappa toma como base a relao entre a
proporo de concordncia observada (p
o
) e a proporo da concordncia
esperada (p
e
), conforme as frmulas mostradas abaixo:

kappa
p p
p
p
a d
n
p
n
o e
e
o e
=

=
+
=
1
, onde: e
11 1 2 2
2
. . m n m
n
+
Um teste deve ser realizado para avaliar a significncia estatstica do
valor calculado para Kappa, cuja hiptese nula a ser testada aquela que
indicaria uma ausncia de concordncia entre os observadores (kappa = 0).
No caso de rejeio da hiptese nula (kappa > 0), h a indicao de que existe
alguma concordncia entre os observadores, sem, no entanto, significar neces-
sariamente que a concordncia seja alta, cabendo ao pesquisador avaliar se a
medida obtida satisfatria ou no. Alguns autores, como Landis e Koch, 1977,
sugerem a seguinte interpretao:
Tabela 17.6 Avaliao do grau de intensidade da concordncia entre dois observadores
Valor de kappa Intensidade da concordncia
< 0 Sem concordncia
0,0 0,20 Leve
0,21 0,40 Moderada
0,41 0,60 Forte
0,61 0,80 Muito forte
0,81 0,99 Quase perfeita
1,0 Perfeita
Observe que esta tabela no universalmente aceita, uma vez que os autores
no mostram evidncias que amparem a sua exatido, sendo baseada apenas
na experincia pessoal, pois, na prtica, verifica-se que o nmero de categorias
e de sujeitos afeta o valor de kappa, o qual ser maior quando existirem poucas
categorias. Assim, apesar de suas limitaes, o teste considerado como uma
medida mais robusta do que um simples clculo de percentagens, j que o
mesmo considera o grau de concordncia em razo da ocorrncia da chance.
BIOESTATISTICA_VOL02.indb 190 25/06/12 17:22
TESTES PARA VARIVEIS ORDINAIS 191
Entretanto, alguns autores afirmam que o teste subestima o grau de concor-
dncia entre os observadores, isto porque, quando no completamente certos,
estes tendem a advinhar os resultados de suas observaes. O exemplo a seguir
mostra uma aplicao para o teste de concordncia de kappa.
Exemplo: Um estudo foi conduzido por Ferreira et al (2006) para verificar
a capacidade dos odontlogos em identificar o sexo dos pacientes pela anlise
visual de suas arcadas dentrias. Para tal experimento, foram selecionadas
as fotografias das arcadas de 20 indivduos adultos jovens, sendo 10 do sexo
masculino e 10 do sexo feminino. A identificao das arcadas foi feita em dois
diferentes momentos, com intervalo de 30 dias entre eles. Para que os odontlogos
selecionados fizessem o reconhecimento, as fotografias foram aleatoriamente
misturadas imediatamente antes de cada sesso de identificao. Os resultados
das avaliaes efetuadas por um dos odontlogos esto mostrados abaixo. Existe
concordncia estatisticamente significativa entre os resultados?
Foto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Sexo F M M F F M F M M M F M F M F F M F F M
Primeira
avaliao
F
+
M
+
M
+
F
+
F
+
M
+
M

M
+
F

M
+
M

M
+
F
+
F

F
+
F

F
+
F
+
M
+
Segunda
avaliao
F
+
F

M
+
F
+
M

M
+
F
+
F

M
+
M
+
M

M
+
F
+
M
+
M

F
+
M
+
F
+
F
+
M
+
M Masculino; F Feminino.
Com base no resultado acima, pode-se construir a seguinte tabela de
contingncia:
Tabela 17.7 Tabela de contingncia para a concordncia entre os diagnsticos de um
odontlogo em duas diferentes avaliaes
Primeira avaliao
Total
Correta Incorreta
Segunda
avaliao
Correta 11 4 15
Incorreta 3 2 5
Total 14 6 20
BIOESTATISTICA_VOL02.indb 191 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 192
Passo 1 Formular as hipteses estatsticas:
H kappa
0
: =0
(No existe concordncia quanto aos resultados encontra-
dos nas duas avaliaes).
H kappa
A
: >0
(Existe concordncia quanto aos resultados encontrados
nas duas avaliaes).
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%) unilateral
Passo 3 Calcular o valor de kappa:

x 14)
p
a d
n
p
n m n m
n
o
e
=
+
=
+
=
=
+
=
+
11 2
20
0 65
15
1 1 2 2
2
,
. .
( ((
,
, ,
5
20
240
400
0 60
1
0 65 0 6
2
x 6)
= =
=

=

kappa
p p
p
o e
e
00
1 0 60
0 05
0 40
0 125

= =
,
.
,
,
Passo 4 Concluso:
No existem, portanto, evidncias que comprovem ter havido concordn-
cia em relao s observaes nos dois momentos avaliados. Isto , no
houve concordncia na identificao do sexo dos indivduos avaliados, pois
kappa = 0,125; P = 0,286 .
Note que o teste de concordncia de Kappa mede apenas o grau de concor-
dncia entre dois avaliadores. Para uma medida de concordncia entre trs ou
mais avaliadores, o teste a ser utilizado a estatstica pi de Scott.
17.5 TESTE PARAMTRICO VERSUS
NO-PARAMTRICO
Antes de se decidir por um teste no-paramtrico, o pesquisador deve
conhecer algumas de suas vantagens e devantagens em relao aos testes
baseados na distribuio normal gaussiana. So elas:
BIOESTATISTICA_VOL02.indb 192 25/06/12 17:22
TESTES PARA VARIVEIS ORDINAIS 193
Quando as exigncias clssicas para a utilizao dos testes paramtricos
no so atendidas, os testes no-paramtricos so os mais apropriados,
pois so mais livres em termos de regras, sendo, portanto, de aplicao
mais ampla. Porm, quando utilizados em dados que satisfazem as exign-
cias de simetria, os testes no-paramtricos so menos eficientes em de-
tectar alguma diferena entre os grupos comparados, especialmente quan-
do o tamanho amostral pequeno. Nestes casos, a preferncia de escolha
recai sempre sobre um teste paramtrico;
Os testes no-paramtricos so indicados quando o modelo de distribui-
o dos dados na populao desconhecida ou assimtrica, assim como
quando os grupos a serem comparados apresentam varincias desiguais
(heterocedasticidade). Ou ainda, quando entre os grupos a serem compa-
rados, alguns apresentam distribuio simtrica enquanto que outros so
assimtricos;
Em geral, os testes no-paramtricos so menos robustos em relao
aos testes paramtricos, uma vez que so empregados em dados mensu-
rados em escalas no-dimensionais, do tipo nominal, ordinal ou dicot-
mica. De fato, a transformao de dados quantitativos dimensionais em
dados categricos, ou a sua reduo para uma escala qualitativa orde-
nvel que possa ser substituda por postos, tal como ocorre no teste de
Wilcoxon-Mann-Whitney, causa perda de informao relativa variabili-
dade dos dados da amostra estudada, fato este que pode comprometer a
qualidade do teste de hiptese. Portanto, antes de escolher este ou aquele
teste, o pesquisador dever proceder minuciosa anlise de seus dados,
de maneira que possa optar pelo teste mais apropriado ao delineamento
de sua pesquisa.
BIOESTATISTICA_VOL02.indb 193 25/06/12 17:22
BIOESTATISTICA_VOL02.indb 194 25/06/12 17:22
parte 5

ANLI SE MULTI VARI ADA
Para alguns, a frase pode parecer contundente,
mas, aps longos anos estudando o assunto,
posso dizer que, quem ainda no aprendeu estatstica
no pode afrmar que sabe fazer pesquisa.
Prof. Mauro Fontelles
Mdico, cirurgio do trauma e pesquisador.
BIOESTATISTICA_VOL02.indb 195 25/06/12 17:22
BIOESTATISTICA_VOL02.indb 196 25/06/12 17:22
18
Anlise Conceitual
Multivariada
O objetivo do presente captulo fornecer ao leitor, subsdios para que
ele possa compreender os princpios que regem o processo de aplicao
da estatstica multivariada, de modo que, dentre todos os diferentes testes
estatsticos existentes, ele possa escolher aquele que melhor se aplica ao
modelo delineado no projeto de sua pesquisa, assim como possa interpretar
de modo correto os resultados observados. Na prtica, nos modelos de
estudo multivariado, o pesquisador estuda a influncia relativa simultnea
de duas ou mais variveis preditoras, possivelmente causais, sobre uma
nica varivel resposta, a qual tomada como desfecho. Assim, embora com
algumas limitaes, este modelo , sem dvida, mais atraente que aqueles
de anlise bivariada, pois, em razo de analisar vrios fatores simulta-
neamente, reflete de forma mais fidedigna os fenmenos observados na
prtica do dia-a-dia da pesquisa. Por isso, importante que os pesquisa-
dores dominem suas tcnicas, pois, somente dessa maneira, podem extrair
o mximo de informaes contidas em seus experimentos.
BIOESTATISTICA_VOL02.indb 197 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 198
18.1 BASES CONCEITUAIS DA ESTATSTICA
MULTIVARIADA

A compreenso de como a interao de mltiplas variveis atua sobre um
determinado desfecho o objetivo maior de um estudo que emprega a anlise
multivariada como mtodo de pesquisa, sendo, portanto o resultado final
da investigao. Assim, para tornar mais fcil a base do raciocnio para esta
compreenso, utilizaremos um exemplo extrado do cotidiano: suponha que,
aps uma longa viagem turstica de nibus, um passageiro queira mensurar o
seu grau de satisfao com a referida viagem, isto , se ela deve ser classificada
como excelente, boa, mdia ou ruim. Com vistas a este objetivo, ele considera
que alguns fatores inerentes viagem contriburam de forma efetiva para sua
classificao. So eles: o conforto do nibus, o preo da passagem, o tempo
de viagem e o roteiro turstico. Neste caso, podemos afirmar que o conforto,
o preo, o tempo e o roteiro so as variveis preditoras (independentes), que
atuaram conjuntamente, modificando o desfecho da varivel resposta (depen-
dente) grau de satisfao. Existe, portanto, uma relao entre as variveis
estudadas, a qual pode ser posta da seguinte maneira: o grau de satisfao
depende do conforto, do preo, do tempo e do roteiro. Tornando a afirmao
mais lgica, podemos escrev-la da seguinte forma:
Grau de satisfao Conforto + Preo + Tempo + Roteiro
Aqui, um fato importante deve ser considerado. As quatro variveis indepen-
dentes no atuam, necessariamente, com a mesma intensidade na determinao
do desfecho. Cada uma delas tem uma determinada importncia quanto ao grau
de satisfao do passageiro. Em outras palavras, para cada uma das variveis
independentes deve ser atribudo um fator de ponderao (peso), de tal maneira
que as suas importncias relativas sejam proporcionalmente ajustadas s demais
na determinao do desfecho estudado. Assim, a afirmao anterior pode ser
reescrita de uma maneira mais apropriada, tal como mostrado a seguir:
Grau de satisfao peso
c
.Conforto + peso
p
.Preo + peso
t
.Tempo + peso
r
.Roteiro

BIOESTATISTICA_VOL02.indb 198 25/06/12 17:22
ANLISE CONCEITUAL MULTIVARIADA 199
O prximo passo a ser considerado transformar a afirmao em um
modelo matemtico que possa ser utilizado para clculos estatsticos. Para tal,
necessrio transform-la em uma equao matemtica, tomando-se como
referncia a equao da reta y = a + bx, a qual, em estatstica, considerada
como a frmula da regresso linear simples. Porm, como existem outras
variveis independentes que tambm atuam no grau de satisfao, como por
exemplo, o horrio da partida do nibus, mas que no foram consideradas
pelo passageiro, a frmula no perfeita, necessitando, portanto, de um fator
de correo chamado termo de erro (e), para que a igualdade, em ambos os
membros da equao, seja satisfeita. Este termo de erro, embora de nome um
tanto inadequado, pois no significa necessariamente um erro no processo
de avaliao da interao, englobar todas as outras variveis que no esto
sendo analisadas, mas que tambm atuam no desfecho do estudo. Assim, repre-
sentando-se a varivel-resposta grau de satisfao pela letra y, as variveis
preditoras conforto, preo, tempo e roteiro por x
1
, x
2
, x
3
e x
4
, e os respec-
tivos pesos por b
1
, b
2
, b
3
e b
4
, a equao pode ser escrita da seguinte forma:
Como se pode observar, o uso desta equao no permite que o verda-
deiro valor para y (desfecho) possa ser calculado, pois o termo de erro e no
conhecido. Na prtica, para que a equao possa ser empregada, o que na
verdade se calcula o valor estimado de y, designado por (l-se y-chapu).
Deste modo, o valor de e deve ser subtrado da equao, a qual passa a ser
escrita da seguinte forma:
Assim, subtraindo-se a segunda da primeira equao, tem-se: (y ) = e.
Deste modo, o termo de erro e corresponde ao valor observado para a varivel-
-resposta y, menos o valor previsto para a mesma varivel, sendo, por isso,
chamado de resduo. Portanto, com base neste raciocnio, podemos afirmar
que as melhores estimativas para os valores da varivel de desfecho so obtidas
quando o resduo for mnimo.

y a b x b x b x b x = + + + +
1 1 2 2 3 3 4 4
y a b x b x b x b x e = + + + + +
1 1 2 2 3 3 4 4
BIOESTATISTICA_VOL02.indb 199 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 200
A equao para calcular comumente chamada de modelo linear geral,
a qual utilizada como base para diversos procedimentos de anlise multiva-
riada, entre os quais se destacam a anlise de varincia (ANOVA), a regresso
linear mltipla e a regresso logstica mltipla, todos mostrados nos captulos
subsequentes deste livro.
Como em outros captulos, nosso objetivo fornecer subsdios suficientes
para que o leitor possa identificar as situaes em que a anlise multivariada
a mais adequada, assim como interpretar os resultados obtidos. Portanto,
agora que estes fundamentos foram explicados, o leitor poder demonstrar,
a ttulo de exerccio, os procedimentos para um estudo que queira avaliar a
interao das variveis preditoras idade, estatura, massa corporal e sexo
na determinao da varivel resposta presso arterial. Caso tenha interesse
em aprender mais sobre este procedimento, consultar Jekel et al (2005).
18.2 OBJETIVOS DA ESTATSTICA MULTIVARIADA
Os objetivos de uma anlise multivariada podem ser resumidos como
mostrado a seguir:
Testar se existe, de fato, uma associao verdadeira entre cada uma das
variveis preditoras (x) estudadas e a varivel resposta analisada (y). Ou
seja, verificar se a correlao entre cada uma das variveis preditoras e a
varivel resposta no ocorreu por puro acaso;
Verificar se existe uma interao entre as diversas variveis predi-
toras (x) na determinao da varivel resposta (y). A interao est
presente quando uma das variveis preditoras influencia a maneira
pela qual outra varivel, tambm preditora, explica o comportamento
da varivel resposta;
Caso exista interao entres as variveis preditoras, compreender quo
importante so estas variveis preditoras (x), tanto individual como
conjuntamente, para explicar a variao da varivel resposta (y);
Determinar qual das variveis independentes a mais forte ao predizer
o comportamento da varivel resposta, ou como interage com as outras
variveis na sua capacidade para a predio.
BIOESTATISTICA_VOL02.indb 200 25/06/12 17:22
ANLISE CONCEITUAL MULTIVARIADA 201
18.3 A ESCOLHA DO TESTE ESTATSTICO
A escolha do teste estatstico apropriado deve ser realizada ainda na fase
de delineamento do estudo, logo aps a escolha das variveis que comporo a
pesquisa. Esta escolha, que geralmente se traduz em algum grau de dificuldade
para um pesquisador menos experiente, envolve uma srie de fatores que
devero ser considerados, sendo os mais importantes o tipo de delineamento
do estudo, o tipo de varivel estudada e o nmero de grupos comparados. Assim,
quando se considera o modelo de delineamento, deve-se verificar se a compa-
rao entre os grupos um estudo do tipo pareado ou se envolve comparao
de grupos de amostras independentes, ou se o estudo do tipo caso-controle
ou coorte etc. Quanto ao tipo de varivel, o pesquisador deve estar atento, pois
as variveis podem ser paramtricas, ordinais, dicotmicas ou nominais e, para
cada tipo de varivel, um tipo diferente de teste estatstico deve ser escolhido.
Igualmente, o nmero de variveis a serem comparadas tambm determina
o tipo de teste, pois a anlise pode ser univariada, bivariada ou multivariada,
assim como o nmero de grupos estudados tambm deve ser considerado.
Com base nesses requisitos, os testes estatsticos podem ser classificados
em dois grandes grupos, os testes paramtricos e os testes no-paramtricos,
conforme o tipo de varivel estudada. Os testes paramtricos so mais robustos
do que os no-paramtricos e, consequentemente, devem ser a primeira escolha
do investigador, quando o seu emprego for permitido, isto , quando os dados
coletados achem-se normalmente distribudos. Quando a escolha um teste
no-paramtrico, o pesquisador admite que a distribuio de seus dados no
seja normal, ou que ele no tem elementos suficientes para poder afirmar que
o sejam. Na dvida, o pesquisador deve optar pela estatstica no-paramtrica.
De qualquer maneira, seja qual for a opo do pesquisador, ele precisa
ainda decidir qual, dentre os diversos testes existentes, em ambos os grupos,
o mais apropriado para o modelo de sua pesquisa. Isto porque, existem
testes especficos para amostras dependentes e independentes, como, da
mesma forma, o nmero de comparaes a serem realizadas na pesquisa
tambm importante, uma vez que existem testes indicados para comparao
somente entre duas amostras, e outros indicados para comparaes mltiplas,
entendendo-se como mltiplas, um nmero de comparaes superior a duas
BIOESTATISTICA_VOL02.indb 201 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 202
amostras. Deste modo, com o intuito de facilitar ao leitor quanto escolha do
teste estatstico apropriado, os quadros 18.1 e 18.2 mostram as opes para as
anlises bivariadas e multivariadas, respectivamente.
Quadro 18.1 Escolha do teste estatstico para anlise bivariada, conforme o tipo
de varivel estudada
Tipos de
variveis
Primeira varivel
Contnua Ordinal Dicotmica Nominal
S
e
g
u
n
d
a

v
a
r
i

v
e
l
Dicotmica
no-pareada
- Teste t de Student
- Teste de
Mann-Whitney
- Teste qui-quadrado
para tendncia linear
- Teste
qui-quadrado
- Teste exato de
Fisher
---
Dicotmica
pareada
- Teste t pareado - Teste de Wilcoxon
- Teste do
qui-quadrado de
McNemar
---
Nominal
- Anlise de
varincia de uma
via (ANOVA).
- Teste Kruskal-Wallis
- Teste
qui-quadrado
- Teste
qui-quadrado
Ordinal ---
- Coefciente de
correlao de
Spearman
- Coefciente de
correlao de Kendall
--- ---
Contnua
- Coefciente de
correlao de
Pearson
- Regresso linear
- Agrupar a variveis
contnuas e calcular o
coef. de correlao de
Spearman ou coef. de
correlao de Kendall
ou qui-quadrado.
--- ---
BIOESTATISTICA_VOL02.indb 202 25/06/12 17:22
ANLISE CONCEITUAL MULTIVARIADA 203
Quadro 18.2 Escolha do teste estatstico para anlise multivariada, conforme
o tipo de varivel estudada
Tipos de
variveis
Varivel dependente
Contnua Ordinal Dicotmica Nominal
V
a
r
i

v
e
i
s

i
n
d
e
p
e
n
d
e
n
t
e
s
Todas so
categricas
- Anlise de
varincia (ANOVA)
- No existe teste
para anlise
multivariada
de variveis
dependentes
ordinais.
- Tratar como
variveis contnuas
ou realizar a
anlise do
log-linear.
- Regresso
logstica
- Anlise do
log-linear
- Anlise do
log-linear
Algumas
categricas
e algumas
contnuas
- Anlise de
covarincia
(ANCOVA)
- Regresso
logstica
- Agrupar as
variveis
contnuas e
realizar anlise do
log-linear.
Todas so
contnuas
- Regresso linear
mltipla
- Regresso
logstica
- Anlise da funo
discriminante
- Anlise da funo
discriminante
- Agrupar as
variveis
contnuas e
realizar anlise do
log-linear.
BIOESTATISTICA_VOL02.indb 203 25/06/12 17:22
BIOESTATISTICA_VOL02.indb 204 25/06/12 17:22
19
Anlise de Varincia
(ANOVA)
Na pesquisa experimental, embora o mais frequente seja a comparao
de apenas dois grupos amostrais, no raro o pesquisador desafiado a
comparar os resultados de trs ou mais amostras, simultaneamente. Neste
caso, quando os dados so obtidos de amostras cujas variveis so expressas
em uma escala contnua e com distribuio normal, a comparao ser feita
entre trs ou mais mdias amostrais ao mesmo tempo. Por exemplo, se o
interesse verificar se pessoas em diferentes grupos etrios, isto , crianas,
adultos e idosos tm, em mdia, diferentes valores para a dosagem srica do
colesterol total, o estudo ser feito comparando-se as mdias das medidas
dos trs grupos, simultaneamente.
Do mesmo modo, se o que se deseja comparar diferentes situaes
experimentais em uma mesma populao, como por exemplo, testar quatro
diferentes tipos de tratamentos em uma mesma comunidade, o investigador
dever separar, aleatoriamente, quatro grupos de indivduos e administrar um
tipo de tratamento para cada um dos grupos estudados. Aqui, novamente, ter
que comparar quatro mdias amostrais, simultaneamente.
Note que, em ambos os casos, a hiptese nula a ser testada que as mdias
amostrais no diferem entre si. Ou seja, H
0
:
1
=
2
=
3
= ...
n
. Como os valores
que sero comparados so mdias resultantes de variveis contnuas, num
BIOESTATISTICA_VOL02.indb 205 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 206
primeiro momento, pode parecer correto realizar vrios testes t de Student
entre os diferentes grupos, tomando-se as amostras duas a duas. Esta seria
uma soluo pouco eficiente, uma vez que, para um nmero k de amostras, a
formao total de pares (p) seria:
p
k k
=
( ) 1
2
Assim, para o caso de quatro amostras, tem-se a formao de seis pares
e, portanto, a aplicao de seis testes t para comparar as mdias duas a duas:
x x x x x x
1 2 1 3 1 4
x x x , , ,
... e assim, sucessivamente. Tal processo de comparao,
no entanto, estatisticamente incorreto, pois resulta num trabalho exaustivo
e desnecessrio, alm de aumentar a probabilidade de se cometer um erro
falso-positivo (erro tipo I), porque, com o aumento do nmero de mdias a
serem comparadas, maior ser a possibilidade de se encontrar, entre elas, uma
diferena estatisticamente significante somente por acaso, em razo do erro
amostral. Isto ocorre porque o teste t de Student foi idealizado para comparar
apenas duas mdias, com probabilidade de se concluir, de maneira incorreta,
por uma diferena que no existe. Desta forma, quando se aumenta o nmero
de mdias, aumenta-se a probabilidade de erro.
Portanto, quando o objetivo comparar vrios grupos, simultaneamente,
e para que se possa manter o erro tipo I em um nvel constante, o proce-
dimento correto o emprego de um teste de abrangncia global, o qual
utilizado para avaliar se existe alguma diferena entre as mdias e, somente se
este primeiro teste for positivo, deve-se, ento, testar as vrias combinaes
entre elas. Neste caso, a tcnica a ser empregada a anlise de varincia
(ANOVA
1
), a qual compara todas as mdias em um nico teste, objetivando
identificar se existe ao menos uma diferena estatisticamente significativa
entre os grupos comparados. Caso esta diferena exista, aplica-se, ento, uma
das diversas tcnicas de comparaes mltiplas para que se possam identi-
ficar quais os grupos diferem entre si.
1. ANOVA Acrnimo das palavras inglesas analysis of variance.
BIOESTATISTICA_VOL02.indb 206 25/06/12 17:22
ANLISE DE VARINCIA 207
19.1 BASE DA ANOVA (TESTE F)

Desenvolvida por Sir Ronald Fisher
2
, o teste ANOVA constitui uma
poderosa ferramenta estatstica de anlise multivariada que, com base no
modelo linear geral, permite comparar mais de duas mdias simultanea-
mente, constituindo-se, portanto, no primeiro passo para identificar a variao
entre trs ou mais grupos estudados simultaneamente. O argumento do teste
baseado no seguinte princpio: se tomarmos dois mtodos diferentes para
estimar a varincia, sendo o primeiro empregado para o clculo em diferentes
amostras e o segundo para o clculo em uma determinada populao; se todas
as amostras vierem desta populao, estas duas estimativas da varincia devem
ser necessariamente iguais. Isto , se a varincia de diferentes amostras no
diferirem significativamente entre si, elas so estimativas da mesma varincia
populacional
2
e, portanto, da mesma mdia populacional . Com base neste
princpio, Fischer desenvolveu duas maneiras distintas para medir a varincia
das observaes de diferentes grupos. So elas:
Varincia entre grupos (
s
E
2
) aquela que tem como base a variao
entre as mdias dos grupos estudados, isto , que mede a variao
existente entre todas as mdias amostrais selecionadas para o estudo. A
varincia entre grupos tambm chamada de quadrado da mdia entre
grupos (QM
E
);
Varincia dentro dos grupos (
s
D
2
) aquela que tem como base a
variao dentro de cada grupo, isto , que mede a variao dentro de
cada uma das mdias amostrais selecionadas para o estudo. A varincia
dentro dos grupos tambm chamada de quadrado da mdia dentro
dos grupos (QM
D
);
Varincia total (
s
T
2
) Corresponde quela que obtida quando todos os
grupos so reunidos de modo a formar um nico bloco, composto da soma
de todos os elementos das amostras.
De tal modo que podemos escrever:
s s s
T E D
2 2 2
= +
2. Sir Ronald Aylmer Fisher (1890-1962) Estatstico e bilogo ingls, criador das fundaes
para a cincia estatstica moderna.
BIOESTATISTICA_VOL02.indb 207 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 208
Note que o quadrado da mdia corresponde a um outro nome para a
varincia, a qual definida como a soma dos quadrados dos desvios em relao
mdia (SQ), dividida pelo nmero de graus de liberdade (gl), de modo que o
teste F corresponde razo entre as varincias entre os grupos e dentro dos
grupos, o qual pode ser expresso da seguinte maneira:
Teste
Varincia entre os grupos
Varincia dent
F =
rro dos grupos
= = =
s
s
QM
QM
SQ gl
SQ gl
E
D
E
D
E E
D D
2
2
/
/
Portanto, o teste F consiste em um procedimento estatstico que calcula a
variao total observada no estudo e a divide em dois componentes perfeitamente
identificveis: o primeiro componente a variao entre mdia de cada grupo e a
mdia geral de todos os indivduos do estudo (variao entre os grupos). Este
componente representa o efeito dos diferentes tratamentos. O segundo compo-
nente a variao observada entre cada indivduo e a mdia de seu respectivo
grupo (variao dentro dos grupos). Este componente representa as diferenas
individuais aos tratamentos. Assim, se as mdias dos grupos forem bastantes
diferentes umas das outras, ocorrer uma variao considervel entre elas e a
mdia geral de todos os indivduos do estudo. Entretanto, se as mdias dos grupos
no forem muito diferentes entre si, a variao entre elas e a mdia geral no ser
muito maior do que a variao entre os indivduos dentro de cada grupo.
Desta forma, a hiptese nula (H
0
)

para o teste F a afirmativa de que as duas
varincias (entre e dentro) so iguais. Isto , que a variao entre as mdias no
maior do que a variao entre as observaes individuais dentro de um grupo.
Assim, para que a hiptese nula seja aceita, bastar que se demonstre que as mdias
amostrais ( x ) no diferem significativamente entre si, alm do que seria de se
esperar somente pelo acaso, em razo do erro aleatrio. Isto , que elas estimam a
mesma mdia populacional . Caso contrrio, rejeita-se a hiptese nula e se aceita a
hiptese alternativa (H
A
) de que as mdias amostrais no estimam a mesma mdia
. Neste caso, conclumos que nem todas as mdias so iguais, ou seja, que pelo
menos uma delas difere das demais. Entretanto, o teste F no mostra qual ou quais
delas so diferentes entre si, o que explica a necessidade da utilizao de testes de
comparao mltipla (post hoc) para que se possa determinar qual ou quais das
diferenas entre as mdias so estatisticamente significantes (verdadeiras).
BIOESTATISTICA_VOL02.indb 208 25/06/12 17:22
ANLISE DE VARINCIA 209
Portanto, se o valor calculado para o teste F for prximo a 1, as duas
estimativas da varincia so semelhantes, e a hiptese nula de que todas as
mdias provm de uma mesma populao no rejeitada. Porm, se o valor
F
calc
muito maior que 1, com o valor desta diferena maior do que seria de se
esperar somente por acaso, deve haver alguma razo que explique esta grande
diferena entre os grupos comparados, a qual deve ser atribuda ao efeito dos
tratamentos. Neste caso, a hiptese da no-diferena deve ser rejeitada.
Da mesma maneira, para que se possa testar a significncia estatstica do
valor de F
calc
obtido no experimento, compara-se este valor com o valor F
gl gl
N D
; ;

extrado da tabela de valores crticos da distribuio F, a qual encontrada no
final deste livro. Este valor crtico determina o limite para uma diferena ao
acaso entre as varincias entre e dentro dos grupos comparados. Assim, para
um determinado nvel de significncia (nvel ) preestabelecido e com (k 1)
graus de liberdade no numerador e (n k) graus de liberdade no denominador,
se o valor de F
calc
for menor que
F
gl gl
N D
; ;
tabelado, aceita-se a hiptese nula
de que no h diferena entre os tratamentos, pois a variao observada entre
os grupos da mesma ordem daquela observada dentro dos grupos. Caso
contrrio, se o valor de F
calc
for maior que
F
gl gl
N D
; ;
, rejeita-se a hiptese nula e
se conclui que h diferena entre os grupos comparados.
19.2 TIPOS DE ANOVA
O uso da anlise de varincia como mtodo estatstico requer que o pesqui-
sador conhea suas diferentes formas de aplicao, uma vez que so possveis
vrios modelos experimentais para a ANOVA. Na prtica, entretanto, a maioria
dos modelos mais complexos constituem combinaes de modelos mais simples,
os quais podem ser classificados conforme o nmero de variveis indepen-
dentes analisadas no estudo. So eles: modelo de delineamento inteiramente
casualizado, tambm chamado de ANOVA de um critrio (one way ANOVA)
e modelo de delineamento em blocos casualizados, conhecido como ANOVA
de dois critrios, ou mltiplos critrios. Outros modelos mais complexos, tais
como os modelos fatoriais, modelos de quadrados latinos, modelos agrupados
e modelos de medidas repetidas (dados emparelhados) tambm podem ser
BIOESTATISTICA_VOL02.indb 209 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 210
calculados. Neste livro, abordaremos apenas os modelos bsicos de anlise de
varincia. Caso o leitor tenha interesse em aprender mais sobre os procedi-
mentos mais complexos, consultar Dawson et al (2003) e Beiguelman (2002).
Assim, no sentido de melhor esclarecer o leitor, antes de mostrar as carac-
tersticas de cada um dos modelos bsicos da ANOVA, convm definir alguns
termos especficos mais utilizados neste tipo de anlise estatstica.
Tratamento (k) Corresponde a cada um dos diferentes processos experi-
mentais estudados em um dado experimento;
Unidade experimental cada um dos grupos de indivduos que
recebem um determinado processo experimental (tratamento). A escolha
dos indivduos para a formao de uma unidade experimental deve ser
aleatria. , portanto, cada uma das amostras do estudo;
Repetio (r) a aplicao de um mesmo tratamento a todos os
indivduos que compem uma determinada unidade experimental. As
repeties permitem uma aferio da variabilidade intrnseca de cada
unidade experimental, assim como da variabilidade entre as diversas
unidades experimentais estudadas em um experimento;
Erro experimental Corresponde variao entre as unidades experi-
mentais (indivduos) que constituem um mesmo tratamento (grupo).
, portanto, a variao dentro do mesmo tratamento, a qual estimada
pela mdia das varincias de cada grupo, sendo, por isso, chamada de
varincia mdia dentro dos grupos (varincia dentro). Tambm
conhecida como varincia residual, ela representa a frao da variabi-
lidade que no explicada pelo efeito dos tratamentos;
Bloco Tambm chamado de fator, representa cada um dos conjuntos
formados por unidades experimentais semelhantes e homogneas entre
si. Um experimento poder ser formado por um, dois ou mais blocos,
segundo seja ANOVA de um critrio ou de mltiplos critrios. Assim,
em cada bloco, haver tantas unidades experimentais quantos forem os
tratamentos a ser comparados.
Deste modo, dependendo do tipo de delineamento experimental, o teste F
para anlise da varincia pode ser classificado como:
BIOESTATISTICA_VOL02.indb 210 25/06/12 17:22
ANLISE DE VARINCIA 211
ANOVA de um critrio (one way ANOVA)
Tambm chamado de modelo inteiramente casualizado, o tipo de
delineamento em que os grupos (amostras) estudados so comparados
segundo um nico critrio de classificao, isto , pelo tipo de tratamento
que recebem. Neste modelo de estudo, testa-se apenas uma varivel indepen-
dente, designada pelo tipo de tratamento, o qual analisado em apenas um
bloco constitudo por vrias unidades experimentais, sendo os elementos
dentro de cada amostra obtidos de maneira aleatria (randmica). Assim,
para cada unidade experimental sorteado um dos tipos de tratamentos que
devero ser comparados no estudo. Por exemplo: Simes et al (2008) anali-
saram a estabilidade oxidativa da carne mecanicamente separada (CMS) da
piramutaba (Branchyplatystoma vaillant) por meio de vrias anlises fsico-
-qumicas e microbiolgicas, dentre elas o pH. Foram coletadas 10 amostras
em quatro momentos distintos: 0, 30, 60 e 90 dias de estocagem 18
o
C.
Neste exemplo de ANOVA, testou-se o efeito do tempo de estocagem (tipo de
tratamento ou varivel preditora) sobre o valor do pH (varivel resposta ou
dependente), em quatro diferentes amostras (grupos).
A Tabela 19.1 mostra a notao e o modelo de organizao de dados para
uma ANOVA de um critrio, com um nico bloco experimental.
Tabela 19.1 Notao e modelo de organizao de dados para uma ANOVA
de um critrio (bloco nico)
Tratamentos Total
1 2 3 ... k
x
11
x
21
x
31
...
x
k1
x
12
x
22
x
32
...
x
k2
. . . ... .
. . . ... .
x
1r
x
2r
x
3r
...
x
kr
Total T
1
T
2
T
3
... T
k
T x

=
Repeties r r r ... r N= kr
Mdia x
1
x
2
x
3
x
k
Adaptado de Rossi, RM (2006)
BIOESTATISTICA_VOL02.indb 211 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 212
ANOVA de dois critrios (two way ANOVA)
Tambm chamado de modelo fatorial, este tipo de delineamento semelhante
ANOVA de um critrio, exceto pelo fato de que so analisados dois fatores (ou
duas variveis independentes) simultaneamente, sendo cada fator distribudo
em um bloco constitudo por trs ou mais unidades experimentais homogneas
(grupos). Neste caso, o pareamento feito por blocos. Por exemplo: no experi-
mento anterior em que se relaciona a variao do pH com o tempo de estocagem
da carne mecanicamente separada da espcie de peixe piramutaba, suponha que
o pesquisador tenha realizado o mesmo experimento para as temperaturas de
18
o
C, 25
o
C e 36
o
C. Neste caso, cujos blocos seriam representados pelos experi-
mentos realizados em diferentes temperaturas, o pesquisador busca controlar a
variao entre os sujeitos das amostras para que ela no seja confundida com
uma possvel diferena entre os tempos de congelamento. Assim, a variao
total do pH observada no experimento seria atribuda variao natural entre
os sujeitos da amostra (variao residual), entre os tempos de congelamento
(tratamentos) e entre as diferentes temperaturas (blocos).
19.2.1 Requisitos para uso da ANOVA
Para que os dados de trs ou mais amostras possam ser submetidos a um
teste de anlise de varincia, necessrio que algumas condies sejam obser-
vadas. So elas:
Que a varivel em estudo (x) apresente-se normalmente distribuda na
populao. Porm, para grandes amostras, em razo do teorema do limite
central, essa condio pode ser relaxada;
Que as amostras sejam randmicas e haja homocedasticidade de suas
varincias, isto , que elas no difiram significativamente entre si. Assim,
antes de realizar a ANOVA, fundamental que se proceda a um teste
de homogeneidade das varincias, o que pode ser feito pela aplicao
do teste de Cochran, para nmeros iguais de repetio dentro de cada
grupo, e o teste de Bartlett, para variveis com nmeros desiguais de
repetio. Em razo de ser um teste bastante robusto, a ANOVA fornece
resultados confiveis mesmo na presena de uma considervel heteroce-
dasticidade entre as varincias, desde que os tamanhos amostrais sejam
iguais ou quase iguais.
BIOESTATISTICA_VOL02.indb 212 25/06/12 17:22
ANLISE DE VARINCIA 213
19.3 ANOVA DE UM CRITRIO
Os clculos para a obteno do valor do teste F podem ser realizados pela
aplicao de frmulas alternativas, desenvolvidas a partir das frmulas tradi-
cionais das somas dos quadrados total, entre os grupos e dentro dos grupos.
Como o objetivo deste livro no a deduo das frmulas gerais, mostraremos
apenas a aplicao das frmulas alternativas, as quais so mostradas na Tabela
19.2, tambm denominada tabela de anlise de varincia, cujo objetivo
mostrar o modelo geral de um experimento inteiramente casualizado. Esta
tabela utilizada pela maioria dos programas computacionais estatsticos
tradicionais.
Tabela 19.2 Modelo geral de tabela de anlise de varincia contendo as frmulas alternativas
Fontes de variao
Graus de liberdade
(gl)
Soma dos quadrados
(SQ)
Varincia
(s
2
)
Razo F
Entre os grupos
(tratamentos)
k1
SQ
x
n
C
E
n
k
=

2
s
SQ
k
E
E 2
1
=

F
s
s
calc
E
D
=
2
2
Dentro dos grupos
(variao residual) Nk
SQ SQ SQ
D T E
=
s
SQ
N k
D
D 2
=

Total
N1
SQ x C
T
n k
=

2
Fator de correo C
x
N
n k
=


2
k Nmero de amostras (tratamentos) do estudo
N Total de elementos das k amostras
n Nmero de elementos de cada amostra
Exemplo: Com o objetivo de avaliar o padro de ensino de uma escola
pblica estadual, um pesquisador selecionou, aleatoriamente, a nota de seis
alunos nas disciplinas de lngua portuguesa, fsica, qumica e matemtica. Os
dados esto relacionados na Tabela 19.3. Existe diferena estatisticamente
significante entre os aproveitamentos dos alunos em relao s disciplinas
cursadas? Considerar nvel de significncia de 5%.
BIOESTATISTICA_VOL02.indb 213 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 214
Tabela 19.3 Valores das notas escolares de seis alunos de uma escola pblica estadual

Notas nas disciplinas
Total
Portugus Matemtica Fsica Qumica
6 9 8 6
9 8 6 5
9 7 7 4
8 8 6 5
7 8 7 6
9 8 8 4
Totais 48 48 42 30 x = 168
Repeties (n) 6 6 6 6 N = 24
Mdias ( x )
8 8 7 5
x
2
392 386 298 154 1.230
Passo 1 Formular as hipteses estatsticas:
H
O
: No existem diferenas entre as mdias das notas das disciplinas
analisadas, pois

P M F Q
= = =
.
H
A
: Ao menos uma das mdias difere das demais, sendo

P M P F
ou


ou ou ou ou
P Q M F M Q F Q

.
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%) unilateral
Passo 3 Determinar o valor crtico do teste F:
gl do numerador (entre) -
gl k
E
= = = 1 4 1 3
gl do denominador (dentro) -
gl N k
D
= = = 24 4 20
gl do total -
gl N
T
= = = 1 24 1 23
Ento,
F F
gl gl
N D
; ; , ; ;
, = =
0 05 3 20
3 10
Passo 4 Calcular o valor do fator de correo C:
C
x
N
n k
=

= = =

2
2
168
24
28 224
24
1 176
.
.
Passo 5 Calcular o valor do teste F:

SQ x C
T
n k
= = =

2
1 230 1 176 54 . .
BIOESTATISTICA_VOL02.indb 214 25/06/12 17:22
ANLISE DE VARINCIA 215




SQ
x
n
C
E
n
k
=

=
+ + +
=

2
2 2 2 2
48 48 42 30
6
1 176 36 .
s
SQ
k
E
E
2
1
36
3
12 =

= =
SQ SQ SQ
D T E
= = = 54 36 18
s
SQ
N k
D
D
2
18
20
0 90 =

= = ,
F
s
s
calc
E
D
= = =
2
2
12
0 9
13 33
,
,
Tabela 19.4 Anlise de varincia dos dados da Tabela 19.3
Fonte de variao gl SQ QM (s
2
) Fcalc
Entre os grupos
(tratamentos)
3 36 12
13,33
P = 0,0001
Dentro dos grupos
(variao residual)
20 18 0,9
23 54

Passo 6 Regra de deciso:

Se , aceita-se
Se
F F H
F
calc
calc
<

0 05 3 20 0 , ; ;
.
FF H
F
calc
0 05 3 20 0 , ; ;
. , rejeita-se
Como =13,33 > , rejeita-se F H
0 05 3 20 0
3 10
, ; ;
, . =
Passo 7 Concluso:
Como o valor para
F
calc
maior que o valor crtico tabelado
F
0 05 3 20 , ; ;
,
rejeita-se H
0
e conclui-se que ao menos uma das mdias difere das de-
BIOESTATISTICA_VOL02.indb 215 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 216
mais. Portanto, existe alguma diferena estatisticamente significan-
te entre as mdias referentes s notas nas disciplinas avaliadas, pois
F P
calc
= = 13 33 0 0001 , ; , .
Assim, como j anteriormente explicado, quando o resultado do teste F
no estatisticamente significante, nenhum outro teste adicional necessrio,
uma vez que se estima que todas as mdias so estatisticamente semelhantes e
foram retiradas da mesma populao. Isto , elas estimam a mesma mdia . No
entanto, quando ocorre uma diferena significante entre as mdias amostrais,
o teste F no indica quais destas mdias so estatisticamente diferentes entre
si. Neste caso, para que se possam determinar quais so diferentes, deve-se
passar para a segunda fase da ANOVA, na qual se aplica um dos testes de
comparaes mltiplas disponveis em estatstica, dos quais os mais utilizados
sero descritos a seguir.

19.4 TESTES DE COMPARAES MLTIPLAS
Os testes de comparaes mltiplas so complementos para a ANOVA,
que identificam as diferenas entre as mdias, comparando-as duas a duas.
Semelhantes ao teste t de Student, estes testes controlam o erro ao considerar o
nvel de significncia conforme o nmero de comparaes realizadas no experi-
mento. Alm do mais, a varincia dentro dos grupos estimada entre todas as
amostras analisadas, ao passo que, no teste t, a varincia dentro dos grupos
estimada somente com base entre duas amostras.
19.4.1 Teste Tukey (HSD)
Desenvolvido por John Tukey
3
, o mesmo estatstico que criou o diagrama
de caule e folha (steam-and-leaf ) e o grfico box plot (box-and-whisker plot), o
teste tambm conhecido como teste HSD, do ingls honestly significant diffe-
3. John Wilder Tukey (1915-2000) Estatstico americano, premiado, em 1982, com a medalha
de honra do Institute of Electrical and Electronics Engineers (EUA) pela sua contribuio para
a anlise espectral dos processos randmicos e pela transformada rpida do algoritmo de
Fourier. Durante a Segunda Guerra Mundial, trabalhou com Samuel Wilks e William Cochran.
BIOESTATISTICA_VOL02.indb 216 25/06/12 17:22
ANLISE DE VARINCIA 217
rence (diferena verdadeiramente significante), assim chamado em razo dos
outros testes de comparaes mltiplas tornarem a significncia estatstica
mais fcil de ser obtida.
Na prtica, o teste de Tukey mais exato e mais eficaz em relao aos
demais testes existentes, pois permite que se estabelea a diferena mnima
significante (d.m.s) entre as mdias amostrais quando estas so comparadas
duas a duas, tomando-se como referncia um determinado nvel de signifi-
cncia previamente estabelecido para o experimento. Esta eficcia significa
que a hiptese nula com mais frequncia corretamente rejeitada.
Tukey para amostras de mesmo tamanho
Para amostras, ou grupos, com o mesmo nmero de elementos, o teste
Tukey dado por:

d ms q
QMR
n
k glresduo
. .
; ;
=

Onde:
; ; k gl
q
resduo a
= Amplitude total estudentizada obtida na tabela de
valores crticos da distribuio q (ver tabela no final do livro).
QMR = Quadrado mdio da variao dentro dos grupos (variao
residual) obtido na anlise de varincia.
n = Nmero de elementos submetidos a cada tratamento.
Aps calcular o valor para a d.m.s, deve-se construir uma tabela de compa-
rao entre as mdias, conforme demonstrado na Tabela 19.5. Assim, de acordo
com o teste Tukey, para que qualquer diferena entre as mdias seja consi-
derada estatisticamente significante, necessrio que o valor absoluto da
diferena seja igual ou superior ao valor da d.m.s.
Exemplo: Com base nos dados da Tabela 19.3, anlise de varincia
apresentada na Tabela 19.4 mostra um valor F significante ao nvel de
5%, o que indica que ao menos uma das mdias das notas obtidas nas
disciplinas analisadas diferente das demais. Mas, qual , ou quais so as
mdias diferentes?
BIOESTATISTICA_VOL02.indb 217 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 218
Passo 1 Calcular o valor da d.m.s:


Para: e q QMR n
0 05 4 20
3 958 0 9
, ; ,
, ; , = = ==6
Tem-se: d ms . . ,
,
, = = 3 958
0 9
6
1 53
Passo 2 Calcular as diferenas entre as mdias:
Tabela 19.5 Comparaes entre as mdias pelo teste Tukey
Pares de mdias
Valor absoluto da
diferena
| | d.m.s Concluso
P vs M |8 8| = 0 No Mdias no diferem
P vs F |8 7| = 1 No Mdias no diferem
P vs Q |8 5| = 3 Sim Mdias diferem
M vs F |8 7| = 1 No Mdias no diferem
M vs Q |8 5| = 3 Sim Mdias diferem
F vs Q |7 5| = 2 Sim Mdias diferem
P Portugus; M Matemtica; F Fsica; Q Qumica.
Passo 3 Concluso:
Entre as mdias analisadas, conclui-se que ocorreram diferenas estatis-
ticamente significativas somente entre as notas de Portugus e Qumica,
Matemtica e Qumica, e Fsica e Qumica. As demais combinaes de m-
dia no diferiram entre si.
Tukey para amostras de tamanhos diferentes
Para amostras com tamanhos diferentes, o teste de Tukey realizado
comparando-se o valor de q
calc
com o valor crtico tabelado q
;k;glresduo
, para
cada uma das diferena entre as mdias analisadas. O valor q
calc
obtido pela
seguinte frmula:



q
x x
EP
EP
QMR
n n
calc
A B
A B
=

= +

| |
, onde:
2
1 1

BIOESTATISTICA_VOL02.indb 218 25/06/12 17:22


ANLISE DE VARINCIA 219
Sendo: e
A B
x x

= As mdias das duas amostras que esto sendo
comparadas.
EP = Erro padro de cada diferena entre as mdias.
QMR = Quadrado mdio da variao dentro dos grupos (variao
residual) obtido na anlise de varincia.
Aps calcular os valores para o erro padro (EP) e para o q
calc
, deve-se
construir uma tabela de comparao entre as mdias, conforme demonstrado
na Tabela 19.8. Assim, de acordo com o teste Tukey, para que qualquer diferena
entre elas seja considerada estatisticamente significativa, necessrio que o
valor de q
calc
seja maior que o valor tabelado de q
;k;glresduo
. O exemplo, a seguir,
mostra uma anlise de varincia com grupos de tamanhos desiguais, seguida
da aplicao do teste Tukey.

Exemplo: Um estudo foi conduzido para avaliar o efeito de trs diferentes
programas de treinamento na reduo da massa corporal de pacientes com
sobrepeso, frequentadores de uma academia especializada. Para tal experi-
mento, trs grupos de pacientes foram aleatoriamente selecionados. Para cada
grupo, o programa foi ministrado durante um perodo de 30 dias. Os dados
relativos perda de peso, em kg, esto expressos na Tabela 19.6, abaixo.
Tabela 19.6 Valores da perda de peso, em kg, de pacientes submetidos
a trs diferentes programas de treinamento
Pacientes
Programas de treinamento
A1 B2 C3
01 8 7 12
02 10 8 10
03 7 8 9
04 9 7 11
05 8 8 9
06 10 6 --
n 6 6 5
Total 52 44 51
x 8,66 7,33 10,20
BIOESTATISTICA_VOL02.indb 219 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 220
A anlise de varincia mostrou que existe diferena estatisticamente
significativa entre as mdias dos valores das perdas de peso dos programas
comparados no experimento, isto , que ao menos uma das mdias difere
significativamente das demais. Os resultados da ANOVA esto relacionados na
Tabela 19.7, abaixo.
Tabela 19.7 Anlise de varincia dos dados da Tabela 19.6
Fonte de variao gl SQ QM (s
2
) Fcalc
Entre os grupos
(tratamentos)
2 22,416 11,208
8,98
P = 0,0034
Dentro dos grupos
(variao residual)
14 17,467 1,248
16 39,883
Passo 1 Calcular o valor crtico do teste:
q
0 05 314
3 702
, ; ;
, =


Passo 2 Determinar os valores para q
calc
:



q
x x
QMR
n n
calcA B
A B
A B
1 2
1 2
1 2
2
1 1
8 66
=

+

=

| |
| , 77 33
1 248
2
1
6
1
6
1 330
0 456
2 916
, |
,
,
,
,
+

= =
q
x x
QMR
n n
calcA C
A C
A C
1 3
1 3
1 3
2
1 1
8 66
=

+

=

| |
| , 110 20
1 248
2
1
6
1
6
1 540
0 456
3 377
, |
,
,
,
,
+

= =
q
x x
QMR
n n
calcB C
B C
B C
2 3
2 3
2 3
2
1 1
7 33
=

+

=

| |
| , 110 20
1 248
2
1
6
1
5
2 870
0 478
6 004
, |
,
,
,
,
+

= =
BIOESTATISTICA_VOL02.indb 220 25/06/12 17:22
ANLISE DE VARINCIA 221
Passo 3 Construir a tabela de comparao:
Tabela 19.8 Comparao entre as mdias pelo teste Tukey
Grupos comparados
| x x
A B


|
| q
calc
| q
0,05;3;14
Concluso
A1 vs B2 1,330 2,916 < 3,702 Mdias no diferem
A1 vs C3 1,540 3,377 < 3,702 Mdias no diferem
B2 vs C3 2,870 6,004 > 3,702 Mdias diferem
Passo 4 Concluso:
Ocorreu diferena estatisticamente significativa somente entre os progra-
mas B2 e C3.
Intervalo de confana para a mdia
Com o teste Tukey, tambm pode ser calculado o intervalo de confiana para
a mdia de um dos tratamentos participantes da ANOVA. A frmula dada por:

IC x t
QMR
n
i
95
1
%
;
=
glresduo
Para o grupo A1, o intervalo de confiana para a estimativa da perda de
peso calculada da seguinte maneira:

IC
IC
95 8 66 2 145
1 248
6
95 8 66 2 145 0 4
% , ,
,
% , ( , )( ,
=
= 556
95 8 66 0 98
)
% , , IC =
IC95 0 98 7 68 % , , = = 8,66 (limite inferior)
8,66 (limite superior) = + =
=
0 98 9 64
95 7
, .
% IC ,, , 68 9 64
1
kg kg < <
A
BIOESTATISTICA_VOL02.indb 221 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 222
19.4.2 Teste de Student-Newman-Keuls (SNK)
O teste SNK corresponde a um outro tipo de anlise de comparao post
hoc derivada do trabalho de William Gosset (1927), Newman (1939) e Keuls
(1952). O modelo, que tambm baseado no teste de significncia entre as
mdias tomadas duas a duas, semelhante ao teste Tukey, exceto pelo valor
crtico, que depende no do nmero de grupos (k) envolvidos no experimento,
mas do nmero de mdias (k

) do experimento includas na amplitude entre as


duas mdias que esto sendo testadas. Por exemplo, no caso de quatro mdias
sendo testadas, quando se compara a maior com a menor das quatro mdias,
k = 4; quando se compara a segunda maior mdia com a menor delas, k = 3, e
assim, sucessivamente. Ento o valor crtico dado por:
q
k glresduo ; ;
'
.
Para o exemplo mostrado na Tabela 19.6, os valores crticos de
q
k glresduo ; ;
'

so determinados da seguinte maneira:
C3 vs B2: k

= 3 e
q
0 05 314
3 702
, ; ;
, =
(amplitude entre 10,20 e 7,33 contm as
mdias 10,20; 8,66 e 7,33).
C3 vs A1: k

= 2 e
q
0 05 214
3 033
, ; ;
, =
(amplitude entre 10,20 e 8,66 contm as
mdias 10,20 e 8,66).
A1 vs B2: k

= 2 e
q
0 05 214
3 033
, ; ;
, =
(amplitude entre 8,66 e 7,33 contm as
mdias 8,66 e 7,33).
Assim, o primeiro passo proceder anlise de varincia (teste F), com
o objetivo de verificar se as amostras foram retiradas da mesma populao.
Caso o teste F fornea um valor estatisticamente significante, o prximo passo
dispor as mdias em ordem crescentes de seus valores e calcular o valor q
SNKcalc

de acordo com a frmula a seguir:
q
x x
QMR
n n
A B
A B
SNKcalc
=

+

2
1 1
Sendo:
x x
A B
e
= As mdias das duas amostras que esto sendo
comparadas.
BIOESTATISTICA_VOL02.indb 222 25/06/12 17:22
ANLISE DE VARINCIA 223
QMR = Quadrado mdio da variao dentro dos grupos (variao
residual) obtido na anlise de varincia.
Aps calcular os valores para o q
calc
, deve-se construir uma tabela de
comparao entre as mdias, conforme demonstrado na Tabela 19.9. Assim, de
acordo com o teste Student-Newman-Keuls, para que qualquer diferena entre
elas seja considerada estatisticamente significativa, necessrio que o valor de
q
calc
seja maior que o valor tabelado de q
;k;glresduo
.
Tabela 19.9 Comparao entre as mdias pelo teste de Student-Newman-Keuls
Grupos comparados x x
A B
q
SNKcalc
q
tabelado
Concluso
C3 vs B2 2,870 6,004 > 3,702 Mdias diferem
C3 vs A1 1,540 3,377 > 3,033 Mdias diferem
A1 vs B2 1,330 2,916 < 3,033 Mdias no diferem
Note que o teste de Student-Newman-Keuls e o teste Tukey utilizam o
mesmo valor crtico para a primeira comparao entre as mdias. De outro
modo, o teste Tukey utiliza o mesmo valor crtico para todas as demais compa-
raes, enquanto que o teste de Student-Newman-Keuls reduz o tamanho do
valor crtico conforme o nmero de mdias contidas na amplitude das mdias
ento comparadas. Isto justificado pelo fato de que algumas diferenas
avaliadas no teste so consideradas como se fosse uma nica diferena entre
duas mdias, quando, na realidade, envolve trs ou mais mdias e, portanto,
trs ou mais diferenas. Como resultado, para alguns autores, o teste SNK
mais robusto que o teste Tukey.
Assim, comparando-se os resultados dos dois testes aplicados ao mesmo
exemplo mostrado na Tabela 19,6, verifica-se que o teste Tukey considerou apenas
uma comparao estatisticamente significante entre as mdias analisadas (C3 vs
B2), ao passo que o teste de Student-Newman-Keuls encontrou duas diferenas
(C3 vs B2 e C3 vs A1). Outro ponto importante a ser considerado que, se no existe
diferena estatisticamente significativa entre duas mdias, conclui-se, portanto,
que tambm no h diferena entre as mdias compreendidas entre elas.
BIOESTATISTICA_VOL02.indb 223 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 224
19.4.3 Teste de Bonferroni
Tambm chamado de teste de comparaes mltiplas de Dunn, o procedi-
mento de Bonferroni
4
pode ser utilizado para mltiplas comparaes entre todas
as mdias do experimento, assim como para comparaes das mdias experi-
mentais contra um grupo controle, se este existir. Neste caso, a nica diferena
que o nmero de comparaes k menor, porque elas so realizadas somente
contra o grupo controle. Por exemplo, para o estudo mostrado na Tabela 19.6,
supondo-se que o grupo A1 o grupo controle, se as comparaes forem feitas
somente contra ele, o valor de k ser igual a 2. Assim, como condio, neces-
srio que a escolha das comparaes a serem realizadas seja feita antes da
realizao inicial do teste F, sendo, por este motivo, o procedimento proposto
por Bonferroni, considerado um teste de comparaes a priori ou planejadas.
O teste consiste em corrigir o nvel de significncia , de modo a manter a
taxa total de erro igual ou abaixo do valor previamente estipulado para o estudo;
no caso do exemplo dado, em 5%. O valor
Bonf
corrigido pela seguinte frmula:
Por sua vez, para o caso das comparaes mltiplas realizadas aps o
teste F, o procedimento consiste e calcular o valor de t
Bonf
para cada uma das
diferenas entre as mdias comparadas, o qual dado pela seguinte frmula:
t
x x
QMR
n n
Bonf
A B
A B
=

+

1 1
Aps calcular os valores de t
Bonf
, cada valor deve ser comparado com o
valor t crtico tabelado, para um alfa corrigido de Bonferroni (
Bonf
) e com os
4 Carlo Emilio Bonferroni (1892-1960) Matemtico italiano conhecido pelos seus trabalhos
sobre teorias das probabilidades.


Bonf
k
onde = , : - Nvel de significncia preestabelecido para
o experimento.
k - Nmero de comparaes que sero realiza-
das no experimento.
BIOESTATISTICA_VOL02.indb 224 25/06/12 17:22
ANLISE DE VARINCIA 225
graus de liberdade do resduo (variao dentro dos grupos) da tabela ANOVA
(t
Bonf;glresduo
). A seguir, deve-se construir uma tabela de comparao entre as
mdias, conforme demonstrado na Tabela 19.10. Assim, de acordo com o teste
de Bonferroni, para que qualquer diferena entre elas seja considerada estatis-
ticamente significativa, necessrio que o valor de t
Bonf
seja maior que o valor
crtico tabelado de t
Bonf;glresduo
.
Para o caso do exemplo mostrado na Tabela 19.6 e para um nvel alfa de
5%, se considerarmos todas as possveis comparaes, o qual ser comparado
com os demais grupos, o valor de
Bonf
dado por:

Bonf
= =
0 05
3
0 0167
,
,
Verificando a tabela da distribuio t de Student, para um teste bicaudal, o
valor mais prximo de 0,0167 0,02. Ento o valor crtico a ser utilizado nas
comparaes mltiplas t
0,02;14
= 2,624. A Tabela 19.19 mostra os resultados
das comparaes entre os grupos estudados.
Tabela 19.10 Comparao entre as mdias pelo teste de Bonferroni
Grupos comparados x x
A B
t
Bonf
t
0,02;14
Concluso
A1 vs B2 1,330 2,062 < 2,624 Mdias no diferem
A1 vs C3 1,540 2,278 < 2,624 Mdias no diferem
B2 vs C3 2,87 4,245 > 2,624 Mdias diferem

19.5 ANOVA DE MLTIPLOS CRITRIOS
Como referido anteriormente, na ANOVA de mltiplos critrios, a
variao total observada no experimento atribuda variao natural entre
os diferentes tratamentos (entre os grupos), entre os sujeitos das amostras
(dentro dos grupos ou variao residual) e entre os blocos. Portanto, como
dois fatores so analisados neste tipo de estudo, no caso, as duas variveis
BIOESTATISTICA_VOL02.indb 225 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 226
independentes, sendo cada uma delas medida em diferentes blocos, o modelo
chamado de delineamento em blocos casualizados, cuja anlise a ANOVA de
dois critrios (two way ANOVA).
Assim, tal como para a ANOVA de um critrio, demonstraremos apenas a
aplicao das frmulas alternativas, as quais esto relacionadas na Tabela 19.11,
tambm denominada tabela de anlise de varincia, cujo objetivo mostrar o
modelo geral de um experimento em blocos casualizados. Esta tabela utilizada
pela maioria dos programas computacionais estatsticos tradicionais.
Tabela 19.11 Modelo geral de tabela de anlise de varincia contendo as frmulas alternativas
para delineamentos em blocos casualizados
Fontes de
variao
Graus de liberdade
(gl)
Soma dos quadrados
(SQ)
Varincia
(s
2
)
Razo F
Entre os grupos
(tratamentos)
gl k
T
= 1
SQ
x
b
C
T
=
( )


2
s
SQ
k
T
T 2
1
=

F
s
s
calcT
T
R
=
2
2
(Trat.)
(Res.)
Entre os blocos gl b
B
= 1
SQ
T
k
C
B
B
=
( )

2
s
SQ
b
B
B 2
1
=

F
s Bloc
s s
calcB
B
R
=
2
2
( .)
(Re .)
Variao residual gl gl gl gl
R Tot T B
= SQ SQ SQ SQ
R Tot T B
= s
SQ
gl
R
R
R
2
=
Total gl kb
Tot
= ( ) 1 SQ x C
Tot
=

2
Fator de correo C
x
kb
=
( )
2 k Nmero de amostras (tratamentos) do
estudo
b Nmero de blocos do estudo
O raciocnio o mesmo utilizado para a ANOVA de um critrio. Inicialmente,
calcula-se o valor para a razo F
calcT ,
o qual ser comparado com o valor crtico
tabelado F
gl gl
T R
; ;
, de modo que se possa verificar se existe alguma diferena
estatisticamente significativa entre os diferentes tratamentos (amostras).
Assim, se

F F
calcT gl gl
T R
>
; ;
, conclui-se que existe ao menos uma diferena signi-
ficativa, sendo a determinao da significncia entre os tratamentos, tomados
dois a dois, verificada pela aplicao de um teste de comparaes mltiplas
do tipo Tukey, Student-Newman-Keuls ou Bonferroni. Caso contrrio, se
F F
calcT gl gl
T R
<
; ;
, no h necessidade de se aplicar nenhum teste de comparaes
mltiplas, pois no existem diferenas significativas entre os tratamentos. Do
BIOESTATISTICA_VOL02.indb 226 25/06/12 17:22
ANLISE DE VARINCIA 227
mesmo modo, para a comparao entre os blocos, o raciocnio idntico quele
empregado para os tratamentos.
A seguir, para ilustrar um modelo de aplicao da ANOVA de dois critrios,
utilizaremos uma variante do exemplo mostrado para a ANOVA de um critrio.
Exemplo: Em uma determinada cidade, com o objetivo de avaliar o padro
do ensino das escolas de ensino mdio, compararam-se as mdias obtidas nas
disciplinas Portugus, Matemtica, Fsica e Qumica (tratamentos), segundo
a categoria da escola de origem do aluno, seja ela federal, estadual, municipal
ou particular (blocos). Os dados esto relacionados na Tabela 19.11. Existe
diferena estatisticamente significante entre os aproveitamentos dos alunos
em relao s disciplinas cursadas? Existe diferena no padro de ensino
conforme a categoria da escola? Considerar nvel de significncia de 5%.
Tabela 19.12 Anlise da varincia para comparar as mdias das notas das disciplinas
(tratamentos) conforme o tipo de escola (blocos)

Mdias nas disciplinas
Total do bloco (TB)
Portugus Matemtica Fsica Qumica
Tipo de escola
Federal 6 9 9 6 30
Estadual 9 8 6 5 28
Municipal 9 7 7 4 27
Particular 8 8 6 5 27
Totais (x) 32 32 28 20 112
Mdias ( x )
8 8 7 5
x
2
262 258 202 102 824
Passo 1 Formular as hipteses estatsticas:
H
0
: No existe diferena entre as mdias das notas das disciplinas analisa-
das, pois

P M F Q
= = =
.
H
A
: Ao menos uma das mdias difere das demais, sendo

P M P F
ou

ou ou ou ou
P Q M F M Q F Q

.
H
0
: A categoria da escola no interfere na mdia da disciplina analisada.
H
A
: A categoria da escola interfere na mdia da disciplina analisada.
BIOESTATISTICA_VOL02.indb 227 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 228
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%) unilateral
Passo 3 Determinar o valor crtico do teste F:
gl do numerador (tratamentos) -
gl k
T
= = = 1 4 1 3
gl do numerador (blocos) -
gl b
B
= = = 1 4 1 3
gl do total -
gl kb
Tot
= = = ( ) ( ) 1 4 4 1 15 x

gl do denominador (resduo) -
gl gl gl gl
R Tot T B
= = = 15 3 3 9
Ento:
Valor crtico para comparao entre os tratamentos = F F
gl gl
T R
; ; , ; ;
, = =
0 05 3 9
3 86
Valor crtico para comparao entre os blocos =
F F
gl gl
B R
; ; , ; ;
, = =
0 05 3 9
3 86
Passo 4 Calcular o valor do fator de correo C:

C
x
kb
=
( )
= = =

2
2
112
16
12 544
16
784
.
Passo 5 Calcular o valor do teste F:







SQ x C
Tot
= = =

2
824 784 40
SQ
x
b
C
T
=
( )
=
+ + +
= =

2
2 2 2 2
32 32 28 20
4
784 808 784 24
s
SQ
k
T
T
2
1
24
3
8 =

= =
SQ
T
k
C
B
B
=
( )
=
+ + +
= =

2
2 2 2 2
30 28 27 27
4
784 785 50 784 1 , ,,50
s
SQ
b
B
B
2
1
1 50
3
0 50 =

= =
,
,
SQ SQ SQ SQ
R Tot T B
= = = 40 24 1 50 14 50 , ,
BIOESTATISTICA_VOL02.indb 228 25/06/12 17:22
ANLISE DE VARINCIA 229
s
SQ
gl
R
R
R
2
14 50
9
1 61 = = =
,
,
F
s
s
calcT
T
R
= = =
2
2
8
1 61
4 96
Tratamentos
Resduo
,
, F
s
s
calcB
B
R
= = =
2
2
0 5
1 61
0 31
Blocos
Resduo
,
,
, e
Tabela 19.13 Anlise de varincia para os dados da Tabela 19.12
Fonte de variao gl SQ QM (s
2
) Fcalc
Entre os grupos
(tratamentos)
3 24 8
F
calcT
= 4 96 ,
P = 0,026
Entre os blocos 3 1,5 0,5
F
calcB
=0 31 ,
P = 0,818
Dentro dos grupos
(variao residual)
9 14,5 1,61

Passo 6 Regra de deciso para a comparao entre os tratamentos:

Se , aceita-se
Se
F F H
F
calcT
calcT
<

0 05 3 9 , ; ;
.
0
, rejeita-se
Como =4,69 >
F H
F
calcT
0 05 3 9 , ; ;
.
0
, rejeita-se F H
0 05 3 9
3 86
, ; ;
, . =
0

Passo 7 Regra de deciso para a comparao entre os blocos:

Se , aceita-se
Se
F F H
F
calcB
calcB
<

0 05 3 9 , ; ;
.
0
, rejeita-se
Como =0,31 <
F H
F
calcB
0 05 3 9 , ; ;
.
0
, aceita-se F H
0 05 3 9
3 86
, ; ;
, . =
0

Passo 8 Concluso:
Como o valor para F
calcT
maior que o valor crtico tabelado
F
0 05 3 9 , ; ;
,
rejeita-se H
0
e conclui-se que ao menos uma das mdias difere das de-
mais. Portanto, existe alguma diferena estatisticamente significante entre
BIOESTATISTICA_VOL02.indb 229 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 230
as mdias referentes s disciplinas avaliadas, pois F P
calcT
= = 4 69 0 026 , ; , .
Por outro lado, como o valor de F
calcB
menor que o valor crtico tabelado
F
0 05 3 9 , ; ;
, aceita-se H
0
e se conclui que no ocorreram diferenas estatistica-
mente significativas entre os blocos comparados, demonstrando, portan-
to, que a categoria da escola no influenciou nas mdias dos alunos, pois

F P
calcB
= = 0 31 0 818 , ; , .
Note que, no teste da ANOVA de dois critrios, tambm importante o
processo de randomizao para a distribuio dos tratamentos nas amostras,
mesmo que os pacientes sejam distribudos em grupos homogneos. No
exemplo acima, a seleo das mdias de cada disciplina (tratamentos) foi feita
de modo aleatrio entre todos os participantes de cada bloco, o que permite ao
pesquisador estimar a variao que devida categoria da escola, que pode
ser subtrada da variao residual. Este procedimento diminui o tamanho do
resduo, de modo que reste apenas a variao aleatria entre os indivduos
da pesquisa, a qual no pode ser atribuda nem disciplina avaliada nem
categoria da escola estudada.
Observe, tambm, que a distribuio em blocos melhora a preciso do
experimento, desde que seja interessante verificar se h diferena significativa
entre eles, pois, em muitos casos, os blocos so distribudos conforme uma
diferena j previamente reconhecida entre os indivduos do estudo. Porm,
se o teste F para a comparao entre os blocos no for significativo, isto pode
indicar que as unidades experimentais eram originalmente homogneas entre
si e no houve sucesso em reduzir a variao residual, ou que as amostras so
demasiadamente pequenas para apresentar alguma diferena significativa
entre elas.
BIOESTATISTICA_VOL02.indb 230 25/06/12 17:22
20
Anlise de Varincia
No-Paramtrica
Igualmente como j foi referido nos captulos anteriores, na pesquisa experi-
mental, sempre que os requisitos de normalidade dos dados amostrais forem
violados, para que possa testar suas hipteses, o pesquisador dever buscar uma
alternativa nos modelos no-paramtricos. Do mesmo modo, situao semelhante
ocorre na anlise de varincia, pois, embora o teste F seja bastante robusto,
mesmo para os casos de grandes amostras que no sigam princpio da norma-
lidade, o pesquisador deve sempre considerar o uso da ANOVA no-paramtrica,
especialmente quando estas so pequenas e desviam-se consideravelmente em
relao distribuio normal, assim como quando as varincias so acentuada-
mente desiguais e os tamanhos amostrais so diferentes.
De qualquer forma, tal como para os demais testes no-paramtricos,
na ANOVA no-paramtrica, os testes tomam como base a anlise dos dados
por postos em vez de considerarem os valores originais, de modo que, para a
ANOVA de um critrio, o mtodo no-paramtrico o teste de Kruskal-Wallis,
com as comparaes mltiplas post hoc entre as mdias podendo ser feitas
usando-se o teste da soma de postos de Wilcoxon. Por sua vez, para a ANOVA
de dois critrios em que h interesse em mais de duas amostras relacionadas,
em dois momentos distintos, o mtodo no-paramtrico de escolha o teste de
Friedman. Estes testes sero descritos a seguir.
BIOESTATISTICA_VOL02.indb 231 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 232
20.1 TESTE DE KRUSKAL-WALLIS (TESTE H)
Tambm conhecido como teste H, o teste de Kruskal
1
-Wallis
2
um procedi-
mento estatstico que objetiva comparar trs ou mais amostras independentes,
do mesmo tamanho ou de tamanhos desiguais, cujos escores so mensurados
em nvel ordinal (por postos), sendo, portanto, um substituto no-paramtrico
para a ANOVA de um critrio. Na prtica, o teste uma extenso do teste da
soma de postos de Wilcoxon-Mann-Whitney (WMW) para trs ou mais grupos.
Note, porm, para que o teste possa ser utilizado, necessrio que as trs
ou mais amostras sejam aleatrias e as observaes independentes, tanto dentro
de cada amostra como entre as amostras estudadas, ao mesmo tempo em que
a varivel considerada deve ser mensurada em escala ordinal, isto , que seja
apresentada do menor ao maior valor. Para tal, necessrio que cada valor da
mostra corresponda a um posto (escore ou rank), o qual deve ser representado
por um nmero natural, que indicar sua posio no conjunto de dados amostrais,
quando ordenados. Portanto, o menor valor da amostra receber o posto de
nmero 1, e assim sucessivamente, at que o maior valor receba o posto de maior
nmero. Quando ocorre a presena de valores iguais na amostra, considera-se a
mdia dos postos que seriam ocupados por eles, de tal modo que no afete o posto
seguinte. Tome-se, como exemplo, um conjunto de seis valores j ordenados: {9;
15; 17; 17; 21; 23}. Os respectivos postos sero: {1; 2; 3,5; 3,5; 5; 6}.
Raciocnio do teste
Para ilustrar o raciocnio, consideremos a comparao entre trs amostras
(tratamentos), A, B e C. Se os valores para os indivduos da amostra A forem,
em geral, menores que os valores para os indivduos das amostras B ou C,
quando se ordenam, do menor para o maior, todos os valores das trs amostras
consideradas conjuntamente, os postos ocupados pelos indivduos da amostra
A sero, em geral, menores do que os postos ocupados pelos indivduos das
amostras B e C. Como consequncia, o posto mdio da amostra A ser menor do
1. William Henry Kruskal (1919-2005) - Matemtico e estatstico americano, foi professor
emrito da Universidade de Chicago.
2 Wilson Allen Wallis (1912-1998) - Economista e estatstico americano, foi sub-secretrio de
economia, negcios e agricultura do governo de Ronald Reagan.
BIOESTATISTICA_VOL02.indb 232 25/06/12 17:22
ANLISE DE VARINCIA NO-PARAMTRICA 233
que os postos mdios das amostras B e C. Neste caso, se a diferena encontrada
for grande o suficiente para que possa ser explicada alm do que se esperaria
encontrar somente pelo acaso, a diferena entre os trs postos mdios dita
estatisticamente significativa, indicando que a populao A diferente das
populaes B e C. O mesmo princpio aplicado para as amostras B e C, isto , o
teste verifica se ao menos uma das amostras difere das demais.
O teste envolve o clculo de um valor estatstico chamado de valor H, cuja
distribuio testada contra a hiptese de nulidade. No caso de pequenas
amostras (n < 6) e para experimentos onde o nmero de grupos (k) pequeno,
a significncia estatstica verificada com a utilizao da tabela de valores
crticos da distribuio H de Kruskal-Wallis (ver tabela no final do livro), a
qual fornece os valores crticos para
H
n n n
i
; ; ;...
1 2
. Mas, para grandes amostras
ou quando mais de cinco grupos (k > 5) so comparados, a estatstica H tem
uma boa aproximao com a distribuio qui-quadrado (
2
), sendo, neste
caso, o valor H
calc
comparado com o valor crtico tabelado

a gl ;
2
com (k 1)
graus de liberdade. Assim, importante saber que os procedimentos para
a utilizao do teste H de Kruskal-Wallis diferem de acordo com o tamanho
amostral, todos facilmente calculados e que sero mostrados a seguir:
Inicialmente, ordenam-se, do menor para o maior, os valores das amostras
e anota-se, ao lado de cada valor, o nmero de ordem (ou posto) corres-
pondente. No esquea que, se houver empate, o posto para cada valor
empatado corresponde mdia dos postos que seriam ocupados por eles;
A seguir, determinam-se os tamanhos amostrais, os quais so designados
por n
1
, n
2
, n
3
,..., n
i
;
Obtm-se os valores para R
1
, R
2
, R
3
,..., R
i
, que correspondem s somas dos
postos para as amostras 1, 2, 3, ...k
i
, respectivamente. Se a ordenao estiver
correta, teremos:
R
N N
para N n
i
=
+
=

( )
;
1
2
1

Em seguida, calcula-se o valor do teste (H
calc
). A frmula mostrada a
seguir:
BIOESTATISTICA_VOL02.indb 233 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 234

H
N N
R
n
N
calc
i
i
=
+
+

12
1
3 1
2
( )
( ), onde: N = n
i
n
i
- Tamanho de cada amostra.
R
i
- Soma dos postos de cada
amostra.
Se ocorrerem empates nos postos, o valor de H
calc
dever ser corrigido pelo
fator de correo (FC) conforme a frmula abaixo:
FC
CE
N N
CE t t =

1
3
3
; onde: ( )
Sendo t o nmero de observaes empatadas em cada posto. Por exemplo:
se hover dois empates com o posto 2,5 e outros quatro empates com o posto
7,5, o clculo para CE ser:
CE = + = ( ) ( ) 2 2 4 4 66
3 3
Ento:
Finalmente, o teste de significncia realizado da seguinte maneira: se o
valor de H
calc
for maior que o valor crtico tabelado H
a n n n
i
; ; ;...
1 2
ou

;gl
2
, a
hiptese nula rejeitada. Caso contrrio, aceita-se a hiptese nula.
Assim temos:
H
0
: os tratamentos no diferem significativamente entre si;
H
1
: ao menos um dos tratamentos difere significativamente dos demais.
Para demonstrar a aplicao do teste Kruskal-Wallis, utilizaremos o
seguinte exemplo:
Exemplo: O teste de Apgar
3
um exame rpido realizado imediatamente
aps o nascimento, cujo objetivo avaliar, ainda na sala de parto, a condio
3. Virginia Apgar (1909-1974) Mdica americana especializada em anestesia peditrica, foi a
fundadora da neonatologia, sendo mais conhecida pela criao do teste de Apgar, um mtodo
revolucionrio de avaliar a sade de recm-nascido, que reduziu drasticamente a mortalidade
infantil em todo o mundo.
H
H
FC
corrig
calc
=
BIOESTATISTICA_VOL02.indb 234 25/06/12 17:22
ANLISE DE VARINCIA NO-PARAMTRICA 235
fsica do recm-nascido. O teste feito pela anlise dos batimentos cardacos,
reflexos, tnus muscular, cor da pele e respirao, os quais recebem nota de 0 a
2, podendo chegar ao mximo de 10, que corresponde criana mais saudvel,
e os valores inferiores a 5 indicam que o recm-nascido necessita de assis-
tncia mdica imediata para se adaptar ao novo ambiente. Um pesquisador,
que queria verificar se a idade materna interfere no teste de Apgar, comparou
os escores obtidos em trs grupos de mulheres, adolescentes (idade < 20 anos),
adultas jovens (idade de 20 a 34 anos) e adultas maduras (idade > 34 anos).
Os escores (j ordenados) so apresentados nas tabelas 20.1 e 20.2, abaixo.
Portanto, existe diferena estatisticamente significativa nos valores do teste de
Apgar entre as crianas nascidas de mes com diferentes faixas etrias?
Tabela 20.1 Ordem, escore do teste de Apgar e o respectivo posto para cada um
dos 17 recm-nascidos includos no estudo.
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Escore 4 5 6 6 6 7 7 7 8 8 8 8 9 9 10 10 10
Posto 1 2 4 7 10,5 13,5 16
Tabela 20.2 - Ordem, escore do teste de Apgar e o respectivo posto para cada um
dos 17 recm-nascidos conforme a idade materna
Idade < 20 anos Idade de 20 a 34 anos Idade > 34 anos
RN Escore Posto RN Escore Posto RN Escore Posto
5 6 4 7 7 7 1 4 1
6 7 7 8 7 7 2 5 2
10 8 10,5 9 8 10,5 3 6 4
11 8 10,5 14 9 13,5 4 6 4
13 9 13,5 16 10 16 12 8 10,5
10 10 16 17 10 16 -- -- --
R
i
61,5 70,0 21,5
n
i
6 6 5
R
R
n
i
i
i
= R
1
10 25 = , R
2
11 66 = , R
3
4 30 = ,
BIOESTATISTICA_VOL02.indb 235 25/06/12 17:22
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 236
Uma vez que, na populao estudada, no existe um padro de distribuio
para o teste de Apgar, e o nmero de indivduos nas trs amostras pequeno,
a melhor maneira de compar-las utilizar um teste no-paramtrico. Neste
caso, o teste Kruskal-Wallis o mais adequado, pois as trs amostras so
independentes e a varivel estudada do tipo ordinal.
Passo 1 Formular as hipteses estatsticas:
H
0
:No existem diferenas entre as mdias dos escores do teste de Apgar
para os grupos analisados, pois

1 2 3
= =
.
H
A
:Ao menos uma das mdias difere das demais, sendo

1 2 1 3
ou

ou
2 3

.
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%) unilateral
Passo 3 Determinar o valor crtico do teste:
H H
n n n ; ; ; , ; ; ;
,
1 2 3
0 05 6 6 5
5 765 = =
Passo 4 Calcular o valor do teste H
calc
:
Sendo R
N N
ento
i
=
+
+ + = =

( )
; ( , , , )
1
2
61 5 70 0 21 5 153
117 17 1
2
( ) +


A ordenao est correta.
Assim: H
calc
=
+
+ +

12
17 17 1
61 5
6
70 0
6
21 5
5
3
2 2 2
( )
, , ,
(1 17 1 6 372 + = ) ,
Como foram observados empates para os escores 6, 7, 8, 9 e 10, necess-
rio realizar a correo para H
calc
.
Passo 5 Calcular o valor do teste H
corrig
:



CE = + + + + = + + + ( ) ( ) ( ) ( ) ( ) 3 3 3 3 4 4 2 2 3 3 24 24 60
3 2 3 3 3
66 24 138 + =
FC =

= = = 1
138
17 17
1
138
4 896
1 0 0282 0 972
3
.
, ,
H
H
FC
corrig
calc
= = =
6 372
0 972
6 556
,
,
,

BIOESTATISTICA_VOL02.indb 236 25/06/12 17:22
ANLISE DE VARINCIA NO-PARAMTRICA 237
Passo 6 Regra de deciso:
Se , aceita-se
Se
H H H
H
corrig
corr
<
0 05 6 6 5 , ; ; ;
.
0
iig
corrig
H H
H
, rejeita-se
Como =

0 05 6 6 5 , ; ; ;
.
0
6,556 > , rejeita-se H H
0 05 6 6 5
5 765
, ; ; ;
, . =
0

Passo 7 Concluso:
Como o valor para
H
corrig
maior que o valor crtico tabelado
H
0 05 6 6 5 , ; ; ;
,
rejeita-se H
0
e conclui-se que ao menos uma das mdias difere das demais.
Portanto, existe alguma diferena estatisticamente significativa entre as
mdias dos testes de Apgar de crianas nascidas de mes com diferentes
faixas etrias, pois
H P
corrig
= = 6 556 0 037 , ; ,
.
Assim, como j anteriormente explicado, quando o resultado do teste H no
estatisticamente significante, nenhum outro teste adicional necessrio, uma
vez que se estima que todas as mdias sejam estatisticamente semelhantes e,
portanto, foram retiradas da mesma populao. Isto , elas estimam a mesma
mdia . No entanto, quando ocorre uma diferena significativa entre as
mdias amostrais, o teste H no indica quais destas mdias so estatistica-
mente diferentes entre si. Neste caso, para que se possam determinar quais
so diferentes, deve-se passar para a segunda fase da ANOVA no-paramtrica,
na qual se aplica um dos testes de comparaes mltiplas disponveis, sendo o
teste de Dunn o mais utilizado e que ser mostrado a seguir.
20.1.1 Teste de Dunn (Teste Q)
O teste de Dunn um procedimento no-paramtrico post hoc, que
corresponde ao teste de comparaes mltiplas de Tukey utilizado na ANOVA
paramtrica (Teste F). O raciocnio do teste semelhante e baseia-se na compa-
rao entre os postos mdios ( R
i
) obtidos para cada amostra (tratamento).
O teste de Dunn realizado comparando-se o valor de Q
calc
para cada uma
das diferenas entre os postos mdios ( R
i
) analisados, com o valor crtico
tabelado Q
;k
obtido na tabela de valores crticos da distribuio Q (ver tabela
no final do livro). O valor Q
calc
obtido pela seguinte frmula:
BIOESTATISTICA_VOL02.indb 237 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 238


Q
R R
EP
EP
N N
n n
calc
A B
A B
=

=
+
+

,
( )
onde:
1
12
1 1

Sendo:
R R
A B
e

= Os postos mdios das duas amostras que esto sendo
comparadas.
EP = Erro padro de cada diferena entre os postos mdios que
esto sendo comparados.
N = n
i
n
A
e n
B
= Tamanho das duas amostras que esto sendo comparadas.
Se ocorrerem empates, o EP deve ser corrigido pela seguinte frmula:
EP
N N CE
N n n
A B
=
+

( )
( )
,
1
12 12 1
1 1
oonde: CE t t =

( )
3
Aps calcular os valores para o erro padro (EP) e para o Q
calc
, deve-se
construir uma tabela de comparao entre os postos mdios, conforme
demonstrado na Tabela 20.3. Assim, de acordo com o teste de Dunn, para que
qualquer diferena entre eles seja considerada estatisticamente significativa,
necessrio que o valor de Q
calc
seja maior que o valor tabelado de Q
;k
. Assim,
para o exemplo mostrado na Tabela 20.2, os testes de significncia entre os
postos mdios so mostrados abaixo:
Passo 1 Calcular o valor crtico do teste:

Q
0 05 3
2 394
, ;
, =

Passo 2 Determinar os valores para Q
calc
:


Q
R R
N N CE
N n n
calc1 2
1 2
1 2
1
12 12 1
1 1
;
( )
( )
=

+

=

+

| , , |
( )
(
10 25 11 66
17 17 1
12
138
12 117 1
1
6
1
6
1 410
2 874
0 490

= =
)
,
,
,
BIOESTATISTICA_VOL02.indb 238 25/06/12 17:23
ANLISE DE VARINCIA NO-PARAMTRICA 239
Q
R R
N N CE
N n n
calc1 3
1 3
1 3
1
12 12 1
1 1
;
( )
( )
=

+

=

+

| , , |
( )
(
10 25 4 30
17 17 1
12
138
12 177 1
1
6
1
5
5 950
3 014
1 974

= =
)
,
,
,
Q
R R
N N CE
N n n
calc2 3
2 3
2 3
1
12 12 1
1 1
;
( )
( )
=

+

=

+

| , , |
( )
(
11 66 4 30
17 17 1
12
138
12 177 1
1
6
1
5
7 360
3 014
2 442

= =
)
,
,
,
Passo 3 Construir a tabela de comparao:
Tabela 20.3 Comparao entre as mdias pelo teste de Dunn
Grupos etrios
comparados
| R R
A B
e | Q
calc
Q
0,05;3
Concluso
< 20 vs 20 a 34 1,410 0,490 < 2,394 Mdias no diferem
< 20 vs > 34 5,950 1,974 < 2,394 Mdias no diferem
20 a 34 vs > 34 7,360 2,442 > 2,394 Mdias diferem
Passo 4 Concluso:
Ocorreu diferena estatisticamente significativa somente entre os recm-
-nascidos dos grupos de mes com idade de 20 a 34 anos e idade > 34 anos.
Observe, tambm, que os valores do teste de Agar foram, em mdia,
maiores para os recm-nascidos de mes com idade compreendida de 20 a 34
BIOESTATISTICA_VOL02.indb 239 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 240
anos e menores para os recm-nascidos de mes com idade maior de 34 anos.
Porm, para os valores dos recm-nascidos de mes com idade menor de 20
anos, o resultado do teste de Dunn foi inconclusivo, provavelmente em razo
do pequeno tamanho amostral utilizado na pesquisa.
20.2 TESTE DE FRIEDMAN (TESTE

r
2
)
O teste Friedman
4
corresponde a um modelo de teste estatstico
no-paramtrico utilizado como uma alternativa para a ANOVA de dois critrios.
Os dados devem ser mensurados em nvel ordinal, e a comparao feita entre
trs ou mais amostras (tratamentos) relacionadas ou dependentes, cujos
valores so distribudos por blocos. Na prtica, comparam-se os k tratamentos
em que so formados b blocos, com a finalidade de que ocorra um pareamento
entre as diferentes amostras. As amostras devem ter o mesmo tamanho, e os
dados devem ser dispostos em linhas, que representam os blocos, e em colunas,
que representam as condies experimentais ou tratamentos.
A realizao do modelo de Friedman semelhante aos demais testes
no-paramtricos:
Inicialmente, atribui-se o nmero de ordem (posto), de modo crescente,
para os valores dentro de cada bloco (linhas). No esquea que, se houver
empate, o posto para cada valor empatado corresponde mdia dos postos
que seriam ocupados por eles;
Posteriormente, obtm-se os valores para R
1
, R
2
, R
3
,..., R
i
, que corres-
pondem s somas dos postos dentro de cada tratamento (colunas);
Em seguida, calcula-se o valor do teste

r
2
. A frmula mostrada abaixo:


r i
i
k
b k k
R b k onde
2 2
1
12
1
3 1 =
+
+
=

. ( )
. ( ), : b - Nmero de blocos.
k Nmero de tratamentos.
R
i
- Soma dos postos de cada
amostra.
4. Milton Friedman (1912-2006) Economista e estatstico americano ganhador do prmio
Nobel de Economia em 1976.
BIOESTATISTICA_VOL02.indb 240 25/06/12 17:23
ANLISE DE VARINCIA NO-PARAMTRICA 241
Se ocorrerem empates nos postos, o valor de

r
2
dever ser corrigido
pelo fator de correo (FC) conforme a frmula abaixo. A nica diferena que
a ordenao se faz separadamente dentro de cada bloco.
FC
CE
b k k
onde CE t t =

1
3
3
( )
; : ( )
Sendo t o nmero de observaes empatadas em cada posto, dentro de
cada bloco. Por exemplo: se no bloco 1, houver dois empates com o posto 1,5 e,
no bloco 2, 3, empates com o posto 2, o clculo para CE ser:
CE = + = ( ) ( ) 2 2 3 3 30
3 3
Ento:

r corrig
r
FC
2
2
=
Finalmente, o teste de significncia realizado da seguinte maneira: no
caso de pequenas amostras, isto , k 6 e b 15
5
, a significncia estatstica
verificada com a utilizao da tabela de valores crticos da distribuio

r
2

de Friedman (ver tabela no final do livro), a qual fornece os valores crticos
para

r k b ; ;
2
. Mas, para grandes amostras (k > 6 ou b > 15), a estatstica

r
2

tem uma boa aproximao com a distribuio qui-quadrado (
2
), sendo, neste
caso, o valor

rcalc
2
comparado com o valor crtico tabelado

r k ;( - ) 1
2
com
(k 1) graus de liberdade. Assim, se o valor de

rcalc
2
for maior que o valor
crtico tabelado

r k b ; ;
2

ou

r k ;( - ) 1
2
, a hiptese nula rejeitada. Caso contrrio,
aceita-se a hiptese nula. Assim, temos:
H
0
: os tratamentos no diferem significativamente entre si;
H
1
: ao menos um dos tratamentos difere significativamente dos demais.
Para demonstrar a aplicao do teste de Friedman, utilizaremos o seguinte
exemplo:
5. A tabela da distribuio de Friedman contm apenas valores crticos at k = 6 e b = 15.
BIOESTATISTICA_VOL02.indb 241 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 242
Exemplo: Um estudo simples-cego foi delineado para avaliar o sabor e
aroma de quatro variedades de caf (Coffea sp). Para tal experimento, cinco
baristas
6
foram selecionados, e cada um deles deveria atribuir um escore de
zero a dez pontos, conforme a preferncia individual. Os resultados esto
relacionados na Tabela 20.4. A anlise dos baristas foi influenciada pela
variedade do caf?
Tabela 20.4 Valores dos escores, e respectivos postos, atribudos a quatro variedades de caf,
conforme a preferncia individual de cada um dos cinco baristas selecionados para o estudo
Barista
Cramer Bourbon Caturra Robusta
Escore Posto Escore Posto Escore Posto Escore Posto
01 4 1 5 2 7 3 8 4
02 6 1,5 6 1,5 7 3 8 4
03 7 2 6 1 8 3 9 4
04 8 1,5 8 1,5 9 3,5 9 3,5
05 8 1 9 2 10 3,5 10 3,5
R
i
R
1
= 7 R
2
= 8 R
3
= 16 R
4
= 19

Uma vez que, na populao estudada, no existe um padro de distribuio
para a anlise sensorial avaliada e o nmero de observaes nas amostras
pequeno, a melhor maneira de compar-las utilizar um teste no-paramtrico.
Neste caso, o teste de Friedman o mais adequado, pois as quatro amostras so
relacionadas, e a varivel estudada do tipo ordinal.
Passo 1 Formular as hipteses estatsticas:
H
0
: No existem diferenas entre as mdias dos escores para as espcies de
caf analisadas, pois

1 2 3 4
= = =
.
H
A
: Ao menos uma das mdias difere das demais, sendo

1 2 1 3
ou

ou ou ou ou
1 4 2 3 2 4 3 4

.
6. Barista - Profissional especializado em cafs, cuja principal funo conhecer todas as fases
da vida do produto, desde o cultivo da planta, etapas de processamento e beneficiamento do
gro, alm dos detalhes dos processos de extrao da bebida.
BIOESTATISTICA_VOL02.indb 242 25/06/12 17:23
ANLISE DE VARINCIA NO-PARAMTRICA 243
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%) unilateral
Passo 3 Determinar o valor crtico do teste:

r k b
H
; ; , ; ;
,
2
0 05 4 5
7 800 = =
Passo 4 Calcular o valor do teste

rcalc
2
:

rcalc
2 2 2 2 2
12
5 4 4 1
7 8 16 19 3 5 4 1 87 6 =
+
+ + +
( )
+ =
. ( )
. ( ) , 00 75 00 12 600 = , ,
Como foram observados empates nos blocos 2, 4 e 5, necessrio realizar
a correo para

rcalc
2
.
Passo 5 Calcular o valor do teste

rcorrig
2
:
Bloco 1 - 2 postos empatados em 1,5 (2
3
2)
Bloco 4 - 2 postos empatados em 1,5 (2
3
2)
2 postos empatados em 3,5 (2
3
2)
Bloco 5 - 2 postos empatados em 3,5 (2
3
2)


CE = + + + = ( ) ( ) ( ) ( ) 2 2 2 2 2 2 2 2 24
3 2 3 3
FC =

= = = 1
24
5 4 4
1
24
300
1 0 080 0 920
3
( )
, ,


rcorrig
rcalc
FC
2
2
12 600
0 920
13 695 = = =
,
,
,

Passo 6 Regra de deciso:
Se aceita se H
Se
rcorrig r
rc

2
0 05 4 5
2
0
<
, ; ;
, - .
oorrig r
rcor
rejeita se H
Como
2
0 05 4 5
2
0

, ; ;
, - .
rrig r
rejeita se
2
0 05 4 5
2
13 695 7 800 = > = , , , -
, ; ;
HH
0
.
BIOESTATISTICA_VOL02.indb 243 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 244
Passo 7 Concluso:
Como o valor para

rcorrig
2
maior que o valor crtico tabelado

r0 05 4 5
2
, ; ;
,
rejeita-se H
0
e se conclui que ao menos uma das mdias difere das
demais. Portanto, existe alguma diferena estatisticamente signifi-
cativa entre as avaliaes dos baristas e o tipo de caf analisado, pois

rcorrig
P
2
13 695 0 005 = = , ; ,
.
Assim, como j anteriormente explicado, quando o resultado do teste

r
2

no estatisticamente significante, nenhum outro teste adicional neces-
srio, uma vez que se estima que todas as mdias sejam estatisticamente
semelhantes e, portanto, foram retiradas da mesma populao. Isto , elas
estimam a mesma mdia . No entanto, quando ocorre uma diferena signifi-
cativa entre as mdias amostrais, o teste

r
2
no indica quais destas mdias so
estatisticamente diferentes entre si. Neste caso, para que se possam deter-
minar quais so diferentes, deve-se passar para a segunda fase da ANOVA
no-paramtrica, na qual se aplica um dos testes de comparaes mltiplas
disponveis em estatstica.
BIOESTATISTICA_VOL02.indb 244 25/06/12 17:23
21
Regresso Mltipla
Neste captulo, abordaremos dois modelos de anlise de regresso: a
anlise de regresso mltipla e a regresso logstica, todos muito utilizados
em pesquisa na rea das cincias da sade. Em ambos, correlacionam-se duas
ou mais variveis independentes com apenas uma varivel dependente, obser-
vando-se que o primeiro modelo deve ser utilizado quando a varivel-resposta
(dependente) e todas as variveis preditoras (independentes) so contnuas,
enquanto que a regresso logstica deve ser o mtodo de escolha para os casos
em que a varivel-resposta dicotmica (binria) e as variveis preditoras so
contnuas ou categricas.
21.1 REGRESSO LINEAR MLTIPLA
No captulo 12 deste livro, descrevemos os procedimentos para a regresso
linear simples, a qual deve ser utilizada quando o pesquisador deseja fazer
previso para o valor de uma varivel-resposta (y) com base no conhecimento
dos valores de uma nica varivel preditora (x). Do mesmo modo, a anlise de
regresso linear mltipla corresponde a uma generalizao direta da regresso
BIOESTATISTICA_VOL02.indb 245 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 246
linear simples, exceto pelo fato de que, na regresso mltipla utilizam-se duas
ou mais variveis preditoras.
Assim, a ttulo de uma breve reviso, lembramos que o modelo de
regresso linear simples dado pela equao da reta y = a + bx, onde y corres-
ponde ao valor encontrado para a varivel dependente e x o valor da varivel
dependente. Por sua vez, a constante a representa o intercepto, isto , o ponto
em que a reta cruza, no grfico, o eixo das ordenadas (eixo y), ao passo que
a constante b corresponde inclinao da reta, ou seja, ao ngulo que ela
forma com o eixo das abscissas (eixo x), sendo conhecido, tambm, como
coeficiente de regresso.
Portanto, interessante notar que verdadeira reta de regresso para uma
dada populao somente seria obtida caso todos os valores de x e y fossem
conhecidos. Porm, como normalmente isso impossvel de ser feito, o mais
comum que a regresso entre as variveis estudadas seja calculada tomando-
-se uma amostra n de pontos, aleatoriamente coletados, da populao e, a partir
desses pontos, determinar os valores do coeficiente linear (a) e do coeficiente
angular (b), de tal maneira que a reta encontrada possa ser ajustada. Assim,
para que se possa utilizar a reta de regresso a fim de fazer previses para y,
com base em valores determinados de x, deve-se realizar um teste de hiptese
para verificar se a regresso de x sobre y verdadeira, isto , se a dependncia
de y em relao a x real, se no ocorreu por acaso, em razo do erro aleatrio.
Deste modo, como a dependncia de y em relao a x dada pelo coeficiente de
regresso (b), o qual geralmente calculado com base em uma amostra, o teste
de hiptese serve para verificar se existe uma diferena estatisticamente signi-
ficativa entre o coeficiente calculado b e o verdadeiro coeficiente da populao
(B) de onde a amostra foi retirada.
O mesmo princpio aplicado regresso linear mltipla, cujo modelo
matemtico dado pela seguinte equao:
y a b x b x b x b x
k k
= + + + + +
1 1 2 2 3 3
...
Onde: a = Intercepto do eixo y;
b
i
= Coeficiente angular da i-sima varivel;
k = Nmero de variveis independentes.
BIOESTATISTICA_VOL02.indb 246 25/06/12 17:23
REGRESSO MLTIPLA 247
Na equao, onde b
1
o coeficiente de regresso associado primeira
varivel preditora x
1
e b
2
o coeficiente de regresso associado segunda
varivel preditora x
2
e assim por diante, o modelo conhecido como combi-
nao linear, cujas frmulas para calcular a e b foram mostradas no captulo
12. Note que ela representa um modelo para resumir a combinao de
diferentes variveis em um nico valor numrico, pois corresponde a uma
mdia ponderada resultante da soma dos valores de x multiplicados por seus
respectivos coeficientes de regresso, de modo que a introduo de variveis
independentes adicionais aumenta a capacidade de predio do modelo em
relao regresso linear simples. Este procedimento visa a reduzir o valor
do intercepto, o qual, em regresso, significa a parte da varivel dependente
explicada por outras variveis que no aquelas consideradas na pesquisa.
Deste modo, mesmo quando estamos interessados em estudar o efeito
de uma nica varivel preditora sobre uma dada varivel-resposta, sempre
aconselhvel incluir, mediante a aplicao de um modelo de anlise de
regresso mltipla, as outras variveis capazes de afetar o comportamento
desta varivel-resposta. Este procedimento reduz o erro aleatrio decorrente
do processo de amostragem, reduz a varincia residual e aumenta o poder
do teste estatstico, alm de minimizar o vis resultante da no-introduo,
no modelo, de uma varivel importante para o desfecho esperado. Aqui, cabe
uma observao: na anlise de regresso mltipla, a existncia de correlao
entre uma varivel dependente e um conjunto de variveis independentes
no significa necessariamente uma relao de causalidade, mas apenas uma
relao estatstica.
Eventualmente, em uma anlise de regresso mltipla, pode-se incluir,
entre as variveis preditoras, uma varivel nominal do tipo binria, como o
sexo, por exemplo. Quando isto ocorre, os dois resultados possveis para esta
varivel precisam ser convencionalmente codificados. No caso da varivel sexo,
as mulheres podem receber o cdigo 0 e os homens o cdigo 1, ou vice-versa.
Este procedimento, conhecido como codificao dummy, permite que uma
varivel nominal possa ser includa em uma equao de regresso calculada
por programas computacionais. Porm, a deciso de qual dos dois resultados
recebe o cdigo 0 e qual recebe o cdigo 1 puramente arbitrria e depende
exclusivamente do pesquisador, que deve escolher a maneira mais conveniente
BIOESTATISTICA_VOL02.indb 247 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 248
para a interpretao dos seus resultados. A interpretao de uma varivel
dummy feita sempre em relao ao resultado codificado como 1.
21.1.1 Construo do modelo
Em um modelo de regresso linear mltipla, a deciso crucial para o
pesquisador est em selecionar o menor nmero de variveis preditoras, para
que a maior porcentagem possvel de variao da varivel-resposta possa ser
explicada. Por exemplo, acrescentar uma varivel, que seja responsvel apenas
por uma pequena frao de variao, pode no ser compensador. Assim, o
pesquisador dever selecionar um modelo de regresso que lhe permita
escolher, dentre outras, as variveis que atuam de maneira mais importante
sobre o desfecho a ser estudado.
Clculo dos indicadores da correlao mltipla
Tal como na regresso simples, os indicadores representam uma impor-
tante ferramenta para a interpretao dos resultados. A seguir, descreveremos
os principais indicadores utilizados na anlise de regresso mltipla.
Coeficiente de correlao mltipla (R) Semelhante ao coeficiente de
correlao produto-momento de Pearson (r), calculado para a regresso
linear simples, na regresso mltipla, calcula-se o coeficiente de correla-
o mltipla R, o qual interpretado exatamente da mesma maneira, isto
para indicar a intensidade da relao linear entre as variveis preditoras e
a varivel-resposta estudada.
Matriz de correlao O uso da tabela de correlaes uma ferramenta
muito til na verificao de possveis correlaes entre as variveis predi-
toras (colinearidade
1
). Assim, para evitar o problema de colinearidade, a
matriz de correlaes entre as variveis independentes deve ser analisada.
Como regra geral, se a correlao entre duas variveis for superior a 0,70,
pode haver colinearidade entre elas. Esta regra, no entanto, ineficiente,
sendo a melhor alternativa aquela em que seriam analisadas todas as pos-
1. A colinearidade ocorre quando duas ou mais variveis independentes apresentam correlao
entre si.
BIOESTATISTICA_VOL02.indb 248 25/06/12 17:23
REGRESSO MLTIPLA 249
sveis correlaes entre cada uma das variveis preditoras. Isto pode ser
feito construindo-se a matriz de correlaes combinadas.
Coeficiente de determinao mltipla (R
2
) Do mesmo modo, o coefi-
ciente de determinao da regresso (R
2
) tambm pode ser calculado, o
qual indica o percentual da varincia total da varivel dependente, que
explicado pela equao de regresso. A colinearidade entre as variveis
preditoras tambm pode ser identificada pelo coeficiente de determina-
o. Isto ocorre quando este coeficiente relativamente alto e, no entan-
to, todos os coeficientes de regresso no apresentam valores estatistica-
mente significativos. Para eliminar o problema da colinearidade, algumas
variveis independentes podem ser retiradas da equao aps anlise da
matriz de correlao.
Coeficiente de determinao mltipla ajustado (R
2
A) outro im-
portante indicador, pois, na anlise de regresso mltipla, toda vez que
uma varivel independente adicionada equao, o coeficiente de de-
terminao aumenta, mesmo que esta nova varivel no contribua sig-
nificativamente para a explicao da varincia residual. Desta forma,
til analisar o coeficiente de determinao ajustado, que, ao contrrio
do coeficiente de determinao, diminui se a varivel adicionada possuir
um pequeno poder de explicao para a varivel-resposta, podendo ter
at um valor negativo.
Estatstica t calculada para determinar se cada um dos coeficientes de
regresso estatisticamente significativo. Ela utiliza a funo da distribui-
o t de Student para retornar os valores da probabilidade de significncia,
assim como para gerar os intervalos de confiana (IC) para cada coeficien-
te de regresso.
Teste ANOVA utilizado na verificao da significncia estatstica para
os valores do coeficiente de correlao mltipla (R) e coeficiente de deter-
minao (R
2
). Utiliza a funo da distribuio F para retornar os valores de
probabilidade de significncia.
Estatstica Durbin-Watson (DW) utilizada para verificar se existe co-
linearidade entre as variveis independentes includas no modelo. O valor
da estatstica DW calculado com os resduos (erros) da equao de re-
gresso. A anlise da estatstica de Durbin-Watson feita a partir da ta-
BIOESTATISTICA_VOL02.indb 249 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 250
bela de valores crticos (ver tabela no final do livro). As concluses sobre
o coeficiente DW devem considerar o limite crtico inferior (d
L
) e o limite
crtico superior (d
U
), obtidos nessa tabela, o qual depende no nvel de sig-
nificncia (), do nmero de variveis independentes (k) e do tamanho da
amostra (n) do modelo. A frmula a seguinte:


Clculo do coefciente de regresso padronizado ()
De todo jeito, tal como ocorre na regresso simples, relevante notar que
a regresso mltipla avalia apenas a relao linear entre as variveis preditoras
e a varivel-resposta. Por sua vez, os coeficientes de regresso (b
i
) so inter-
pretados de modo diferente na regresso mltipla quando comparados com
a regresso simples. Nesta, o coeficiente de regresso b indica a quantidade
de variao da varivel-resposta y, que devida a cada acrscimo de uma
unidade na varivel preditora x. Na regresso mltipla, um determinado coefi-
ciente de regresso b
i
mostra at que ponto o valor da varivel-resposta y pode
ser alterado em funo do aumento de uma unidade na varivel preditora x
i
,
mantendo-se constantes os valores das demais variveis preditoras da equao
de regresso. Porm, embora sejam importantes, na anlise mltipla, os valores
dos coeficientes de regresso no podem ser utilizados para se decidir quais
variveis preditoras so as mais importantes, uma vez que eles se referem s
diferentes grandezas, pois cada um deles est relacionado com a escala em
que a varivel x foi mensurada. Deste modo, a nica informao que se pode
inferir desses coeficientes que o sinal positivo ou negativo descreve o sentido
da correlao entre a varivel preditora e o desfecho, ou seja, se a correlao
positiva ou negativa, sendo, por este motivo, chamados de coeficientes de
regresso no-padronizados.
Uma maneira de eliminar este inconveniente, padronizar os coefi-
cientes de regresso, o que pode ser feito a partir da equao de regresso.
Para tal, basta multiplicar o coeficiente de regresso no-padronizado pelo
DW
i i
i
n
i
i
n
=

=
=

( )

1
2
2
2
1
BIOESTATISTICA_VOL02.indb 250 25/06/12 17:23
REGRESSO MLTIPLA 251
desvio padro da varivel x e, em seguida, dividir o resultado pelo desvio-
-padro da varivel y. Assim, temos:
Assim, uma vez que a padronizao tenha sido realizada, pode-se, agora,
comparar as magnitudes dos valores dos coeficientes de regresso e fazer
inferncias acerca de quais variveis preditoras so mais importantes na deter-
minao do desfecho da varivel-resposta, pois, quanto maior for o coeficiente,
maior ser a influncia de x sobre y.
Modelo de regresso mltipla escalonada
A escolha do modelo um dos passos mais importantes na anlise de
regresso mltipla, pois ele que ir possibilitar a escolha das variveis
independentes que mais se correlacionam com a varivel-resposta. Os modelos
mais tradicionais compreendem a seleo progressiva (mtodo forward) e a
eliminao regressiva (mtodo backward).
No modelo de seleo progressiva, o processo comea com a incluso
da varivel preditora x que tiver maior correlao com a varivel-resposta y.
Em seguida, as demais variveis preditoras so acrescentadas uma de cada
vez, at que todas as variveis estatisticamente significativas sejam includas
na equao de regresso, respeitando-se a ordem decrescente de seus coefi-
cientes de correlao. Por sua vez, o modelo de eliminao regressiva comea
pela incluso de todas as variveis preditoras e, em seguida, aquelas que no
apresentam coeficiente de regresso significativo so retiradas da equao.
Aps este procedimento, a equao deve ser recalculada, usando-se, agora,
apenas as variveis significativas, uma vez que estes coeficientes modificam-se
quando algumas variveis so retiradas da anlise.
Uma outra abordagem para a escolha das variveis preditoras usar
o processo regresso escalonada, o qual combina os dois procedimentos
descritos acima. O mtodo inicia da mesma maneira que a seleo progressiva.
Entretanto, aps a incluso, na equao, de uma nova varivel preditora
x, procede-se verificao para saber se todas as variveis anteriormente

i
i x
y
b s
s
=
.
BIOESTATISTICA_VOL02.indb 251 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 252
includas mantm o seu nvel de significncia. Caso isto ocorra, cada uma delas
ser mantida na equao de regresso somente se a sua retirada causar uma
reduo significativa no coeficiente de determinao R
2
. Caso contrrio, ela ser
eliminada. O processo se repete at que todas as variveis explicativas tenham
sido testadas. No dia a dia da pesquisa, a utilizao de programas computa-
cionais oferece opes para a escolha do melhor modelo de combinao entre
todas variveis preditoras includas no estudo.
A seguir, mostraremos um exemplo de regresso linear mltipla. Os clculos
no sero aqui abordados, uma vez que foram apresentados no captulo 12, que
trata da regresso linear simples. Para tal, ser utilizado o programa BioEstat,
de fcil aplicao.
Exemplo: Suponha que uma pesquisa foi conduzida para verificar se existe
correlao entre os valores da presso arterial sistlica e os valores da estatura,
da massa corporal e da idade, em 10 atletas frequentadores de uma academia
de ginstica. Os dados esto relacionados na Tabela 21.1, mostrada a seguir.
Tabela 21.1 Valores da presso arterial sistlica, idade (anos), massa corporal (kg)
e estatura (cm) de 10 atletas
Atleta
Presso sistlica
y
Idade
x
1
Massa corporal
x
2
Estatura
x
3
01 132 29 63 162
02 134 33 72 168
03 132 37 72 166
04 143 41 79 179
05 142 43 71 167
05 147 45 69 168
07 144 47 83 173
08 146 49 85 171
09 152 51 64 163
10 149 51 58 165
Passo 1 Formular as hipteses estatsticas:
H
0
: Os valores da presso arterial sistlica no dependem da estatura e/ou
da massa corporal e/ou da idade, pois
b b b
1 2 3
0 0 0 = = = , ,
;
BIOESTATISTICA_VOL02.indb 252 25/06/12 17:23
REGRESSO MLTIPLA 253
H
A
: Os valores da presso arterial sistlica dependem da estatura e/ou da
massa corporal e/ou da idade, pois, ao menos um b
i
0.
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%) unilateral
Passo 3 Determinar os valores do teste:
Os dados devem ser introduzidos no grid do programa, com a primeira
coluna contendo os valores da varivel dependente y, e as demais colunas,
os valores das variveis preditoras x. Selecionar o menu estatsticas e es-
colher a opo regresso e clicar em linear mltipla. Selecionar as colunas
e clicar em executar o teste. O programa exibir um quadro contendo as
seguintes informaes:
Passo 4 Concluses:
Como o valor do teste ANOVA (teste F) foi significativo (P = 0,0023), re-
jeita-se a hiptese nula (H
0
) e aceita-se a hiptese alternativa (H
A
) que ao
BIOESTATISTICA_VOL02.indb 253 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 254
menos uma das variveis preditoras, idade, massa corporal ou estatura,
influencia no valor da presso arterial sistlica. Entre os coeficientes par-
ciais de regresso, somente o b
1
mostrou-se estatisticamente significativo,
com t = 7,4497 e P = 0,0003. Isto mostra, portanto, que a varivel idade (x
1
)
aquela mais explicativa para a variao da presso arterial sistlica dos
atletas avaliados. Com base nos dados, o valor da presso arterial sistlica
deve aumentar 0,8738 mmHg para cada acrscimo de um ano de idade, a
partir de 29 e at 51 anos.
Os coeficientes de determinao mltipla (R
2
), de determinao mltipla
ajustado (R
2
A) e de correlao mltipla (R) so mostrados no quadro de resul-
tados. O valor do coeficiente de determinao igual a 0,9088 alto, o que indica
um poder de explicao da equao de regresso de 90,88%. No entanto, como
dois dos coeficientes parciais de regresso no so significativos, pode-se
suspeitar da existncia de colinearidade nas variveis independentes (variveis
independentes correlacionadas).
Com base nas variveis preditoras, o modelo linear para a predio de y
representado pela seguinte equao:
O programa tambm disponibiliza o procedimento para a anlise de
regresso passo-a-passo (stepwise), progressiva e regressiva. Para o exemplo
descrito, o mtodo progressivo exibe o quadro mostrado abaixo, no qual se
verifica que, quando a varivel x
3
(estatura) includa, o coeficiente de deter-
minao (R
2
) da equao no se altera, indicando, portanto, que esta varivel
deve ser retirada da regresso.
Para o mtodo regressivo, o programa exibe outro quadro, o qual
mostrado a seguir. Neste quadro, verifica-se que, quando a varivel x
3
(estatura)

, , ( , ) , y x x x = + + + 68 97 0 87 0 23 0 31
1 2 3
BIOESTATISTICA_VOL02.indb 254 25/06/12 17:23
REGRESSO MLTIPLA 255
excluda, o coeficiente de determinao (R
2
) da equao tambm no se altera,
confirmando, portanto, que esta varivel deve ser retirada da regresso.
O programa BioEstat no mostra a matriz de correlao e a matriz de
correlaes combinadas, ambas bastante teis na anlise da colinearidade.
Estas matrizes sero mostradas nas tabelas 21.2 e 21.3, a seguir:
Tabela 21.2 Matriz de correlao entre as variveis preditoras idade, massa corporal e
estatura de 10 atletas
Correlaes
Idade
(x
1
)
Massa corporal
(x
2
)
Estatura
(x
3
)
Idade (x
1
) 1,00 0,0844 0,1414
Massa corporal (x
2
) 0,0844 1,00 0,7767
Estatura (x
3
) 0,1414 0,7767 1,00
A matriz de correlao mostrada na Tabela 21.2 confirma as suspeitas de colinea-
ridade, pois existe uma alta correlao de x
2
(massa corporal) em relao a x
3
(estatura),
o que sugere mais estudos para concluir sobre a existncia de colinearidade.
Tabela 21.3 Matriz de correlaes combinadas entre as variveis preditoras idade,
massa corporal e estatura de 10 atletas
Correlaes combinadas
Idade (x
1
)
x
2
: x
3
0,1471
x
2
0,0844
x
3
0,1414
Massa corporal (x
2
)
x
1
: x
3
0,7772
x
1
0,0844
x
3
0,7767
Estatura (x
3
)
x
1
: x
2
0,7805
x
1
0,1414
x
2
0,7767

BIOESTATISTICA_VOL02.indb 255 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 256
A tabela de correlaes combinadas uma ferramenta muito til na
verificao das correlaes entre as variveis preditora (colinearidade). Pela
anlise da Tabela 21.3, verifica-se que a varivel x
2
apresenta forte corre-
lao com a combinao das variveis x
1
e x
3
, porm, sem correlao com x
1
,
quando comparada isoladamente. Por sua vez, a varivel x
3
apresenta forte
correlao com a combinao das variveis x
1
e x
2
, porm, sem correlao
significativa com x
1
, quando comparadas isoladamente, sendo provavel-
mente a responsvel pelas interpretaes contraditrias de significncia.
Pela anlise apenas da matriz de correlaes, normalmente no h dados
suficientes para concluir quais variveis podem ou no ser retiradas da
regresso. Mas, olhando para as correlaes combinadas, pode-se inferir
que a varivel x
3
deve ser retirada da regresso, pois ela representada pela
combinao de x
1
e x
2
.
vlido ressaltar que, para validar os testes de regresso linear mltipla,
necessrio que o modelo de anlise siga todos os pressupostos bsicos
referentes regresso linear simples, os quais esto relacionados no captulo
12 deste livro.
21.2 REGRESSO LOGSTICA SIMPLES
E MLTIPLA
O mtodo da regresso logstica o modelo ideal de anlise quando a
varivel-resposta em estudo dicotmica (binria) e as variveis preditoras
incluem valores numricos (dimensionais) e medidas nominais. , pois, uma
tcnica estatstica que tem como objetivo produzir, a partir de um conjunto
de observaes, um modelo que permita a predio de valores assumidos
por uma varivel categrica a partir de um conjunto de variveis explicativas,
contnuas e/ou binrias, sendo amplamente utilizada em cincias mdicas e
sociais, como um mtodo til para predizer a probabilidade da ocorrncia
de um determinado evento, como uma doena, por exemplo, em funo da
exposio a determinados fatores de risco. Uma outra vantagem da regresso
logstica que a sua aplicao no exige os pressupostos de normalidade para a
distribuio das variveis preditoras, alm do que, os coeficientes de regresso
BIOESTATISTICA_VOL02.indb 256 25/06/12 17:23
REGRESSO MLTIPLA 257
podem ser interpretados em termos de risco relativo nos estudos de coorte, ou
mesmo taxas de tendncia nos delineamentos do tipo caso-controle.
Assim, quando o modelo correlaciona a varivel-resposta y com uma nica
varivel preditora x, ele chamado de regresso logstica simples. Neste
caso, a varivel y, binria, codificada (codificao dummy) como 1 (sucesso)
e 0 (insucesso), o mesmo ocorrendo para a varivel x. Por sua vez, nos casos em
que a correlao realizada entre a varivel-resposta y e duas ou mais variveis
preditoras x, o modelo conhecido como regresso logstica mltipla, sendo
a varivel y do tipo binria, a qual assume valores 1 (sucesso) e 0 (insucesso). As
variveis preditoras podem ser binrias ou contnuas (dimensionais); quando
binrias, tambm recebem a codificao dummy.
Portanto, como no modelo multivariado utilizam-se os valores de um
conjunto de variveis preditoras para calcular a probabilidade da ocorrncia da
varivel-resposta, os efeitos das associaes entre essas variveis podem ser
controlados, sendo a odds ratio, a medida de associao calculada a partir do
modelo logstico. A frmula, tambm denominada Logit, mostrada a seguir.

Onde: b
0
= Intercepto.
b
1
, b
2
...b
n
Coeficientes de regresso.
exp = Base do logaritmo natural (2,718) usada para a potncia
mostrada entre parnteses.
Nesta equao, os termos b
0
e b
n
representam os parmetros desconhe-
cidos e que sero estimados a partir dos dados amostrais, com base no mtodo
mxima verossimilhana, o qual mostra a probabilidade mxima de se obter o
resultado observado. Assim, conhecendo-se os parmetros b
0
e b
n
e os valores
das variveis preditoras para um determinado indivduo, pode-se, ento,
aplicar a frmula da regresso logstica para calcular a probabilidade (P
x
) de
que este indivduo desenvolva o desfecho estudado.
A equao pode ser montada especificando-se as variveis a serem includas
no modelo, ou utilizando-se um dos mtodos semelhantes queles empregados
P
b b x b x b x
x
n n
=
+ + + + +
( )

1
1
0 1 1 2 2
exp ...
BIOESTATISTICA_VOL02.indb 257 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 258
para a regresso mltipla. Na regresso logstica, em vez do teste F, utiliza-se
o teste do qui-quadrado (
2
) para se

verificar a significncia estatstica de cada
varivel em relao determinao do resultado da regresso.
A seguir, utilizando-se o programa BioEstat 5.0, mostraremos os exemplos
para os modelos de regresso logstica simples e mltipla.

Modelo de regresso logstica simples
Exemplo: Um estudo foi conduzido para verificar a associao entre a
incidncia de neoplasia cutnea e a histria clnica de exposio excessiva luz
solar. Para tal finalidade, 20 mulheres, na faixa etria de 60 a 70 anos, foram
aleatoriamente selecionadas dentre aquelas atendidas em um ambulatrio
pblico de dermatologia. Os dados esto expressos na Tabela 21.4, abaixo.
A codificao dummy estabelecida foi a seguinte:
Varivel y: neoplasia cutnea presente = 1; ausente = 0.
Varivel x: exposio excessiva radiao solar presente = 1; ausente = 0.
Tabela 21.4 Codifcao dummy para as variveis includas na regresso logstica simples
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Varivel y 1 0 1 0 1 0 1 0 0 0 0 0 0 0 1 1 0 1 1 1
Varivel x 1 0 0 0 1 0 1 0 0 0 1 0 0 0 0 1 1 1 1 0
Passo 1 Formular as hipteses estatsticas:
H
0
: a incidncia de neoplasia cutnea no est associada exposio exces-
siva luz solar , pois b
1
= 0 ;
H
A
: a incidncia de neoplasia cutnea est associada exposio excessiva
luz solar, pois b
1
0 .
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%) unilateral
Passo 3 Determinar os valores do teste:
Os dados devem ser introduzidos no grid do programa, com a primeira co-
luna contendo os valores da varivel dependente y, e a segunda coluna, os
valores da varivel preditora x. Selecionar o menu estatsticas e escolher a
BIOESTATISTICA_VOL02.indb 258 25/06/12 17:23
REGRESSO MLTIPLA 259
opo regresso e clicar em logstica simples. Selecionar as colunas e clicar
em executar o teste. O programa exibir um quadro contendo as seguintes
informaes:

Passo 4 Concluses:
Como o valor P do teste foi significativo (P = 0,0371), rejeita-se a hiptese
nula (H
0
) e aceita-se a hiptese alternativa (H
A
) que a exposio excessiva
luz solar influencia na incidncia da neoplasia cutnea. Isto , a odds ratio
indica que a chance da ocorrncia de neoplasia 9 vezes maior em mulhe-
res com antecedentes de exposio excessiva radiao solar quando com-
parada chance em mulheres sem antecedentes. O intervalo de confiana
de 95% confirma a significncia estatstica do teste, pois o valor 1 no est
contido no referido intervalo.
O programa fornece a equao de regresso para o modelo proposto. Para
o exemplo acima, a equao dada por:


Assim, com base na equao mostrada acima, podem-se calcular as
probabilidades para as possveis ocorrncias da varivel-resposta neoplasia
cutnea, tal como mostrado a seguir.
Logit P x
i i
= + 1 0986 2 1972 , ,
BIOESTATISTICA_VOL02.indb 259 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 260
Para x
i
= 1 (com antecedentes de exposio excessiva luz solar):

Para x
i
= 0 (sem antecedentes de exposio excessiva luz solar):
Na regresso logstica, cada coeficiente b
i
, calculado, fornece uma estimativa
do logaritmo natural (ln) da odds ratio ajustada, de modo a permitir que, para
todas as variveis includas no modelo, a odds ratio pode ser estimada direta-
mente a partir da exponenciao destes coeficientes. Assim, para o exemplo
dado, tem-se:

O intervalo de confiana de 95% para a odds ratio calculado da seguinte
maneira:

Logit x
exp
P
P
= + =
=
+

1 0986 2 1972 1 1 0986
1
1
1 09
, , ,
( , 886
1
1 0 3333
0 75
)
,
, =
+
= (75%)
Logit x 0
exp
P
P
= + =
=
+

1 0986 2 1972 1 0986
1
1
1
, , ,
( ,00986
1
1 2 9999
0 25
)
,
, =
+
= (25%)
OR
b
= = = exp exp
1
21972
8 9998
,
,
IC OR
IC
b b
95
1 1
1 96
%( )
, ( )
=

exp
x erro padro
995
21972 1 96 21972 2
%( )
, , , ,
OR = =


exp exp
x1,0541 00660
01312
95 1 1402

= = IC % ,
,
exp (limite inferior r)
exp (limite super = =
4 2632
71 0369
,
, i ior)
IC OR OR 95 1 1402 71 0369 %( ) , , = < <
BIOESTATISTICA_VOL02.indb 260 25/06/12 17:23
REGRESSO MLTIPLA 261
Modelo de regresso logstica mltipla
Exemplo: Um estudo foi conduzido para verificar a associao entre a
incidncia de neoplasia cutnea em relao ao sexo, exposio excessiva
radiao solar, idade e ao uso de filtro solar. Para tal finalidade,
40 pacientes de ambos os sexos, na faixa etria de 36 a 56 anos, foram
aleatoriamente selecionados dentre aqueles atendidos em um ambulatrio
pblico de dermatologia. Os dados foram introduzidos no grid do programa
BioEstat 5.0.
A codificao dummy estabelecida foi a seguinte:
Varivel y: neoplasia cutnea presente = 1; ausente = 0.
Varivel x
1
: sexo masculino = 1; feminino = 0.
Varivel x
2
: exposio excessiva radiao solar presente = 1; ausente = 0.
Varivel x
3
: idade (varivel contnua).
Varivel x
4
: uso de filtro solar presente = 1; ausente = 0.
Passo 1 Formular as hipteses estatsticas:
H
0
: a incidncia de neoplasia cutnea no est associada aos fatores de ris-
co estudados, pois b
1
=0, b
2
= 0, b
3
= 0, b
4
= 0 ;
H
A
: a incidncia de neoplasia cutnea est associada a um dos fatores de
risco estudado, sendo b
1
0 e/ou b
2
0 e/ou b
3
0 e/ou b
4
0 .
Passo 2 Escolher o nvel de significncia (nvel alfa):
0, 05 (5%) unilateral a =
Passo 3 Determinar os valores do teste:
Os dados devem ser introduzidos no grid do programa, com a primeira
coluna contendo os valores da varivel dependente y, e as demais colunas,
os valores das variveis preditoras x. Selecionar o menu estatsticas e esco-
lher a opo regresso e clicar em logstica mltipla. Selecionar as colunas
e clicar em executar o teste. O programa exibir um quadro contendo as
seguintes informaes:
BIOESTATISTICA_VOL02.indb 261 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 262
Passo 4 Concluses:
Como o valor do teste foi significativo (P < 0,0001), rejeita-se a hiptese
nula (H
0
) e aceita-se a hiptese alternativa (H
A
) que as variveis sexo e
exposio excessiva radiao solar influenciaram na incidncia da ne-
oplasia cutnea. Isto , a odds ratio indica que a chance da ocorrncia de
neoplasia foi 7,6 (1/0.1317)
2
vezes maior em pacientes do sexo feminino
quando comparada chance em pacientes do sexo masculino (P = 0,0464).
Porm, se o paciente do sexo masculino e apresenta exposio excessiva
radiao solar, a chance de neoplasia foi 14,7 vezes maior quando compa-
rada chance em um paciente do sexo feminino e sem exposio excessiva
radiao solar (P = 0,0117).
A incidncia de neoplasia cutnea no apresentou relao estatisticamente
significante com as variveis idade e uso de filtro solar.
O programa fornece a equao de regresso para o modelo proposto. Para
o exemplo acima, a equao dada por:

2. Para calcular a chance para o paciente do sexo feminino, divide-se o valor 1 pela chance para
o paciente do sexo masculino (0,1317). Isto , 1/0,1317 = 7,59.
Logit P x x x
i
= + + 5 8443 2 027 2 6880 0 1460
1 2 3
, ( , ) ( , ) ( , )) ( , ) 2 286
4
x
BIOESTATISTICA_VOL02.indb 262 25/06/12 17:23
REGRESSO MLTIPLA 263
Assim, com base na equao acima referida, podem-se calcular as probabi-
lidades para as possveis ocorrncias da varivel-resposta neoplasia cutnea
em funo das variveis preditoras, tal como para os dois exemplos mostrados
a seguir.
Para: x
1
= 1 (sexo masculino).
x
2
= 1 (com exposio excessiva radiao solar).
x
3
= 50 (idade igual 50 anos).
x
4
= 1 (com uso de filtro solar)

Para: x
1
= 0 (sexo feminino).
x
2
= 0 (sem exposio excessiva radiao solar).
x
3
= 60 (idade igual a 60 anos).
x
4
= 0 (com uso de filtro solar)

Estratgia de modelagem reduzida
O objetivo da estratgia de modelagem reduzida obter o melhor ajuste
para o modelo, com um nmero mnimo de variveis preditoras, de tal modo
que aquelas no significativas e que pouco contribuem para o resultado,
Logit 1 1 P
i
= + + 5 8443 2 027 2 6880 0 14 , ( , ) ( , ) ( , 660 2 286
0 1693
1
1
50 1
Logit
exp

=
=
+

) ( , )
,
(
P
P
i

=
+
=
01693
1
1 1 1845
0 4578
, )
,
, (45,78%)
Logit 0 0 P
i
= + + 5 8443 2 027 2 6880 0 14 , ( , ) ( , ) ( , 660 2 286
2 9157
1
1
2
60 0
Logit
exp

=
=
+

) ( , )
,
(
P
P
i
,, )
,
,
9157
1
1 0 0541
0 9487 =
+
= (94,87%)
BIOESTATISTICA_VOL02.indb 263 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 264
possam ser descartadas da regresso. Como regra geral, permanecem no
modelo (modelo no reduzido) apenas as variveis com valor de P menor
que 0,05, ou aquelas com um P um pouco maior, mas que sejam comprovada-
mente importantes para a varivel-resposta da regresso. Do mesmo modo,
deve permanecer no modelo a varivel que, quando retirada, provoca uma
grande alterao na probabilidade do desfecho, mesmo que ela no seja
estatisticamente significativa. A seguir, mostraremos os passos necessrios
para a realizao do modelo reduzido.
Passo 1 O processo inicia pela realizao da regresso logstica simples
entre a varivel-resposta e cada uma das variveis preditoras includas
no estudo. A seguir, selecionam-se aquelas que apresentarem, no teste
de hiptese, um valor P menor ou igual a 0,20. Para o exemplo mostrado
acima, a Tabela 21.5 relaciona os valores de P das variveis em questo.
Nesta tabela, observa-se que somente a varivel x
4
uso de filtro solar
no apresenta o critrio de incluso, pois P > 0,20, devendo, portanto, ser
excluda do modelo.
Tabela 21.5 Variveis e respectivos valores de P obtidos na regresso logstica simples
Varivel Valor de P
Sexo 0,0007
Exposio excessiva radiao solar 0,0032
Idade 0,0667
Uso de fltro solar 0,4005
Passo 2 O prximo passo realizar a regresso logstica mltipla com to-
das as variveis preditoras, exceto com aquela retirada do modelo, no caso,
a varivel x
4
uso de filtro solar. Com utilizao do programa BioEstat 5.0,
obteremos o resultado mostrado a seguir:
BIOESTATISTICA_VOL02.indb 264 25/06/12 17:23
REGRESSO MLTIPLA 265
A razo de verossimilhana verifica o ajuste global do modelo e testa a
hiptese de nulidade de que todos os coeficientes b
i
das variveis, exceto o
intercepto, so iguais a zero. O resultado de P = 0,0001 indica que o modelo
se ajusta adequadamente aos dados.
Passo 3 O procedimento seguinte a excluso das variveis que apresen-
tam o valor de P > 0,10. Para o exemplo acima, a varivel x
3
idade deve ser
retirada, pois P = 0,8155. Em seguida, executa-se, novamente, a regresso
mltipla com as variveis preditoras que permaneceram no modelo e, en-
to, compara-se o modelo anterior com o modelo reduzido final.

BIOESTATISTICA_VOL02.indb 265 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 266
Passo 4 Concluses:
Como o valor do teste foi significativo (P < 0,0001), rejeita-se a hiptese
nula (H
0
) e aceita-se a hiptese alternativa (H
A
), que as variveis sexo e
exposio excessiva radiao solar influenciaram na incidncia da ne-
oplasia cutnea. Isto , a odds ratio indica que a chance da ocorrncia de
neoplasia foi 14,9 (1/0.0667) vezes maior em pacientes do sexo feminino
quando comparada chance em pacientes do sexo masculino (P = 0,0032).
Porm, se o paciente do sexo masculino e apresenta exposio excessiva
radiao solar, a chance de neoplasia foi 9.0 vezes maior quando compa-
rada chance em um paciente do sexo feminino e sem exposio excessiva
radiao solar (P = 0,0166).
Regresso para varivel categrica com mais de dois nveis
Quando uma varivel categrica apresentar mais de dois nveis de resposta,
necessrio proceder ao fatoramento para transform-la em variveis dummies
(categoria 0 - 1). O esquema abaixo, mostra este procedimento para uma varivel
que apresente trs categorias de resposta, como, por exemplo, a religio.
Religio Religio 1 Religio 2 Religio 3
1 - Evanglica 1 0 0
2 - Catlica 0 1 0
3 - Outras 0 0 1
A varivel dummy para a religio evanglica ser a varivel religio 1,
a qual assumir o valor 1 quando a religio for a evanglica e o valor 0 para
as demais. A varivel religio 2 assumir o valor 1 quando a religio for a
catlica e 0 nos demais casos. A varivel religio 3 assumir o valor 1quando
a religio for outra, e o valor 0 para as demais.
BIOESTATISTICA_VOL02.indb 266 25/06/12 17:23
22
Anlise de Sobrevida
Em muitos modelos de pesquisa, a varivel em estudo pode corresponder
ao perodo de acompanhamento para um determinado evento de interesse,
sendo o resultado medido em termos de extenso do tempo apurado desde o
incio da observao at que o referido desfecho ocorra. Na rea da economia,
por exemplo, um economista pode querer estudar o tempo mdio em que uma
determinada classe de trabalhadores permanece desempregada aps a perda
do emprego, e compar-lo com o tempo mdio de outra classe qualquer; ou um
engenheiro pode avaliar o tempo mdio de vida til de um novo equipamento,
at que uma determinada falha mecnica ocorra.
Na rea da sade, muitos estudos so delineados com a finalidade de
avaliar o tempo de acompanhamento de pacientes submetidos a um deter-
minado tipo de tratamento, que pode ser o emprego de uma nova droga, a
aplicao de uma nova interveno clnica ou um novo procedimento cirrgico,
sempre com o intuito de compar-los aos procedimentos j existentes, no
sentido de identificar aquele que apresenta melhor desempenho em termos
de remisso dos sintomas ou de sobrevida
1
, por exemplo. Em todos os casos,
1. Prolongamento da vida alm de determinado prazo; tempo de vida que ultrapassa determinado
limite (Dicionrio Aurlio).
BIOESTATISTICA_VOL02.indb 267 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 268
seja na rea da sade ou em qualquer outra rea do conhecimento, o modelo
requer que a varivel-resposta (desfecho) seja dicotmica, do tipo sucesso/
insucesso, presena/ausncia ou sobrevida/morte. Porm, como neste tipo de
estudo sempre existe a possibilidade de que alguns participantes possam ser
perdidos durante o perodo de acompanhamento, ou por que abandonam o
tratamento ou por que so excludos, pois o estudo termina antes da ocorrncia
do desfecho de interesse, tcnicas especiais de anlise estatstica devem ser
empregadas para esses casos, sendo a mais apropriada, a tbua de anlise de
sobrevida, que pode ser estudada pelo mtodo atuarial ou pelo mtodo de
Kaplan-Meier, ambos discutidos no presente captulo.
Nestes tipos estudos de sobrevida, geralmente os sujeitos participantes
so includos na pesquisa em diferentes momentos do ano calendrio, porm,
na anlise, todos eles tm seu tempo de sobrevivncia
2
contado a partir de sua
entrada no estudo, a qual considerada como o tempo zero para observao
de cada indivduo, sendo o evento final, o bito ou qualquer outro que indique
uma modificao do estado inicial do sujeito da pesquisa, tal como a cura, a
recorrncia da doena ou o seu retorno ao trabalho, por exemplo. Nestes casos,
o evento final denominado ocorrncia ou falha, por referir-se mais frequen-
temente a eventos indesejveis, tais como o aparecimento da doena ou mesmo
a morte do paciente.
Por outro lado, pode ocorrer que alguns indivduos no sejam observados
at a ocorrncia da falha, ou seja, que tenham seu tempo de observao incom-
pleto. Esse tipo de perda no tempo de observao denominado censura. Isso
pode ocorrer quando os indivduos permanecem, ao trmino, sem mudana
da condio estudada, ou falecem por causas no relacionadas com a doena
de interesse, ou abandonam espontaneamente a pesquisa. Os estudos em que
existe censura so denominados com observaes incompletas.
Portanto, em pesquisa clnica, h dois tipos de delineamentos que podem
ser utilizados para acompanhar o tempo como varivel de interesse. Um deles
o estudo experimental do tipo ensaio clnico controlado e randomizado,
o qual indicado para avaliar diferentes formas de tratamento. O outro tipo
o estudo observacional do tipo coorte histrica (retrospectiva), cujos dados
2. Qualidade ou estado de sobrevivente; durao contnua no espao e no tempo (Aurlio).
BIOESTATISTICA_VOL02.indb 268 25/06/12 17:23
ANLISE DE SOBREVIDA 269
podem ser obtidos pela coleta direta em bases de dados j existentes, tais como
registros mdicos existentes pronturios hospitalares.
Assim, neste captulo, abordaremos os dois mtodos mais comumente utili-
zados para determinar as curvas de sobrevida o mtodo atuarial e o mtodo
de Kaplan-Meier, considerando-se o tempo transcorrido desde a entrada do
indivduo no estudo (data da incluso) at a ocorrncia do evento de interesse
(falha) ou at a censura por perda no tempo de observao (observao incom-
pleta). Da mesma maneira, mostraremos o teste do logrank e a estatstica do
qui-quadrado de Mantel-Haenszel, ambos utilizados no teste de significncia
para diferenas entre duas curvas de sobrevida.
22.1 MTODO ATUARIAL
Tambm conhecido como mtodo de anlise do quadro vital ou de Cutler-
Ederer, o mtodo atuarial
3
, inicialmente desenvolvido pelas companhias seguradoras
para o clculo de prmios de seguro e de aposentadoria, tem sido amplamente
utilizado na prtica mdica para calcular a taxa de sobrevida de pacientes subme-
tidos a avaliaes clnicas decorrentes de tratamentos experimentais.
Neste tipo de anlise, as probabilidades de sobrevida so calculadas para
intervalos fixos e arbitrrios previamente estabelecidos pelo pesquisador,
como em anos ou meses, por exemplo, de modo que o nmero de observaes
seja bem distribudo ao longo de todo o perodo do estudo, sendo o nmero
de pacientes expostos ao risco igual ao nmero de pacientes vivos por ocasio
do incio de cada intervalo. Por sua vez, o mtodo considera que todos os
afastamentos (censuras) ocorrem, em mdia, a meio caminho do intervalo,
de tal maneira que, nas anlises, so considerados apenas os pacientes
presentes no incio do intervalo, mas no no seu trmino, seja porque no
estavam no estudo h tempo suficiente ou porque abandonaram a pesquisa.
Assim, em cada intervalo, o nmero de pacientes expostos ajustado de
acordo com o nmero de censuras, supondo-se que elas ocorreram de modo
3. Aturia - Parte da estatstica que investiga problemas relacionados com a teoria e o clculo de
seguros numa coletividade (Dicionrio Aurlio).
BIOESTATISTICA_VOL02.indb 269 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 270
uniforme durante cada perodo analisado. Isto feito subtraindo-se metade
das censuras do total de pacientes expostos ao risco no incio do perodo,
supondo-se que estes pacientes ficaram, em mdia, expostos apenas metade
do intervalo analisado. O nmero de pacientes expostos ao risco dado pela
seguinte equao:
E n
w
i i
i
=
2
, onde: n
i
- Nmero de sujeitos no incio do intervalo.
w
i
- Nmero de censuras no intervalo.
Desta forma, no mtodo atuarial, para cada um dos intervalos, a proba-
bilidade da ocorrncia do desfecho estudado, como o bito, por exemplo, a
probabilidade de sobrevida e a probabilidade acumulada de sobrevida
so calculadas pelas seguintes frmulas:


q
d
E
d
n
w
i
i
i
i
i
i
= =

2
, onde: q
i
- Probabilidade da ocorrncia do desfecho em
estudo.
d
i
- Nmero de ocorrncias no intervalo.
p q
i i
= 1 , onde: p
i
- Probabilidade de sobrevida no intervalo.
S p p p
i i
=
1 2
onde: x x x ... , S
i
- Probabilidade acumulada de sobrevida ao
final do intervalo.
EP S S
d
n n d
i i
i
i i i
( )
( )
, =

onde: EP - Erro padro da probabilidade acu-


mulada de sobrevida.
Para ilustrar a aplicao prtica do mtodo atuarial para anlise de
sobrevida, utilizaremos os dados do estudo publicado por Bustamante-Teixeira
et al (2002), que avaliou a probabilidade de sobrevida de casos incidentes de
cncer de estmago em Campinas, So Paulo, entre 1991 e 1994. A Tabela 22.1
mostra o resultado do estudo.
BIOESTATISTICA_VOL02.indb 270 25/06/12 17:23
ANLISE DE SOBREVIDA 271
Tabela 22.1 Clculo das probabilidades de sobrevida pelo mtodo atuarial, para casos de
cncer de estmago diagnosticados em Campinas, entre 1991 e 1994
Intervalo
em anos
i
Sujeitos
presentes
ao incio do
intervalo
n
i
Ocorrncias
no intervalo
d
i
Censuras
no intervalo
w
i
Pacientes
expostos
ao risco
E
i
Probabilidade
do desfecho
q
i
Probabilidade
de sobrevida
p
i
Probabilidade
acumulada
S
i
0 - 1 337 224 15 329,5 0,6798 0,3202 0,3202
1 - 2 98 46 4 96 0,4792 0,5208 0,1668
2 - 3 48 13 0 48 0,2708 0,7291 0,1216
3 - 4 35 6 2 34 0,1764 0,8235 0,1001
4 - 5 27 4 2 26 0,1538 0,8461 0,0847
Modifcado de Bustamante-Teixeira et al, 2002

Na tabela, a coluna n
i
corresponde ao nmero de pacientes por ocasio
do incio de cada intervalo, de tal maneira que, na primeira linha, esto todos
pacientes includos no estudo, isto , n
1
= 337. Durante este primeiro intervalo
de um ano, morreram 224 pacientes (ocorrncias) e 15 foram perdidos
(censurados), de forma que d
1
= 224 e w
1
= 15. Assim, no primeiro intervalo, o
nmero ajustado de pacientes expostos ao risco de morrer foi de 337 (15
2) = 329,5; a probabilidade de morte foi 224 329,5 = 0,6798, o que resulta em
uma probabilidade de sobreviver de 1 0,6798 = 0,3202.
Para o segundo intervalo, que corresponde ao espao de tempo decorrido
entre o primeiro e o segundo ano aps o diagnstico, havia somente 98
pacientes vivos no incio do perodo; ocorreram 46 mortes (ocorrncias) e
4 pacientes foram perdidos do acompanhamento (censurados). Assim, 96
(98 (4 2)) pacientes estavam expostos ao risco de morrer, o que resulta
em uma probabilidade de morte de 0,4792 (46 96) e, em consequncia, na
probabilidade de sobreviver de 0,5208 (1 0,4792). Observe que a probabi-
lidade acumulada no segundo intervalo depende do paciente ter sobrevivido
ao intervalo anterior, sendo, portanto, um exemplo de probabilidade condi-
cional. Assim, a sobrevida acumulada aps dois anos do diagnstico de
0,1668, resultado da multiplicao da sobrevida no primeiro intervalo
BIOESTATISTICA_VOL02.indb 271 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 272
(0,3202) pela sobrevida no segundo intervalo (0,5208). Desta forma, neste
estudo, a probabilidade de um paciente com cncer gstrico estar vivo aps
cinco anos do diagnstico de 0,0847 (8,47%).
As probabilidades acumuladas de sobrevivncia podem ser represen-
tadas em um grfico de curva de sobrevida. Neste grfico, a linha disposta
na forma de degraus de uma escada, irregularmente desnivelados, e, para o
exemplo em questo, ela representa a probabilidade de sobrevivncia para os
337 pacientes introduzidos no estudo. Assim, verifica-se, ao longo do tempo,
medida que o ocorre ampliao do intervalo transcorrido desde a admisso
de cada paciente ao estudo, a probabilidade de sobrevivncia torna-se cada
vez menor, uma vez que o nmero de pacientes que permanecem na anlise
decresce a cada intervalo. Alguns programas estatsticos para computa-
dores fornecem grficos com linhas pontilhadas em cada lado da curva de
sobrevida, que representam os limites para o intervalo de confiana de 95%,
o qual pode ser calculado utilizando-se a frmula do erro-padro da proba-
bilidade acumulada de sobrevida. A Figura 22.1, abaixo, mostra o grfico da
curva de sobrevida para o exemplo dado.
Fig. 22.1 - Curva de probabilidade de sobrevida acumulada para pacientes com diagnstico de
cncer gstrico, em Campinas, no perodo entre 1991 e 1994. Mtodo atuarial
BIOESTATISTICA_VOL02.indb 272 25/06/12 17:23
ANLISE DE SOBREVIDA 273
De qualquer modo, embora o mtodo atuarial tenha ampla aplicao na
anlise da curva de sobrevida de pacientes submetidos a determinados tipos
de tratamento, ele pode ser empregado em estudos que analisem outros
desfechos alm de morte, tal como para comparar o tempo de internao de
pacientes submetidos a diferentes procedimentos, para verificar o tempo de
vida til de prteses ou equipamentos mdicos e laboratoriais, ou para analisar
o tempo de adeso de pacientes a determinados programas de sade pblica
etc. Por outro lado, como este mtodo considera que todas as censura ocorrem a
meio caminho do perodo de tempo transcorrido para cada intervalo, isto pode
levar a vis significativo de avaliao caso estes intervalos sejam muito longos,
se houver muitas censuras ou se elas no ocorrerem na metade do intervalo.
Este vis menos preocupante quando o tamanho da amostra relativamente
grande, porm, para pequenas amostras, o problema pode ser contornado pela
aplicao do mtodo de Kaplan-Meier, que ser descrito a seguir.
22.2 MTODO DE KAPLAN-MEIER
Tambm conhecido como mtodo produto-limite de Kaplan-Meier,
a anlise de sobrevida por este mtodo semelhante anlise atuarial,
exceto que o perodo de tempo transcorrido desde a admisso do paciente
ao estudo no subdividido em intervalos fixos, tal como em anos ou
meses, o que o torna adequado para pesquisas com pequenas amostras.
Neste mtodo, uma nova probabilidade de sobrevida calculada toda vez
que registrada uma ocorrncia, isto , uma morte, sendo os afastamentos
(censuras) ignorados. Assim, a cada morte, o mtodo calcula uma nova linha
para a tbua de sobrevida, de tal maneira que os intervalos de tempo so
desiguais, pois as mortes no ocorrem todas com igual perodo de tempo
contado a partir da entrada do paciente no estudo. Por esta razo, a curva
de Kaplan-Meier parece com uma escada cujos degraus, irregularmente
desnivelados, tambm apresentam diferentes comprimentos. Deste modo,
cada morte marca o trmino de um intervalo e o incio de outro, para o qual
a taxa de sobrevida menor que do intervalo anterior, sendo os perodos
de tempo entre as ocorrncias, livres de morte. Portanto, cada ocorrncia
BIOESTATISTICA_VOL02.indb 273 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 274
produz uma queda imediata na probabilidade de sobrevivncia e, ento, um
outro perodo livre de mortes inicia.
Desta forma, no mtodo de Kaplan-Meier, para cada um dos intervalos,
a probabilidade da ocorrncia do desfecho estudado, como o bito, por
exemplo, a probabilidade de sobrevida e a probabilidade acumulada de
sobrevida so calculadas pelas seguintes frmulas:
p
i
- Probabilidade de sobrevida no intervalo. p q
i i
= 1 , onde:
S
i
- Probabilidade acumulada de sobrevida
ao final do intervalo.
S p p p
i i
=
1 2
onde: x x x ... ,
EP - Erro padro da probabilidade acu-
mulada de sobrevida.
EP S S
d
n n d
i i
i
i i i
( )
( )
, =

onde:
q
i
- Probabilidade da ocorrncia do desfecho
em estudo.
d
i
- Nmero de ocorrncias no perodo.
n
i
- Sujeitos vivos no incio do perodo.
q
d
n
i
i
i
= , onde:
Para ilustrar a aplicao prtica do mtodo produto-limite de Kaplan-Meier
para estudo de sobrevida, novamente utilizaremos, parcialmente, os dados do
estudo publicado por Bustamante-Teixeira et al (2002). A Tabela 22.2 mostra o
resultado do estudo at o tempo de 48 meses aps o incio da pesquisa.
Na tabela, a coluna n
i
corresponde ao nmero de pacientes por ocasio
do incio do primeiro intervalo, de tal maneira que, na primeira linha esto
todos pacientes includos no estudo, isto n
1
= 29. Durante este primeiro
intervalo de um ms aps o diagnstico, morreram 5 pacientes (ocorrncias)
e nenhum paciente foi perdido (censurado), de forma que n
1
= 29 e d
1
= 5.
Assim, um ms aps de acompanhamento, a probabilidade de morte foi de
0,1724 (5 29), o que resulta em uma probabilidade de sobreviver igual a
0,8276 (1 0,1724).
BIOESTATISTICA_VOL02.indb 274 25/06/12 17:23
ANLISE DE SOBREVIDA 275
Tabela 22.2 Clculo das probabilidades de sobrevida, pelo mtodo de Kaplan-Meier, para
casos de cncer de estmago diagnosticados em Campinas, entre 1991 e 1994
Meses
aps o
diagnstico
i
Sujeitos vivos
no incio do
ms
n
i
Ocorrncias
no perodo
d
i
Censuras
no perodo
w
i
Probabilidade
do desfecho
q
i
Probabilidade
de sobrevida

p
i
Probabilidade
acumulada
S
i
1 29 5 0 0.1724 0.8276 0.8276
2 24 2 0 0.0833 0.9167 0.7587
3 22 2 1 0.0909 0.9091 0.6897
5 19 2 0 0.1053 0.8947 0.6171
6 17 1 0 0.0588 0.9412 0.5808
10 16 1 1 0.0625 0.9375 0.5445
11 14 2 0 0.1429 0.8571 0.4667
13 12 1 0 0.0833 0.9167 0.4278
14 11 3 0 0.2727 0.7273 0.3111
18 8 1 0 0.1250 0.8750 0.2722
19 7 1 0 0.1429 0.8571 0.2333
38 6 1 0 0.1667 0.8333 0.1945
48 5 1 0 0.2000 0.8000 0.1556
Modifcado de Bustamante-Teixeira et al, 2002
No segundo intervalo, que corresponde ao espao de tempo decorrido no
segundo ms aps o diagnstico, dos 24 pacientes vivos no incio do intervalo,
2 morreram ao final do perodo, o que resulta em uma probabilidade de morte
de 0,0833 (2 24) e, em consequncia, na probabilidade de sobreviver igual a
0,9167 (1 0,0833). Observe que, tal qual o mtodo atuarial, a probabilidade
acumulada no segundo intervalo depende do paciente ter sobrevivido ao
intervalo anterior, sendo, portanto, um exemplo de probabilidade condicional.
Assim, a sobrevida acumulada, aps dois meses do diagnstico, de 0,8577,
resultado da multiplicao da sobrevida no primeiro intervalo (0,8276) pela
sobrevida no segundo intervalo (0,9167). Desta forma, neste estudo, a proba-
bilidade de um paciente com cncer gstrico estar vivo aps 48 meses do
diagnstico de 0,1556 (15,56%).
BIOESTATISTICA_VOL02.indb 275 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 276
Para o mtodo de Kaplan-Meier, as probabilidades acumuladas de sobre-
vivncia tambm podem ser representadas em um grfico de curva de
sobrevida. Neste grfico, a linha disposta na forma de degraus irregular-
mente desnivelados. Para o exemplo em questo, ela representa a probabilidade
de sobrevivncia para os 29 pacientes com cncer gstrico, introduzidos no
estudo. Assim, verifica-se ao longo do tempo, medida que ocorre a ampliao
do intervalo transcorrido desde a admisso de cada paciente ao estudo, a proba-
bilidade de sobrevivncia torna-se cada vez menor, uma vez que o nmero
de pacientes que permanecem na anlise decresce a cada intervalo. Alguns
programas estatsticos para computadores fornecem grficos com linhas
pontilhadas em cada lado da curva de sobrevida, que representam os limites
para o intervalo de confiana de 95%, o qual pode ser calculado utilizando-se
a frmula do erro-padro da probabilidade acumulada de sobrevida. A Figura
22.2, abaixo, mostra o grfico da curva de sobrevida de Kaplan-Meier para o
exemplo da Tabela 22.2.
De qualquer forma, os modelos descritos acima permitem que um
conjunto de curvas de sobrevida acumulada, formadas a partir de duas ou
mais amostras, possam ser comparadas, no sentido de se verificar se elas so
estatisticamente diferentes. Os mtodos mais utilizados para esta compa-
rao sero descritos a seguir.

Fig. 22.2 - Curva de probabilidade de sobrevida acumulada para pacientes com diagnstico de
cncer gstrico, em Campinas, no perodo entre 1991 e 1994. Mtodo de Kaplan-Meier
BIOESTATISTICA_VOL02.indb 276 25/06/12 17:23
ANLISE DE SOBREVIDA 277
22.3 TESTES DE SIGNIFICNCIA ESTATSTICA
Na prtica do dia-a-dia da pesquisa, o que geralmente se deseja comparar
as curvas de sobrevida de pacientes submetidos a diferentes tipos de trata-
mento, no sentido de verificar qual o mais efetivo em termos de prolongar
o tempo de sobrevivncia. No entanto, ao se comparar duas ou mais destas
curvas, pode-se esperar que alguma diferena entre elas ocorra somente por
acaso, em razo do erro aleatrio ou amostral. Assim, para que a hiptese de
nulidade possa ser efetivamente testada, necessria a aplicao de tcnicas
especiais de comparao entre duas distribuies de tempo de sobrevida,
uma vez que o teste t de Student para amostras independentes no pode ser
utilizado, isto porque estes tempos no so normalmente distribudos, ou seja,
no seguem o padro da curva normal gaussiana.
Uma outra opo seria a utilizao de testes no-paramtricos, como o teste
da soma de postos de Wilcoxon-Mann-Whitney, o qual poderia comparar
a ordem dos postos (ranks) dos tempos de sobrevida, conforme explicado no
captulo 17 deste livro. Porm, este teste somente poder ser empregado nos
casos em que todas as ocorrncias (mortes) j tenham acontecido para todos os
sujeitos includos no estudo poca da anlise dos dados. Assim, caso o estudo
da sobrevida seja realizado enquanto alguns indivduos ainda estiverem vivos,
este mtodo no pode ser empregado. Nestes casos, outros procedimentos de
comparao devero ser escolhidos. Dentre estes procedimentos, destacam-se
o teste do logrank e a estatstica do qui-quadrado de Mantel-Haenszel, os
quais sero demonstrados a seguir.
22.3.1 Teste do logrank
Primeiro proposto por Nathan Mantel
4
e posteriormente nomeado por
Richard
5
e Julian Peto
6
, o teste do logrank utilizado para comparar as curvas
4. Nathan Mantel (1919-2002) - Bioestatstico americano que, juntamente com William Haenszel,
idealizou o teste conhecido como odds ratio de Mantel-Haenszel.
5. Richard Peto (1943-?) Estatstico e epidemiologista ingls, professor de estatstica mdica e
epidemiologia na Universidade de Oxford.
6. Julian Peto Estatstico e epidemiologista ingls, professor da Escola de Medicina Tropical de
Londres, que, com seu irmo Richard Peto, publicou artigos com o teste do logrank.
BIOESTATISTICA_VOL02.indb 277 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 278
de sobrevida de duas amostras, geralmente de um grupo controle e um grupo
tratamento, no sentido de verificar a hiptese nula de que cada grupo tem a
mesma probabilidade de sobrevida. Assim, apesar do nome, este teste no
utiliza logaritmos ou postos (ranks) na sua frmula; na prtica, ele compara
o nmero de mortes (ocorrncias) observadas (O) em cada grupo com o
nmero de mortes que seriam esperadas (E) tomando-se por base o nmero
total de bitos verificados nos dois grupos, quando analisados de maneira
combinada. Deste modo, cada vez que uma morte ocorre, o teste calcula a
probabilidade de que esta morte observada tenha ocorrido no grupo trata-
mento e a probabilidade que tenha ocorrido no grupo controle, sendo cada
probabilidade, proporcional ao nmero de sobreviventes em cada grupo,
para aquele ponto no tempo.
Em seguida, o nmero de mortes esperadas para cada grupo, e em cada
ponto no tempo, calculado multiplicando-se o nmero total de mortes
no perodo pela proporo de pacientes ainda vivos no mesmo perodo.
Ento, dentro de cada grupo em estudo, os nmeros das mortes observadas
e esperadas so somados para que os totais possam ser comparados pela
aplicao do teste do qui-quadrado (
2
) com 1 grau de liberdade, conforme a
frmula mostrada abaixo:
Onde: O
T
e E
T
= Mortes observadas e esperadas no grupo tratamento.
O
C
e E
C
= Mortes observadas e esperadas no grupo controle.
Como os mtodos de curva de sobrevida podem ser empregados em estudos
que analisem outros desfechos de interesse alm de morte, para ilustrar uma
aplicao prtica do teste logrank, utilizaremos um exemplo fictcio tomado de
uma indstria de processamento de alimentos.
Exemplo: Suponhamos que uma indstria alimentcia queria comparar os
tempos de vida de prateleira (shelflife) de carne bovina resfriada e acondi-
cionada em dois diferentes tipos de embalagem: Tipo A, selada a vcuo; e Tipo
logrank
2
2 2
=

+
( ) ( ) O E
E
O E
E
T T
T
C C
C
BIOESTATISTICA_VOL02.indb 278 25/06/12 17:23
ANLISE DE SOBREVIDA 279
B, selada com atmosfera modificada. Para tal experimento, 40 peas de carne
resfriada foram pesadas (1 kg) e aleatoriamente divididas em duas amostras
de 20 unidades cada, denominadas A e B. As peas da amostra A foram indivi-
dualmente colocadas em embalagens seladas a vcuo; as peas da amostra B
foram acondicionadas em embalagens com atmosfera modificada
7
. Ambas as
amostras foram mantidas sob refrigerao a uma temperatura de 4C, durante
o perodo de 16 dias. As ocorrncias foram consideradas pela anlise sensorial
das carnes, quando estas apresentassem caractersticas de deteriorao que
a tornavam imprpria para o consumo, tais como alta limosidade, colorao
plida, formao de exsudato e odor levemente desagradvel. Os dados do
experimento esto relacionados na Tabela 22.3.
Tabela 22.3 Clculo dos valores do teste logrank para as curvas de vida de prateleira de duas
amostras de carne bovina resfriada
Tempo
(dias)
Embalagens expostas ao risco Ocorrncias observadas Ocorrncias Esperadas
Tipo A Tipo B Total Tipo A Tipo B Total Tipo A Tipo B Total
5 20 20 40 1 0 1 0,50 0,50 1
6 19 20 39 1 0 1 0,49 0,51 1
7 18 20 38 2 0 2 0,95 1,05 2
8 16 20 36 3 1 4 1,78 2,22 4
9 13 19 32 4 1 5 2,03 2,97 5
10 9 18 27 5 1 6 2,00 4,00 6
11 4 17 21 3 2 5 0,95 4,05 5
12 1 15 16 1 2 3 0,19 2,81 3
13 0 13 13 0 3 3 0,00 3,00 3
14 0 10 10 0 4 4 0,00 4,00 4
15 0 6 6 0 4 4 0,00 4,00 4
16 0 2 2 0 2 2 0,00 2,00 2
Totais O
A
= 20 O
B
= 20 40 E
A
= 8,88 E
B
= 31,12 40
7. Mtodo de embalagem de alimentos, cujo ar atmosfrico ao redor do produto substitudo por
uma mistura otimizada de CO
2
, N
2
e O
2
. Proporciona um aumento da vida til do produto pelo
controle do desenvolvimento de microorganismos.
BIOESTATISTICA_VOL02.indb 279 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 280
Passo 1 Formular as hipteses estatsticas:
H O E
0
: =
(as duas curvas no diferem entre si quanto ao tempo de prate-
leira das amostras estudadas).
H O E
A
:
(as curvas diferem entre si quanto ao tempo de prateleira das
amostras estudadas).
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%)
Passo 3 Determinar o valor crtico do teste:
gl =
=
1
3 84
0 05 1
2

, ;
,

Passo 4 Calcular o valor do teste:
logrank
2
2 2
20 8 88
8 88
20 31 12
31 12
13 9 =

+

=
( , )
,
( , )
,
, 22 3 97 17 89 + = , ,
Passo 5 Regra de deciso:
Se rank aceita se H
Se ran
log , - .
log
, ;

2
0 05 1
2
0
<
kk rejeita se H
Como rank

2
0 05 1
2
0
2

=
, ;
, - .
log 17 89 3 84
0 05 1
2
0
, , , - .
, ;
> = rejeita se H

Passo 6 Concluso:
Como o valor calculado para logrank
2
maior que o valor crtico tabelado

0 05 1
2
, ;
, rejeita-se H
0
e conclui-se que existe uma diferena estatisticamente
significativa entre as distribuies dos tempos de prateleira das duas
amostras de carne bovina resfriada. Portanto, o produto embalado com
atmosfera modificada apresentou maior probabilidade de conservao at
o tempo analisado, pois logrank
2
17 89 0 0001 = < , ; , P .
A Figura 22.3 mostra o grfico de comparao para as curvas de probabi-
lidade relativas s duas amostras estudadas
BIOESTATISTICA_VOL02.indb 280 25/06/12 17:23
ANLISE DE SOBREVIDA 281
Fig. 22.3 - Curvas de probabilidade acumulada de vida de prateleira para as duas amostras
de carne bovina resfriada. Mtodo de Kaplan-Meier
Clculo da razo de risco
O mtodo de logrank permite que a razo de risco entre as duas amostras
possa ser facilmente calculada com base nos valores observados e esperados.
Para o exemplo em questo, a razo de risco de deteriorao da carne resfriada
calculada dividindo-se o risco de deteriorao para a amostra embalada a
vcuo pelo risco para a amostra embalada com atmosfera modificada. A frmula
dada pela seguinte equao:
Razo de Risco ( )
/
/
/ ,
/ ,
RR
O E
O E
A A
B B
= = =
20 8 88
20 31 12
22 25
0 64
3 51
,
,
, =
Observe que a razo de risco igual a 3,51 deve ser interpretada da seguinte
maneira: o risco de deteriorao para o grupo de carnes resfriadas e acondicio-
nadas em embalagens seladas a vcuo foi 3,51 vezes maior quando comparado
ao risco para o grupo de carnes resfriadas e acondicionadas em embalagens
com atmosfera modificada. A razo de risco calculada pressupe que o risco ou
a probabilidade de deteriorao igual em qualquer tempo do estudo; no caso,
para qualquer um dos 16 dias da pesquisa.
BIOESTATISTICA_VOL02.indb 281 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 282
22.3.2 Estatstica do qui-quadrado de
Mantel-Haenszel
O teste do qui-quadrado de Mantel-Haenszel pode ser utilizado para
comparar outros tipos de distribuio, alm das curvas de sobrevida calculadas
pelo mtodo atuarial ou Kaplan-Meier. O mtodo consiste em combinar uma
srie de tabelas de contingncia 2 x 2
8
construdas a partir dos valores das
amostras, uma para cada um dos diferentes intervalos de tempo de sobrevi-
vncia. Assim, a primeira etapa definir os intervalos de tempo para que as
tabelas possam ser construdas, nas quais os valores dos indivduos vivos e
das ocorrncias (mortos) so colocados nas linhas da tabela, enquanto que o
nmero de sujeitos de cada grupo colocado nas colunas.
Aps calcular os totais das linhas e das colunas de cada tabela, a estatstica
Mantel-Haenszel calculada com base no valor da casela superior esquerda
(casela a), para a qual calculado o seu valor esperado (E
a
) e a varincia
deste valor esperado (V
a
), para cada uma das tabelas 2 x 2. As frmulas so as
seguintes:
E a ( ) =
Total da linha Total da coluna
Total ggeral
n - Total geral da tabela. V a
a c b d a b c d
n n
( )
( )( )( )( )
( )
, =
+ + + +

2
1
ondde:
Aps o clculo do valor esperado e da varincia da casela a de cada uma
das tabelas, estes valores devem ser somados, assim como devem ser somados
os valores observados para a mesma casela. O teste de Mantel-Haenszel
calculado dividindo-se a diferena entre a soma dos valores observados (O
a
)
e a soma dos valores esperados (E
a
), elevada ao quadrado, pela soma das
varincias (V
a
). A frmula a seguinte:
Mantel Haenszel
O a E a
V a
i i
i
-
( ) ( )
( )

2
2
=

8. Para saber mais sobre a tabela de contingncia 2 x 2, sugerimos que o leitor consulte o captulo
14 deste livro.
n - Total geral da tabela.
BIOESTATISTICA_VOL02.indb 282 25/06/12 17:23
ANLISE DE SOBREVIDA 283
22.3.2 Estatstica do qui-quadrado de
Mantel-Haenszel
O teste do qui-quadrado de Mantel-Haenszel pode ser utilizado para
comparar outros tipos de distribuio, alm das curvas de sobrevida calculadas
pelo mtodo atuarial ou Kaplan-Meier. O mtodo consiste em combinar uma
srie de tabelas de contingncia 2 x 2
8
construdas a partir dos valores das
amostras, uma para cada um dos diferentes intervalos de tempo de sobrevi-
vncia. Assim, a primeira etapa definir os intervalos de tempo para que as
tabelas possam ser construdas, nas quais os valores dos indivduos vivos e
das ocorrncias (mortos) so colocados nas linhas da tabela, enquanto que o
nmero de sujeitos de cada grupo colocado nas colunas.
Aps calcular os totais das linhas e das colunas de cada tabela, a estatstica
Mantel-Haenszel calculada com base no valor da casela superior esquerda
(casela a), para a qual calculado o seu valor esperado (E
a
) e a varincia
deste valor esperado (V
a
), para cada uma das tabelas 2 x 2. As frmulas so as
seguintes:
E a ( ) =
Total da linha Total da coluna
Total ggeral
n - Total geral da tabela. V a
a c b d a b c d
n n
( )
( )( )( )( )
( )
, =
+ + + +

2
1
ondde:
Aps o clculo do valor esperado e da varincia da casela a de cada uma
das tabelas, estes valores devem ser somados, assim como devem ser somados
os valores observados para a mesma casela. O teste de Mantel-Haenszel
calculado dividindo-se a diferena entre a soma dos valores observados (O
a
)
e a soma dos valores esperados (E
a
), elevada ao quadrado, pela soma das
varincias (V
a
). A frmula a seguinte:
Mantel Haenszel
O a E a
V a
i i
i
-
( ) ( )
( )

2
2
=

8. Para saber mais sobre a tabela de contingncia 2 x 2, sugerimos que o leitor consulte o captulo
14 deste livro.
n - Total geral da tabela.
Para ilustrar a aplicao prtica do qui-quadrado de Mantel-Haenszel como
mtodo para comparar duas curvas de sobrevida, utilizaremos o exemplo a seguir.
Exemplo: Um estudo experimental com Ratos Wistar cirrticos
9
foi
conduzido com o objetivo de comparar as curvas de sobrevida para dois
diferentes tipos de tratamento. Ao primeiro grupo, constitudo de 16 animais,
foi ministrada a droga A por um perodo de cinco semanas; ao segundo grupo,
de 20 animais, a droga B foi ministrada por mesmo perodo de tempo. Existe
diferena estatisticamente significativa entre as curvas de sobrevida para os
grupos estudados? Os dados esto relacionados na Tabela 22.4, abaixo.
Tabela 22.4 Clculo dos valores do teste do qui-quadrado de Mantel-Haenszel para as curvas
de sobrevida de ratos cirrticos submetidos a dois diferentes tipos de tratamento
Semanas
Tabela 2 x 2 Observado Esperado Varincia Chances
Droga A Droga B Total a
i
E(a
i
) V(a
i
) ad/n bc/n
1
Vivos 13 18 31 13 13,78 1,09 0,72 1,50
Mortos 3 2 5
Total 16 20 36
2
Vivos 9 15 24 9 10,06 1,36 0,87 1,94
Mortos 4 3 7
Total 13 18 31
3
Vivos 4 11 15 4 5,62 1,38 0,67 2,29
Mortos 5 4 9
Total 9 15 24
4
Vivos 2 7 9 2 2,40 0,75 0,53 0,93
Mortos 2 4 6
Total 4 11 15
5
Vivos 1 5 6 1 1,33 0,39 0,22 0,56
Mortos 1 2 3
Total 2 7 9
Somas 29,0 33,19 4,98 3,02 7,22
Qui-quadrado de Mantel-Haenszel = 3,52
OR = 0,42
9. A cirrose heptica em ratos pode ser experimentalmente induzida pela ligadura do ducto biliar
comum por um perodo de quatro semanas.
BIOESTATISTICA_VOL02.indb 283 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 284
Passo 1 Formular as hipteses estatsticas:
H O E
0
: =
(as probabilidades das curvas no diferem entre si quanto ao
tempo de sobrevida dos grupos estudados);
H O E
A
:
(as probabilidades das curvas diferem entre si quanto ao tempo
de sobrevida dos grupos estudados).
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%)
Passo 3 Determinar o valor crtico do teste:

gl =
=
1
3 84
0 05 1
2

, ;
,
Passo 4 Calcular o valor do teste:

Mantel Haenszel -
, ,
,
,
2
29 0 33 19
4 98
3 52 =

=
Passo 5 Regra de deciso:

Se Mantel Haenszel aceita se H
S
- , - .
, ;

2
0 05 1
2
0
<
ee Mantel Haenszel rejeita se H - , - .
, ;

2
0 05 1
2
0

CComo Mantel Haenszel - , , ,


, ;

2
0 05 1
2
3 52 3 84 = < = aceita se H - .
0
Passo 6 Concluso:
Como o valor calculado para o qui-quadrado de Mantel-Haenszel menor
que o valor crtico tabelado

0 05 1
2
, ;
, aceita-se H
0
e conclui-se que no
existe diferena estatisticamente significativa entre as probabilidades das
curvas de sobrevida para os dois grupos analisados. Portanto, o tempo
de sobrevida para o grupo de animais tratados com a droga A no diferiu
do tempo de sobrevida do grupo de animais tratados com a droga B, pois
Mantel-Haenszel
2
3 52 0 0971 = = , ; , P .
A Figura 22.4 mostra o grfico de comparao para as curvas de probabi-
lidade acumulada de sobrevida relativas aos dois grupos de ratos.
BIOESTATISTICA_VOL02.indb 284 25/06/12 17:23
ANLISE DE SOBREVIDA 285
Fig. 22.4 - Curvas de probabilidade acumulada de sobrevida para os dois grupos de ratos
cirrtico submetidos a dois diferentes tipos de tratamento. Mtodo de Kaplan-Meier
Clculo da razo de chance combinada
Embora no seja necessrio para o clculo do teste do qui-quadrado de
Mantel-Haenszel, a odds ratio combinada pode ser estimada para fins de
anlise dos resultados. A frmula dada por:
OR
a d
n
b c
n
MH
i i
i
i i
i
x
=

x
OR
MH
= =
3 02
7 22
0 42
,
,
,
Para o exemplo em questo, o valor calculado significa que a chance de
sobrevida para o grupo de ratos cirrticos tratados com a droga A foi 0,42
(42:100) vezes maior quando comparada chance para o grupo de animais
tratados com a droga B. Observe que o valor menor que 1 decorre do fato do
numerador da frao ser menor que o denominador, pois a chance absoluta
para o grupo A (3,02) menor que para o grupo B (7,22), o que torna a inter-
pretao do resultado um tanto confuso para os menos experientes. Assim,
uma maneira mais compreensvel seria inverter a frao, o que d uma OR
MH

igual a 2,39 (7,22/3,02). Este procedimento no altera a relao das chances
BIOESTATISTICA_VOL02.indb 285 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 286
entre os grupos. Assim, neste caso, a chance de sobrevida para o grupo de ratos
tratados com a droga B 2,39 vezes maior quando comparada chance para o
grupo de ratos tratados com a droga A. Este valor da razo de chance pressupe
que a probabilidade de sobrevivncia igual em qualquer tempo do estudo; no
caso, para qualquer uma das cinco semanas da pesquisa.
Como anteriormente relatado, os procedimentos descritos acima so os
mais utilizados para a comparao de curvas de sobrevida. Entretanto, vrios
outros mtodos de anlise existentes na literatura podem ser empregados,
sendo todos muito semelhantes. Dentre eles, citamos os testes de Gehan
(Wilcoxon generalizado) ou o modelo de risco proporcional de Cox. Assim,
para um maior aprofundamento sobre o assunto, sugerimos ao leitor consultar
os seguintes autores: Breslow e Day (1993), Dawson e Trapp (2003).
BIOESTATISTICA_VOL02.indb 286 25/06/12 17:23
23
Experimentos Fatoriais
Como intensamente explanado ao longo de todos os captulos deste
livro, o objetivo da maioria das pesquisas determinar a influncia de uma
ou mais variveis preditoras sobre uma outra varivel de interesse, a qual
dita varivel-resposta ou dependente. Na prtica, o que sempre se deseja
saber de que maneira estas variveis preditoras, doravante denominadas de
fatores, interagem entre si de modo que possam influenciar o comportamento
da varivel-resposta; como, tambm, desejvel conhecer o comportamento
desta varivel frente a qualquer alterao introduzida em um dos fatores.
Assim, diante desta ideia, percebe-se que o conjunto como um todo constitui
um sistema complexo que atua como uma funo matemtica, de modo que, a
cada alterao de um dos fatores, pode-se prever o comportamento da resposta,
mesmo que de maneira aproximada, sendo o objetivo da pesquisa, determinar
esta funo, para que melhores previses possam ser feitas.
Portanto, em qualquer projeto de pesquisa, o passo inicial escolher os fatores
(variveis) de interesse que sero controlados (manipulados) pelo pesquisador,
e a resposta que se quer estudar, de modo que o experimento possa ser adequa-
damente planejado. Por sua vez, quando desejamos estudar um grande nmero
de fatores na determinao da resposta, sempre possvel que alguns deles no
tenham qualquer influncia sobre o desfecho, e, estud-los, seria desperdcio de
1. Doutor em Estatstica, Professor do Instituto de Cincias Exatas e Naturais da Universidade
Federal do Par.
Mauro Jos Fontelles
Edson Marcos Leal Soares Ramos
1
BIOESTATISTICA_VOL02.indb 287 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 288
tempo e de recursos materiais. Nestes casos, a melhor conduta seria realizar uma
seleo prvia, para decidir quais dos fatores merecem ser includos no modelo,
sendo os experimentos fatoriais o modelo de planejamento mais adequado para
este propsito, os quais sero explanados neste captulo.
23.1 NOES BSICAS SOBRE
EXPERIMENTOS FATORIAIS
No dia-a-dia da pesquisa, geralmente utilizamos experimentos mais
simples, que comparam diferentes nveis de um nico fator, considerando
que todos os demais fatores que possam interferir no resultado da resposta
se mantenham constantes. Isto ocorre, por exemplo, quando comparamos os
efeitos de diferentes doses de uma droga experimental (fator) em um mesmo
grupo de animais, mantendo-se constante a massa corporal, a idade, o sexo
etc. Porm, existem diversos outros modelos de delineamento, nos quais as
variaes de dois ou mais fatores devem ser estudadas simultaneamente; neste
caso, estamos falando de experimento fatorial, como por exemplo, se compa-
rarmos diferentes dosagens da droga em grupos de animais com diferentes
valores da massa corporal e da idade. Desta forma, interessante ressaltar que
os experimentos fatoriais geralmente so mais eficientes que os experimentos
simples, pois permitem, ao pesquisador, extrair concluses mais fidedignas.
Por exemplo, se o objetivo for mensurar o nvel da excreo urinria de
uma nova droga experimental, 1 hora aps a administrao oral da mesma, e
se forem ministradas quatro doses diferentes (D
1
, D
2
, D
3
e D
4
), da mesma droga,
em quatro animais com o mesmo peso corporal, somente poderemos concluir
que a dose D
1
, por exemplo, a que apresentou menor nvel de excreo para
aquela massa corporal estudada. Porm, possvel que, para outro valor de
peso, a dose D
2
supere todas as outras dosagens, em relao excreo renal.
Assim, num experimento fatorial, variando-se simultaneamente as doses do
medicamento e os pesos dos animais, todas as possibilidades possveis so
pesquisadas, de maneira que as concluses so mais generalizadas.
Portanto, como regra geral, define-se como experimento fatorial, o tipo de
delineamento que correlaciona as combinaes entre os diferentes nveis mensu-
BIOESTATISTICA_VOL02.indb 288 25/06/12 17:23
EXPERIMENTOS FATORIAIS 289
rados para dois ou mais fatores, sendo os fatores representados por cada uma das
variveis preditoras, para as quais os nveis so fixados segundo o interesse do
pesquisador. Desta forma, cada uma das subdivises de um fator denominada
de nvel do fator, e todas as possveis combinaes entre os diversos fatores nos
seus diferentes nveis, so denominadas de tratamentos ou ensaios. Assim, se
todas as possveis combinaes, entre todos os nveis mensurados de cada fator
forem consideradas no modelo, o esquema dito experimento fatorial completo.
Caso inclua apenas fraes bem definidas do modelo completo, o delineamento
dito experimeto fatorial incompleto, o qual muito til na seleo dos nveis
adequados e/ou daqueles fatores que, de fato, influenciam na varivel-resposta.
De qualquer modo, a maioria dos autores no considera os experimentos
fatoriais como um delineamento experimental, mas, sim, um esquema de
desdobramento de modelos de tratamento que pode ser adaptado a qualquer
um dos delineamentos experimentais, tais como o delineamento inteiramente
casualizado (DIC) ou em blocos casualizados (DBC), anteriormente abordados
(ver ANOVA), ou em quadrados latinos (DQL) etc. Neste livro, consideraremos
os delineamentos inteiramente casualizados.
Por exemplo, se tomarmos um delineamento inteiramente casualizado, com
somente dois fatores, temperatura (T) e Presso (P), cada um deles, mensurado
em dois nveis, 1 e 2, teremos um experimento fatorial 2 x 2, com 4 possveis
combinaes (tratamentos) as quais so representadas da seguinte forma:
T
1
P
1
T
1
P
2
T
2
P
1
T
2
P
2

Porm, se os fatores forem mensurados em trs nveis, 1, 2 e 3, teremos um
experimento fatorial 3 x 3, isto , com 9 possveis combinaes:
T
1
P
1
T
1
P
2
T
1
P
3
T
2
P
1
T
2
P
2
T
2
P
3
T
3
P
1
T
3
P
2
T
3
P
3
Assim, se representarmos por k o nmero de fatores, e por N o nmero de nveis
mensurados para cada fator, um experimento fatorial completo ter o nmero de
BIOESTATISTICA_VOL02.indb 289 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 290
possveis combinaes determinado por N
k
. Deste modo, observa-se que o nmero
de ensaios cresce exponencialmente medida que um novo fator ou um nvel de
mensurao acrescentado ao experimento, de tal maneira que modelos completos
com a utilizao de 7 ou mais fatores com dois nveis, ou 4 fatores com 3 ou mais
nveis, tornam-se experimentalmente inviveis em razo do grande nmero de
combinaes. A Tabela 23.1 mostra as possveis combinaes para experimentos
fatoriais completos com at 6 fatores mensurados em at 4 nveis.
Tabela 23.1 Nmero de possveis combinaes para esquemas fatoriais completos
at k = 6 e N = 4
Nveis de
mensurao
Fatores (variveis)
k = 2 k = 3 k = 4 k = 5 k = 6
N = 2 2
2
= 4 2
3
= 8 2
4
= 16 2
5
= 32 2
6
= 64
N = 3 3
2
= 9 3
3
= 27 3
4
= 81 3
5
= 243 3
6
= 729
N = 4 4
2
= 16 4
3
= 64 4
4
= 256 4
5
= 1.024 4
6
= 4.096
Note que o principal problema dos experimentos fatoriais que o nmero
de tratamentos aumenta rapidamente com um pequeno aumento do nmero
das variveis. Assim, uma soluo para resolver este problema seria a escolha
de delineamentos fatoriais incompletos ou fracionados, os quais podem ser
utilizados para selecionar os fatores e/ou os seus nveis, que produzem as
melhores respostas para a varivel de desfecho estudada.
Por outro lado, a anlise estatstica mais trabalhosa, pois so necessrios
os clculos dos efeitos principais e da interao de todos os fatores, alm do
que, a interpretao dos resultados se torna mais difcil medida aumenta o
nmero de nveis e de fatores no experimento.
Interao entre fatores
Nos experimentos fatoriais, pode-se estudar no apenas os efeitos indivi-
duais de cada um dos fatores, mas, tambm, se existe interao entre os diversos
fatores considerados no modelo. A interao entre dois ou mais fatores ocorre
quando a modificao na varivel-resposta, decorrente da variao entre os
nveis de um fator, no igual modificao decorrente da mesma variao dos
outros fatores. Isto , a interao ocorre quando a mudana de nvel em um dos
BIOESTATISTICA_VOL02.indb 290 25/06/12 17:23
EXPERIMENTOS FATORIAIS 291
fatores produz uma modificao na resposta em um dos nveis do outro fator,
diferente da resposta produzida nos outros nveis deste mesmo fator.
Para ilustrar este conceito, vamos considerar o exemplo de um experimento
fatorial que combina 3 doses (D
0
, D
1
e D
2
) de uma droga, com 2 medidas (P
0
e P
1
)
de massa corporal, em animais, cujo o objetivo mediar a excreo urinria da
referida droga. As mdias dos valores esto apresentadas na tabela abaixo.
Tabela 23.2 Valores mdios da excreo urinria da droga, em mcg/ml, conforme
a dose e a massa corporal
Dose da droga (Fator A)
Massa corporal (Fator B)
P
0
P
1
D0 10 20
D1 20 30
D2 30 40
Os grficos abaixo ilustram a relao entre os dois fatores considerados no
estudo. Neles, podemos verificar que as linhas correspondentes aos diferentes
nveis de cada um dos fatores so paralelas entre si. Isto mostra que, para todos os
nveis do fator A, a diferena entre as mdias para os nveis do fator B a mesma.
Do mesmo modo, para os dois nveis do fator B, as diferenas entre as mdias
de quaisquer dos nveis do fator A so sempre iguais. Estas trs caractersticas,
quando presentes, mostram no haver interao entre os fatores estudados.

Fig. 23.1 Grfcos que mostram a ausncia de interao entre os fatores dose e massa
corporal, em relao excreo urinria de uma droga experimental
BIOESTATISTICA_VOL02.indb 291 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 292
Nos experimentos fatoriais, quando a interao entre os fatores est
presente, isto pode afetar as observaes, de tal modo que os resultados da
pesquisa podem ser estudados pela combinao de diferentes nveis de cada
um dos fatores. Assim, quando dois fatores so investigados, uma alternativa
seria conduzir dois diferentes experimentos, um para cada fator. Caso isto seja
feito, cada experimento fornecer apenas informao sobre o seu prprio fator,
de tal maneira que, se mais informaes fossem necessrias, novos fatores
deveriam ser investigados, o que aumentaria consideravelmente o nmero de
experimentos. Por esta razo, a alternativa mais lgica seria estudar todos os
fatores de modo simultneo, todos reunidos em um experimento fatorial, o
que mostra ser um nico experimento com dois ou mais fatores, mais rpido,
preciso e econmico que dois ou mais experimentos com um nico fator.
A Figura 23.2, abaixo, mostra os grficos que ilustram um experimento no
qual ocorre interao entre os fatores.



Fig. 23.2 Grfcos que mostram a presena de interao entre os fatores dose e massa
corporal, em relao excreo urinria de uma droga experimental
Assim, quando o efeito de um fator depende do nvel do outro,dizemos que
os dois fatores interagem. Neste caso, possvel calcular o efeito da interao
entre eles, o que ser demonstrado a seguir. Para tal objetivo, vamos considerar
um experimento fatorial 2 x 2, com os fatores, dose da droga, mensurada nos
nveis D
0
e D
1
, e peso corporal (P), nos nveis P
0
e P
1
. A varivel de desfecho
estudada o valor da excreo urinria da referida droga. Os dados esto
representados na Tabela 23.3, abaixo.
BIOESTATISTICA_VOL02.indb 292 25/06/12 17:23
EXPERIMENTOS FATORIAIS 293
Tabela 23.3 Valores mdios da excreo urinria da droga, em mcg/ml, conforme
a dose e o peso corporal
Dose da droga (Fator A)
Peso corporal (Fator B)
Total
P
0
P
1
D
0
22 35 57
D
1
48 73 121
Total 70 108 178
A Figura 23.3 mostra a representao geomtrica dos efeitos do experi-
mento relacionado na Tabela 23.3. Os vrtices do quadrado representam os
resultados da excreo urinria da droga para todas as possveis combinaes
entre os dois fatores includos no experimento, ao passo que os sinais + e
representam o menor e o maior nvel desses fatores.
Fig. 23.3 Representao geomtrica de um delineamento fatorial 2 x 2
Efeito simples de um fator
Corresponde ao valor da variao da varivel-resposta, no caso, a excreo
urinria da droga, em razo das variaes nos nveis de um fator, em cada um
dos nveis do outro fator. dado pelas seguintes equaes:
Efeito simples do Fator A (Dose) no nvel P
0
do Fator B (Peso).
Dose
(em P0)
= y
2
y
1
= 48 22 = 26 mcg/ml.
Interpretao: Ao nvel de P
0
, a variao da dose da droga causa uma
alterao de 26 mcg/ml na excreo urinria.
BIOESTATISTICA_VOL02.indb 293 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 294
Efeito simples do Fator A (Dose) no nvel P
1
do Fator B (Peso).
Dose
(em P1)
= y
4
y
3
= 73 35 = 38 mcg/ml.
Interpretao: Ao nvel de P
1
, a variao da dose da droga causa uma
alterao de 38 mcg/ml na excreo urinria.
Efeito simples do Fator B (Peso) no nvel D
0
do Fator A (Dose).
Peso
(em D0)
= y
3
y
1
= 35 22 = 13 mcg/ml.
Interpretao: Ao nvel de D
0
, a variao do peso causa uma alterao de
13 mcg/ml na excreo urinria.
Efeito simples do Fator B (Peso) no nvel D
1
do Fator A (Dose).
Peso
(em D1)
= y
4
y
2
= 73 48 = 25 mcg/ml.
Interpretao: Ao nvel de D
1
, a variao do peso causa uma alterao de
25 mcg/ml na excreo urinria.
Efeito principal de um fator
Corresponde diferena entre os valores mdios das variaes da
varivel-resposta, no caso a excreo urinria da droga, medidos nveis
de um fator, independentemente dos nveis do outro fator. Para o exemplo
em questo, o efeito principal do Fator A (Dose) pode ser entendido como
a diferena entre as mdias da variao da excreo urinria da droga,
medidas nos dois nveis de A, independente do fator B (Peso). dado pelas
seguintes equaes:
Efeito principal do Fator A (Dose).
Fator A Dose
y y y y
( )
( ) ( )
( ) (
=
+

+
=
+

+
2 4 3 1
2 2
73 48
2
35 222
2
32
)
/ = mcg ml

Interpretao: quando a dose administrada passa do nvel baixo para o
nvel alto, isto causa um aumento mdio de 32 mcg/ml na excreo urinria
da droga.
Efeito principal do Fator B (Peso).

Fator B Peso
y y y y
( )
( ) ( )
( ) (
=
+

+
=
+

+
3 4 1 2
2 2
35 73
2
22 488
2
38
)
/ = mcg ml
BIOESTATISTICA_VOL02.indb 294 25/06/12 17:23
EXPERIMENTOS FATORIAIS 295
Interpretao: quando o peso passa do nvel baixo para o nvel alto, isto
causa um aumento de 38 mcg/ml na excreo urinria da droga.
Efeito da interao entre dois fatores
Corresponde ao valor da variao que ocorre na varivel-resposta, em razo
da variao nos nveis de um fator, quando este passa de um nvel a outro do outro
fator. Para o exemplo em questo, o efeito da interao entre os Fatores A e B pode
ser entendido como a diferena entre a variao de A (Dose) em P
1
e a variao de
A (Dose) em P
0.
Pode ser calculada por uma das duas frmulas abaixo.
Efeito da interao do Fator A (Dose) x Fator B (Peso).


Dose Peso =
Efeito da Dose Efeito
(emP1)

da Dose
2
ou ainda,
(emP0)
=

=
( )
,
38 26
2
6
ou ainda,
Peso Dose =
Efeito do Peso Efeito
(emD1)

do Peso
2
(emD0)
=

=
( ) 25 13
2
6
Note que tanto faz calcular a interao AB como BA, o resultado o mesmo.
Porm, a maneira mais simples de calcular o efeito da interao entre dois
fatores pelo clculo da diferena (contraste) entre as mdias determinadas
pelas duas diagonais. A equao a seguinte:

AB
y y y y y y y y
=
+

+
=
+ ( ) ( )
1 4 2 3 1 2 3 4
2 2 2
Assim para o exemplo em questo, teramos:
AB =
+
= =
22 48 35 73
2
12
2
6
Note, tambm, que, na representao geomtrica de um experimento
fatorial, os efeitos principais dos fatores so calculados pelas diferenas entre
os lados opostos, ao passo que o efeito de interao dado pelo contraste entre
as duas diagonais do quadrado. A seguir, mostraremos um delineamento intei-
ramente casualizado, com modelo fatorial 2
2
.
BIOESTATISTICA_VOL02.indb 295 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 296
23.2 EXPERIMENTO FATORIAL 2
2
Para realizar um experimento fatorial 2 x 2, o primeiro passo definir as
variveis preditoras, isto , os dois fatores (ou classes, para dados qualitativos)
que atuaro na determinao da varivel de desfecho (varivel-resposta).
Portanto, para efeito de ilustrao, vamos supor o seguinte exemplo:
Exemplo: Uma indstria de alimentos conduziu um experimento para
estudar os efeitos da temperatura (Fator A) e do tempo (Fator B) sobre o
rendimento, em porcentagem, de um novo produto extrusado (desfecho).
Assim, para que se possa estudar o efeito de qualquer fator sobre uma
varivel-resposta, necessrio faz-lo variar e observar o resultado que essa
variao produz sobre essa varivel de desfecho. Para isso, precisamos estudar
o efeito de cada fator em pelo menos dois diferentes nveis, o que nos leva a
concluir que o experimento mais simples aquele em que cada fator varia
somente entre dois nveis. Neste experimento, cada fator ser medido em dois
nveis: baixo () e alto (+).
O prximo passo escolher os nveis de variao de cada um dos dois fatores.
Esta escolha muito importante e deve ser embasada em conhecimento prvio
sobre a relao entre as variveis estudadas. Na prtica, os melhores nveis
devem ser escolhidos com base em dados publicados na literatura ou colhidos
em ensaios aleatrios realizados em um projeto piloto. Isto evita que o pesqui-
sador atire no escuro, isto , que tente adivinhar quais so os melhores nveis
para o seu experimento. Consideram-se como nveis mximo e mnimo ideais
para um determinado fator, aqueles que, no ensaio piloto, produzem a melhor
e a pior resposta sobre a varivel-resposta, respectivamente, quando este fator
considerado de maneira individual. Para efeitos ilustrativos, tomaremos os
seguintes nveis para as variveis estudadas:
Fator A (Temperatura): Nvel inferior T = 60
o
C.
Nvel superior T+ = 80
o
C.
Fator B (Tempo): Nvel inferior t = 20 min.
Nvel superior t+ = 30 min.
Portanto, para fazer o experimento, deve-se realizar todos os ensaios
possveis (quatro para o fatorial 2 x 2) e registrar as respectivas respostas
BIOESTATISTICA_VOL02.indb 296 25/06/12 17:23
EXPERIMENTOS FATORIAIS 297
observadas (rendimentos do produto) para cada uma das quatro possveis
combinaes entre os nveis escolhidos. Assim, teremos: 60
o
C x 20 min, 60
o
C
x 30 min, 80
o
C x 20 min e 80
o
C x 30 min. Para que se possa estimar o erro
aleatrio da resposta em cada uma das combinaes, os ensaios so todos reali-
zados com trs repeties (triplicata). Este procedimento importante para que
se possa determinar se existe significncia estatstica entre a ao de cada fator e
o desfecho estudado. Os dados dos ensaios devem ser dispostos em uma matriz
de planejamento, conforme mostrado na Tabela 23.4, abaixo.
Tabela 23.4 Matriz de planejamento para os ensaios
Fator A
(Temperatura)
Fator B
(Tempo)
Tratamentos
(Ensaios)
Repeties
Total
Mdia
(Rendimento)
1 2 3
y
1
21 20 19 60 20
+ y
2
21 23 22 66 22
+ y
3
26 24 25 75 25
+ + y
4
33 32 31 96 32

A Figura 23.4 mostra a representao geomtrica dos efeitos do experi-
mento mostrado na Tabela 23.4.
Fig. 23.4 Representao geomtrica dos resultados obtidos em um experimento que correla-
ciona os efeitos dos fatores Tempo e Temperatura, no rendimento de um produto alimentcio
t
1
y
3
= 25 y
4
= 32
y
1
= 20 y
2
= 22
t
0
T
0
Fator B
(Tempo em min)
Fator A
(Temperatura em
0
C)
T
1
BIOESTATISTICA_VOL02.indb 297 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 298
Clculo dos efeitos dos fatores
O passo seguinte calcular os efeitos dos fatores, tal como foi demonstrado
no item 22.1. Os clculos so os seguintes:
Temperatura:
T
y y y y
=
+

+
=
+

+
=
( ) ( )
( ) ( )
, %
2 4 1 3
2 2
22 32
2
20 25
2
4 5
- A mudana da temperatura, do nvel baixo para o alto, aumentou o rendi-
mento em 4,5%.
Tempo:
t
y y y y
=
+

+
=
+

+
=
( ) ( )
( ) ( )
, %
3 4 1 2
2 2
25 32
2
20 22
2
8 5
- A mudana do tempo, do nvel baixo para o alto, aumentou o rendimento
em 8,5%.
Temperatura x Tempo:
T t
y y y y
x =
+
=
+
=
1 2 3 4
2
20 22 25 32
2
5%
- A interao entre os dois fatores, temperatura e tempo, aumentou o
rendimento em 5%.
A Tabela 23.5 mostra as mdias dos valores dos rendimentos conforme os
efeitos dos fatores estudados.
Tabela 23.5 valores mdios do rendimento conforme o tempo e a temperatura
de processamento
Fator A
(Temperatura)
Fator B
(Tempo)
Mdias conforme o
tempo
+
20 25 y
t
=22 5 ,
+ 22 32 y
t +
=27
Mdias conforme a
temperatura
y
T
=21 y
T+
=28 5 , y =24 75 ,
BIOESTATISTICA_VOL02.indb 298 25/06/12 17:23
EXPERIMENTOS FATORIAIS 299
Ajuste do modelo de regresso
Quando os fatores em estudo so do tipo quantitativo, como no exemplo em
questo (temperaturas e tempo), est indicado fazer uma anlise de regresso
mltipla. O modelo de regresso para um experimento com dois fatores, cada
um mensurado em dois nveis, dado pela seguinte equao:
y x x x x
i jr j j j j ijr
= + + + +
0 1 1 2 2 12 1 2
Onde: y = a varivel resposta.
b
0
, b
1
, b
2
e b
12
= Parmetros que sero estimados pelo mtodo dos
mnimos quadrados.
x
1
e x
2
= So as variveis que representam os fatores A e B respec-
tivamente. As variveis x
1
e x
2
so codificadas como -1 e +1, e x
1
x
2

representa a interao entre elas.
e = o termo do erro aleatrio associado resposta y.
Na prtica, os parmetros so calculados da seguinte maneira:

, %
, %

0
1
24 75
2
4 5
2
2 25
= =
= = =
y
Efeito do fator A
22
12
2
8 5
2
4 25 = = =
=
Efeito do fator B
Efeito do
, %
, %

ss fatores AB
2
5
2
2 5 = =
%
, %

Assim, o modelo ajustado dado pela equao abaixo, na qual os coeficientes
b
0
, b
1
, b
2
e b
12
so estimadores dos parmetros populacionais b
0
, b
1
, b
2
e b
12
.

, , , , y b b x b x b x x x x = + + + = + + +
0 1 1 2 2 12 1 2 1 2
24 75 2 25 4 25 2 5xx x
1 2
De todo jeito, relevante notar que a regresso mltipla avalia apenas
a relao linear entre as variveis preditoras e a varivel-resposta. Por sua
BIOESTATISTICA_VOL02.indb 299 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 300
vez, os coeficientes de regresso (b
i
) so interpretados de modo diferente na
regresso mltipla quando comparados com a regresso simples. Nesta, o
coeficiente de regresso b indica a quantidade de variao da varivel-resposta
y que devida a cada acrscimo de uma unidade na varivel preditora x. Na
regresso mltipla, um determinado coeficiente de regresso b
i
mostra at que
ponto o valor da varivel-resposta y pode ser alterado em funo do aumento
de uma unidade na varivel preditora x
i
, mantendo-se constantes os valores
das demais variveis preditoras da equao de regresso.
Assim, necessrio comparar os efeitos dos fatores para que se
possam determinar qual deles significativo. Esta comparao realizada
pela aplicao do teste F (ANOVA), conforme foi abordado no captulo 19
deste livro.
Confrmao por anlise de varincia
Portanto, quando o objetivo comparar vrios fatores, simultaneamente, e
para que se possa manter o erro tipo I em um nvel constante, o procedimento
correto o emprego de um teste de abrangncia global, o qual utilizado para
avaliar se existe alguma diferena entre as mdias e, somente se este primeiro
teste for positivo, deve-se, ento, testar as vrias combinaes entre elas. Neste
caso, a tcnica a ser empregada a anlise de varincia (ANOVA), a qual
compara todas as mdias em um nico teste, objetivando identificar se existe
ao menos uma diferena estatisticamente significativa entre os fatores compa-
rados. Caso esta diferena exista, aplica-se, ento, uma das diversas tcnicas de
comparaes mltiplas para que se possam identificar quais os grupos diferem
entre si. O teste ANOVA tambm utilizado na verificao da significncia
estatstica para os valores do coeficiente de correlao mltipla (R) e coefi-
ciente de determinao (R
2
). Neste caso, o delineamento foi um experimento
inteiramente casualizado, com os tratamentos dispostos em um modelo de
esquema fatorial 2 x 2, com trs repeties. Os dados obtidos so apresentados
na Tabela 23.6.
Assim, existe diferena estatisticamente significante entre os rendimentos
obtidos para o produto extrusado com as variaes da temperatura (Fator A)
e do tempo (Fator B)?
BIOESTATISTICA_VOL02.indb 300 25/06/12 17:23
EXPERIMENTOS FATORIAIS 301
Tabela 23.6 Valores, em porcentagem, dos rendimentos, para cada uma das repeties
conforme o tipo de tratamento

Tratamentos (ensaios)
Total
T
0
t
0
T
1
t
0
T
0
t
1
T
1
t
1
Repeties
21 21 26 33
20 23 24 32
19 22 25 31
Totais 60 66 75 96 x = 297
Repeties (n) 3 3 3 3 N = 12
Mdias ( x )
20 22 25 32
x
2
1.202 1.454 1.877 3.074 7.607
Passo 1 Formular as hipteses estatsticas:
H
0
: No existem diferenas entre as mdias dos rendimentos, pois

T t T t T t T t
0 0 1 0 0 1 1 1
= = =
.
H
A
: Ao menos uma das mdias difere das demais, sendo
T t T t
0 0 1 0
ou

T t T t T t T t T t T t T
0 0 0 1 0 0 1 1 1 0 0 1
ou ou ou
11 0 1 1 0 1 1 1
t T t T t T t
ou
Passo 2 Escolher o nvel de significncia (nvel alfa):
=0 05 , (5%) unilateral
Passo 3 Determinar o valor crtico do teste F:
gl do numerador (entre) -
gl k
E
= = = 1 4 1 3
gl do denominador (dentro) -
gl N k
D
= = = 12 4 8
gl do total -
gl N
T
= = = 1 12 1 11
Ento, F F
gl gl
N D
; ; , ; ;
, = =
0 05 3 8
4 07
Passo 4 Calcular o valor do fator de correo C:
C
x
N
n k
=

= = =

2
2
297
12
88 209
12
7 350 75
.
. ,

Passo 5 Calcular o valor do teste F:

SQ x C
T
n k
= = =

2
7 607 7 350 75 256 25 . . , ,

BIOESTATISTICA_VOL02.indb 301 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 302



SQ
x
n
C
E
n
k
=

=
+ + +

2
2 2 2 2
60 66 75 96
3
7 350 75 . , ==248 25 ,
s
SQ
k
E
E
2
1
248 25
3
82 75 =

= =
,
,
SQ SQ SQ
D T E
= = = 256 25 248 25 8 , ,
s
SQ
N k
D
D
2
8
8
1 =

= =
F
s
s
calc
E
D
= = =
2
2
82 75
1
82 75
,
,
Tabela 23.7 Anlise de varincia dos dados da Tabela 23.6
Fonte de variao gl SQ QM Fcalc
Entre os grupos
(tratamentos)
3 248,25 82,75
82,75
P = 0,00004
Dentro dos grupos
(variao residual)
8 8,00 1,00
Total 11 256,25
Passo 6 Regra de deciso:

Se , aceita-se
Se
F F H
F F
calc
calc
<

0 05 3 8 0 , ; ;
.
00 05 3 8 0 , ; ;
. , rejeita-se
Como =82,75 >
H
F F
calc 00 05 3 20 0
4 07
, ; ;
, . = , rejeita-se H

Passo 7 Concluso:
Como o valor para
F
calc
maior que o valor crtico tabelado
F
0 05 3 8 , ; ;
, rejeita-
-se H
0
e conclui-se que ao menos uma das mdias difere das demais.
BIOESTATISTICA_VOL02.indb 302 25/06/12 17:23
EXPERIMENTOS FATORIAIS 303
Portanto, existe alguma diferena estatisticamente significante entre
as mdias referentes aos rendimentos dos ensaios avaliados, pois
F P
calc
= = 82 75 0 00004 , ; ,
.
Com este resultado, a continuao da anlise deve envolver a comparao
das mdias dos ensaios pelo emprego de um dos procedimentos de comparaes
mltiplas, tal como os testes de Tukey, Student-Newman-Keuls, Bonferroni etc.
Uma maneira mais simples de anlise baseada no modelo de experimento
fatorial. Assim, tomando-se os totais repeties das diferentes combinaes
dos nveis dos fatores A e B, pode-se construir um novo quadro de anlise de
varincia que permite testar se existe interao entre os fatores estudados, e se
cada um desses fatores tem efeito estatisticamente significante sobre o rendi-
mento do produto em anlise. O Quadro 23.1 mostra os totais das repeties para
cada um dos diferentes nveis dos fatores temperatura (T) e tempo (t).
Quadro 23.1 Valores totais das repeties das diferentes combinaes
dos nveis dos fatores A e B
Fator A
(Temperatura)
Fator B
(Tempo)
Totais
t
0
t
1
T
0
60 (ya) 25 (yb) 85 (yab)
T
1
22 (yc) 32 (yd) 54 (ycd)
Totais 82 (yac) 57 (ybd) 139 (yabcd)
Assim, sendo r o nmero de repeties, a e b o nmero de nveis para
os fatores A e B, respectivamente, as Somas dos Quadrados (SQ) podem ser
escritas pelas seguintes frmulas:
SQ A
y y
r
y
ab r
ab cd abcd
( )
. .
=
+
=
+
=
2 2 2
2 2 2
2
85 54
6
139
12
800 08 ,
SQ B
y y
r
y
ab r
ac bd abcd
( )
. .
=
+
=
+
=
2 2 2
2 2 2
2
82 57
6
139
12
522 08 ,
BIOESTATISTICA_VOL02.indb 303 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 304
SQ AB ( ) , , , , = = 248 25 80 08 52 08 116 09
Obs. As Somas dos Quadrados associadas ao total e ao resduo perma-
necem as mesmas, sendo SQ(T) = SQ(A) +SQ(B) + SQ(AB).
Deste modo, uma nova tabela para a anlise de varincia pode ser
construda:
Tabela 23.8 Anlise de varincia dos dados do Quadro 23.1
Fonte de variao gl SQ QM Fcalc
Temperatura (A) 1 80,08 80,08 80,08
Tempo (B) 1 52,08 52,08 52,08
Interao AB 1 116,09 116,09 116,09
Tratamentos 3 248,25 82,75 82,75
Resduo 8 8,00 1,00
Total 11 256,25
Comparando-se os valores de F
calc
, obtidos na Tabela 23.8, com os valores
crticos tabelados, podemos concluir que:
Para a interao AB:

Se , aceita-se
Se
F F H
F
calcAB
calcAB
<
0 05 1 8 0 , ; ;
.
, rejeita-se
Como =116
F H
F
calcAB
0 05 1 8 0 , ; ;
.
,,09 > , rejeita-se F H
0 05 3 20 0
5 32
, ; ;
, . =
Assim, como o teste para interao AB foi significativo, isto indica que
o efeito da temperatura estatisticamente diferente entre os dois nveis
do fator tempo considerados no estudo. A Figura 23.5 mostra o grfico das
mdias do rendimento para os diferentes nveis da temperatura, conforme o
nvel do fator tempo.
BIOESTATISTICA_VOL02.indb 304 25/06/12 17:23
EXPERIMENTOS FATORIAIS 305

Fig. 23.5 Grfcos das mdias do rendimento conforme a interao dos fatores
temperatura e tempo
Uma vez que a interao entre os fatores A e B foi estatisticamente signi-
ficativa, no tem sentido estudar os efeitos simples de cada um dos fatores,
isoladamente. O passo seguinte, ento, seria desdobrar a interao para que
se possa estudar o comportamento de um dos fatores dentro de cada nvel
do outro fator. Na prtica, e em razo da tediosidade dos clculos, utilizamos
programas estatsticos computacionais que, alm de fornecer qual a combi-
nao tima dos fatores na obteno da resposta desejada, disponibilizam
mtodos grficos que modelam a funo que relaciona essas variveis, de modo
que uma figura geomtrica possa ser obtida quando uma varivel resposta
plotada como uma funo de um ou mais fatores quantitativos. Dentro dos
diferentes mtodos grficos, destaca-se a anlise de superfcie, a qual ser
abordada no item subsequente deste captulo. Mas, de qualquer maneira, para
o leitor interessado em aprofundar seus conhecimentos a respeito de experi-
mentos fatoriais, sugerimos as seguintes leituras: Rodrigues, M. I.; Iemma, A.
F. (Planejamento de experimentos e otimizao de processos) e Neto, B. B.;
Scarmino, I. S.; Bruns, R. E. (Como fazer experimentos).
23.3 EXPERIMENTO FATORIAL NO MINITAB
O planejamento de experimentos utilizado para determinar qual a
combinao tima de variveis na obteno da resposta desejada. A resposta
a varivel dependente, enquanto as variveis que a influenciam, so as
BIOESTATISTICA_VOL02.indb 305 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 306
variveis independentes, denominadas de fatores. Este tipo de planejamento
de experimentos permite estimar os efeitos de vrios fatores e suas respectivas
interaes sobre a varivel resposta, e, para tanto, deve-se selecionar os nveis
em que cada fator ir atuar. O planejamento fatorial completo permite fazer
experimentos com todas as possveis combinaes entre os nveis dos fatores.
Para acessar este planejamento, utiliza-se, no Minitab

, o caminho Stat DOE


Factorial, conforme a Figura 23.6, mostrada abaixo.
Fig. 23.6 Comandos para realizao do planejamento fatorial no Minitab
A fim de realizar um planejamento fatorial completo 2
2
, estudamos
dois fatores, cada um mensurado em dois nveis. Inicialmente vamos criar o
planejamento; em seguida executar o experimento e finalmente, analisar o
planejamento. Para tal, utiliza-se o seguinte caminho Stat DOE Factorial
Create Factorial Design, conforme mostrado na Figura 23.6.
Assim, suponha que se queira criar um planejamento fatorial completo com
dois fatores, Temperatura (Fator A) e Tempo (Fator B), cada um a dois nveis,
conforme mostra Tabela 23.9. O planejamento gerado deve ter trs replicaes
e deve estar na ordem padro de execuo.
Tabela 23.9 Planejamento fatorial completo com dois fatores, Temperatura e Tempo
Fontes de variao
Baixo
()
Alto
(+)
Fator A (Temperatura) 60 80
Fator B (Tempo) 20 30
BIOESTATISTICA_VOL02.indb 306 25/06/12 17:23
EXPERIMENTOS FATORIAIS 307
A expresso geral de um planejamento fatorial completo com dois fatores
da forma
Onde, b
0
, b
1
, b
2
e b
3
so coeficientes e A, B so os fatores.
A janela inicial mostrada na Figura 23.7. Nesta janela, pode-se escolher o
tipo de planejamento em Type of Design. Os tipos disponveis so:
2-Level factorial (default generators) Esta opo selecionada quando
se deseja criar planejamentos fatoriais com fatores em dois nveis, com os
geradores padro;
2-Level factorial (specify generators) Esta opo selecionada quando
se deseja criar planejamentos fatoriais com fatores em dois nveis e se quer
especificar os geradores;
Plackett-Burman design Esta opo selecionada quando se deseja
criar planejamentos Plackett-Burman (planejamento de seleo);
General full factorial design Esta opo selecionada quando se deseja
criar planejamentos fatoriais completos, com pelo menos um dos fatores
sendo mensurado em mais de dois nveis.

Fig. 23.7 Janela inicial para criar Fig. 23.8 Tabela de escolha
um experimento fatorial do planejamento adequado
Na janela inicial, tm-se os seguintes submenus: Display Available
Designs, Designs, Factors, Options e Results. Em Display Available
Designs, que aparece na Figura 23.8, mostrada uma tabela para auxiliar

Y b b A b B b AB = + + +
0 1 2 3
BIOESTATISTICA_VOL02.indb 307 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 308
na escolha do planejamento mais adequado, baseando-se no nmero de
fatores e execues que ele ter. Nesta tabela, os planejamentos esto classi-
ficados por cores como em um semforo: vermelho (resoluo III - cuidado,
planejamento altamente fracionado), amarelo (resoluo IV - planejamento
deve ser realizado com ateno) e verde (resolues V, VI, VII, VIII e Full - siga
em frente, estes planejamentos so reconhecidos). Este submenu apenas um
guia para a escolha do menor planejamento, mas no h selees a serem feitas.
Em Designs, que aparece na Figura 23.9, podem-se escolher as carac-
tersticas do planejamento. Na primeira caixa escolhe-se o planejamento
a ser criado. Nela, tem-se o nome, o nmero de execues, a resoluo e
a representao do planejamento. Ainda, no submenu Designs, tm-se as
seguintes opes:
Number of center points Nesta opo, entra-se com o nmero de pontos
centrais do planejamento;
Number of replicates Nesta opo, entra-se com nmero de replicaes
de cada fator;
Number of blocks Entra-se com o nmero de blocos do planejamento.
Em Factors, mostrado na Figura 23.10, tm-se as seguintes opes:
Factor Mostra os fatores (variveis) que sero considerados no planejamento;
Name Nesta opo, entra-se com os nomes dos fatores selecionados;
Low Nesta outra opo, entra-se com o nvel baixo de cada fator;
High Nesta, entra-se com o nvel alto de cada fator.

Fig. 23.9 Submenu Designs
Fig. 23.9 Submenu Designs Fig. 23.10 Submenu Factors
BIOESTATISTICA_VOL02.indb 308 25/06/12 17:23
EXPERIMENTOS FATORIAIS 309
Em Options, que aparece na Figura 23.11, tm-se as seguintes opes:
Fold Design Onde se pode criar um planejamento invertido que
consiste no planejamento original e uma cpia deste, mas com os nveis
invertidos. Esta opo utilizada quando se trabalha com planeja-
mentos fatoriais fracionrios, pois neste tipo de planejamento, pode-se
ter confundimento, isto , um ou mais efeitos no podem ser estimados
separadamente.
Do not fold Utiliza-se esta opo quando se quer usar o planejamento
invertido;
Fold on all factors Utiliza-se esta opo quando o objetivo usar um
planejamento com os nveis invertidos de todos os fatores;
Fold just on factor Para que os nveis sejam invertidos somente no fator
selecionado;
Fraction Esta opo deve ser selecionada quando se quer especificar
qual ser a frao utilizada no planejamento, caso ele seja fracionrio;
Use principal fraction Esta opo deve ser escolhida quando se quer
utilizar a frao principal;
Use fraction number a opo selecionada quando se quer utilizar
outra frao diferente da principal;
Randomize runs Utiliza-se esta opo quando se quer tornar aleatria a
ordem de execuo do planejamento;
Base for random data generator Esta opo permite que se entre com
a semente da ordem aleatria;
Store design in worksheet Esta opo permite que se armazenem os
dados do planejamento em uma planilha.
Em Results, mostrado na Figura 23.12, tm-se as seguintes opes:
Printed Results Utiliza-se esta opo quando se deseja escolher quais resul-
tados sero exibidos na Session Window. Tm-se as seguintes alternativas:
a. None Esta opo deve ser selecionada quando se deseja que nenhum
resultado seja exibido;
b. Summary table Utiliza-se esta opo quando se quer exibir o resumo
do planejamento com o nmero de fatores, execues, blocos, repeties e
pontos centrais;
BIOESTATISTICA_VOL02.indb 309 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 310
c. Summary table, alias table Esta opo permite que seja exibido o
resumo do planejamento, como na alternativa acima, e mais a tabela de
confundimento;
d. Summary table, alias table, data table Utiliza-se esta opo quando
se deseja que sejam exibidos o resumo do planejamento, a tabela de
confundimento e uma matriz de planejamento;
e. Summary table, alias table, data table, defining relation Esta opo
permite que sejam exibidos o resumo do planejamento, a tabela de confun-
dimento, a matriz do planejamento e as relaes definidas entre os fatores.

Fig. 23.11 Submenu Options Fig. 23.12 Submenu Results
Na opo Content of Alias Table, tm-se duas alternativas:
a. Default interactions Utiliza-se esta opo quando se quer que mostrar
a tabela de confundimento com um nmero de interaes padro;
b. Interactions up through order Esta opo deve ser selecionada
quando se quer definir a maior ordem de interao que ter a tabela de
confundimento exibida na Session Window.
Para criar o planejamento apresentado na Tabela 23.9, precisa-se
preencher a janela inicial da Figura 23.7 da seguinte forma: em Type of
Design escolhe-se 2-level factorial (default generators) e, na caixa Number
of factors, entra-se com o nmero 2 (os fatores so Temperatura e Tempo).
O submenu Designs deve ser preenchido de acordo com a Figura 22.13, j
que o planejamento solicitado no exemplo tem duas replicaes. O submenu
Factors deve ser preenchido de acordo com a Figura 23.14.
BIOESTATISTICA_VOL02.indb 310 25/06/12 17:23
EXPERIMENTOS FATORIAIS 311

Fig. 23.13 Submenu Designs Fig. 23.14 Submenu Designs com os
para o exemplo da Tabela 23.9 dados do exemplo mostrado na Tabela 23.9
No submenu Options, a nica alterao necessria desmarcar a opo
Randomize runs, j que se quer o planejamento na ordem-padro. Nenhuma
alterao ser feita no submenu Results. Pode-se, desta forma, gerar o plane-
jamento solicitado na Tabela 23.9. Os resultados exibidos na Session Window
so apresentados na Figura 23.15. Neste resumo, tem-se o nmero de fatores
(Factors), o planejamento base (Base Design), o nmero de execues (Runs),
o nmero de replicaes (Replicates), o nmero de blocos (Blocks) e o nmero
de pontos centrais (Center pts). Na Figura 23.16, tem-se a matriz de planeja-
mento, armazenada na planilha.


FULL FACTORIAL DESIGN
Factors: 2 Base Design:2; 4
Runs: 12 Replicates:3
Blocks: 1 Center pts (total):0
All terms are free from aliasing.
Fig. 23.15 Resumo do experimento Fig. 23.16 Matriz de Planejamento para o
fatorial exemplo da Tabela 23.7, armazenada no
Session Window
BIOESTATISTICA_VOL02.indb 311 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 312
Seguindo o roteiro inicial, depois que o planejamento desenvolvido,
devem-se executar os experimentos. Cada linha da planilha mostrada na Figura
23.17 um experimento executado.
Fig. 23.17 Matriz de planejamento aps executado o experimento do exemplo
mostrado na Tabela 23.7
Para analisar um planejamento de experimentos fatorial, utiliza-se o
caminho Stat DOE Analyze Factorial Design, mostrado na Figura 23.18.
Agora, suponha que se deseje analisar o planejamento proposto na Tabela 23.9,
considerando como varivel-resposta o Rendimento, conforme a Figura 23.19.
O objetivo obter o modelo do experimento para unidades no codificadas e
construir os grficos dos efeitos (Probabilidade Normal e Pareto). Antes de
iniciar a anlise dos experimentos, necessrio colocar a coluna Rendimento
na planilha do MINITAB, conforme Figura 23.16.
Fig. 23.18 Comando Analyze Factorial Design
BIOESTATISTICA_VOL02.indb 312 25/06/12 17:23
EXPERIMENTOS FATORIAIS 313
A janela inicial do comando Analyze Factorial Design mostrada na
Figura 23.19. Na caixa Responses, entra-se com a varivel-resposta. Nesta,
tm-se os seguintes submenus: Terms, Covariates, Graphs, Results e Storage.
Em Terms, mostrado na Figura 23.20, pode-se se selecionar os termos que
sero includos no modelo. Neste submenu, tm-se as seguintes opes:
Include terms in the model up through order Utiliza-se esta opo
quando se quer especificar a ordem das interaes entre os fatores;
Available Terms Nesta opo, selecionam-se os termos que podem ser
includos no modelo;
Selected Terms Nesta opo, tm-se os termos que j esto selecio-
nados para fazer parte do modelo. Para incluir ou excluir um termo,
seleciona-se o termo e utilizam-se os botes que aparecem entre as cai-
xas de dilogo;
Include blocks in the model Utiliza-se esta opo quando se quer os
termos relacionados aos blocos;
Include center points in the model Utiliza-se esta opo quando se
querem incluir os termos relacionados aos pontos centrais.



Fig. 23.19 Janela inicial do comando Fig. 23.20 Submenu Terms
Analyze Factorial Design
Em Graphs, podem-se construir grficos para analisar os efeitos e
os resduos. Este submenu mostrado na Figura 23.21. Em Effects Plots,
podem-se selecionar os grficos dos efeitos:
Normal Nesta opo, um grfico de probabilidade normal dos efeitos
construdo;
BIOESTATISTICA_VOL02.indb 313 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 314
Pareto Nesta opo, um grfico de Pareto dos efeitos construdo. Na
opo Alpha, especifica-se o nvel de significncia desejado.
Os resduos so obtidos a partir da diferena entre os valores observados
e os valores ajustados pelo modelo. Para construir os grficos de resduos,
deve-se selecionar o tipo de resduo desejado. Em Residuals for Plots, tm-se
as seguintes opes:
Regular Nesta opo, utilizam-se os resduos regulares;
Standardized Nesta opo, utilizam-se resduos padronizados;
Deleted Nesta opo utilizam os resduos studentizados, que so basea-
dos na distribuio t de Student.
Em Residual Plots, tm-se as seguintes opes de grficos de resduos:
Histogram Nesta opo, obtm-se um histograma de resduos;
Normal Plot Nesta opo, obtm-se um grfico de probabilidade normal
dos resduos;
Residual versus fits Nesta opo, obtm-se um grfico de disperso dos
resduos versus os valores ajustados;
Residual versus order Nesta opo, obtm-se um grfico de disperso
dos resduos versus a ordem que os experimentos foram executados;
Residual versus the variables Nesta opo, obtm-se um grfico de dis-
perso dos resduos versus outra varivel de interesse.

Fig. 23.21 Submenu Graphs Fig. 23.22 Submenu Results
BIOESTATISTICA_VOL02.indb 314 25/06/12 17:23
EXPERIMENTOS FATORIAIS 315
Em Results, mostrado na Figura 23.22, podem-se selecionar quais infor-
maes sero exibidas na Session Window. Nele, tem-se as seguintes opes:
Display of Results, Display of Alias Table e Display of Least Squares Means.
Em Display of Results, pode-se selecionar o conjunto de informaes que
sero exibidas na Session Window. As opes so:
Do not display Nesta opo nenhuma informao exibida;
Coefficients and ANOVA table So exibidos os coeficientes do modelo e
a tabela da anlise de varincia - ANOVA;
Unusual observations in addition to the above So exibidos os co-
eficientes do modelo, a tabela da anlise de varincia e as observaes
no-usuais;
Full table of fits and residuals in addition to the above So exibidos
os coeficientes do modelo, a tabela da anlise de varincia, as observaes
no-usuais e a tabela completa de valores ajustados e resduos.
Em Display of Alias Table, seleciona-se o conjunto de informaes que
so exibidas na Session Window, referente tabela de confundimento. As
opes so:
Do not display Nesta opo nenhuma informao sobre a tabela de con-
fundimento exibida;
Default interactions Exibe a tabela de confundimento com as interaes
padro;
Interactions up through order Exibe a tabela de confundimento com as
interaes at a ordem especificada na caixa ao lado.
Em Display of Least Squares Means possibilita exibir a mdia ajustada
ou mdia de mnimos quadrados dos termos selecionados. Este item possui
duas opes:
Available Terms Nesta opo, tm-se os termos para os quais se podem
calcular a mdia ajustada, e;
Selected Terms Nesta opo tm-se os termos j selecionados, para cal-
cular a mdia ajustada.
BIOESTATISTICA_VOL02.indb 315 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 316
Para analisar o exemplo, cujos dados so mostrados na Figura 23.17, deve-se
preencher a janela inicial do comando Analyze Factorial Design, conforme
a Figura 23.19. Como no houve nenhuma restrio aos termos utilizados e
o planejamento no possui blocos ou pontos centrais, no preciso alterar
nenhuma das caixas de dilogo do submenu Terms. O submenu Graphs deve
ser preenchido de acordo com a Figura 23.20. Nenhuma alterao necessria
nos submenus Results e Storage. As sadas geradas, pelo MINITAB, so: anlise
do planejamento (na Session Window) e os grficos dos efeitos (probabi-
lidade normal e Pareto). A sada gerada na Session Window a apresentada
na Figura 23.23.
A partir da Figura 23.23, observam-se as estimativas para os efeitos
(coluna Effect) e para os coeficientes (coluna Coef ) de cada termo (coluna
Term). A ltima coluna o valor P para cada termo, com base no qual se decide
se um determinado termo significante ou no. Observando os valores obtidos,
nota-se que a interao Temperatura versus Tempo no possui valor menor que
0,05 (que o nvel de significncia adotado), assim, vemos que este termo no
significante e, portanto, no necessrio inclu-lo no modelo. Ento, deve-se
gerar um novo ajuste fatorial sem a interao Temperatura versus Tempo,
conforme se pode ver na Figura 23.24.
A partir da Figura 23.24, observa-se que no primeiro grupo, tm-se as
estimativas para os efeitos, e que os valores obtidos, todos menores que 0,05,
mostram que todos os termos so significantes e, portanto, necessrio incluir
todos no modelo. Para se obter o modelo do planejamento com unidades codifi-
cadas, utilizam-se os valores da coluna Coef, para cada termo correspondente
da coluna Term.
No segundo grupo, tem-se a tabela de anlise de varincia onde so testados
os efeitos principais e as interaes. A ltima coluna o valor P para cada efeito,
com base no qual se decide qual o efeito significante ou no. Observando os
valores obtidos, v-se que, as interaes (Lack of Fit) no so significantes, mas
os efeitos principais (Main Effects) so significantes e, portanto, necessrio
incluir somente os efeitos principais no modelo.
No terceiro grupo, tem-se o modelo do planejamento, para unidades
no-codificadas. Este modelo :
Rendimento = - 71,50 + 0,65 Temperatura + 3,10 Tempo.
BIOESTATISTICA_VOL02.indb 316 25/06/12 17:23
EXPERIMENTOS FATORIAIS 317
FACTORIAL FIT: RENDIMENTO VERSUS TEMPERATURA; TEMPO
Primeiro Grupo
Estimated Effects and Coeffcients for Rendimento (coded units)
Term Effect Coef SE Coef T P
Constant 51,500 1,414 36,42 0,000
Temperatura 13,000 6,500 1,414 4,60 0,002
Tempo 31,000 15,500 1,414 10,96 0,000
Temperatura*Tempo 5,000 2,500 1,414 1,77 0,115
S = 4,89898 R-Sq = 94,75% R-Sq(adj) = 92,78%
Segundo Grupo
Analysis of Variance for Rendimento (coded units)
Source DF Seq SS Adj SS Adj MS F P
Main Effects 2 3390,00 3390,00 1695,00 70,63 0,000
2-Way Interactions 1 75,00 75,00 75,00 3,12 0,115
Residual Error 8 192,00 192,00 24,00
Pure Error 8 192,00 192,00 24,00
Total 11 3657,00
Terceiro Grupo
Estimated Coeffcients for Rendimento using data in uncoded units
Term Coef
Constant 16,0000
Temperatura -0,600000
Tempo -0,40000
Temperatura*Tempo 0,0500000
Effects Plot for Rendimento
Alias Structure
I
Temperatura
Tempo
Temperatura*Tempo
Fig. 23.23 Resultado do Ajuste Fatorial Exemplo da Tabela 23.7
BIOESTATISTICA_VOL02.indb 317 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 318
FACTORIAL FIT: RENDIMENTO VERSUS TEMPERATURA; TEMPO
Primeiro Grupo
Estimated Effects and Coeffcients for Rendimento (coded units)
Term Effect Coef SE Coef T P
Constant 51,500 1,572 32,75 0,000
Temperatura 13,000 6,500 1,572 4,13 0,003
Tempo 31,000 15,500 1,572 9,86 0,000
S = 5,44671 R-Sq = 92,70% R-Sq(adj) = 91,08%
Segundo Grupo
Analysis of Variance for Rendimento (coded units)
Source DF Seq SS Adj SS Adj MS F P
Main Effects 2 3390,00 3390,00 1695,00 57,13 0,000
Residual Error 9 267,00 267,00 29,67
Lack of Fit 1 75,00 75,00 75,00 3,13 0,115
Pure Error 8 192,00 192,00 24,00
Total 11 3657,00
Unusual Observations for Rendimento
Obs StdOrder Rendimento Fit SE Fit Residual St Resid
3 3 50,0000 60,5000 2,7234 -10,5000 -2,23R
R denotes an observation with a large standardized residual.
Terceiro Grupo
Estimated Coeffcients for Rendimento using data in uncoded units
Term Coef
Constant -71,5000
Temperatura 0,650000
Tempo 3,10000
Fig. 23.24 Resultado do Ajuste Fatorial sem a Interao Exemplo da Tabela 23.7
Os grficos, gerados so: grfico de probabilidade normal e o grfico de
Pareto, mostrados nas figuras 23.25 e 23.26, respectivamente.
BIOESTATISTICA_VOL02.indb 318 25/06/12 17:23
EXPERIMENTOS FATORIAIS 319
Fig. 23.25 Grfco de probabilidade normal do exemplo mostrado na Tabela 23.9
Fig. 23.26 Grfco de Pareto para o exemplo mostrado na Tabela 23.9
No grfico de probabilidade normal, somente os termos com efeitos signi-
ficantes sero identificados. Os termos que no tm efeitos significantes ficam
prximos reta, ajustada ao valor zero (0). No grfico de Pareto, tm-se os
efeitos em ordem de significncia. Os termos, cujas barras estiverem acima da
linha vermelha pontilhada, so os termos significantes para o valor a definido.
Com base nos resultados da Session Window, j analisados, e nas figuras
23.25 e 23.26, conclu-se que os fatores Temperatura e Tempo, analisados neste
planejamento, influenciam significativamente a varivel resposta Rendimento.
Alm disso, a interao entre estes dois fatores no influencia significativa-
mente na varivel resposta.
BIOESTATISTICA_VOL02.indb 319 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 320
Os grficos fatoriais so muito teis para analisar um planejamento. Para
acessar o comando Fatorial Plots, utliza-se o caminho Stat DOE Factorial
Factorial Plots, conforme a Figura 23.27. Assim, suponha que se queiram
construir os grficos de efeitos principais, interaes e a representao geom-
trica para o planejamento da Tabela 23.9.
Fig. 23.27 Comando Factorial Plots
A janela inicial deste comando mostrada na Figura 23.28. Nesta janela,
pode-se escolher entre trs tipos de grficos fatoriais:
Main Effects Plot Nesta opo constri-se o grfico de efeitos principais;
Interaction Plot Nesta opo constri-se o grfico das interaes;
Cube Plot Nesta opo constri a representao geomtrica do planejamento.
Em Type of Means to Use in Plots, seleciona-se o tipo de mdia utilizada
para a construo dos grficos fatoriais. Tm-se duas opes: a mdia dos
valores dos experimentos (Data Means) e a mdia dos valores ajustados pelo
modelo (Fitted Means).

Fig. 23.28 Submenu Factorial Plots Fig. 23.29 Submenu Factorial Plots - Main Effects
BIOESTATISTICA_VOL02.indb 320 25/06/12 17:23
EXPERIMENTOS FATORIAIS 321
Quando se seleciona qualquer das opes de grficos, o submenu Setup se
torna ativo. Nele, podem-se definir as caractersticas do grfico. Por exemplo,
o submenu Setup, mostrado na Figura 23.29, referente ao grfico Main Effect,
possui as seguintes opes:
Responses Nesta opo entra-se com a varivel resposta;
Factors to Include in Plots Nesta opo podem-se escolher quais fato-
res aparecero no grfico. Para isto, utilizam-se as seguintes opes:
Available Onde se encontram os fatores que podem ser selecionados
para o grfico;
Selected Nesta opo encontram-se os fatores j selecionados para o
grfico.
O submenu Setup para os outros dois tipos de grficos, idntico. Para o
exemplo proposto, marcam-se todos os grficos e seleciona-se a opo Data Means
na janela inicial. Em cada opo Setup, entra-se com a varivel Rendimento em
Responses e selecionam-se todos os fatores possveis. Os grficos fatoriais so
mostrados nas figuras 23.30, 23.31 e 23.32, respectivamente.
Fig. 23.30 Grfco dos Efeitos Principais para o exemplo mostrado na Tabela 23.9
No grfico dos efeitos principais, mostrado na Figura 23.30, v-se que
ambos os fatores melhoram o Rendimento, quando esto no seu nvel alto. No
grfico das interaes, mostrados na Figura 23.31, v-se que existe alguma
BIOESTATISTICA_VOL02.indb 321 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 322
interao entre Temperatura e Tempo, j que as linhas no so paralelas. Ou
seja, o efeito da Temperatura muda, dependendo do nvel escolhido para o
Tempo, e vice-versa.
Fig. 23.31 Grfco das Interaes para o exemplo mostrado na Tabela 23.9
A representao geomtrica do planejamento, mostrado na Figura 23.32,
um quadrado, j que o planejamento possui dois fatores. Neste grfico,
confirma-se que a Temperatura e o Tempo devem estar nos seus nveis altos
para aumentar o Rendimento, j que o vrtice do quadrado, cujo valor maior
(76), o que usa Temperatura a 30
o
C e 20 minutos de Tempo.
Fig. 23.32 Grfco Cube plot para o exemplo mostrado na Tabela 23.9
BIOESTATISTICA_VOL02.indb 322 25/06/12 17:23
EXPERIMENTOS FATORIAIS 323
23.4 SUPERFCIE DE RESPOSTA NO MINITAB
O grfico superfcie de resposta uma tcnica de otimizao, baseada em
planejamentos fatoriais, que permite investigar a existncia de curvaturas. Para
acessar este comando, utiliza-se o caminho Stat DOE Response Surface,
conforme mostra a Figura 23.33.
A superfcie de resposta possui dois tipos de planejamentos: central
composto e Box-Behnken. Aqui ser mostrado um planejamento central
composto. Inicialmente, ser criado o planejamento, em seguida executado o
experimento e, finalmente, sero analisados os resultados. Para se criar um
planejamento central composto, utiliza-se o caminho Stat DOE Response
Surface Create Response Surface Design, conforme mostra a Figura 23.33.
Fig. 23.33 Comando Response Surface
Inicialmente, considere que um pesquisador deseja saber como se comporta
o Rendimento de um experimento similar aquele apresentado na Tabela 23.9,
que altera dois diferentes fatores, a Temperatura (em graus Celsius) e o Tempo
de (em minutos). O pesquisador sabe que o modelo deste planejamento no
linear, por isto vai usar o planejamento central composto. Este planejamento se
baseia num modelo quadrtico, que tem a expresso dada por,

Y b b A b B b A b B b AB = + + + + +
0 1 2 3 2 4 2 5
Onde, b
0
, b
1
, b
2
, b
3
, b
4
e b
5
so coeficientes e A, B so os fatores.
BIOESTATISTICA_VOL02.indb 323 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 324
O interesse analisar o planejamento criado pelo pesquisador, de modo
a obter o modelo do planejamento, as curvas de nveis e a superfcie de
resposta. Para facilitar o entendimento do planejamento que se quer criar,
toma-se como base o planejamento mostrado na Tabela 23.10. As colunas
Temperatura e Tempo contm, respectivamente, as unidades no-codifi-
cadas dos fatores Temperatura e Tempo, para cada experimento, ao passo
que as colunas A e B contm, respectivamente, as unidades codificadas para
esses dois fatores.
Tabela 23.10 Planejamento Central Composto com dois fatores, Temperatura e Tempo
Experimento Temperatura Tempo A B
1 60,00 20,00 -1 -1
2 80,00 20,00 1 -1
3 60,00 30,00 -1 1
4 80,00 30,00 1 1
5 55,86 25,00 -1,41 0
6 84,14 25,00 1,41 0
7 70,00 17,93 0 -1,41
8 70,00 32,07 0 1,41
9 70,00 25,00 0 0
10 70,00 25,00 0 0
11 70,00 25,00 0 0
Deve-se, ento, (i) criar o planejamento central composto; (ii) Gerar
a equao do modelo; (iii) Construir curvas de nveis e de superfcie
resposta. A janela inicial deste comando pode ser visualizada na Figura
23.34. Nesta janela, pode-se escolher o tipo de planejamento. Como opes,
tm-se: (i) Central composite e (ii) Box-Behnken. Number of factors
nesta opo pode-se entrar com o nmero de fatores que sero analisados
no planejamento.
No submenu Display Available Designs, apresentado na Figura 23.35,
pode-se ver o nmero de execues do planejamento de acordo com o nmero
de fatores e o tipo de planejamento escolhido.
BIOESTATISTICA_VOL02.indb 324 25/06/12 17:23
EXPERIMENTOS FATORIAIS 325


Fig. 23.34 Janela inicial do comando Fig. 23.35 Submenu Display
Create Response Surface Design Available Designs
Em designs, apresentado na Figura 23.36, pode-se escolher o planeja-
mento de acordo com o nmero de execues, blocos, pontos centrais e valor
do a. Number of Center Points nesta opo pode-se modificar o nmero de
pontos centrais do planejamento, acessando a opo Custom. Pode-se, ainda,
modificar o valor de alpha, para isso utiliza-se a opo Custom.
Em Factors, apresentado na Figura 23.37, pode-se definir os fatores e seus
nveis. Quando se deseja que os nveis dos fatores representem os pontos cubo
(ou quadrado), escolhe-se Cube points, em Levels Define. Porm, quando se
deseja que os nveis dos fatores representem os pontos axiais, escolhe-se Axial
points, em Levels define. Em Name, entra-se com o nome dos fatores, em Low,
com os nveis baixos dos fatores e, em High, com os nveis altos dos fatores.

Fig. 23.36 Submenu Designs - Fig. 23.37 Submenu Factors -
Superfcie de Resposta Superfcie de Resposta
BIOESTATISTICA_VOL02.indb 325 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 326
Em Options, apresentada na Figura 23.38, pode-se aleatorizar a ordem de
execuo do planejamento, em Randomize runs. Em Base for random data
generator pode-se entrar com a semente da ordem aleatria. Para realizar o
armazenamento dos dados do planejamento na planilha, necessrio que a
opo Store design in worksheet esteja selecionada.
Fig. 23.38 Submenu Options - Superfcie de Resposta
Em Results, apresentado na Figura 23.39, escolhe-se quais informaes
sobre o planejamento sero exibidas na Session Window. Como opes,
tm-se:
None Nesta opo, nenhuma informao exibida na Session Window;
Summary table Uma tabela resumo do planejamento exibida;
Summary table and data table exibida uma tabela resumo e uma ta-
bela com os dados do planejamento.
Fig. 23.39 Submenu Factors - Superfcie de Resposta
Para desenvolver o exemplo proposto, deve-se escolher o planejamento
Central composite em Type of Design e, em Number of factors, escolhe-se
dois fatores, conforme apresentado na Figura 23.34.
BIOESTATISTICA_VOL02.indb 326 25/06/12 17:23
EXPERIMENTOS FATORIAIS 327
Em Designs deve ser preenchida de acordo com a Figura 23.36. Observando
a figura, o planejamento escolhido possui 13 execues, com o padro de cinco
observaes no ponto central. Como, neste caso, o planejamento possui trs
execues no ponto central, precisa-se alterar de 5 para 3 pontos centrais, em
Number of Center Points. Assim, o planejamento ficar com 11 execues,
conforme apresentado na Figura 23.36.
Em Factors deve-se preencher conforme a Figura 23.37. Para se gerar o
planejamento padro, sem ordem aleatria, necessrio desmarcar a opo
Randomize runs, conforme a Figura 23.38. Em Results, nenhuma alterao
ser necessria.
Na tabela resumo da Session Window pode-se confirmar o nmero de
fatores; de blocos, de pontos centrais, de execues, e o valor do nvel alpha
utilizado. O planejamento aps executado, armazenado na planilha e
mostrado na Figura 23.40. A coluna StdOrder mostra a ordem padro dos
experimentos; a coluna RunOrder mostra a ordem aleatria para a execuo
do planejamento; a coluna Blocks mostra o nmero de blocos. Temperatura
indica as unidades no-codificadas do fator Temperatura, e Tempo, indica as
unidades no-codificadas do fator Tempo.

Fig. 23.40 Planejamento Central Composto com dois fatores, Temperatura e Tempo
conforme o exemplo da Tabela 23.8
Agora, devem-se executar os experimentos planejados e apresentados
na planilha mostrada na Figura 23.40 e depois analis-los. Cada linha desta
BIOESTATISTICA_VOL02.indb 327 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 328
planilha um experimento que deve ser executado. Os resultados obtidos so
apresentados na Tabela 23.11.
Tabela 23.11 Resultado do Planejamento Central Composto com dois fatores,
Temperatura e Tempo
Experimento Temperatura Tempo Rendimento
1 60,00 20,00 88
2 80,00 20,00 109
3 60,00 30,00 89
4 80,00 30,00 87
5 55,86 25,00 82
6 84,14 25,00 86
7 70,00 17,93 107
8 70,00 32,07 88
9 70,00 25,00 115
10 70,00 25,00 112
11 70,00 25,00 114
Para analisar um planejamento Superfcie de Resposta, utiliza-se o
caminho Stat DOE Response Surface Analyze Response Surface
Design, conforme a Figura 23.41.
Fig. 23.41 Comando Analyze Response Surface Design
O objetivo analisar o Planejamento Central Composto mostrado na
Tabela 23.11. Inicialmente, necessrio que os valores de Rendimentos,
obtidos a partir dos experimentos, sejam armazenados na Planilha do Minitab,
BIOESTATISTICA_VOL02.indb 328 25/06/12 17:23
EXPERIMENTOS FATORIAIS 329
conforme Figura 23.42. A janela inicial do comando para analisar este tipo de
planejamento apresentada na Figura 23.43.
Fig. 23.42 Resultado do Planejamento Central Composto com dois fatores,
Temperatura e Tempo, conforme o exemplo da Tabela 23.11
Fig. 23.43 Janela inicial do comando Analyze Response Surface Design
Na janela do comando Analyze Response Surface Design, entra-se com
a varivel-resposta na caixa Responses. No exemplo em estudo, a varivel-
-resposta (Y) Rendimento. Nesta caixa pode-se escolher, em Analyze data
using, a unidade usada para analisar o planejamento e para construir o modelo.
Tm-se as seguintes opes:
Coded units Nesta opo tm-se as unidades codificadas, ou seja, usan-
do os cdigos 1 para nvel baixo e 1 para nvel alto, dos fatores;
Uncoded units Nesta opo tm-se as unidades no-codificadas, ou
seja, usando o valor real de cada nvel do fator. O fator Temperatura, por
exemplo, tem nvel baixo 60
o
C e nvel alto 80
o
C. Quando se seleciona a
opo unidades codificadas, so mostrados, na Session Window, os coe-
ficientes do modelo para unidades codificadas e os coeficientes para uni-
dades no-codificadas.
BIOESTATISTICA_VOL02.indb 329 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 330
Nos submenus Terms, Graphs, Results e Storage, pode-se ver que eles
tm opes similares s apresentadas durante a anlise e planejamentos
fatoriais. No experimento em estudo, nenhuma das opes padro devem ser
alteradas. Na Figura 23.44, est a sada gerada e vista na Session Window.
RESPONSE SURFACE REGRESSION: RENDIMENTO VERSUS TEMPERATURA; TEMPO
The analysis was done using coded units.
Primeiro Grupo
Estimated Regression Coeffcients for Rendimento
Term Coef SE Coef T P
Constant 113,667 1,707 66,573 0,000
Temperatura 3,082 1,046 2,948 0,032
Tempo -5,984 1,046 -5,723 0,002
Temperatura*Temperatura -14,208 1,244 -11,417 0,000
Tempo*Tempo -7,458 1,244 -5,993 0,002
Temperatura*Tempo -5,750 1,479 -3,889 0,012
S = 2,957 R-Sq = 97,5% R-Sq(adj) = 95,0%
Segundo Grupo
Analysis of Variance for Rendimento
Source DF Seq SS Adj SS Adj MS F P
Regression 5 1701,18 1701,18 340,236 38,90 0,001
Linear 2 362,44 362,44 181,219 20,72 0,004
Square 2 1206,49 1206,49 603,246 68,98 0,000
Interaction 1 132,25 132,25 132,250 15,12 0,012
Residual Error 5 43,73 43,73 8,746
Lack-of-Fit 3 39,06 39,06 13,021 5,58 0,156
Pure Error 2 4,67 4,67 2,333
Total 10 1744,91
Unusual Observations for Rendimento
Obs StdOrder Rendimento Fit SE Fit Residual St Resid
4 4 87,000 83,348 2,338 3,652 2,02 R
R denotes an observation with a large standardized residual.
Terceiro Grupo
Estimated Regression Coeffcients for Rendimento using data in uncoded units
Term Coef
Constant -961,906
Temperatura 23,0749
Tempo 21,7699
Temperatura*Temperatura -0,142083
Tempo*Tempo -0,298333
Temperatura*Tempo -0,115000
Fig. 23.44 Resultado do Surface Design Exemplo da Tabela 23.8
BIOESTATISTICA_VOL02.indb 330 25/06/12 17:23
EXPERIMENTOS FATORIAIS 331
A interpretao desta sada muito similar quela feita para o planejamen-
to fatorial. No grupo desta sada, tm-se os coeficientes (coluna Coef ) de cada
termo (coluna Term) do modelo. A ltima coluna o valor P para cada termo,
com base no qual se decide qual termo significante ou no. Observando os
valores obtidos, todos menores que 0,05 (que o nvel de significncia adota-
do), conclui-se que todos os termos so significantes e, portanto, necessrio
incluir a todos no modelo.
Para obter o modelo do planejamento com unidades codificadas, utilizam-
-se os valores da coluna Coef, para cada termo correspondente da coluna Term.
Portanto, o modelo obtido :
Rendimento = 113,67 + 3,08 Temperatura 5,98 Tempo 14,21 Tempera-
tura
2
7.46 Tempo
2
5,75 Temperatura Tempo.
No segundo grupo, tem-se a tabela de anlise de varincia, onde so tes-
tados os modelos e ajustes. Em seguida, colocado um alerta de ocorrncia de
uma observao no usual para a resposta Y. Pode-se ver que o Minitab ajusta
automaticamente o valor 87, resultado do 4 experimento, para o valor 83,348,
indicando que o resduo resultante alto.
No terceiro grupo, apresentado o modelo do planejamento, para unida-
des no-codificadas.
Durante a construo dos grficos de curvas de nveis e superfcie, utiliza-
-se o caminho Stat DOE Response Surface Countour/Surface Plots,
conforme Figura 23.45.
Fig. 23.45 Comando Countour/Surface Plots
BIOESTATISTICA_VOL02.indb 331 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 332
Agora, suponha que se queira construir o grfico das curvas de nveis e
a superfcie de resposta para o experimento em estudo. A janela inicial deste
comando mostrada na Figura 23.46.
Fig. 23.46 Janela inicial do comando Countour / Surface Plots
Em Contour/Suface Plotes, selecionam-se as opes Countour plot e Sur-
face (Wireframe) plot para se obter, respectivamente, o grfico de curvas de
nveis e o grfico da superfcie resposta. Cada uma das opes possui o subme-
nu Setup, o qual necessrio ser visualizado, mesmo quando nenhuma altera-
o necessria. Neste submenu, apresentado na Figura 23.47, deve-se sele-
cionar a varivel resposta em Response. Ainda, em Select a pair of factors for
a single plot deve-se selecionar o par de fatores a ser utilizado no grfico, ou
selecionar a opo Generate plots for all pairs or factors, para gerar grficos
para todos os pares de fatores.
Fig. 23.47 Submenu Setup do comando Countour Plot
BIOESTATISTICA_VOL02.indb 332 25/06/12 17:23
EXPERIMENTOS FATORIAIS 333
Na opo Display plots using, pode-se definir se o grfico ser gerado
com unidades codificadas, selecionando Coded units, ou com unidades no-
-codificadas, selecionando Uncoded units. No submenu Setup do grfico Sur-
face plot, as opes so as mesmas do Setup do grfico Contour plot. Para
analisar o experimento em estudo, preenche-se a janela inicial de acordo com a
Figura 23.45, entrando em cada um dos Setups.
Os grficos gerados so mostrados nas figuras 23.48 e 23.49. Na Figura
23.48, pode-se ver que o maior Rendimento obtido quando a Temperatura
est por volta de 70 oC e quando o Tempo um ponto maior que 20 minutos.
Fig. 23.48 Grfco Countour Plot para o exemplo da Tabela 23.8
Fig. 23.49 Grfco Surface para o exemplo da Tabela 23.8
BIOESTATISTICA_VOL02.indb 333 25/06/12 17:23
BIOESTATISTICA_VOL02.indb 334 25/06/12 17:23
TABELAS
BIOESTATISTICA_VOL02.indb 335 25/06/12 17:23
BIOESTATISTICA_VOL02.indb 336 25/06/12 17:23
TABELAS 337
Tabela 1 - Distribuio normal gaussiana:
valores de z e respectivas reas entre a mdia (zero) e z
z
rea
entre
0 e z
z
rea
entre
0 e z
z
rea
entre
0 e z
z
rea
entre
0 e z
z
rea
entre
0 e z
z
rea
entre
0 e z
0,00 0,0000 0,56 0,2123 1,12 0,3686 1,68 0,4535 2,24 0,4875 2,80 0,4974
0,01 0,0040 0,57 0,2157 1,13 0,3708 1,69 0,4545 2,25 0,4878 2,81 0,4975
0,02 0,0080 0,58 0,2190 1,14 0,3729 1,70 0,4554 2,26 0,4881 2,82 0,4976
0,03 0,0120 0,59 0,2224 1,15 0,3749 1,71 0,4564 2,27 0,4884 2,83 0,4977
0,04 0,0160 0,60 0,2257 1,16 0,3770 1,72 0,4573 2,28 0,4887 2,84 0,4977
0,05 0,0199 0,61 0,2291 1,17 0,3790 1,73 0,4582 2,29 0,4890 2,85 0,4978
0,06 0,0239 0,62 0,2324 1,18 0,3810 1,74 0,4591 2,30 0,4893 2,86 0,4979
0,07 0,0279 0,63 0,2357 1,19 0,3830 1,75 0,4599 2,31 0,4896 2,87 0,4979
0,08 0,0319 0,64 0,2389 1,20 0,3849 1,76 0,4608 2,32 0,4898 2,88 0,4980
0,09 0,0359 0,65 0,2422 1,21 0,3869 1,77 0,4616 2,33 0,4901 2,89 0,4981
0,10 0,0398 0,66 0,2454 1,22 0,3888 1,78 0,4625 2,34 0,4904 2,90 0,4981
0,11 0,0438 0,67 0,2486 1,23 0,3907 1,79 0,4633 2,35 0,4906 2,91 0,4982
0,12 0,0478 0,68 0,2517 1,24 0,3925 1,80 0,4641 2,36 0,4909 2,92 0,4982
0,13 0,0517 0,69 0,2549 1,25 0,3944 1,81 0,4649 2,37 0,4911 2,93 0,4983
0,14 0,0557 0,70 0,2580 1,26 0,3962 1,82 0,4656 2,38 0,4913 2,94 0,4984
0,15 0,0596 0,71 0,2611 1,27 0,3980 1,83 0,4664 2,39 0,4916 2,95 0,4984
0,16 0,0636 0,72 0,2642 1,28 0,3997 1,84 0,4671 2,40 0,4918 2,96 0,4985
0,17 0,0675 0,73 0,2673 1,29 0,4015 1,85 0,4678 2,41 0,4920 2,97 0,4985
0,18 0,0714 0,74 0,2704 1,30 0,4032 1,86 0,4686 2,42 0,4922 2,98 0,4986
0,19 0,0753 0,75 0,2734 1,31 0,4049 1,87 0,4693 2,43 0,4925 2,99 0,4986
0,20 0,0793 0,76 0,2764 1,32 0,4066 1,88 0,4699 2,44 0,4927 3,00 0,4987
0,21 0,0832 0,77 0,2794 1,33 0,4082 1,89 0,4706 2,45 0,4929 3,01 0,4987
0,22 0,0871 0,78 0,2823 1,34 0,4099 1,90 0,4713 2,46 0,4931 3,02 0,4987
0,23 0,0910 0,79 0,2852 1,35 0,4115 1,91 0,4719 2,47 0,4932 3,03 0,4988
0,24 0,0948 0,80 0,2881 1,36 0,4131 1,92 0,4726 2,48 0,4934 3,04 0,4988
0,25 0,0987 0,81 0,2910 1,37 0,4147 1,93 0,4732 2,49 0,4936 3,05 0,4989
0,26 0,1026 0,82 0,2939 1,38 0,4162 1,94 0,4738 2,50 0,4938 3,06 0,4989
0,27 0,1064 0,83 0,2967 1,39 0,4177 1,95 0,4744 2,51 0,4940 3,07 0,4989
0,28 0,1103 0,84 0,2995 1,40 0,4192 1,96 0,4750 2,52 0,4941 3,08 0,4990
0,29 0,1141 0,85 0,3023 1,41 0,4207 1,97 0,4756 2,53 0,4943 3,09 0,4990
0,30 0,1179 0,86 0,3051 1,42 0,4222 1,98 0,4761 2,54 0,4945 3,10 0,4990
BIOESTATISTICA_VOL02.indb 337 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 338
z
rea
entre
0 e z
z
rea
entre
0 e z
z
rea
entre
0 e z
z
rea
entre
0 e z
z
rea
entre
0 e z
z
rea
entre
0 e z
0,31 0,1217 0,87 0,3078 1,43 0,4236 1,99 0,4767 2,55 0,4946 3,11 0,4991
0,32 0,1255 0,88 0,3106 1,44 0,4251 2,00 0,4772 2,56 0,4948 3,12 0,4991
0,33 0,1293 0,89 0,3133 1,45 0,4265 2,01 0,4778 2,57 0,4949 3,13 0,4991
0,34 0,1331 0,90 0,3159 1,46 0,4279 2,02 0,4783 2,58 0,4951 3,14 0,4992
0,35 0,1368 0,91 0,3186 1,47 0,4292 2,03 0,4788 2,59 0,4952 3,15 0,4992
0,36 0,1406 0,92 0,3212 1,48 0,4306 2,04 0,4793 2,60 0,4953 3,16 0,4992
0,37 0,1443 0,93 0,3238 1,49 0,4319 2,05 0,4798 2,61 0,4955 3,17 0,4992
0,38 0,1480 0,94 0,3264 1,50 0,4332 2,06 0,4803 2,62 0,4956 3,18 0,4993
0,39 0,1517 0,95 0,3289 1,51 0,4345 2,07 0,4808 2,63 0,4957 3,19 0,4993
0,40 0,1554 0,96 0,3315 1,52 0,4357 2,08 0,4812 2,64 0,4959 3,20 0,4993
0,41 0,1591 0,97 0,3340 1,53 0,4370 2,09 0,4817 2,65 0,4960 3,21 0,4993
0,42 0,1628 0,98 0,3365 1,54 0,4382 2,10 0,4821 2,66 0,4961 3,22 0,4994
0,43 0,1664 0,99 0,3389 1,55 0,4394 2,11 0,4826 2,67 0,4962 3,23 0,4994
0,44 0,1700 1,00 0,3413 1,56 0,4406 2,12 0,4830 2,68 0,4963 3,24 0,4994
0,45 0,1736 1,01 0,3438 1,57 0,4418 2,13 0,4834 2,69 0,4964 3,25 0,4994
0,46 0,1772 1,02 0,3461 1,58 0,4429 2,14 0,4838 2,70 0,4965 3,30 0,4995
0,47 0,1808 1,03 0,3485 1,59 0,4441 2,15 0,4842 2,71 0,4966 3,35 0,4996
0,48 0,1844 1,04 0,3508 1,60 0,4452 2,16 0,4846 2,72 0,4967 3,40 0,4997
0,49 0,1879 1,05 0,3531 1,61 0,4463 2,17 0,4850 2,73 0,4968 3,45 0,4997
0,50 0,1915 1,06 0,3554 1,62 0,4474 2,18 0,4854 2,74 0,4969 3,50 0,4998
0,51 0,1950 1,07 0,3577 1,63 0,4484 2,19 0,4857 2,75 0,4970 3,60 0,4998
0,52 0,1985 1,08 0,3599 1,64 0,4495 2,20 0,4861 2,76 0,4971 3,70 0,4999
0,53 0,2019 1,09 0,3621 1,65 0,4505 2,21 0,4864 2,77 0,4972 3,80 0,4999
0,54 0,2054 1,10 0,3643 1,66 0,4515 2,22 0,4868 2,78 0,4973 3,90 0,49995
0,55 0,2088 1,11 0,3665 1,67 0,4525 2,23 0,4871 2,79 0,4974 4,00 0,49997
Tabela 1 - Distribuio normal gaussiana: valores de z e respectivas reas
entre a mdia (zero) e z (continuao)
BIOESTATISTICA_VOL02.indb 338 25/06/12 17:23
TABELAS 339
gl
Bilateral: 0,40 0,20 0,10 0,05 0,02 0,01 0,001
Unilateral: 0,20 0,10 0,05 0,025 0,01 0,005 0,0005
1 1,376 3,078 6,314 12,706 31,821 63,656 636,578
2 1,061 1,886 2,920 4,303 6,965 9,925 31,600
3 0,978 1,638 2,353 3,182 4,541 5,841 12,924
4 0,941 1,533 2,132 2,776 3,747 4,604 8,610
5 0,920 1,476 2,015 2,571 3,365 4,032 6,869
6 0,906 1,440 1,943 2,447 3,143 3,707 5,959
7 0,896 1,415 1,895 2,365 2,998 3,499 5,408
8 0,889 1,397 1,860 2,306 2,896 3,355 5,041
9 0,883 1,383 1,833 2,262 2,821 3,250 4,781
10 0,879 1,372 1,812 2,228 2,764 3,169 4,587
11 0,876 1,363 1,796 2,201 2,718 3,106 4,437
12 0,873 1,356 1,782 2,179 2,681 3,055 4,318
13 0,870 1,350 1,771 2,160 2,650 3,012 4,221
14 0,868 1,345 1,761 2,145 2,624 2,977 4,140
15 0,866 1,341 1,753 2,131 2,602 2,947 4,073
16 0,865 1,337 1,746 2,120 2,583 2,921 4,015
17 0,863 1,333 1,740 2,110 2,567 2,898 3,965
18 0,862 1,330 1,734 2,101 2,552 2,878 3,922
19 0,861 1,328 1,729 2,093 2,539 2,861 3,883
20 0,860 1,325 1,725 2,086 2,528 2,845 3,850
21 0,859 1,323 1,721 2,080 2,518 2,831 3,819
22 0,858 1,321 1,717 2,074 2,508 2,819 3,792
23 0,858 1,319 1,714 2,069 2,500 2,807 3,768
24 0,857 1,318 1,711 2,064 2,492 2,797 3,745
25 0,856 1,316 1,708 2,060 2,485 2,787 3,725
Tabela 2 - Valores crticos da distribuio t de Student
BIOESTATISTICA_VOL02.indb 339 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 340
gl
Bilateral: 0,40 0,20 0,10 0,05 0,02 0,01 0,001
Unilateral: 0,20 0,10 0,05 0,025 0,01 0,005 0,0005
26 0,856 1,315 1,706 2,056 2,479 2,779 3,707
27 0,855 1,314 1,703 2,052 2,473 2,771 3,689
28 0,855 1,313 1,701 2,048 2,467 2,763 3,674
29 0,854 1,311 1,699 2,045 2,462 2,756 3,660
30 0,854 1,310 1,697 2,042 2,457 2,750 3,646
40 0,851 1,303 1,684 2,021 2,423 2,704 3,551
60 0,848 1,296 1,671 2,000 2,390 2,660 3,460
120 0,845 1,289 1,658 1,980 2,358 2,617 3,373
infinito 0,842 1,282 1,645 1,960 2,326 2,576 3,290
Tabela 2 - Valores crticos da distribuio t de Student (continuao)
BIOESTATISTICA_VOL02.indb 340 25/06/12 17:23
TABELAS 341
gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
1 648 799 864 900 922 937 948 957 963 969 973 977
2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,41
3 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,37 14,34
4 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,79 8,75
5 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,57 6,52
6 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,41 5,37
7 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,71 4,67
8 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,24 4,20
9 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,91 3,87
10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,66 3,62
11 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,47 3,43
12 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,32 3,28
13 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 3,20 3,15
14 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15 3,09 3,05
15 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 3,01 2,96
16 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99 2,93 2,89
17 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92 2,87 2,82
18 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,81 2,77
19 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 2,82 2,76 2,72
20 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,72 2,68
21 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,68 2,64
22 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70 2,65 2,60
23 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,62 2,57
24 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,59 2,54
25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,56 2,51
26 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59 2,54 2,49
27 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,51 2,47
28 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55 2,49 2,45
29 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,48 2,43
30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,46 2,41
Tabela 3.1 - Distribuio F: valores crticos para um teste bilateral ( = 0,05)
BIOESTATISTICA_VOL02.indb 341 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 342
gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
32 5,53 4,15 3,56 3,22 3,00 2,84 2,71 2,62 2,54 2,48 2,43 2,38
34 5,50 4,12 3,53 3,19 2,97 2,81 2,69 2,59 2,52 2,45 2,40 2,35
36 5,47 4,09 3,50 3,17 2,94 2,78 2,66 2,57 2,49 2,43 2,37 2,33
38 5,45 4,07 3,48 3,15 2,92 2,76 2,64 2,55 2,47 2,41 2,35 2,31
40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,33 2,29
42 5,40 4,03 3,45 3,11 2,89 2,73 2,61 2,51 2,43 2,37 2,32 2,27
44 5,39 4,02 3,43 3,09 2,87 2,71 2,59 2,50 2,42 2,36 2,30 2,26
46 5,37 4,00 3,42 3,08 2,86 2,70 2,58 2,48 2,41 2,34 2,29 2,24
48 5,35 3,99 3,40 3,07 2,84 2,69 2,56 2,47 2,39 2,33 2,27 2,23
50 5,34 3,97 3,39 3,05 2,83 2,67 2,55 2,46 2,38 2,32 2,26 2,22
55 5,31 3,95 3,36 3,03 2,81 2,65 2,53 2,43 2,36 2,29 2,24 2,19
60 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,22 2,17
65 5,26 3,91 3,32 2,99 2,77 2,61 2,49 2,39 2,32 2,25 2,20 2,15
70 5,25 3,89 3,31 2,97 2,75 2,59 2,47 2,38 2,30 2,24 2,18 2,14
80 5,22 3,86 3,28 2,95 2,73 2,57 2,45 2,35 2,28 2,21 2,16 2,11
100 5,18 3,83 3,25 2,92 2,70 2,54 2,42 2,32 2,24 2,18 2,12 2,08
125 5,15 3,80 3,22 2,89 2,67 2,51 2,39 2,30 2,22 2,15 2,10 2,05
150 5,13 3,78 3,20 2,87 2,65 2,49 2,37 2,28 2,20 2,13 2,08 2,03
200 5,10 3,76 3,18 2,85 2,63 2,47 2,35 2,26 2,18 2,11 2,06 2,01
400 5,06 3,72 3,15 2,82 2,60 2,44 2,32 2,22 2,15 2,08 2,03 1,98
1000 5,04 3,70 3,13 2,80 2,58 2,42 2,30 2,20 2,13 2,06 2,01 1,96
infinito 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,99 1,94
Tabela 3.1 - Distribuio F: valores crticos para um teste bilateral ( = 0,05)
(continuao)
BIOESTATISTICA_VOL02.indb 342 25/06/12 17:23
TABELAS 343
Tabela 3.1 - Distribuio F: valores crticos para um teste bilateral ( = 0,05)
gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
1 983 987 993 997 1001 1006 1008 1011 1013 1016 1017 1018
2 39,43 39,44 39,45 39,46 39,46 39,47 39,48 39,48 39,49 39,49 39,50 39,50
3 14,28 14,23 14,17 14,12 14,08 14,04 14,01 13,97 13,96 13,93 13,91 13,90
4 8,68 8,63 8,56 8,51 8,46 8,41 8,38 8,34 8,32 8,29 8,27 8,26
5 6,46 6,40 6,33 6,28 6,23 6,18 6,14 6,10 6,08 6,05 6,03 6,02
6 5,30 5,24 5,17 5,12 5,07 5,01 4,98 4,94 4,92 4,88 4,86 4,85
7 4,60 4,54 4,47 4,41 4,36 4,31 4,28 4,23 4,21 4,18 4,16 4,14
8 4,13 4,08 4,00 3,95 3,89 3,84 3,81 3,76 3,74 3,70 3,68 3,67
9 3,80 3,74 3,67 3,61 3,56 3,51 3,47 3,43 3,40 3,37 3,35 3,33
10 3,55 3,50 3,42 3,37 3,31 3,26 3,22 3,18 3,15 3,12 3,09 3,08
11 3,36 3,30 3,23 3,17 3,12 3,06 3,03 2,98 2,96 2,92 2,90 2,88
12 3,21 3,15 3,07 3,02 2,96 2,91 2,87 2,82 2,80 2,76 2,74 2,72
13 3,08 3,03 2,95 2,89 2,84 2,78 2,74 2,70 2,67 2,63 2,61 2,60
14 2,98 2,92 2,84 2,79 2,73 2,67 2,64 2,59 2,56 2,53 2,50 2,49
15 2,89 2,84 2,76 2,70 2,64 2,59 2,55 2,50 2,47 2,44 2,41 2,40
16 2,82 2,76 2,68 2,63 2,57 2,51 2,47 2,42 2,40 2,36 2,33 2,32
17 2,75 2,70 2,62 2,56 2,50 2,44 2,41 2,35 2,33 2,29 2,26 2,25
18 2,70 2,64 2,56 2,50 2,44 2,38 2,35 2,30 2,27 2,23 2,20 2,19
19 2,65 2,59 2,51 2,45 2,39 2,33 2,30 2,24 2,22 2,18 2,15 2,13
20 2,60 2,55 2,46 2,41 2,35 2,29 2,25 2,20 2,17 2,13 2,10 2,09
21 2,56 2,51 2,42 2,37 2,31 2,25 2,21 2,16 2,13 2,09 2,06 2,04
22 2,53 2,47 2,39 2,33 2,27 2,21 2,17 2,12 2,09 2,05 2,02 2,00
23 2,50 2,44 2,36 2,30 2,24 2,18 2,14 2,08 2,06 2,01 1,99 1,97
24 2,47 2,41 2,33 2,27 2,21 2,15 2,11 2,05 2,02 1,98 1,95 1,94
25 2,44 2,38 2,30 2,24 2,18 2,12 2,08 2,02 2,00 1,95 1,92 1,91
26 2,42 2,36 2,28 2,22 2,16 2,09 2,05 2,00 1,97 1,92 1,90 1,88
27 2,39 2,34 2,25 2,19 2,13 2,07 2,03 1,97 1,94 1,90 1,87 1,85
28 2,37 2,32 2,23 2,17 2,11 2,05 2,01 1,95 1,92 1,88 1,85 1,83
29 2,36 2,30 2,21 2,15 2,09 2,03 1,99 1,93 1,90 1,86 1,83 1,81
30 2,34 2,28 2,20 2,14 2,07 2,01 1,97 1,91 1,88 1,84 1,81 1,79
BIOESTATISTICA_VOL02.indb 343 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 344
gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
32 2,31 2,25 2,16 2,10 2,04 1,98 1,93 1,88 1,85 1,80 1,77 1,75
34 2,28 2,22 2,13 2,07 2,01 1,95 1,90 1,85 1,82 1,77 1,74 1,72
36 2,25 2,20 2,11 2,05 1,99 1,92 1,88 1,82 1,79 1,74 1,71 1,69
38 2,23 2,17 2,09 2,03 1,96 1,90 1,85 1,79 1,76 1,71 1,68 1,66
40 2,21 2,15 2,07 2,01 1,94 1,88 1,83 1,77 1,74 1,69 1,66 1,64
42 2,20 2,14 2,05 1,99 1,92 1,86 1,81 1,75 1,72 1,67 1,64 1,62
44 2,18 2,12 2,03 1,97 1,91 1,84 1,80 1,73 1,70 1,65 1,62 1,60
46 2,17 2,11 2,02 1,96 1,89 1,82 1,78 1,72 1,69 1,63 1,60 1,58
48 2,15 2,09 2,01 1,94 1,88 1,81 1,77 1,70 1,67 1,62 1,58 1,56
50 2,14 2,08 1,99 1,93 1,87 1,80 1,75 1,69 1,66 1,60 1,57 1,55
55 2,11 2,05 1,97 1,90 1,84 1,77 1,72 1,66 1,62 1,57 1,54 1,51
60 2,09 2,03 1,94 1,88 1,82 1,74 1,70 1,63 1,60 1,54 1,51 1,48
65 2,07 2,01 1,93 1,86 1,80 1,72 1,68 1,61 1,58 1,52 1,48 1,46
70 2,06 2,00 1,91 1,85 1,78 1,71 1,66 1,59 1,56 1,50 1,46 1,44
80 2,03 1,97 1,88 1,82 1,75 1,68 1,63 1,56 1,53 1,47 1,43 1,40
100 2,00 1,94 1,85 1,78 1,71 1,64 1,59 1,52 1,48 1,42 1,38 1,35
125 1,97 1,91 1,82 1,75 1,68 1,61 1,56 1,49 1,45 1,38 1,34 1,30
150 1,95 1,89 1,80 1,74 1,67 1,59 1,54 1,46 1,42 1,35 1,31 1,27
200 1,93 1,87 1,78 1,71 1,64 1,56 1,51 1,44 1,39 1,32 1,27 1,23
400 1,90 1,84 1,74 1,68 1,60 1,52 1,47 1,39 1,35 1,27 1,21 1,15
1000 1,88 1,82 1,72 1,65 1,58 1,50 1,45 1,36 1,32 1,23 1,16 1,09
infinito 1,87 1,80 1,71 1,64 1,57 1,48 1,43 1,34 1,30 1,21 1,13 1,01
Tabela 3.1 - Distribuio F: valores crticos para um teste bilateral ( = 0,05)
(continuao)
BIOESTATISTICA_VOL02.indb 344 25/06/12 17:23
TABELAS 345
gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
1 16212 19997 21614 22501 23056 23440 23715 23924 24091 24222 24334 24427
2 198,5 199,0 199,2 199,2 199,3 199,3 199,4 199,4 199,4 199,4 199,4 199,4
3 55,55 49,80 47,47 46,20 45,39 44,84 44,43 44,13 43,88 43,68 43,52 43,39
4 31,33 26,28 24,26 23,15 22,46 21,98 21,62 21,35 21,14 20,97 20,82 20,70
5 22,78 18,31 16,53 15,56 14,94 14,51 14,20 13,96 13,77 13,62 13,49 13,38
6 18,63 14,54 12,92 12,03 11,46 11,07 10,79 10,57 10,39 10,25 10,13 10,03
7 16,24 12,40 10,88 10,05 9,52 9,16 8,89 8,68 8,51 8,38 8,27 8,18
8 14,69 11,04 9,60 8,81 8,30 7,95 7,69 7,50 7,34 7,21 7,10 7,01
9 13,61 10,11 8,72 7,96 7,47 7,13 6,88 6,69 6,54 6,42 6,31 6,23
10 12,83 9,43 8,08 7,34 6,87 6,54 6,30 6,12 5,97 5,85 5,75 5,66
11 12,23 8,91 7,60 6,88 6,42 6,10 5,86 5,68 5,54 5,42 5,32 5,24
12 11,75 8,51 7,23 6,52 6,07 5,76 5,52 5,35 5,20 5,09 4,99 4,91
13 11,37 8,19 6,93 6,23 5,79 5,48 5,25 5,08 4,94 4,82 4,72 4,64
14 11,06 7,92 6,68 6,00 5,56 5,26 5,03 4,86 4,72 4,60 4,51 4,43
15 10,80 7,70 6,48 5,80 5,37 5,07 4,85 4,67 4,54 4,42 4,33 4,25
16 10,58 7,51 6,30 5,64 5,21 4,91 4,69 4,52 4,38 4,27 4,18 4,10
17 10,38 7,35 6,16 5,50 5,07 4,78 4,56 4,39 4,25 4,14 4,05 3,97
18 10,22 7,21 6,03 5,37 4,96 4,66 4,44 4,28 4,14 4,03 3,94 3,86
19 10,07 7,09 5,92 5,27 4,85 4,56 4,34 4,18 4,04 3,93 3,84 3,76
20 9,94 6,99 5,82 5,17 4,76 4,47 4,26 4,09 3,96 3,85 3,76 3,68
21 9,83 6,89 5,73 5,09 4,68 4,39 4,18 4,01 3,88 3,77 3,68 3,60
22 9,73 6,81 5,65 5,02 4,61 4,32 4,11 3,94 3,81 3,70 3,61 3,54
23 9,63 6,73 5,58 4,95 4,54 4,26 4,05 3,88 3,75 3,64 3,55 3,47
24 9,55 6,66 5,52 4,89 4,49 4,20 3,99 3,83 3,69 3,59 3,50 3,42
25 9,48 6,60 5,46 4,84 4,43 4,15 3,94 3,78 3,64 3,54 3,45 3,37
26 9,41 6,54 5,41 4,79 4,38 4,10 3,89 3,73 3,60 3,49 3,40 3,33
27 9,34 6,49 5,36 4,74 4,34 4,06 3,85 3,69 3,56 3,45 3,36 3,28
28 9,28 6,44 5,32 4,70 4,30 4,02 3,81 3,65 3,52 3,41 3,32 3,25
29 9,23 6,40 5,28 4,66 4,26 3,98 3,77 3,61 3,48 3,38 3,29 3,21
30 9,18 6,35 5,24 4,62 4,23 3,95 3,74 3,58 3,45 3,34 3,25 3,18
Tabela 3.2 - Distribuio F: valores crticos para um teste bilateral ( = 0,01)
BIOESTATISTICA_VOL02.indb 345 25/06/12 17:23
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 346
gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
32 9,09 6,28 5,17 4,56 4,17 3,89 3,68 3,52 3,39 3,29 3,20 3,12
34 9,01 6,22 5,11 4,50 4,11 3,84 3,63 3,47 3,34 3,24 3,15 3,07
36 8,94 6,16 5,06 4,46 4,06 3,79 3,58 3,42 3,30 3,19 3,10 3,03
38 8,88 6,11 5,02 4,41 4,02 3,75 3,54 3,39 3,26 3,15 3,06 2,99
40 8,83 6,07 4,98 4,37 3,99 3,71 3,51 3,35 3,22 3,12 3,03 2,95
42 8,78 6,03 4,94 4,34 3,95 3,68 3,48 3,32 3,19 3,09 3,00 2,92
44 8,74 5,99 4,91 4,31 3,92 3,65 3,45 3,29 3,16 3,06 2,97 2,89
46 8,70 5,96 4,88 4,28 3,90 3,62 3,42 3,26 3,14 3,03 2,94 2,87
48 8,66 5,93 4,85 4,25 3,87 3,60 3,40 3,24 3,11 3,01 2,92 2,85
50 8,63 5,90 4,83 4,23 3,85 3,58 3,38 3,22 3,09 2,99 2,90 2,82
55 8,55 5,84 4,77 4,18 3,80 3,53 3,33 3,17 3,05 2,94 2,85 2,78
60 8,49 5,79 4,73 4,14 3,76 3,49 3,29 3,13 3,01 2,90 2,82 2,74
65 8,44 5,75 4,69 4,11 3,73 3,46 3,26 3,10 2,98 2,87 2,79 2,71
70 8,40 5,72 4,66 4,08 3,70 3,43 3,23 3,08 2,95 2,85 2,76 2,68
80 8,33 5,67 4,61 4,03 3,65 3,39 3,19 3,03 2,91 2,80 2,72 2,64
100 8,24 5,59 4,54 3,96 3,59 3,33 3,13 2,97 2,85 2,74 2,66 2,58
125 8,17 5,53 4,49 3,91 3,54 3,28 3,08 2,93 2,80 2,70 2,61 2,54
150 8,12 5,49 4,45 3,88 3,51 3,25 3,05 2,89 2,77 2,67 2,58 2,51
200 8,06 5,44 4,41 3,84 3,47 3,21 3,01 2,86 2,73 2,63 2,54 2,47
400 7,97 5,37 4,34 3,78 3,41 3,15 2,95 2,80 2,68 2,57 2,49 2,41
1000 7,91 5,33 4,30 3,74 3,37 3,11 2,92 2,77 2,64 2,54 2,45 2,38
infinito 7,88 5,30 4,28 3,72 3,35 3,09 2,90 2,74 2,62 2,52 2,43 2,36
Tabela 3.2 - Distribuio F: valores crticos para um teste bilateral ( = 0,01)
(continuao)
BIOESTATISTICA_VOL02.indb 346 25/06/12 17:23
TABELAS 347
gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
1 24572 24684 24837 24937 25041 25146 25213 25295 25339 25399 25436 25466
2 199,4 199,4 199,4 199,4 199,5 199,5 199,5 199,5 199,5 199,5 199,5 199,5
3 43,17 43,01 42,78 42,62 42,47 42,31 42,21 42,08 42,02 41,92 41,87 41,83
4 20,51 20,37 20,17 20,03 19,89 19,75 19,67 19,55 19,50 19,41 19,36 19,32
5 13,21 13,09 12,90 12,78 12,66 12,53 12,45 12,35 12,30 12,22 12,17 12,14
6 9,88 9,76 9,59 9,47 9,36 9,24 9,17 9,07 9,03 8,95 8,91 8,88
7 8,03 7,91 7,75 7,64 7,53 7,42 7,35 7,26 7,22 7,15 7,10 7,08
8 6,87 6,76 6,61 6,50 6,40 6,29 6,22 6,13 6,09 6,02 5,98 5,95
9 6,09 5,98 5,83 5,73 5,62 5,52 5,45 5,37 5,32 5,26 5,21 5,19
10 5,53 5,42 5,27 5,17 5,07 4,97 4,90 4,82 4,77 4,71 4,67 4,64
11 5,10 5,00 4,86 4,76 4,65 4,55 4,49 4,40 4,36 4,29 4,25 4,23
12 4,77 4,67 4,53 4,43 4,33 4,23 4,17 4,08 4,04 3,97 3,93 3,90
13 4,51 4,41 4,27 4,17 4,07 3,97 3,91 3,82 3,78 3,71 3,67 3,65
14 4,30 4,20 4,06 3,96 3,86 3,76 3,70 3,61 3,57 3,50 3,46 3,44
15 4,12 4,02 3,88 3,79 3,69 3,59 3,52 3,44 3,39 3,33 3,29 3,26
16 3,97 3,87 3,73 3,64 3,54 3,44 3,37 3,29 3,25 3,18 3,14 3,11
17 3,84 3,75 3,61 3,51 3,41 3,31 3,25 3,16 3,12 3,05 3,01 2,98
18 3,73 3,64 3,50 3,40 3,30 3,20 3,14 3,05 3,01 2,94 2,90 2,87
19 3,64 3,54 3,40 3,31 3,21 3,11 3,04 2,96 2,91 2,85 2,80 2,78
20 3,55 3,46 3,32 3,22 3,12 3,02 2,96 2,87 2,83 2,76 2,72 2,69
21 3,48 3,38 3,24 3,15 3,05 2,95 2,88 2,80 2,75 2,68 2,64 2,61
22 3,41 3,31 3,18 3,08 2,98 2,88 2,82 2,73 2,69 2,62 2,57 2,55
23 3,35 3,25 3,12 3,02 2,92 2,82 2,76 2,67 2,62 2,56 2,51 2,48
24 3,30 3,20 3,06 2,97 2,87 2,77 2,70 2,61 2,57 2,50 2,46 2,43
25 3,25 3,15 3,01 2,92 2,82 2,72 2,65 2,56 2,52 2,45 2,41 2,38
26 3,20 3,11 2,97 2,87 2,77 2,67 2,61 2,52 2,47 2,40 2,36 2,33
27 3,16 3,07 2,93 2,83 2,73 2,63 2,57 2,48 2,43 2,36 2,32 2,29
28 3,12 3,03 2,89 2,79 2,69 2,59 2,53 2,44 2,39 2,32 2,28 2,25
29 3,09 2,99 2,86 2,76 2,66 2,56 2,49 2,40 2,36 2,29 2,24 2,21
30 3,06 2,96 2,82 2,73 2,63 2,52 2,46 2,37 2,32 2,25 2,21 2,18
Tabela 3.2 - Distribuio F: valores crticos para um teste bilateral ( = 0,01)
BIOESTATISTICA_VOL02.indb 347 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 348
gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
32 3,00 2,90 2,77 2,67 2,57 2,47 2,40 2,31 2,26 2,19 2,15 2,11
34 2,95 2,85 2,72 2,62 2,52 2,42 2,35 2,26 2,21 2,14 2,09 2,06
36 2,90 2,81 2,67 2,58 2,48 2,37 2,30 2,21 2,17 2,09 2,04 2,01
38 2,87 2,77 2,63 2,54 2,44 2,33 2,27 2,17 2,12 2,05 2,00 1,97
40 2,83 2,74 2,60 2,50 2,40 2,30 2,23 2,14 2,09 2,01 1,96 1,93
42 2,80 2,71 2,57 2,47 2,37 2,26 2,20 2,10 2,06 1,98 1,93 1,90
44 2,77 2,68 2,54 2,44 2,34 2,24 2,17 2,07 2,03 1,95 1,90 1,87
46 2,75 2,65 2,51 2,42 2,32 2,21 2,14 2,05 2,00 1,92 1,87 1,84
48 2,72 2,63 2,49 2,39 2,29 2,19 2,12 2,02 1,97 1,90 1,85 1,81
50 2,70 2,61 2,47 2,37 2,27 2,16 2,10 2,00 1,95 1,87 1,82 1,79
55 2,66 2,56 2,42 2,33 2,23 2,12 2,05 1,95 1,90 1,82 1,77 1,73
60 2,62 2,53 2,39 2,29 2,19 2,08 2,01 1,91 1,86 1,78 1,73 1,69
65 2,59 2,49 2,36 2,26 2,16 2,05 1,98 1,88 1,83 1,74 1,69 1,65
70 2,56 2,47 2,33 2,23 2,13 2,02 1,95 1,85 1,80 1,71 1,66 1,62
80 2,52 2,43 2,29 2,19 2,08 1,97 1,90 1,80 1,75 1,66 1,60 1,56
100 2,46 2,37 2,23 2,13 2,02 1,91 1,84 1,74 1,68 1,59 1,53 1,49
125 2,42 2,32 2,18 2,08 1,98 1,86 1,79 1,68 1,63 1,53 1,47 1,42
150 2,38 2,29 2,15 2,05 1,94 1,83 1,76 1,65 1,59 1,49 1,42 1,37
200 2,35 2,25 2,11 2,01 1,91 1,79 1,71 1,60 1,54 1,44 1,37 1,31
400 2,29 2,20 2,06 1,95 1,85 1,73 1,65 1,54 1,47 1,36 1,28 1,21
1000 2,26 2,16 2,02 1,92 1,81 1,69 1,61 1,50 1,43 1,31 1,22 1,13
infinito 2,24 2,14 2,00 1,90 1,79 1,67 1,59 1,47 1,40 1,28 1,17 1,01
Tabela 3.2 - Distribuio F: valores crticos para um teste bilateral ( = 0,01)
(continuao)
BIOESTATISTICA_VOL02.indb 348 25/06/12 17:24
TABELAS 349
gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
1 161 199 216 225 230 234 237 239 241 242 243 244
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,17 2,13
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,13 2,09
Tabela 4.1 - Distribuio F: valores crticos para um teste unilateral ( = 0,05)
BIOESTATISTICA_VOL02.indb 349 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 350
gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
32 4,15 3,29 2,90 2,67 2,51 2,40 2,31 2,24 2,19 2,14 2,10 2,07
34 4,13 3,28 2,88 2,65 2,49 2,38 2,29 2,23 2,17 2,12 2,08 2,05
36 4,11 3,26 2,87 2,63 2,48 2,36 2,28 2,21 2,15 2,11 2,07 2,03
38 4,10 3,24 2,85 2,62 2,46 2,35 2,26 2,19 2,14 2,09 2,05 2,02
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00
42 4,07 3,22 2,83 2,59 2,44 2,32 2,24 2,17 2,11 2,06 2,03 1,99
44 4,06 3,21 2,82 2,58 2,43 2,31 2,23 2,16 2,10 2,05 2,01 1,98
46 4,05 3,20 2,81 2,57 2,42 2,30 2,22 2,15 2,09 2,04 2,00 1,97
48 4,04 3,19 2,80 2,57 2,41 2,29 2,21 2,14 2,08 2,03 1,99 1,96
50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,99 1,95
55 4,02 3,16 2,77 2,54 2,38 2,27 2,18 2,11 2,06 2,01 1,97 1,93
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,95 1,92
65 3,99 3,14 2,75 2,51 2,36 2,24 2,15 2,08 2,03 1,98 1,94 1,90
70 3,98 3,13 2,74 2,50 2,35 2,23 2,14 2,07 2,02 1,97 1,93 1,89
80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00 1,95 1,91 1,88
100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,89 1,85
125 3,92 3,07 2,68 2,44 2,29 2,17 2,08 2,01 1,96 1,91 1,87 1,83
150 3,90 3,06 2,66 2,43 2,27 2,16 2,07 2,00 1,94 1,89 1,85 1,82
200 3,89 3,04 2,65 2,42 2,26 2,14 2,06 1,98 1,93 1,88 1,84 1,80
400 3,86 3,02 2,63 2,39 2,24 2,12 2,03 1,96 1,90 1,85 1,81 1,78
1000 3,85 3,00 2,61 2,38 2,22 2,11 2,02 1,95 1,89 1,84 1,80 1,76
infinito 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,79 1,75
Tabela 4.1 - Distribuio F: valores crticos para um teste unilateral ( = 0,05)
(continuao)
BIOESTATISTICA_VOL02.indb 350 25/06/12 17:24
TABELAS 351
gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
1 245 246 248 249 250 251 252 253 253 254 254 254
2 19,42 19,43 19,45 19,45 19,46 19,47 19,48 19,48 19,49 19,49 19,49 19,50
3 8,71 8,69 8,66 8,64 8,62 8,59 8,58 8,56 8,55 8,54 8,53 8,53
4 5,87 5,84 5,80 5,77 5,75 5,72 5,70 5,68 5,66 5,65 5,64 5,63
5 4,64 4,60 4,56 4,53 4,50 4,46 4,44 4,42 4,41 4,39 4,37 4,36
6 3,96 3,92 3,87 3,84 3,81 3,77 3,75 3,73 3,71 3,69 3,68 3,67
7 3,53 3,49 3,44 3,41 3,38 3,34 3,32 3,29 3,27 3,25 3,24 3,23
8 3,24 3,20 3,15 3,12 3,08 3,04 3,02 2,99 2,97 2,95 2,94 2,93
9 3,03 2,99 2,94 2,90 2,86 2,83 2,80 2,77 2,76 2,73 2,72 2,71
10 2,86 2,83 2,77 2,74 2,70 2,66 2,64 2,60 2,59 2,56 2,55 2,54
11 2,74 2,70 2,65 2,61 2,57 2,53 2,51 2,47 2,46 2,43 2,42 2,40
12 2,64 2,60 2,54 2,51 2,47 2,43 2,40 2,37 2,35 2,32 2,31 2,30
13 2,55 2,51 2,46 2,42 2,38 2,34 2,31 2,28 2,26 2,23 2,22 2,21
14 2,48 2,44 2,39 2,35 2,31 2,27 2,24 2,21 2,19 2,16 2,14 2,13
15 2,42 2,38 2,33 2,29 2,25 2,20 2,18 2,14 2,12 2,10 2,08 2,07
16 2,37 2,33 2,28 2,24 2,19 2,15 2,12 2,09 2,07 2,04 2,02 2,01
17 2,33 2,29 2,23 2,19 2,15 2,10 2,08 2,04 2,02 1,99 1,97 1,96
18 2,29 2,25 2,19 2,15 2,11 2,06 2,04 2,00 1,98 1,95 1,93 1,92
19 2,26 2,21 2,16 2,11 2,07 2,03 2,00 1,96 1,94 1,91 1,89 1,88
20 2,22 2,18 2,12 2,08 2,04 1,99 1,97 1,93 1,91 1,88 1,86 1,84
21 2,20 2,16 2,10 2,05 2,01 1,96 1,94 1,90 1,88 1,84 1,83 1,81
22 2,17 2,13 2,07 2,03 1,98 1,94 1,91 1,87 1,85 1,82 1,80 1,78
23 2,15 2,11 2,05 2,01 1,96 1,91 1,88 1,84 1,82 1,79 1,77 1,76
24 2,13 2,09 2,03 1,98 1,94 1,89 1,86 1,82 1,80 1,77 1,75 1,73
25 2,11 2,07 2,01 1,96 1,92 1,87 1,84 1,80 1,78 1,75 1,73 1,71
26 2,09 2,05 1,99 1,95 1,90 1,85 1,82 1,78 1,76 1,73 1,71 1,69
27 2,08 2,04 1,97 1,93 1,88 1,84 1,81 1,76 1,74 1,71 1,69 1,67
28 2,06 2,02 1,96 1,91 1,87 1,82 1,79 1,75 1,73 1,69 1,67 1,65
29 2,05 2,01 1,94 1,90 1,85 1,81 1,77 1,73 1,71 1,67 1,65 1,64
30 2,04 1,99 1,93 1,89 1,84 1,79 1,76 1,72 1,70 1,66 1,64 1,62
Tabela 4.1 - Distribuio F: valores crticos para um teste unilateral ( = 0,05)
BIOESTATISTICA_VOL02.indb 351 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 352
gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
32 2,01 1,97 1,91 1,86 1,82 1,77 1,74 1,69 1,67 1,63 1,61 1,59
34 1,99 1,95 1,89 1,84 1,80 1,75 1,71 1,67 1,65 1,61 1,59 1,57
36 1,98 1,93 1,87 1,82 1,78 1,73 1,69 1,65 1,62 1,59 1,56 1,55
38 1,96 1,92 1,85 1,81 1,76 1,71 1,68 1,63 1,61 1,57 1,54 1,53
40 1,95 1,90 1,84 1,79 1,74 1,69 1,66 1,61 1,59 1,55 1,53 1,51
42 1,94 1,89 1,83 1,78 1,73 1,68 1,65 1,60 1,57 1,53 1,51 1,49
44 1,92 1,88 1,81 1,77 1,72 1,67 1,63 1,59 1,56 1,52 1,49 1,48
46 1,91 1,87 1,80 1,76 1,71 1,65 1,62 1,57 1,55 1,51 1,48 1,46
48 1,90 1,86 1,79 1,75 1,70 1,64 1,61 1,56 1,54 1,49 1,47 1,45
50 1,89 1,85 1,78 1,74 1,69 1,63 1,60 1,55 1,52 1,48 1,46 1,44
55 1,88 1,83 1,76 1,72 1,67 1,61 1,58 1,53 1,50 1,46 1,43 1,41
60 1,86 1,82 1,75 1,70 1,65 1,59 1,56 1,51 1,48 1,44 1,41 1,39
65 1,85 1,80 1,73 1,69 1,63 1,58 1,54 1,49 1,46 1,42 1,39 1,37
70 1,84 1,79 1,72 1,67 1,62 1,57 1,53 1,48 1,45 1,40 1,37 1,35
80 1,82 1,77 1,70 1,65 1,60 1,54 1,51 1,45 1,43 1,38 1,35 1,32
100 1,79 1,75 1,68 1,63 1,57 1,52 1,48 1,42 1,39 1,34 1,31 1,28
125 1,77 1,73 1,66 1,60 1,55 1,49 1,45 1,40 1,36 1,31 1,27 1,25
150 1,76 1,71 1,64 1,59 1,54 1,48 1,44 1,38 1,34 1,29 1,25 1,22
200 1,74 1,69 1,62 1,57 1,52 1,46 1,41 1,35 1,32 1,26 1,22 1,19
400 1,72 1,67 1,60 1,54 1,49 1,42 1,38 1,32 1,28 1,22 1,17 1,13
1000 1,70 1,65 1,58 1,53 1,47 1,41 1,36 1,30 1,26 1,19 1,13 1,08
infinito 1,69 1,64 1,57 1,52 1,46 1,39 1,35 1,28 1,24 1,17 1,11 1,00
Tabela 4.1 - Distribuio F: valores crticos para um teste unilateral ( = 0,05)
(continuao)
BIOESTATISTICA_VOL02.indb 352 25/06/12 17:24
TABELAS 353
gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
1 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6083 6107
2 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 99,40 99,41 99,42
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,23 27,13 27,05
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,45 14,37
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,96 9,89
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,79 7,72
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,54 6,47
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,73 5,67
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,18 5,11
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,77 4,71
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,46 4,40
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,22 4,16
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 4,02 3,96
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,86 3,80
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,73 3,67
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,62 3,55
17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,52 3,46
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,43 3,37
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,36 3,30
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,29 3,23
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,24 3,17
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,18 3,12
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,14 3,07
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,09 3,03
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 3,06 2,99
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 3,02 2,96
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,99 2,93
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,96 2,90
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,93 2,87
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,91 2,84
Tabela 4.2 - Distribuio F: valores crticos para um teste unilateral ( = 0,01)
BIOESTATISTICA_VOL02.indb 353 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 354
gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
32 7,50 5,34 4,46 3,97 3,65 3,43 3,26 3,13 3,02 2,93 2,86 2,80
34 7,44 5,29 4,42 3,93 3,61 3,39 3,22 3,09 2,98 2,89 2,82 2,76
36 7,40 5,25 4,38 3,89 3,57 3,35 3,18 3,05 2,95 2,86 2,79 2,72
38 7,35 5,21 4,34 3,86 3,54 3,32 3,15 3,02 2,92 2,83 2,75 2,69
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,73 2,66
42 7,28 5,15 4,29 3,80 3,49 3,27 3,10 2,97 2,86 2,78 2,70 2,64
44 7,25 5,12 4,26 3,78 3,47 3,24 3,08 2,95 2,84 2,75 2,68 2,62
46 7,22 5,10 4,24 3,76 3,44 3,22 3,06 2,93 2,82 2,73 2,66 2,60
48 7,19 5,08 4,22 3,74 3,43 3,20 3,04 2,91 2,80 2,71 2,64 2,58
50 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78 2,70 2,63 2,56
55 7,12 5,01 4,16 3,68 3,37 3,15 2,98 2,85 2,75 2,66 2,59 2,53
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,56 2,50
65 7,04 4,95 4,10 3,62 3,31 3,09 2,93 2,80 2,69 2,61 2,53 2,47
70 7,01 4,92 4,07 3,60 3,29 3,07 2,91 2,78 2,67 2,59 2,51 2,45
80 6,96 4,88 4,04 3,56 3,26 3,04 2,87 2,74 2,64 2,55 2,48 2,42
100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59 2,50 2,43 2,37
125 6,84 4,78 3,94 3,47 3,17 2,95 2,79 2,66 2,55 2,47 2,39 2,33
150 6,81 4,75 3,91 3,45 3,14 2,92 2,76 2,63 2,53 2,44 2,37 2,31
200 6,76 4,71 3,88 3,41 3,11 2,89 2,73 2,60 2,50 2,41 2,34 2,27
400 6,70 4,66 3,83 3,37 3,06 2,85 2,68 2,56 2,45 2,37 2,29 2,23
1000 6,66 4,63 3,80 3,34 3,04 2,82 2,66 2,53 2,43 2,34 2,27 2,20
infinito 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,25 2,18
Tabela 4.2 - Distribuio F: valores crticos para um teste unilateral ( = 0,01)
(continuao)
BIOESTATISTICA_VOL02.indb 354 25/06/12 17:24
TABELAS 355
gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
1 6143 6170 6209 6234 6260 6286 6302 6324 6334 6350 6360 6366
2 99,43 99,44 99,45 99,46 99,47 99,48 99,48 99,48 99,49 99,49 99,50 99,50
3 26,92 26,83 26,69 26,60 26,50 26,41 26,35 26,28 26,24 26,18 26,15 26,13
4 14,25 14,15 14,02 13,93 13,84 13,75 13,69 13,61 13,58 13,52 13,49 13,46
5 9,77 9,68 9,55 9,47 9,38 9,29 9,24 9,17 9,13 9,08 9,04 9,02
6 7,60 7,52 7,40 7,31 7,23 7,14 7,09 7,02 6,99 6,93 6,90 6,88
7 6,36 6,28 6,16 6,07 5,99 5,91 5,86 5,79 5,75 5,70 5,67 5,65
8 5,56 5,48 5,36 5,28 5,20 5,12 5,07 5,00 4,96 4,91 4,88 4,86
9 5,01 4,92 4,81 4,73 4,65 4,57 4,52 4,45 4,41 4,36 4,33 4,31
10 4,60 4,52 4,41 4,33 4,25 4,17 4,12 4,05 4,01 3,96 3,93 3,91
11 4,29 4,21 4,10 4,02 3,94 3,86 3,81 3,74 3,71 3,66 3,62 3,60
12 4,05 3,97 3,86 3,78 3,70 3,62 3,57 3,50 3,47 3,41 3,38 3,36
13 3,86 3,78 3,66 3,59 3,51 3,43 3,38 3,31 3,27 3,22 3,19 3,17
14 3,70 3,62 3,51 3,43 3,35 3,27 3,22 3,15 3,11 3,06 3,03 3,00
15 3,56 3,49 3,37 3,29 3,21 3,13 3,08 3,01 2,98 2,92 2,89 2,87
16 3,45 3,37 3,26 3,18 3,10 3,02 2,97 2,90 2,86 2,81 2,78 2,75
17 3,35 3,27 3,16 3,08 3,00 2,92 2,87 2,80 2,76 2,71 2,68 2,65
18 3,27 3,19 3,08 3,00 2,92 2,84 2,78 2,71 2,68 2,62 2,59 2,57
19 3,19 3,12 3,00 2,92 2,84 2,76 2,71 2,64 2,60 2,55 2,51 2,49
20 3,13 3,,05 2,94 2,86 2,78 2,69 2,64 2,57 2,54 2,48 2,44 2,42
21 3,07 2,99 2,88 2,80 2,72 2,64 2,58 2,51 2,48 2,42 2,38 2,36
22 3,02 2,94 2,83 2,75 2,67 2,58 2,53 2,46 2,42 2,36 2,33 2,31
23 2,97 2,89 2,78 2,70 2,62 2,54 2,48 2,41 2,37 2,32 2,28 2,26
24 2,93 2,85 2,74 2,66 2,58 2,49 2,44 2,37 2,33 2,27 2,24 2,21
25 2,89 2,81 2,70 2,62 2,54 2,45 2,40 2,33 2,29 2,23 2,19 2,17
26 2,86 2,78 2,66 2,58 2,50 2,42 2,36 2,29 2,25 2,19 2,16 2,13
27 2,82 2,75 2,63 2,55 2,47 2,38 2,33 2,26 2,22 2,16 2,12 2,10
28 2,79 2,72 2,60 2,52 2,44 2,35 2,30 2,23 2,19 2,13 2,09 2,06
29 2,77 2,69 2,57 2,49 2,41 2,33 2,27 2,20 2,16 2,10 2,06 2,03
30 2,74 2,66 2,55 2,47 2,39 2,30 2,25 2,17 2,13 2,07 2,03 2,01
Tabela 4.2 - Distribuio F: valores crticos para um teste unilateral ( = 0,01)
BIOESTATISTICA_VOL02.indb 355 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 356
gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
32 2,70 2,62 2,50 2,42 2,34 2,25 2,20 2,12 2,08 2,02 1,98 1,96
34 2,66 2,58 2,46 2,38 2,30 2,21 2,16 2,08 2,04 1,98 1,94 1,91
36 2,62 2,54 2,43 2,35 2,26 2,18 2,12 2,04 2,00 1,94 1,90 1,87
38 2,59 2,51 2,40 2,32 2,23 2,14 2,09 2,01 1,97 1,90 1,86 1,84
40 2,56 2,48 2,37 2,29 2,20 2,11 2,06 1,98 1,94 1,87 1,83 1,80
42 2,54 2,46 2,34 2,26 2,18 2,09 2,03 1,95 1,91 1,85 1,80 1,78
44 2,52 2,44 2,32 2,24 2,15 2,07 2,01 1,93 1,89 1,82 1,78 1,75
46 2,50 2,42 2,30 2,22 2,13 2,04 1,99 1,91 1,86 1,80 1,76 1,73
48 2,48 2,40 2,28 2,20 2,12 2,02 1,97 1,89 1,84 1,78 1,73 1,70
50 2,46 2,38 2,27 2,18 2,10 2,01 1,95 1,87 1,82 1,76 1,71 1,68
55 2,42 2,34 2,23 2,15 2,06 1,97 1,91 1,83 1,78 1,71 1,67 1,64
60 2,39 2,31 2,20 2,12 2,03 1,94 1,88 1,79 1,75 1,68 1,63 1,60
65 2,37 2,29 2,17 2,09 2,00 1,91 1,85 1,77 1,72 1,65 1,60 1,57
70 2,35 2,27 2,15 2,07 1,98 1,89 1,83 1,74 1,70 1,62 1,57 1,54
80 2,31 2,23 2,12 2,03 1,94 1,85 1,79 1,70 1,65 1,58 1,53 1,49
100 2,27 2,19 2,07 1,98 1,89 1,80 1,74 1,65 1,60 1,52 1,47 1,43
125 2,23 2,15 2,03 1,94 1,85 1,76 1,69 1,60 1,55 1,47 1,41 1,37
150 2,20 2,12 2,00 1,92 1,83 1,73 1,66 1,57 1,52 1,43 1,38 1,33
200 2,17 2,09 1,97 1,89 1,79 1,69 1,63 1,53 1,48 1,39 1,33 1,28
400 2,13 2,05 1,92 1,84 1,75 1,64 1,58 1,48 1,42 1,32 1,25 1,19
1000 2,10 2,02 1,90 1,81 1,72 1,61 1,54 1,44 1,38 1,28 1,19 1,11
infinito 2,08 2,00 1,88 1,79 1,70 1,59 1,52 1,42 1,36 1,25 1,15 1,00
Tabela 4.2 - Distribuio F: valores crticos para um teste unilateral ( = 0,01)
(continuao)
BIOESTATISTICA_VOL02.indb 356 25/06/12 17:24
TABELAS 357
n
P
x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950
2 0 0,903 0,810 0,640 0,490 0,360 0,250 0,160 0,090 0,040 0,010 0,003
1 0,095 0,180 0,320 0,420 0,480 0,500 0,480 0,420 0,320 0,180 0,095
2 0,003 0,010 0,040 0,090 0,160 0,250 0,360 0,490 0,640 0,810 0,903
3 0 0,857 0,729 0,512 0,343 0,216 0,125 0,064 0,027 0,008 0,001
1 0,135 0,243 0,384 0,441 0,432 0,375 0,288 0,189 0,096 0,027 0,007
2 0,007 0,027 0,096 0,189 0,288 0,375 0,432 0,441 0,384 0,243 0,135
3 0,001 0,008 0,027 0,064 0,125 0,216 0,343 0,512 0,729 0,857
4 0 0,815 0,656 0,410 0,240 0,130 0,063 0,026 0,008 0,002
1 0,171 0,292 0,410 0,412 0,346 0,250 0,154 0,076 0,026 0,004
2 0,014 0,049 0,154 0,265 0,346 0,375 0,346 0,265 0,154 0,049 0,014
3 0,004 0,026 0,076 0,154 0,250 0,346 0,412 0,410 0,292 0,171
4 0,002 0,008 0,026, 0,063 0,130 0,240 0,410 0,656 0,815
5 0 0,774 0,590 0,328 0,168 0,078 0,031 0,010 0,002
1 0,204 0,328 0,410 0,360 0,259 0,156 0,077 0,028 0,006
2 0,021 0,073 0,205 0,309 0,346 0,313 0,230 0,132 0,051 0,008 0,001
3 0,001 0,008 0,051 0,132 0,230 0,313 0,346 0,309 0,205 0,073 0,021
4 0,006 0,028 0,077 0,156 0,259 0,360 0,410 0,328 0,204
5 0,002 0,010 0,031 0,078 0,168 0,328 0,590 0,774
6 0 0,735 0,531 0,262 0,118 0,047 0,016 0,004 0,001
1 0,232 0,354 0,393 0,303 0,187 0,094 0,037 0,010 0,002
2 0,031 0,098 0,246 0,324 0,311 0,234 0,138 0,060 0,015 0,001
3 0,002 0,015 0,082 0,185 0,276 0,313 0,276 0,185 0,082 0,015 0,002
4 0,001 0,015 0,060 0,138 0,234 0,311 0,324 0,246 0,098 0,031
5 0,002 0,010 0,037 0,094 0,187 0,303 0,393 0,354 0,232
6 0,001 0,004 0,016 0,047 0,118 0,262 0,531 0,735
7 0 0,698 0,478 0,210 0,082 0,028 0,008 0,002
1 0,257 0,372 0,367 0,247 0,131 0,055 0,017 0,004
2 0,041 0,124 0,275 0,318 0,261 0,164 0,077 0,025 0,004
3 0,004 0,023 0,115 0,227 0,290 0,273 0,194 0,097 0,029 0,003
4 0,003 0,029 0,097 0,194 0,273 0,290 0,227 0,115 0,023 0,004
5 0,004 0,025 0,077 0,164 0,261 0,318 0,275 0,124 0,041
6 0,004 0,017 0,055 0,131 0,247 0,367 0,372 0,257
7 0,002 0,008 0,028 0,082 0,210 0,478 0,698
Tabela 5 - Distribuio binomial: probabilidades para x sucessos em n observaes
BIOESTATISTICA_VOL02.indb 357 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 358
Tabela 5 - Distribuio binomial: probabilidades para x sucessos em n observaes
(continuao)
n
P
x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950
8 0 0,663 0,430 0,168 0,058 0,017 0,004 0,001
1 0,279 0,383 0,336 0,198 0,090 0,031 0,008 0,001
2 0,051 0,149 0,294 0,296 0,209 0,109 0,041 0,010 0,001
3 0,005 0,033 0,147 0,254 0,279 0,219 0,124 0,047 0,009
4 0,005 0,046 0,136 0,232 0,273 0,232 0,136 0,046 0,005
5 0,009 0,047 0,124 0,219 0,279 0,254 0,147 0,033 0,005
6 0,001 0,010 0,041 0,109 0,209 0,296 0,294 0,149 0,051
7 0,001 0,008 0,031 0,090 0,198 0,336 0,383 0,279
8 0,001 0,004 0,017 0,058 0,168 0,430 0,663
9 0 0,630 0,387 0,134 0,040 0,010 0,002
1 0,299 0,387 0,302 0,156 0,060 0,018 0,004
2 0,063 0,172 0,302 0,267 0,161 0,070 0,021 0,004
3 0,008 0,045 0,176 0,267 0,251 0,164 0,074 0,021 0,003
4 0,001 0,007 0,066 0,172 0,251 0,246 0,167 0,074 0,017 0,001
5 0,001 0,017 0,074 0,167 0,246 0,251 0,172 0,066 0,007 0,001
6 0,003 0,021 0,074 0,164 0,251 0,267 0,176 0,045 0,008
7 0,004 0,021 0,070 0,161 0,267 0,302 0,172 0,063
8 0,004 0,018 0,060 0,156 0,302 0,387 0,299
9 0,002 0,010 0,040 0,134 0,387 0,630
10 0 0,599 0,349 0,107 0,028 0,006 0,001
1 0,315 0,387 0,268 0,121 0,040 0,010 0,002
2 0,075 0,194 0,302 0,233 0,121 0,044 0,011 0,001
3 0,010 0,057 0,201 0,267 0,215 0,117 0,042 0,009 0,001
4 0,001 0,011 0,088 0,200 0,251 0,205 0,111 0,037 0,006
5 0,001 0,026 0,103 0,201 0,246 0,201 0,103 0,026 0,001
6 0,006 0,037 0,111 0,205 0,251 0,200 0,088 0,011 0,001
7 0,001 0,009 0,042 0,117 0,215 0,267 0,201 0,057 0,010
8 0,001 0,011 0,044 0,121 0,233 0,302 0,194 0,075
9 0,002 0,010 0,040 0,121 0,268 0,387 0,315
10 0,001 0,006 0,028 0,107 0,349 0,599
11 0 0,569 0,314 0,086 0,020 0,004
1 0,329 0,384 0,236 0,093 0,027 0,005 0,001
2 0,087 0,213 0,295 0,200 0,089 0,027 0,005 0,001
BIOESTATISTICA_VOL02.indb 358 25/06/12 17:24
TABELAS 359
Tabela 5 - Distribuio binomial: probabilidades para x sucessos em n observaes
(continuao)
n
P
x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950
3 0,014 0,071 0,221 0,257 0,177 0,081 0,023 0,004
4 0,001 0,016 0,111 0,220 0,236 0,161 0,070 0,017 0,002
5 0,002 0,039 0,132 0,221 0,226 0,147 0,057 0,010
6 0,010 0,057 0,147 0,226 0,221 0,132 0,039 0,002
7 0,002 0,017 0,070 0,161 0,236 0,220 0,111 0,016 0,001
8 0,004 0,023 0,081 0,177 0,257 0,221 0,071 0,014
9 0,001 0,005 0,027 0,089 0,200 0,295 0,213 0,087
10 0,001 0,005 0,027 0,093 0,236 0,384 0,329
11 0,004 0,020 0,086 0,314 0,569
12 0 0,540 0,282 0,069 0,014 0,002
1 0,341 0,377 0,206 0,071 0,017 0,003
2 0,099 0,230 0,283 0,168 0,064 0,016 0,002
3 0,017 0,085 0,236 0,240 0,142 0,054 0,012 0,001
4 0,002 0,021 0,133 0,231 0,213 0,121 0,042 0,008 0,001
5 0,004 0,053 0,158 0,227 0,193 0,101 0,029 0,003
6 0,016 0,079 0,177 0,226 0,177 0,079 0,016
7 0,003 0,029 0,101 0,193 0,227 0,158 0,053 0,004
8 0,001 0,008 0,042 0,121 0,213 0,231 0,133 0,021 0,002
9 0,001 0,012 0,054 0,142 0,240 0,236 0,085 0,017
10 0,002 0,016 0,064 0,168 0,283 0,230 0,099
11 0,003 0,017 0,071 0,206 0,377 0,341
12 0,002 0,014 0,069 0,282 0,540
16 0 0,440 0,185 0,028 0,003
1 0,371 0,329 0,113 0,023 0,003
2 0,146 0,275 0,211 0,073 0,015 0,002
3 0,036 0,142 0,246 0,146 0,047 0,009 0,001
4 0,006 0,051 0,200 0,204 0,101 0,028 0,004
5 0,001 0,014 0,120 0,210 0,162 0,067 0,014 0,001
6 0,003 0,055 0,165 0,198 0,122 0,039 0,006
7 0,020 0,101 0,189 0,175 0,084 0,019 0,001
8 0,006 0,049 0,142 0,196 0,142 0,049 0,006
9 0,001 0,019 0,084 0,175 0,189 0,101 0,020
10 0,006 0,039 0,122 0,198 0,165 0,055 0,003
BIOESTATISTICA_VOL02.indb 359 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 360
n
P
x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950
11 0,001 0,014 0,067 0,162 0,210 0,120 0,014 0,001
12 0,004 0,028 0,101 0,204 0,200 0,051 0,006
13 0,001 0,009 0,047 0,146 0,246 0,142 0,036
14 0,002 0,015 0,073 0,211 0,275 0,146
15 0,003 0,023 0,113 0,329 0,371
16 0,003 0,028 0,185 0,440
20 0 0,358 0,122 0,012 0,001
1 0,377 0,270 0,058 0,007
2 0,189 0,285 0,137 0,028 0,003
3 0,060 0,190 0,205 0,072 0,012 0,001
4 0,013 0,090 0,218 0,130 0,035 0,005
5 0,002 0,032 0,175 0,179 0,075 0,015 0,001
6 0,009 0,109 0,192 0,124 0,037 0,005
7 0,002 0,055 0,164 0,166 0,074 0,015 0,001
8 0,022 0,114 0,180 0,120 0,035 0,004
9 0,007 0,065 0,160 0,160 0,071 0,012
10 0,002 0,031 0,117 0,176 0,117 0,031 0,002
11 0,012 0,071 0,160 0,160 0,065 0,007
12 0,004 0,035 0,120 0,180 0,114 0,022
13 0,001 0,015 0,074 0,166 0,164 0,055 0,002
14 0,005 0,037 0,124 0,192 0,109 0,009
15 0,001 0,015 0,075 0,179 0,175 0,032 0,002
16 0,005 0,035 0,130 0,218 0,090 0,013
17 0,001 0,012 0,072 0,205 0,190 0,060
18 0,003 0,028 0,137 0,285 0,189
19 0,007 0,058 0,270 0,377
20 0,001 0,012 0,122 0,358
Tabela 5 - Distribuio binomial: probabilidades para x sucessos em n observaes
(continuao)
BIOESTATISTICA_VOL02.indb 360 25/06/12 17:24
TABELAS 361
Tabela 6 - Valores crticos da distribuio qui-quadrado (
2
)

gl 0,20 0,10 0,05 0,02 0,01 0,001


1 1,64 2,71 3,84 5,41 6,63 10,83
2 3,22 4,61 5,99 7,82 9,21 13,82
3 4,64 6,25 7,81 9,84 11,34 16,27
4 5,99 7,78 9,49 11,67 13,28 18,47
5 7,29 9,24 11,07 13,39 15,09 20,51
6 8,56 10,64 12,59 15,03 16,81 22,46
7 9,80 12,02 14,07 16,62 18,48 24,32
8 11,03 13,36 15,51 18,17 20,09 26,12
9 12,24 14,68 16,92 19,68 21,67 27,88
10 13,44 15,99 18,31 21,16 23,21 29,59
11 14,63 17,28 19,68 22,62 24,73 31,26
12 15,81 18,55 21,03 24,05 26,22 32,91
13 16,98 19,81 22,36 25,47 27,69 34,53
14 18,15 21,06 23,68 26,87 29,14 36,12
15 19,31 22,31 25,00 28,26 30,58 37,70
16 20,47 23,54 26,30 29,63 32,00 39,25
17 21,61 24,77 27,59 31,00 33,41 40,79
18 22,76 25,99 28,87 32,35 34,81 42,31
19 23,90 27,20 30,14 33,69 36,19 43,82
20 25,04 28,41 31,41 35,02 37,57 45,31
21 26,17 29,62 32,67 36,34 38,93 46,80
22 27,30 30,81 33,92 37,66 40,29 48,27
23 28,43 32,01 35,17 38,97 41,64 49,73
24 29,55 33,20 36,42 40,27 42,98 51,18
25 30,68 34,38 37,65 41,57 44,31 52,62
26 31,79 35,56 38,89 42,86 45,64 54,05
27 32,91 36,74 40,11 44,14 46,96 55,48
28 34,03 37,92 41,34 45,42 48,28 56,89
29 35,14 39,09 42,56 46,69 49,59 58,30
30 36,25 40,26 43,77 47,96 50,89 59,70
BIOESTATISTICA_VOL02.indb 361 25/06/12 17:24
BIOESTATISTICA_VOL02.indb 362 25/06/12 17:24
TABELAS 363
gl k: 2 3 4 5 6 7 8 9 10
1 17,97 26,98 32,82 37,08 40,41 43,12 45,40 47,36 49,07
2 6,085 8,331 9,798 10,88 11,74 12,44 13,03 13,54 13,99
3 4,501 5,910 6,825 7,502 8,037 8,478 8,853 9,177 9,462
4 3,927 5,040 5,757 6,287 6,707 7,053 7,347 7,602 7,826
5 3,635 4,602 5,218 5,673 6,033 6,330 6,582 6,802 6,995
6 3,461 4,339 4,896 5,305 5,628 5,895 6,122 6,319 6,493
7 3,344 4,165 4,681 5,060 5,359 5,606 5,815 5,998 6,158
8 3,261 4,041 4,529 4,886 5,167 5,399 5,597 5,767 5,918
9 3,199 3,949 4,415 4,756 5,024 5,244 5,432 5,595 5,739
10 3,151 3,877 4,327 4,654 4,912 5,124 5,305 5,461 5,599
11 3,113 3,820 4,256 4,574 4,823 5,028 5,202 5,353 5,487
12 3,082 3,773 4,199 4,508 4,751 4,950 5,119 5,265 5,395
13 3,055 3,735 4,151 4,453 4,690 4,885 5,049 5,192 5,318
14 3,033 3,702 4,111 4,407 4,639 4,829 4,990 5,131 5,254
15 3,014 3,674 4,076 4,367 4,595 4,782 4,940 5,077 5,198
16 2,998 3,649 4,046 4,333 4,557 4,741 4,897 5,031 5,150
17 2,984 3,628 4,020 4,303 4,524 4,705 4,858 4,991 5,108
18 2,971 3,609 3,997 4,277 4,495 4,673 4,824 4,956 5,071
19 2,960 3,593 3,977 4,253 4,469 4,645 4,794 4,924 5,038
20 2,950 3,578 3,958 4,232 4,445 4,620 4,768 4,896 5,008
24 2,919 3,532 3,901 4,166 4,373 4,541 4,684 4,807 4,915
30 2,888 3,486 3,845 4,102 4,302 4,464 4,602 4,720 4,824
40 2,858 3,442 3,791 4,039 4,232 4,389 4,521 4,635 4,735
60 2,829 3,399 3,737 3,977 4,163 4,314 4,441 4,550 4,646
120 2,800 3,356 3,685 3,917 4,096 4,241 4,363 4,468 4,560
Infinito 2,772 3,314 3,633 3,858 4,030 4,170 4,286 4,387 4,474
Tabela 7 - Valores crticos da distribuio q para = 0,05
BIOESTATISTICA_VOL02.indb 363 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 364
Tabela 7 - Valores crticos da distribuio q para = 0,05
gl k: 11 12 13 14 15 16 17 18 19
1 50,59 51,96 53,20 54,33 55,36 56,32 57,22 58,04 58,83
2 14,39 14,75 15,08 15,38 15,65 15,91 16,14 16,37 16,57
3 9,717 9,946 10,15 10,35 10,53 10,69 10,84 10,98 11,11
4 8,027 8,208 8,373 8,525 8,664 8,794 8,914 9,028 9,134
5 7,168 7,324 7,466 7,596 7,717 7,828 7,932 8,030 8,122
6 6,649 6,789 6,917 7,034 7,143 7,244 7,338 7,426 7,508
7 6,302 6,431 6,550 6,658 6,759 6,852 6,939 7,020 7,097
8 6,054 6,175 6,287 6,389 6,483 6,571 6,653 6,729 6,802
9 5,867 5,983 6,089 6,186 6,276 6,359 6,437 6,510 6,579
10 5,722 5,833 5,935 6,028 6,114 6,194 6,269 6,339 6,405
11 5,605 5,713 5,811 5,901 5,984 6,062 6,134 6,202 6,265
12 5,511 5,615 5,710 5,798 5,878 5,953 6,023 6,089 6,151
13 5,431 5,533 5,625 5,711 5,789 5,862 5,931 5,995 6,055
14 5,364 5,463 5,554 5,637 5,714 5,786 5,852 5,915 5,974
15 5,306 5,404 5,493 5,574 5,649 5,720 5,785 5,846 5,904
16 5,256 5,352 5,439 5,520 5,593 5,662 5,727 5,786 5,843
17 5,212 5,307 5,392 5,471 5,544 5,612 5,675 5,734 5,790
18 5,174 5,267 5,352 5,429 5,501 5,568 5,630 5,688 5,743
19 5,140 5,231 5,315 5,391 5,462 5,528 5,589 5,647 5,701
20 5,108 5,199 5,282 5,357 5,427 5,493 5,553 5,610 5,663
24 5,012 5,099 5,179 5,251 5,319 5,381 5,439 5,494 5,545
30 4,917 5,001 5,077 5,147 5,211 5,271 5,327 5,379 5,429
40 4,824 4,904 4,977 5,044 5,106 5,163 5,216 5,266 5,313
60 4,732 4,808 4,878 4,942 5,001 5,056 5,107 5,154 5,199
120 4,641 4,714 4,781 4,842 4,898 4,950 4,998 5,044 5,086
Infinito 4,552 4,622 4,685 4,743 4,796 4,845 4,891 4,934 4,974
BIOESTATISTICA_VOL02.indb 364 25/06/12 17:24
TABELAS 365
gl k: 20 22 24 26 28 30 32 34 36
1 59,56 60,91 62,12 63,22 64,23 65,15 66,01 66,81 67,56
2 16,77 17,13 17,45 17,75 18,02 18,27 18,50 18,72 18,92
3 11,24 11,47 11,68 11,87 12,05 12,21 12,36 12,50 12,63
4 9,233 9,418 9,584 9,736 9,875 10,00 10,12 10,23 10,34
5 8,208 8,368 8,512 8,643 8,764 8,875 8,979 9,075 9,165
6 7,587 7,730 7,861 7,979 8,088 8,189 8,283 8,370 8,452
7 7,170 7,303 7,423 7,533 7,634 7,728 7,814 7,895 7,972
8 6,870 6,995 7,109 7,212 7,307 7,395 7,477 7,554 7,625
9 6,644 6,763 6,871 6,970 7,061 7,145 7,222 7,295 7,363
10 6,467 6,582 6,686 6,781 6,868 6,948 7,023 7,093 7,159
11 6,326 6,436 6,536 6,628 6,712 6,790 6,863 6,930 6,994
12 6,209 6,317 6,414 6,503 6,585 6,660 6,731 6,796 6,858
13 6,112 6,217 6,312 6,398 6,478 6,551 6,620 6,684 6,744
14 6,029 6,132 6,224 6,309 6,387 6,459 6,526 6,588 6,647
15 5,958 6,059 6,149 6,233 6,309 6,379 6,445 6,506 6,564
16 5,897 5,995 6,084 6,166 6,241 6,310 6,374 6,434 6,491
17 5,842 5,940 6,027 6,107 6,181 6,249 6,313 6,372 6,427
18 5,794 5,890 5,977 6,055 6,128 6,195 6,258 6,316 6,371
19 5,752 5,846 5,932 6,009 6,081 6,147 6,209 6,267 6,321
20 5,714 5,807 5,891 5,968 6,039 6,104 6,165 6,222 6,275
24 5,594 5,683 5,764 5,838 5,906 5,968 6,027 6,081 6,132
30 5,475 5,561 5,638 5,709 5,774 5,833 5,889 5,941 5,990
40 5,358 5,439 5,513 5,581 5,642 5,700 5,753 5,803 5,849
60 5,241 5,319 5,389 5,453 5,512 5,566 5,617 5,664 5,708
120 5,126 5,200 5,266 5,327 5,382 5,434 5,481 5,526 5,568
Infinito 5,012 5,081 5,144 5,201 5,253 5,301 5,346 5,388 5,427
Tabela 7 - Valores crticos da distribuio q para = 0,05 (continuao)
BIOESTATISTICA_VOL02.indb 365 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 366
Tabela 7 - Valores crticos da distribuio q para = 0,05 (continuao)
gl k: 38 40 50 60 70 80 90 100
1 68,26 68,92 71,73 73,97 75,82 77,40 78,77 79,98
2 19,11 19,28 20,05 20,66 21,16 21,59 21,96 22,29
3 12,75 12,87 13,36 13,76 14,08 14,36 14,61 14,82
4 10,44 10,53 10,93 11,24 11,51 11,73 11,92 12,09
5 9,250 9,330 9,674 9,949 10,18 10,38 10,54 10,69
6 8,529 8,601 8,913 9,163 9,370 9,548 9,702 9,839
7 8,043 8,110 8,400 8,632 8,824 8,989 9,133 9,261
8 7,693 7,756 8,029 8,248 8,430 8,586 8,722 8,843
9 7,428 7,488 7,749 7,958 8,132 8,281 8,410 8,526
10 7,220 7,279 7,529 7,730 7,897 8,041 8,166 8,276
11 7,053 7,110 7,352 7,546 7,708 7,847 7,968 8,075
12 6,916 6,970 7,205 7,394 7,552 7,687 7,804 7,909
13 6,800 6,854 7,083 7,267 7,421 7,552 7,667 7,769
14 6,702 6,754 6,979 7,159 7,309 7,438 7,550 7,650
15 6,618 6,669 6,888 7,065 7,212 7,339 7,449 7,546
16 6,544 6,594 6,810 6,984 7,128 7,252 7,360 7,457
17 6,479 6,529 6,741 6,912 7,054 7,176 7,283 7,377
18 6,422 6,471 6,680 6,848 6,989 7,109 7,213 7,307
19 6,371 6,419 6,626 6,792 6,930 7,048 7,152 7,244
20 6,325 6,373 6,576 6,740 6,877 6,994 7,097 7,187
24 6,181 6,226 6,421 6,579 6,710 6,822 6,920 7,008
30 6,037 6,080 6,267 6,417 6,543 6,650 6,744 6,827
40 5,893 5,934 6,112 6,255 6,375 6,477 6,566 6,645
60 5,750 5,789 5,958 6,093 6,206 6,303 6,387 6,462
120 5,607 5,644 5,802 5,929 6,035 6,126 6,205 6,275
Infinito 5,463 5,498 5,646 5,764 5,863 5,947 6,020 6,085
BIOESTATISTICA_VOL02.indb 366 25/06/12 17:24
TABELAS 367
n
2
n
1
9 10 11 12 13 14 15 16 17 18 19 20
1
2 0 0 0 1 1 1 1 1 2 2 2 2
3 2 3 3 4 4 5 5 6 6 7 7 8
4 4 5 6 7 8 9 10 11 11 12 13 13
5 7 8 9 11 12 13 14 15 17 18 19 20
6 10 11 13 14 16 17 19 21 22 24 25 27
7 12 14 16 18 20 22 24 26 28 30 32 34
8 15 17 19 22 24 26 29 31 34 36 38 41
9 17 20 23 26 28 31 34 37 39 42 45 48
10 20 23 26 29 33 36 39 42 45 48 52 55
11 23 26 30 33 37 40 44 47 51 55 58 62
12 26 29 33 37 41 45 49 53 57 61 65 69
13 28 33 37 41 45 50 54 59 63 67 72 76
14 31 36 40 45 50 55 59 64 67 74 78 83
15 34 39 44 49 54 59 64 70 75 80 85 90
16 37 42 47 53 59 64 70 75 81 86 92 98
17 39 45 51 57 63 67 75 81 87 93 99 105
18 42 48 55 61 67 74 80 86 93 99 106 112
19 45 52 58 65 72 78 85 92 99 106 113 119
20 48 55 62 69 76 83 90 98 105 112 119 127
Tabela 8 - Valores crticos da distribuio U de Mann-Whitney, para testes unilaterais com =
0,025 e bilaterais com = 0,05
BIOESTATISTICA_VOL02.indb 367 25/06/12 17:24
BIOESTATISTICA_VOL02.indb 368 25/06/12 17:24
TABELAS 369
n
Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,001
Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,0005
4 2 0
5 4 2 0
6 6 3 2 0
7 9 5 3 2 0
8 12 8 5 3 1 0
9 16 10 8 5 3 1 0
10 20 14 10 8 5 3 1
11 24 17 13 10 7 5 3 0
12 29 21 17 13 9 7 5 1
13 35 26 21 17 12 9 7 2
14 40 31 25 21 15 12 9 4
15 47 36 30 25 19 15 12 6
16 54 42 35 29 23 19 15 8
17 61 48 41 34 27 23 19 11
18 69 55 47 40 32 27 23 14
19 77 62 53 46 37 32 27 18
20 86 69 60 52 43 37 32 21
21 95 77 67 58 49 42 37 25
22 104 86 75 65 55 48 42 30
23 114 94 83 73 62 54 48 35
24 125 104 91 81 69 61 54 40
25 136 113 100 89 76 68 60 45
26 148 124 110 98 84 75 67 51
27 160 134 119 107 92 83 74 57
28 172 145 130 116 101 91 82 64
29 185 157 140 126 110 100 90 71
30 198 169 151 137 120 109 98 78
31 212 181 163 147 130 118 107 86
32 226 194 175 159 140 128 116 94
33 241 207 187 170 151 138 126 102
34 257 221 200 182 162 148 136 111
35 272 235 213 195 173 159 146 120
Tabela 9 - Valores crticos da distribuio T de Wilcoxon
BIOESTATISTICA_VOL02.indb 369 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 370
Tabela 9 - Valores crticos da distribuio T de Wilcoxon
(continuao)
n
Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,001
Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,0005
36 289 250 227 208 185 171 157 130
37 305 265 241 221 198 182 168 140
38 323 281 256 235 211 194 180 150
39 340 297 271 249 224 207 192 161
40 358 313 286 264 238 220 204 172
41 377 330 302 279 252 233 217 183
42 396 348 319 294 266 247 230 195
43 416 365 336 310 281 261 244 207
44 436 384 353 327 296 276 258 220
45 456 402 371 343 312 291 272 233
46 477 422 389 361 328 307 287 246
47 499 441 407 378 345 322 302 260
48 521 462 426 396 362 339 318 274
49 543 482 446 415 379 355 334 289
50 566 503 466 434 397 373 350 304
51 590 525 486 453 416 390 367 319
52 613 547 507 473 434 408 384 335
53 638 569 529 494 454 427 402 351
54 668 592 550 514 473 445 420 368
55 688 615 573 536 493 465 438 385
56 714 639 595 557 514 484 457 402
57 740 664 618 579 535 504 477 420
58 767 688 642 602 556 525 497 438
59 794 714 666 625 578 546 517 457
60 822 739 690 648 600 567 537 476
61 850 765 715 672 623 598 558 495
62 879 792 741 697 646 611 580 515
63 908 819 767 721 669 634 602 535
64 938 847 793 747 693 657 624 556
65 968 875 820 772 718 681 647 577
66 998 903 847 798 742 705 670 599
67 1029 932 875 825 768 729 694 621
68 1061 962 903 852 793 754 718 643
BIOESTATISTICA_VOL02.indb 370 25/06/12 17:24
TABELAS 371
n
Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,001
Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,0005
69 1093 992 931 879 819 779 742 666
70 1126 1022 960 907 846 805 767 689
71 1159 1053 990 936 873 831 792 712
72 1192 1084 1020 964 901 858 818 736
73 1226 1116 1050 994 928 884 844 761
74 1261 1148 1081 1023 957 912 871 786
75 1296 1181 1112 1053 986 940 898 811
76 1331 1214 1144 1084 1015 968 925 836
77 1367 1247 1176 1115 1044 997 953 862
78 1403 1282 1209 1147 1075 1026 981 889
79 1440 1316 1242 1179 1105 1056 1010 916
80 1478 1351 1276 1211 1136 1086 1039 943
81 1516 1387 1310 1244 1168 1116 1069 971
82 1554 1423 1345 1277 1200 1147 1099 999
83 1593 1459 1380 1311 1232 1178 1129 1028
84 1632 1496 1415 1345 1265 1210 1160 1057
85 1672 1533 1451 1380 1298 1242 1191 1086
86 1712 1571 1487 1415 1332 1275 1223 1116
87 1753 1609 1524 1451 1366 1308 1255 1146
88 1794 1648 1561 1487 1400 1342 1288 1177
89 1836 1688 1599 1523 1435 1376 1321 1208
90 1878 1727 1638 1560 1471 1410 1355 1240
91 1921 1767 1676 1597 1507 1445 1389 1271
92 1964 1808 1715 1635 1543 1480 1423 1304
93 2008 1849 1755 1674 1580 1516 1458 1337
94 2052 1891 1795 1712 1617 1552 1493 1370
95 2097 1933 1836 1752 1655 1589 1529 1404
96 2142 1976 1877 1791 1693 1626 1565 1438
97 2187 2019 1918 1832 1731 1664 1601 1472
98 2233 2062 1960 1872 1770 1702 1638 1507
99 2280 2106 2003 1913 1810 1740 1676 1543
100 2327 2151 2045 1955 1850 1779 1714 1578
Tabela 9 - Valores crticos da distribuio T de Wilcoxon
(continuao)
BIOESTATISTICA_VOL02.indb 371 25/06/12 17:24
BIOESTATISTICA_VOL02.indb 372 25/06/12 17:24
TABELAS 373
n
1
n
2
n
3
a: 0,10 0,05 0,02 0,01 0,005 0,002 0,001
2 2 2 4,571
3 2 1 4,286
3 2 2 4,500 4,714
3 3 1 4,571 5,143
3 3 2 4,556 5,361 6,250
3 3 3 4,622 5,600 6,489 (7,200) 7,200
4 2 1 4,500
4 2 2 4,458 5,333 6,000
4 3 1 4,056 5,208
4 3 2 4,511 5,444 6,144 6,444 7,000
4 3 3 4,709 5,791 6,564 6,745 7,318 8,018
4 4 1 4,167 4,967 (6,667) 6,667
4 4 2 4,555 5,455 6,600 7,036 7,282 7,855
4 4 3 4,545 5,598 6,712 7,144 7,598 8,227 8,909
4 4 4 4,654 5,692 6,962 7,654 8,000 8,654 9,269
5 2 1 4,200 5,000
5 2 2 4,373 5,160 6,000 6,533
5 3 1 4,018 4,960 6,044
5 3 2 4,651 5,251 6,124 6,909 7,182
5 3 3 4,533 5,648 6,533 7,079 7,636 8,048 8,727
5 4 1 3,987 4,985 6,431 6,955 7,364
5 4 2 4,541 5,273 6,505 7,205 7,573 8,114 8,591
5 4 3 4,549 5,656 6,676 7,445 7,927 8,481 8,795
5 4 4 4,619 5,657 6,953 7,760 8,189 8,868 9,168
5 5 1 4,109 5,127 6,145 7,309 8,182
5 5 2 4,623 5,338 6,446 7,338 8,131 6,446 7,338
5 5 3 4,545 5,705 6,866 7,578 8,316 8,809 9,521
5 5 4 4,523 5,666 7,000 7,823 8,523 9,163 9,606
5 5 5 4,940 5,780 7,220 8,000 8,780 9,620 9,920
Tabela 10 - Valores crticos da distribuio H de Kruskal-Wallis
BIOESTATISTICA_VOL02.indb 373 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 374
Tabela 10 - Valores crticos da distribuio H de Kruskal-Wallis
n
1
n
2
n
3
a: 0,10 0,05 0,02 0,01 0,005 0,002 0,001
6 1 1 ---
6 2 1 4,200 4,822
6 2 2 4,545 5,345 6,182 6,982
6 3 1 3,909 4,855 6,236
6 3 2 4,682 5,348 6,227 6,970 7,515 8,182
6 3 3 4,538 5,615 6,590 7,410 7,872 8,628 9,346
6 4 1 4,038 4,947 6,174 7,106 7,614
6 4 2 4,494 5,340 6,571 7,340 7,846 8,494 8,827
6 4 3 4,604 5,610 6,725 7,500 8,033 8,918 9,170
6 4 4 4,595 5,681 6,900 7,795 8,381 9,167 9,861
6 5 1 4,128 4,990 6,138 7,182 8,077 8,515
6 5 2 4,596 5,338 6,585 7,376 8,196 8,967 9,189
6 5 3 4,535 5,602 6,829 7,590 8,314 9,150 9,669
6 5 4 4,522 5,661 7,018 7,936 8,643 9,458 9,960
6 5 5 4,547 5,729 7,110 8,028 8,859 9,771 10,271
6 6 1 4,000 4,945 6,286 7,121 8,165 9,077 9,692
6 6 2 4,438 5,410 6,667 7,467 8,210 9,219 9,752
6 6 3 4,558 5,625 6,900 7,725 8,458 9,458 10,150
6 6 4 4,548 5,724 7,107 8,000 8,754 9,662 10,342
6 6 5 4,542 5,765 7,152 8,124 8,987 9,948 10,524
6 6 6 4,643 5,801 7,240 8,222 9,170 10,187 10,889
7 7 7 4,594 5,819 7,332 8,378 9,373 10,516 11,310
8 8 8 4,595 5,805 7,355 8,465 9,495 10,805 11,705
2 2 1 1 ---
2 2 2 1 5,357 5,679
2 2 2 2 5,667 6,167 (6,667) 6,667
3 1 1 1 ---
3 2 1 1 5,143
3 2 2 1 5,556 5,833 6,500
BIOESTATISTICA_VOL02.indb 374 25/06/12 17:24
TABELAS 375
n
1
n
2
n
3
a: 0,10 0,05 0,02 0,01 0,005 0,002 0,001
3 2 2 2 5,544 6,333 6,978 7,133 7,533
3 3 1 1 5,333 6,333
3 3 2 1 5,689 6,244 6,689 7,200 7,400
3 3 2 2 5,745 6,527 7,182 7,636 7,873 8,018 8,455
3 3 3 1 5,655 6,600 7,109 7,400 8,055 8,345
3 3 3 2 5,879 6,727 7,636 8,105 8,379 8,803 9,030
3 3 3 3 6,026 7,000 7,872 8,538 8,897 9,462 9,513
4 1 1 1
4 2 1 1 5,250 5,833
4 2 2 1 5,533 6,133 6,667 7,000
4 2 2 2 5,755 6,545 7,091 7,391 7,964 8,291
4 3 1 1 5,067 6,178 6,711 7,067
4 3 2 1 5,591 6,309 7,018 7,455 7,773 8,182
4 3 2 2 5,750 6,621 7,530 7,871 8,273 8,689 8,909
4 3 3 1 5,589 6,545 7,485 7,758 8,212 8,697 9,182
4 3 3 2 5,872 6,795 7,763 8,333 8,718 9,167 9,455
4 3 3 3 6,016 6,984 7,995 8,659 9,253 9,709 10,016
4 4 1 1 5,182 5,945 7,091 7,909 7,909
4 4 2 1 5,568 6,386 7,364 7,886 8,341 8,591 8,909
4 4 2 2 5,808 6,731 7,750 8,346 8,692 9,269 9,462
4 4 3 1 5,692 6,635 7,660 8,231 8,583 9,038 9,327
4 4 3 2 5,901 6,874 7,951 8,621 9,165 9,615 9,945
4 4 3 3 6,019 7,038 8,181 8,876 9,495 10,105 10,467
4 4 4 1 5,564 6,725 7,879 8,588 9,000 9,478 9,758
Tabela 10 - Valores crticos da distribuio H de Kruskal-Wallis
(continuao)
BIOESTATISTICA_VOL02.indb 375 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 376
Tabela 10 - Valores crticos da distribuio H de Kruskal-Wallis
(continuao)
n
1
n
2
n
3
a: 0,10 0,05 0,02 0,01 0,005 0,002 0,001
4 4 4 2 5,914 6,957 8,157 8,871 9,486 10,043 10,429
4 4 4 3 6,042 7,142 8,350 9,075 9,742 10,542 10,929
4 4 4 4 6,088 7,235 8,515 9,287 9,971 10,809 11,338
2 1 1 1 1 ---
2 2 1 1 1 5,786
2 2 2 1 1 6,250 6,750
2 2 2 2 1 6,600 7,133 (7,533) 7,533
2 2 2 2 2 6,982 7,418 8,073 8,291 (8,727) 8,727
3 1 1 1 1 ---
3 2 1 1 1 6,139 6,583
3 2 2 1 1 6,511 6,800 7,400 7,600
3 2 2 2 1 6,709 7,309 7,836 8,127 8,327 8,618
3 2 2 2 2 6,955 7,682 8,303 8,682 8,985 9,273 9,364
3 3 1 1 1 6,311 7,111 7,467
3 3 2 1 1 6,600 7,200 7,892 8,073 8,345
3 3 2 2 1 6,788 7,591 8,258 8,576 8,924 9,167 9,303
3 3 2 2 2 7,026 7,910 8,667 9,115 9,474 9,769 10,026
3 3 3 1 1 6,788 6,576 8,242 8,424 8,848 (9,455) 9,455
3 3 3 2 1 6,910 7,769 8,590 9,051 9,410 9,769 9,974
3 3 3 2 2 7,121 8,044 9,011 9,505 9,890 10,330 10,637
3 3 3 3 1 7,077 8,000 8,879 9,451 9,846 10,286 10,549
3 3 3 3 2 7,210 8,200 9,267 9,876 10,333 10,838 11,171
3 3 3 3 3 7,333 8,333 9,467 10,200 10,733 10,267 11,667
BIOESTATISTICA_VOL02.indb 376 25/06/12 17:24
TABELAS 377
k : 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001
2 0,674 1,282 1,645 1,960 2,327 2,576 2,807 3,091 3,291
3 1,383 1,834 2,128 2,394 2,713 2,936 3,144 3,403 3,588
4 1,732 2,128 2,394 2,639 2,936 3,144 3,342 3,588 3,765
5 1,960 2,327 2,576 2,807 3,091 3,291 3,481 3,719 3,891
6 2,128 2,475 2,713 2,936 3,209 3,403 3,588 3,820 3,988
7 2,261 2,593 2,823 3,038 3,304 3,494 3,675 3,902 4,067
8 2,369 2,690 2,914 3,124 3,384 3,570 3,748 3,972 4,134
9 2,461 2,773 2,992 3,197 3,453 3,635 3,810 4,031 4,191
10 2,540 2,845 3,059 3,261 3,512 3,692 3,865 4,083 4,241
11 2,609 2,908 3,119 3,317 3,565 3,743 3,914 4,129 4,286
12 2,671 2,965 3,172 3,368 3,613 3,789 3,957 4,171 4,326
13 2,726 3,016 3,220 3,414 3,656 3,830 3,997 4,209 4,363
14 2,777 3,062 3,264 3,456 3,695 3,868 4,034 4,244 4,397
15 2,823 3,105 3,304 3,494 3,731 3,902 4,067 4,276 4,428
16 2,866 3,144 3,342 3,529 3,765 3,935 4,098 4,305 4,456
17 2,905 3,181 3,376 3,562 3,796 3,965 4,127 4,333 4,483
18 2,942 3,215 3,409 3,593 3,825 3,993 4,154 4,359 4,508
19 2,976, 3,246 3,439 3,622 3,852 4,019 4,179 4,383 4,532
20 3,008 3,276 3,467 3,649 3,878 4,044 4,203 4,406 4,554
21 3,038 3,304 3,494 3,675 3,902 4,067 4,226 4,428 4,575
22 3,067 3,331 3,519 3,699 3,925 4,089 4,247 4,448 4,595
23 3,094 3,356 3,543 3,722 3,947 4,110 4,268 4,468 4,614
24 3,120 3,380 3,566 3,744 3,968 4,130 4,287 4,486 4,632
25 3,144 3,403 3,588 3,765 3,988 4,149 4,305 4,504 4,649
Tabela 11 - Valores crticos da distribuio Q para testes de comparaes mltiplas no-
paramtricas
BIOESTATISTICA_VOL02.indb 377 25/06/12 17:24
BIOESTATISTICA_VOL02.indb 378 25/06/12 17:24
TABELAS 379
Tabela 12 - Valores crticos para o coefciente de correlao de Spearman (rS) para postos
n
Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001
a Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
4 0,600 1,000 1,000
5 0,500 0,800 0,900 1,000 1,000
6 0,371 0,657 0,829 0,886 0,943 1,000 1,000
7 0,321 0,571 0,714 0,786 0,893 0,929 0,964 1,000 1,000
8 0,310 0,524 0,643 0,738 0,833 0,881 0,905 0,952 0,976
9 0,267 0,483 0,600 0,700 0,783 0,833 0,867 0,917 0,933
10 0,248 0,455 0,564 0,648 0,745 0,794 0,830 0,879 0,903
11 0,236 0,427 0,536 0,618 0,709 0,755 0,800 0,845 0,873
12 0,217 0,406 0,503 0,587 0,678 0,727 0,769 0,818 0,846
13 0,209 0,385 0,484 0,560 0,648 0,703 0,747 0,791 0,824
14 0,200 0,367 0,464 0,538 0,626 0,679 0,723 0,771 0,802
15 0,189 0,354 0,446 0,521 0,604 0,654 0,700 0,750 0,779
16 0,182 0,341 0,429 0,503 0,582 0,635 0,679 0,729 0,762
17 0,176 0,328 0,414 0,485 0,566 0,615 0,662 0,713 0,748
18 0,170 0,317 0,401 0,472 0,550 0,600 0,643 0,695 0,728
19 0,165 0,309 0,391 0,460 0,535 0,584 0,628 0,677 0,712
20 0,161 0,299 0,380 0,447 0,520 0,570 0,612 0,662 0,696
21 0,J56 0,292 0,370 0,435 0,508 0,556 0,599 0,648 0,681
22 0,152 0,284 0,361 0,425 0,496 0,544 0,586 0,634 0,667
23 0,148 0,278 0,353 0,415 0,486 0,532 0,573 0,622 0,654
24 0,144 0,271 0,344 0,406 0,476 0,521 0,562 0,610 0,642
25 0,142 0,265 0,337 0,398 0,466 0,511 0,551 0,598 0,630
26 0,138 0,259 0,331 0,390 0,457 0,501 0,541 0,587 0,619
27 0,136 0,255 0,324 0,382 0,448 0,491 0,531 0,577 0,608
28 0,133 0,250 0,317 0,375 0,440 0,483 0,522 0,567 0,598
29 0,130 0,245 0,312 0,368 0,433 0,4 75 0,513 0,558 0,589
30 0,128 0,240 0,306 0,362 0,425 0,467 0,504 0,549 0,580
BIOESTATISTICA_VOL02.indb 379 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 380
n
Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001
a Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
31 0,126 0,236 0,301 0,356 0,418 0,459 0,496 0,541 0,571
32 0,124 0,232 0,296 0,350 0,412 0,452 0,489 0,533 0,563
33 0,121 0,229 0,291 0,345 0,405 0,446 0,482 0,525 0,554
34 0,120 0,225 0,287 0,340 0,399 0,439 0,475 0,517 0,547
35 0,118 0,222 0,283 0,335 0,394 0,433 0,468 0,510 0,539
36 0,116 0,219 0,279 0,330 0,388 0,427 0,462 0,504 0,533
37 0,114 0,216 0,275 0,325 0,383 0,421 0,456 0,497 0,526
38 0,113 0,212 0,271 0,321 0,378 0,415 0,450 0,491 0,519
39 0,111 0,210 0,267 0,317 0,373 0,410 0,444 0,485 0,513
40 0,110 0,207 0,264 0,313 0,368 0,405 0,439 0,479 0,507
41 0,108 0,204 0,261 0,309 0,364 0,400 0,433 0,473 0,501
42 0,1 07 0,202 0,257 0,305 0,359 0,395 0,428 0,468 0,495
43 0,105 0,199 0,254 0,301 0,355 0,391 0,423 0,463 0,490
44 0,104 0,197 0,251 0,298 0,351 0,386 0,419 0,458 0,484
45 0,103 0,194 0,248 0,294 0,347 0,382 0,414 0,453 0,479
46 0,102 0,192 0,246 0,291 0,343 0,378 0,410 0,448 0,474
47 0,101 0,190 0,243 0,288 0,340 0,374 0,405 0,443 0,469
48 0,100 0,188 0,240 0,285 0,336 0,370 0,401 0,439 0,465
49 0,098 0,186 0,238 0,282 0,333 0,366 0,397 0,434 0,460
50 0,097 0,184 0,235 0,279 0,329 0,363 0,393 0,430 0,456
51 0,096 0,182 0,233 0,276 0,326 0,359 0,390 0,426 0,451
52 0,095 0,180 0,231 0,274 0,323 0,356 0,386 0,422 0,447
53 0,095 0,179 0,228 0,271 0,320 0,352 0,382 0,418 0,443
54 0,094 0,177 0,226 0,268 0,317 0,349 0,379 0,414 0,439
55 0,093 0,175 0,224 0,266 0,314 0,346 0,375 0,411 0,435
56 0,092 0,174 0,222 0,264 0,311 0,343 0,372 0,407 0,432
57 0,091 0,172 0,220 0,261 0,308 0,340 0,369 0,404 0,428
Tabela 12 - Valores crticos para o coefciente de correlao de Spearman (rS) para postos
(continuao)
BIOESTATISTICA_VOL02.indb 380 25/06/12 17:24
TABELAS 381
Tabela 12 - Valores crticos para o coefciente de correlao de Spearman (rS) para postos
(continuao)
n
Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001
a Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
58 0,090 0,171 0,218 0,259 0,306, 0,337 0,366 0,400 0,424
59 0,089 0,169 0,216 0,257 0,303 0,334 0,363 0,397 0,421
60 0,089 0,168 0,214 0,255 0,300 0,331 0,360 0,394 0,418
61 0,088 0,166 0,213 0,252 0,298 0,329 0,357 0,391 0,414
62 0,087 0,165 0,211 0,250 0,296 0,326 0,354 0,388 0,411
63 0,086 0,163 0,209 0,248 0,293 0,323 0,351 0,385 0,408
64 0,086 0,162 0,207 0,246 0,291 0,321 0,348 0,382 0,405
65 0,085 0,161 0,206 0,244 0,289 0,318 0,346 0,379 0,402
66 0,084 0,160 0,204 0,243 0,287 0,316 0,343 0,376 0,399
67 0,084 0,158 0,203 0,241 0,284 0,314 0,341 0,373 0,396
68 0,083 0,157 0,201 0,239 0,282 0,311 0,338 0,370 0,393
69 0,082 0,156 0,200 0,237 0,280 0,309 0,336 0,368 0,390
70 0,082 0,155 0,198 0,235 0,278 0,307 0,333 0,365 0,388
71 0,081 0,154 0,197 0,234 0,276 0,305 0,331 0,363 0,385
72 0,081 0,153 0,195 0,232 0,274 0,303 0,329 0,360 0,382
73 0,080 0,152 0,194 0,230 0,272 0,301 0,327 0,358 0,380
74 0,080 0,151 0,193 0,229 0,271 0,299 0,324 0,355 0,377
75 0,079 0,150 0,191 0,227 0,269 0,297 0,322 0,353 0,375
76 0,078 0,149 0,190 0,226 0,267 0,295 0,320 0,351 0,372
77 0,078 0,148 0,189 0,224 0,265 0,293 0,318 0,349 0,370
78 0,077 0,147 0,188 0,223 0,264 0,291 0,316 0,346 0,368
79 0,077 0,146 0,186 0,221 0,262 0,289 0,314 0,344 0,365
80 0,076 0,145 0,185 0,220 0,260 0,287 0,312 0,342 0,363
81 0,076 0,144 0,184 0,219 0,259 0,285 0,310 0,340 0,361
82 0,075 0,143 0,183 0,217 0,257 0,284 0,308 0,338 0,359
83 0,075 0,142 0,182 0,216 0,255 0,282 0,306 0,336 0,357
BIOESTATISTICA_VOL02.indb 381 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 382
n
Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001
a Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
84 0,074 0,141 0,181 0,215 0,254 0,280 0,305 0,334 0,355
85 0,074 0,140 0,180 0,213 0,252 0,279 0,303 0,332 0,353
86 0,074 0,139 0,179 0,212 0,251 0,277 0,301 0,330 0,351
87 0,073 0,139 0,177 0,211 0,250 0,276 0,299 0,328 0,349
88 0,073 0,138 0,176 0,210 0,248 0,274 0,298 0,327 0,347
89 0,072 0,137 0,175 0,209 0,247 0,272 0,296 0,325 0,345
90 0,072 0,136 0,174 0,207 0,245 0,271 0,294 0,323 0,343
91 0,072 0,135 0,173 0,206 0,244 0,269 0,293 0,321 0,341
92 0,071 0,135 0,173 0,205 0,243 0,268 0,291 0,319 0,339
93 0,071 0,134 0,172 0,204 0,241 0,267 0,290 0,318 0,338
94 0,070 0,133 0,171 0,203 0,240 0,265 0,288 0,316 0,336
95 0,070 0,133 0,170 0,202 0,239 0,264 0,287 0,314 0,334
96 0,070 0,132 0,169 0,201 0,238 0,262 0,285 0,313 0,332
97 0,069 0,131 0,168 0,200 0,236 0,261 0,284 0,311 0,331
98 0,069 0,130 0,167 0,199 0,235 0,260 0,282 0,310 0,329
99 0,068 0,130 0,166 0,198 0,234 0,258 0,281 0,308 0,327
100 0,068 0,129 0,165 0,197 0,233 0,257 0,279 0,307 0,326
Tabela 12 - Valores crticos para o coefciente de correlao de Spearman (rS) para postos
(continuao)
BIOESTATISTICA_VOL02.indb 382 25/06/12 17:24
TABELAS 383
a b
(n) (M)* : 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001
3 2 3,000 4,000
3 3 2,667 4,667 (6,000) 6,000
3 4 2,000 4,500 6,000 6,500 (8,000) (8,000) 8,000
3 5 2,800 3,600 5,200 6,400 (8,400) 8,400 (10,000) (10,000) 10,000
3 6 2,330 4,000 5,330 7,000 8,330 9,000 (10,330) 10,330 12,000
3 7 2,000 3,714 5,429 7,143 8,000 8,857 10,286 11,143 12,286
3 8 2,250 4,000 5,2S0 6,250 7,750 9,000 9,750 12,000 12,250
3 9 2,000 3,556 5,556 6,222 8,000 9,556 10,667 11,556 12,667
3 10 1,800 3,800 5,000 6,200 7,800 9,600 10,400 12,200 12,600
3 11 4,636 3,818 4,909 6,545 7,818 9,455 10,364 11,636 13,273
3 12 1,500 3,500 5,167 6,167 8,000 9,500 10,167 12,167 12,500
3 13 1,846 3,846 4,769 6,000 8,000 9,385 10,308 11,538 12,923
3 14 1,714 3,571 5,143 6,143 8,143 9,000 10,429 12,000 13,286
3 15 1,733 3,600 4,933 6,400 8,133 8,933 10,000 12,133 12,933
4 2 3,600 5,400 (6,000) 6,000
4 3 3,400 5,400 6,600 7,400 8,200 (9,000) (9,000) 9,000
4 4 3,000 4,800 6,300 7,800 8,400 9,600 (10,200) 10,200 11,1 00
4 5 3,000 5,160 6,360 7,800 9,240 9,960 10,920 11,640 12,600
4 6 3,000 4,800 6,400 7,600 9,400 10,200 11,400 12,200 12,800
4 7 2,829 4,886 6,429 7,800 9,343 10371 11,400 12,771 13,800
4 8 2,550 4,800 6,300 7,650 9,450 10,350 11,850 12,900 13,800
4 9 6,467 7,800 9,133 10,867 12,067 14,467
4 10 6,360 7,800 9,120 10,800 12,000 14,640
Tabela 13 - Valores crticos para a distribuio de Friedman (

r
2
)
BIOESTATISTICA_VOL02.indb 383 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 384
a b
(n) (M)* : 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001
4 11 6,382 7,909 9,327 11,073 12,273 14,891
4 12 6,400 7,900 9,200 11,100 12,300 15,000
4 13 6,415 7,985 7,369 11,123 12,323 15,277
4 14 6,343 7,886 9,343 11,143 12,514 15,257
4 15 6,440 8,040 9,400 11,240 12,520 15,400
5 2 7,200 7,600 8,000 8,000
5 3 7,467 8,533 9,600 10,133 10,667 11,467
5 4 7,600 8,800 9,800 11,200 12,000 13,200
5 5 7,680 8,960 10,240 11,680 12,480 14,400
5 6 7,733 9,067 10,400 11,867 13,067 15,200
5 7 7,771 9,143 10,514 12,114 13,257 15,657
5 8 7,800 9,300 10,600 12,300 13,500 16,000
5 9 7,733 9,244 10,667 12,444 13,689 16,356
5 10 7,76 9,280 10,720 12,480 13,840 16,480
6 2 8,286 9,143 9,429 9,714 10,000
6 3 8,714 9,857 10,810 11,762 12,524 13,286
6 4 9,000 10,286 11,429 12,714 13,511 15,286
6 5 9,000 10,486 11,743 13,229 14,2S7 16,429
6 6 9,048 10,571 12,000 13,619 14,762 17,048
6 7 9,122 10,674 12,061 13,857 15,000 17,612
6 8 9,143 10,714 12,214 14,000 15,286 18,000
6 9 9,127 10,778 12,302 14,143 15,476 18,270
6 10 9,143 10,800 12,343 14,299 15,600 18,514
Para o coeficiente de concordncia de Kendall (W), grafadas entre parnteses
Tabela 13 - Valores crticos para a distribuio de Friedman (

r
2
)
(continuao)
BIOESTATISTICA_VOL02.indb 384 25/06/12 17:24
TABELAS 385
Tabela 14 - Valores crticos para a distribuio de Kolmogorov-Smirnov (D)

n 0,20 0,10 0,05 0,02 0,01 n 0,20 0,10 0,05 0,02 0,01
1 0,900 0,95 0,975 0,990 0,995 21 0,226 0,259 0,287 0,321 0,344
2 0,684 0,776 0,842 0,900 0,929 22 0,221 0,253 0,281 0,314 0,337
3 0,565 0,636 0,708 0,785 0,829 23 0,216 0,247 0,275 0,307 0,330
4 0,493 0,565 0,624 0,689 0,734 24 0,212 0,242 0,269 0,301 0,323
5 0,447 0,509 0,563 0,627 0,669 25 0,208 0,238 0,264 0,295 0,317
6 0,410 0,468 0,519 0,577 0,617 26 0,204 0,233 0,259 0,290 0,311
7 0,381 0,436 0,483 0,538 0,576 27 0,200 0,229 0,254 0,284 0,305
8 0,358 0,410 0,454 0,407 0,542 28 0,197 0,225 0,250 0,279 0,300
9 0,339 0,387 0,430 0,480 0,513 29 0,193 0,221 0,246 0,275 0,295
10 0,323 0,369 0,409 0,457 0,489 30 0,190 0,218 0,242 0,270 0,290
11 0,308 0,352 0,391 0,437 0,468 31 0,187 0,214 0,238 0,266 0,285
12 0,296 0,338 0,375 0,419 0,449 32 0,184 0,211 0,234 0,262 0,181
13 0,285 0,325 0,361 0,404 0,432 33 0,182 0,208 0,231 0,258 0,277
14 0,275 0,314 0,349 0,390 0,418 34 0,179 0,205 0,227 0,254 0,273
15 0,266 0,304 0,338 0,377 0,404 35 0,177 0,202 0,224 0,251 0,269
16 0,258 0,295 0,327 0,366 0,392 36 0,174 0,199 0,221 0,247 0,265
17 0,250 0,286 0,318 0,355 0,381 37 0,172 0,196 0,218 0,244 0,262
18 0,244 0,279 0,309 0,346 0,371 38 0,170 0,194 0,215 0,241 0,258
19 0,237 0,271 0,301 0,337 0,361 39 0,168 0,191 0,213 0,238 0,255
20 0,232 0,265 0,294 0,329 0,352 40 0,165 0,189 0,210 0,235 0,252
- Os valores tabelados correspondem aos pontos Dn;, tais que: P(Dn Dn; ) = .
- Para n > 40, os valores crticos de Dn podem ser aproximados pelas seguintes expresses:

0,20 0,10 0,05 0,02 0,01


1 07 ,
n
1 22 ,
n
1 36 ,
n
1 52 ,
n
1 63 ,
n
BIOESTATISTICA_VOL02.indb 385 25/06/12 17:24
BIOESTATISTICA_VOL02.indb 386 25/06/12 17:24
TABELAS 387
n
k = 1 k = 2 k = 3 k = 4 k = 5
dL du dL du dL du dL du dL du
15 1,08 1,36 0,95 1,54 0,82 1,75 0,69 1,97 0,56 2,21
16 1,10 1,37 0,98 1,54 0,86 1,73 0,74 1,93 0,62 2,15
17 1,13 1,38 1,02 1,54 0,90 1,71 0,78 1,90 0,67 2,10
18 1,16 1,39 1,05 1,53 0,93 1,69 0,92 I,R7 0,71 2,06
19 1,18 1,40 1,08 1,53 0,97 1,68 0,86 1,85 0,75 2,02
20 1,20 1,41 1,10 1,54 1,00 1,68 0,90 1,83 0,79 1,99
21 1,22 1,42 1,13 1,54 1,03 1,67 0,93 1,81 0,83 1,96
22 1,24 1,43 l,l5 1,54 1,05 1,66 0,96 1,80 0,96 1,94
23 1,26 1,44 1,17 1,54 1,08 1,66 0,99 1,79 0,90 1,92
24 1,27 1,45 1,19 1,55 1,10 1,66 1,01 1,18 0,93 1,90
25 1,29 1,45 1,21 1,55 1,12 1,66 1,04 1,77 0,95 1,89
26 1,30 1,46 1,22 1,55 1,]4 1,65 1,06 1,76 0,98 1,88
27 1,32 1,47 1,24 1,56 1,16 1,65 1,08 1,16 1,01 t86
28 1,33 1,48 1,26 1,56 1,18 1,65 1,10 1,75 1,03 1,85
29 1,34 1,48 1,27 1,56 1,20 1,65 1,12 1,74 1,05 1,84
30 1,35 1,49 1,28 1,57 1,21 1,65 1,14 1,74 1,07 1,83
31 1,16 1,50 1,30 1,51 1,23 1,65 1,16 1,74 1,09 1,83
32 1,37 1,50 1,31 1,57 1,24 1,65 1,18 1,73 1,11 1,82
33 1,38 1,51 1,32 1,58 1,26 1,65 1,19 1,73 1,13 1,81
34 1,39 1,51 1,33 1,58 1,27 1,65 1,21 1,73 l,t5 1,81
35 1,40 1,52 1,34 1,58 1,28 1,65 1,22 1,73 1,16 1,80
36 1,41 1,52 1,35 1,59 1,29 1,65 1,24 1,73 1,18 1,80
37 1,42 1,53 1,36 1,59 1,31 1,66 1,25 1,72 1,19 1,80
38 1,43 1,54 1,37 1,59 1,32 1,66 1,26 1,72 1,21 1,79
39 1,43 1,54 1,38 1,60 1,33 1,66 1,27 1,72 1,22 1,79
40 1,44 1,54 1,39 1,60 1,34 1,66 1,29 1,72 1,23 1,79
Tabela 15.1 - Valores crticos para o teste de Durbin-Watson, com = 0,05
BIOESTATISTICA_VOL02.indb 387 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 388
n
k = 1 k = 2 k = 3 k = 4 k = 5
dL du dL du dL du dL du dL du
45 1,48 1,51 1,43 1,62 1,38 1,67 1,34 1,72 1,29 1,78
50 1,50 1,59 1,46 1,63 1,42 1,67 1,38 1,72 1,34 1,77
55 1,53 1,60 1,49 1,64 1,45 1,68 1,41 1,72 1,38 1,77
60 1,55 1,62 1,51 1,65 1,48 1,69 1,44 1,73 1,41 1,77
65 1,57 1,63 1,54 1,66 1,50 1,70 1,47 1,73 1,44 1,77
70 1,58 1,64 1,55 1,67 1,52 1,10 1,49 1,74 1,46 1,77
75 1,60 1,65 1,57 1,68 1,54 1,71 1,51 1,74 1,49 1,77
80 1,61 1,66 1,59 1,69 1,56 1,72 1,53 1,74 1,51 1,77
85 1,62 1,67 1,60 1,70 1,57 1,12 1,55 1,75 1,52 1,77
90 1,63 1,68 1,61 1,70 1,59 1,73 1,57 1,75 1,54 1,78
95 1,64 1,69 162 1,71 1,60 1,73 1,58 1,75 1,56 1,78
100 1,65 1,69 1,63 1,72 1,61 1,74 1,59 1,76 1,57 1,78
Tabela 15.1 - Valores crticos para o teste de Durbin-Watson, com = 0,05
(continuao)
BIOESTATISTICA_VOL02.indb 388 25/06/12 17:24
TABELAS 389
n
k = 1 k = 2 k = 3 k = 4 k = 5
dL du dL du dL du dL, du dL du
15 0,81 1,07 0,70 1,25 0,59 1,46 0,49 1,70 0,39 1,96
16 0,84 1,09 0,74 1,25 0,63 1,44 0,53 l,66 0,44 1,90
17 0,87 1,10 0,77 1,25 0,67 1,43 0,57 1,30 0,48 1,85
18 0,90 1,12 0,80 1,26 0,71 1,42 0,61 1,60 0,52 1,80
19 0,93 1,13 0,83 1,26 0,74 1,41 0,65 1,58 0,56 1,77
20 0,95 1,15 0,86 1,27 0,77 1,41 0,68 1,57 0,60 1,74
21 0,97 1,16 0,89 1,27 0,80 1,41 0,72 1,55 0,63 1,71
22 1,00 1,17 0,91 1,28 0,83 1,40 0,75 1,54 0,66 1,69
23 1,02 1,19 0,94 1,29 0,86 1,40 0,77 1,53 0,70 1,67
24 1,04 1,20 0,96 1,30 0,88 1,41 0,80 1,53 0,72 1,66
25 1,05 1,21 0,98 1,30 0,90 1,41 0,83 1,52 0,75 1,65
26 1,07 1,22 1,00 1,31 0,93 1,41 0,85 1,52 0,78 1,64
27 1,09 1,23 1,02 1,32 0,95 1,41 0,88 1,51 0,81 1,63
28 1,10 1,24 1,04 1,32 0,97 1,41 0,90 1,51 0,83 1,62
29 1,12 1,25 1,05 1,33 0,99 1,42 0,92 1,51 0,85 1,61
30 1,13 1,26 1,07 1,34 1,01 1,42 0,94 1,51 0,88 1,61
31 1,15 1,27 1,08 1,34 1,02 1,42 0,96 1,51 0,90 1,60
32 1,16 1,28 1,10 1,35 1,04 1,43 0,98 1,51 0,92 1,60
33 1,17 1,29 1,11 1,36 1,05 1,43 1,00 1,51 0,94 1,59
34 1,18 1,30 1,13 1,36 1,07 1,43 1,01 1,51 0,95 1,59
35 l,19 1,31 1,14 1,27 1,08 1,44 1,03 1,51 0,97 1,59
36 1,21 1,32 1,15 1,38 1,10 1,44 1,04 1,51 0,99 1,59
37 1,22 1,32 1,16 1,38 1,11 1,45 1,06 1,51 1,00 1,59
38 1,23 1,33 1,18 1,39 1,12 1,45 1,07 1,52 1,02 1,58
39 1,24 1,34 1,19 1,39 1,14 1,45 1,09 1,52 1,03 1,58
40 1,25 1,34 1,20 1,40 1,15 1,46 l,l0 1,52 1,05 1,58
Tabela 15.2 - Valores crticos para o teste de Durbin-Watson, com = 0,01
BIOESTATISTICA_VOL02.indb 389 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 390
n
k = 1 k = 2 k = 3 k = 4 k = 5
dL du dL du dL du dL, du dL du
45 1,29 1,38 1,24 1,42 1,20 1,48 1,16 1,53 1,11 1,58
50 1,32 1,40 1,28 1,45 1,24 1,49 1,20 1,54 1,16 1,59
55 1,36 1,43 1,32 1,47 1,28 1,51 1,25 1,55 1,21 1,59
60 1,38 1,45 1,35 1,48 1,32 1,52 1,28 1,56 1,25 1,60
65 1,41 1,47 1,38 1,50 1,35 1,53 1,31 1,57 1,28 1,61
70 1,43 1,49 1,40 1,52 1,37 1,55 1,34 1,58 1,31 1,61
75 1,45 1,50 1,42 1,53 1,39 1,56 1,37 1,59 1,34 1,62
80 1,47 1,52 1,44 1,54 1,42 1,57 139 1,60 1,36 1,62
8S 1,48 1,53 1,46 1,55 1,43 1,58 1,41 1,60 1,39 1,63
90 1,50 1,54 1,47 1,56 1,45 1,59 1,43 1,61 1,41 1,64
95 1,51 155 1,49 1,57 1,47 1,60 1,45 1,62 1,42 1,64
100 1,52 1,56 1,50 1,58 1,48 1,60 1,46 1,63 1,44 1,65
Tabela 15.2 - Valores crticos para o teste de Durbin-Watson, com = 0,01
(continuao)
BIOESTATISTICA_VOL02.indb 390 25/06/12 17:24
TABELAS 391
i N : 2 3 4 5 6 7 8 9 10
1 0,7071 0,7071 0,6872 0,6646 0,6431 0,6233 0,6052 0,5888 0,5739
2 0,0000 0,1677 0,2413 0,2806 0,3031 0,3164 0,3244 0,3291
3 0,0000 0,0875 0,1401 0,1743 0,1976 0,2141
4 0,0000 0,0561 0,0947 0,1224
5 0,0000 0,0399
i N: 11 12 13 14 15 16 17 18 19 20
1 0,5601 0,5475 0,5359 0,5251 0,5150 0,5056 0,4968 0,4886 0,4808 0,4734
2 0,3315 0,3325 0,3325 0,3318 0,3306 0,3290 0,3273 0,3253 0,3232 0,3211
3 0,2260 0,2347 0,2412 0,2460 0,2495 0,2521 0,2540 0,2553 0,2561 0,2565
4 0,1429 0,1586 0,1707 0,1802 0,1878 0,1939 0,1988 0,2027 0,2059 0,2085
5 0,0695 0,0922 0,1099 0,1240 0,1353 0,1447 0,1524 0,1587 0,1641 0,1686
6 0,0000 0,0303 0,0539 0,0727 0,0880 0,1005 0,1109 0,1197 0,1271 0,1334
7 0,0000 0,0240 0,0433 0,0593 0,0725 0,0837 0,0932 0,1013
8 0,0000 0,0196 0,0359 0,0496 0,0612 0,0711
9 0,0000 0,0163 0,0303 0,0422
10 0,0000 0,0140
Tabela 16.1 - Valores dos coefcientes
N-i+1
para o teste de normalidade W de Shapiro-Wilk
BIOESTATISTICA_VOL02.indb 391 25/06/12 17:24
BIOESTATISTICA_VOL02.indb 392 25/06/12 17:24
TABELAS 393
N
Nvel de significncia
0,01 0,02 0,05 0,10 0,50 0,90 0,95 0,98 0,99
3 0,753 0,756 0,767 0,789 0,959 0,998 0,999 1,000 1,000
4 0,0687 0,707 0,748 0,792 0,935 0,987 0,992 0,996 0,997
5 0,686 0,715 0,762 0,806 0,927 0,979 0,986 0,991 0,993
6 0,713 0,743 0,788 0,826 0,927 0,974 0,981 0,986 0,989
7 0,730 0,760 0,803 0,838 0,928 0,972 0,979 0,985 0,988
8 0,749 0,778 0,818 0,851 0.932 0,972 0,978 0,984 0,987
9 0,764 0,791 0,829 0,859 0,935 0,972 0,978 0,984 0,986
10 0,781 0,806 0,842 0,869 0,938 0,972 0,978 0,983 0,986
11 0,792 0,817 0,850 0,876 0,940 0,973 0,979 0,984 0,986
12 0,805 0,828 0,859 0,883 0,943 0,973 0,979 0,984 0,986
13 0,814 0,837 0,866 0,889 0,945 0,974 0,979 0,984 0,986
14 0,825 0,846 0,874 0,895 0,947 0,975 0,980 0,984 0,986
15 0,835 0,855 0,881 0,901 0,950 0,975 0,980 0,984 0,987
16 0,844 0,863 0,887 0,906 0,952 0,976 0,981 0,985 0,987
17 0,851 0,869 0,892 0,910 0,954 0,977 0,981 0,985 0,987
18 0,858 0,874 0,897 0,914 0,956 0,978 0,982 0,986 0,988
19 0,863 0,879 0,901 0,917 0,957 0,978 0,982 0,986 0,988
20 0,868 0,884 0,905 0,920 0,959 0,979 0,983 0,986 0,988
21 0,873 0,888 0,908 0,923 0,960 0,980 0,983 0,987 0,989
22 0,878 0,892 0,911 0,926 0,961 0,980 0.984 0,987 0,989
23 0,881 0,895 0,914 0,928 0,962 0,981 0,984 0,987 0,989
24 0,884 0,898 0,916 0,930 0,963 0,981 0,984 0,987 0,989
25 0,888 0,901 0,918 0,931 0,964 0,981 0,985 0,988 0,989
26 0,891 0,904 0,920 0,933 0,965 0,982 0,985 0,988 0,989
27 0,894 0,906 0,923 0,935 0,965 0,982 0,985 0,988 0,990
28 0,996 0,908 0,924 0,936 0,966 0,982 0,985 0,988 0,990
29 0,898 0,910 0,926 0,937 0,966 0,982 0,985 0,988 0,990
30 0,900 0,912 0,927 0,939 0,967 0,983 0,985 0,988 0,900
Tabela 16.2 Valores crticos da estatstica W de Shapiro-Wilk
BIOESTATISTICA_VOL02.indb 393 25/06/12 17:24
BIOESTATISTICA_VOL02.indb 394 25/06/12 17:24
TABELAS 395
14835 07362 26733 66337 20020 46848 24360 67813 17531 96160
84156 22328 08704 06439 64789 19606 74597 42899 36235 91089
07439 84935 67799 78493 03976 72783 31131 60452 23680 88212
60562 06499 56274 89528 77248 82823 29149 02415 46849 34372
92554 02182 58212 23811 74399 01856 50828 05868 60178 36120
57154 33430 44547 19479 28029 98735 02523 07352 26115 05784
33592 35545 09878 39291 05498 20618 13325 88848 05151 10298
63113 59196 90890 52945 95027 82655 76150 00102 23247 38135
53456 15261 00582 37612 11971 92844 44112 48161 15426 26704
89202 77388 51468 91049 19894 02188 13318 22280 34959 55245
88891 23578 84958 96820 99600 94748 42738 57576 79063 07765
84885 80345 96016 01251 09348 28560 11147 01657 00755 43642
38697 69389 98345 73048 29507 18526 67736 56657 49748 02160
39871 02677 13729 60302 49365 36310 29226 52028 93731 58365
33006 74668 41831 49768 95000 21495 32144 09647 64404 36257
07154 82834 40799 10422 81214 26325 65495 48346 27304 76266
31432 17859 22968 94194 06884 34888 65166 25467 35774 61056
56960 26638 36632 91651 29180 98155 01805 51464 49138 05710
02355 56388 09067 75695 25493 97169 22686 21475 31110 53045
82103 63195 65527 66243 96807 69165 95289 62930 66343 83711
50825 82955 24147 75012 20103 60267 04051 11654 81456 02920
03628 55427 72771 11270 13391 42267 25646 96957 39640 34334
15891 95262 89450 10087 92371 99885 94941 46284 77397 40100
50811 44401 92573 84821 49314 34342 01290 91163 37248 35041
59943 24172 16959 76008 04121 99199 55271 38518 07155 97528
45342 34103 48817 53536 03630 80439 17091 77911 87900 91034
74881 27536 54074 82623 64322 32241 66784 14590 17966 72187
77329 75480 19058 91100 21175 87860 98479 87996 39068 14348
35196 84012 03780 47762 94498 89812 71238 54070 43360 61395
84371 38352 85742 01610 41863 59977 58513 79876 87152 50249
22980 08123 98993 35609 45406 57914 96884 23851 65979 03903
58486 17927 91107 83002 90223 04731 88063 95720 91892 01246
61376 95034 53865 29670 13302 67790 92887 69725 98265 90459
23756 35575 07730 38317 40512 95941 66943 68526 24235 38609
04044 43464 90762 94781 68427 50021 82905 33939 41037 54417
60047 50681 64384 42320 46016 51491 23656 55597 47347 18863
83531 86235 40884 45400 96397 37285 06290 04315 05773 18621
06544 92307 69731 53410 63161 31227 10973 87011 59483 09370
49791 25181 29805 45135 94955 77642 45637 28200 77295 40800
21295 61442 44858 73413 19594 59741 39278 78953 24769 77854
Tabela 17 - Nmeros aleatrios
BIOESTATISTICA_VOL02.indb 395 25/06/12 17:24
BIOESTATISTICA_VOL02.indb 396 25/06/12 17:24
ADES, A. E.; HIGGINS. J. P. T. The Interpretation of Random-Effects Meta-Analysis in
Decision Models. Medical Decision Making, v. 12, p. 646-654, 2005.
ARMITAGE, P.; BERRY, G. The planning statistical investigations. In: ______ Statistical
methods in medical research. 2. ed. Oxford, Blackwell, 1987.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR 10520: informao e docu-
mentao: apresentao de citaes em documentos. Rio de Janeiro, 2002.
BANERJEE, M. et al. Beyond Kappa: A Review of Interrater Agreement Measures
The Canadian Journal of Statistics, vol. 27, n. 1, p. 3-23, 1999.
BEGHETTO, M. G.; ASSIS, M. C. S; LUFT, V.C.; Mello, E. D. Preciso e acurcia na afe-
rio do peso corporal em adultos hospitalizados. Rev Assoc Med Bras, v. 52,
n. 1, p. 23-7, 2006.
BEIGUELMAN, B. Curso prtico de bioestatstica. 5. ed. Ribeiro Preto: FUNPEC-
Editora, 2002.
BLAND, J. M.; ALTMAN, D. G. Measurement error and correlation coefficients. BMJ,
v. 313, p. 41-2, 1996.
BLAND, J. M.; ALTMAN, D. G. Measuring agreement in method comparison studies.
Statistical Methods in Medical Research. Stat Methods Med Res, v. 8, n. 2,
p.135-60, 1999.
BLAND, J. M.; ALTMAN, D. G. Statistical method for assessing agreement between two
methods of clinical measurement. The Lancet, v. 1, n. 8476, p. 307-10, 1986.
Referncias Bibliogrfcas
BIOESTATISTICA_VOL02.indb 397 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 398
BUSSAB, W. O.; MORETTIN, P. Estatstica bsica. 4 ed. So Paulo, Atual, 1987.
BUSTAMENTE-TEIXEIRA, M. T.; FAERSTEIN, E. LATORRE, M. R. Tcnicas de anlise
de sobrevida. Cadernos de Sade Publica, Rio de Janeiro, v. 18, n. 3, p. 579-
594, 2002.
CALLEGARI-JACQUES, S. Bioestatstica - princpios e aplicaes. 1 ed. Porto Alegre:
Artmed Editora, 2003.
CHOEN, J. A coefficient of agreement for nominal scales. Educ Psychol Meas, v. 20,
p. 37-46, 1960.
DAWSON, B.; TRAPP, R. G. Bioestatstica bsica e clnica. 3 ed. Rio de Janeiro, RJ:
McGraw-Hill Interamericana do Brasil Ltda., 2003.
DERSIMONIAN, R.; LAIRD, N. Meta-analysis in Clinical Trials. Controlled Clinical
Trials, v. 7, p. 177-188, 1986.
DOWNING, D.; CLARK, J. Estatstica Aplicada. 1 ed. So Paulo, SP: Editora Saraiva,
2000.
DUPONT, W. D. Power and sample size calculations. Controlled Clinical Trials, v. 11,
p. 116-128, 1990.
FERREIRA, A.B.H. Novo Dicionrio Aurlio em CD-ROM. Verso 5.0. Curitiba, PR:
Editora Positivo, 2005
FLEISS, J. L. Statistical methods for rates and proportions. New York: John Wiley,
1981. p. 212-236.
FLEISS, J. L.; COHEN, J. The equivalence of weighted kappa and the intraclass cor-
relation coefficient as measures of reliability. Educational and Psychological
Measurement, v. 33, p. 613619, 1973.
FLEISS, J. L.; GROSS, A. J. Meta-analysis in epidemiology, with special reference to
studies of the association between exposure to environmental tobacco smoke
and lung cancer: A critique. J Clin Epidemiol, v. 44, p. 127-39, 1991.
FLETCHER, R. H.; FLETCHER S. W.; WAGNER E. H. Epidemiologia Clnica: Elementos
Essenciais. 3 ed. Porto Alegre, RS: Artes Mdicas, 1996.
FLETCHER, R. H.; FLETCHER S. W.; WAGNER, E. H. Epidemiologia Clnica: Bases
Cientficas da Conduta Mdica. 1 ed. Porto Alegre: Artes Mdicas, 1989.
GAVAGHAN, D. J.; MOORE, A. R.; MCQAY, H. J. An evaluation of homogeneity tests in
meta-analysis in pain using simulations of patient data. Pain, v. 85, p. 415-24,
2000.
BIOESTATISTICA_VOL02.indb 398 25/06/12 17:24
TAMANHO DA AMOSTRA E RANDOMIZAO 399
GREENLAND, S. A simple method to calculate the confidence interval of a stan-
dardized mortality ratio. American Journal of Epidemiology, v. 133, n. 2, p.
212-213, 1990.
GREENLAND, S.; ROBINS, J. M. Estimation of common effect parameter from sparse
follow up data. Biometrics, v. 41, p. 55-68, 1985.
GREENLAND, S.; SALVAN, A. Bias in the one-step method for pooling study results.
Statistics in Medicine, v. 9, p. 247-252, 1990.
HEDGES, L. V.; PIGOTT, T. D. The power of statistical tests in meta-analysis,
Psychological Methods, v. 6, p. 203-217, 2001.
HIGGINS, J. P. T.; THOMPSON, S. G. Quantifying heterogeneity in a meta-analysis.
Statistics in Medicine, v. 21, p. 1539-1558, 2002.
HIGGINS, J. P. T.; THOMPSON, S. G.; DEEKS, J. J.; et al. Measuring inconsistency in
meta-analyses. British Medical Journal, v. 327, p. 557-560, 2003.
HOUWELINGEN, H. C. V.; ARENDS, L. R.; STIJNEN, T. Advanced methods in meta-
-analysis: multivariate approach and meta-regression. Stat Med, v. 21, p.
589-624, 2002.
HULLEY, S. B.; CUMMINGS, S. R.; BROWNER, W. S. et al. Delineando a pesquisa cl-
nica uma abordagem epidemiolgica. 2 ed. Porto Alegre, RS: Artmed Editora,
2001.
IBGE: Normas de apresentao tabular. 3. ed. Rio de Janeiro, 1993.
JEKEL, J. F.; ELMORE, J. G.; KATZ, D. L. Epidemiologia, Bioestatstica e medicina pre-
ventiva. 2 ed. Porto Alegre, RS: Artmed: Editora, 2004.
KAPLAN, E. L.; MEIER, P. Non parametric estimation from incomplete observation.
Journal of the American Statistics Association, v. 53, p. 457-481, 1958.
KIRKWOOD, B. R. Essentials of medical statistics. Oxford: Blackwell, 1988.
LACATOS, E. M.; MARCONE, M. A. Metodologia Cientfica. 2 ed. So Paulo: Atlas,
1991.
LEMESHOW, S.; HOSMER, DAVID. Adequacy of sample size in health studies.
Chichester, John Wiley, 1990.
LEVY, P.; LEMESHOW, S. Sampling for health professionals. Belmont, LLP, 1980.
LEWIS, S.; CLARKE, M. Forest plots: trying to see the wood and the trees. BMJ, v.
322, p.1479-80, 2001.
LOVATTO, P.A. et al. Meta-anlise em pesquisas cientficas: enfoque em metodolo-
gias. R Bras Zootec, v. 36, supl. 2008, p. 285-294, 2007.
BIOESTATISTICA_VOL02.indb 399 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 400
LWANGA, S. K.; LEMESHOW, S. Sample size determination in health studies: a prac-
tical manual. Geneva, World Health Organization, 1991.
MARCANTONIO, A. T.; SANTOS, M. M.; LEHFELD, N. A. Elaborao e divulgao do
trabalho cientfico. So Paulo: Atlas, 1993.
MEDRONHO, R. A.; CARVALHO, D. M.; BLOCH, K. V.; LUIZ, R. R. et al. Epidemiologia.
1 ed. So Paulo, SP: Editora Atheneu, 2005.
MOTTA, V. T.; WAGNER, M. B. Bioestatstica. 1 ed. Caxias do Sul, RG: Robe Editorial,
2003.
NETER, J.; WASSERMAN, W.; KUTNER, M. H. Planning sample sizes, nonprametric
tests, and random ANOVA model. In: _____ Applied linear statistical models:
regression, analysis of variance and experimental designs. 3. ed. Boston,
Irwin, 1990. p. 633-42.
NETO, B. B.; SCARMINO, I. S.; BRUNS, R. E. Como fazer experimento. 2 ed. Campinas
, So Paulo: Editora da Unicamp, 2002.
NETO, B. B.; SCARMINO, I. S.; BRUNS, R. E. Como fazer experimento. 3 ed. Campinas
, So Paulo: Editora da Unicamp, 2007.
OLIVEIRA, S. L. Tratado de metodologia cientfica: Projetos de pesquisas, TGI, TCC,
monografias, dissertaes e teses. So Paulo: Pioneira, 1997.
PEREIRA, M. G. Epidemiologia, Teoria e Prtica. 1 ed. Rio de Janeiro, RJ: Guanabara
Koogan, 1995.
RODRIGUES, M. I.; IEMMA, A. F. Planejamento de experimentos e otimizao de pro-
cessos. 1 ed. Campinas, So Paulo: Casa do Po Editora, 2005.
ROTHMAN, K. J. Modern Epidemiology. Boston, Little Brown, 1986. p.23-34.
SACKETT, D. L. Bias in analytic research. J Chron Dis, v. 32, p. 51-63, 1979.
SEVERINO, A. J. Metodologia do trabalho cientfico. 20 ed. So Paulo: Cortez, 1996.
SIEGEL, S. Estatstica No Paramtrica. So Paulo: 1 ed. Editora McGraw-Hill do
Brasil Ltda., 1975.
SIEGEL, S.; CASTELLAN, N. Nonparametric Statistics for the Behavioral Sciences. 2.
ed. New York: McGraw-Hill, 1988. p. 284-285.
SILVA, C. R. O. Metodologia e organizao do projeto de pesquisa. 1 ed. Fortaleza,
CE: Centro Federal de Educao Tecnolgica do Cear, 2004.
SILVA, E. L.; MENEZES, E. M. Metodologia da pesquisa e elaborao de dissertao. 3
ed. Florianpolis, SC: Universidade Federal de Santa Catarina, 2001.
BIOESTATISTICA_VOL02.indb 400 25/06/12 17:24
TAMANHO DA AMOSTRA E RANDOMIZAO 401
SIM, J.; WRIGHT, C. C. The Kappa Statistic in Reliability Studies: Use, Interpretation,
and Sample Size Requirements. Physical Therapy, v. 85, p. 257-268, 2005.
SNEDECOR, G. W.; COCHRAN, W. G. Statistical methods. 6th ed. Iowa: Iowa State
University Press, 1967. 505 p.
STEEL, R. G. D, TORRIE, J. H. Principles and procedures of statistics. 2nd ed. New
York: Mc Graw-Hill, 1980. 633 p.
STEVENSON, W. J. Estatstica Aplicada Administrao.1 ed. So Paulo, SP: Editora
Harper & Row do Brasil Ltda., 1981.
TRIOLA, M. F. Introduo Estatstica. 7 ed. Rio de Janeiro, RJ: Livros Tcnicos e
Cientficos Editora S.A., 1999.
VELSQUEZ-MELNDEZ, G.; PIMENTA, A. M.; KAC G. Epidemiologia do sobrepeso
e da obesidade e seus fatores determinantes em Belo Horizonte (MG), Brasil:
estudo transversal de base populacional. Rev Panam Salud Publica, v. 16, n. 5,
p. 308-14, 2004.
VIEIRA, S. Metodologia cientfica para a rea de sade. So Paulo, Sarvier, 1984. p.
77-82.
BIOESTATISTICA_VOL02.indb 401 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 402
BIOESTATISTICA_VOL02.indb 402 25/06/12 17:24
NDICE REMISSIVO 403
ndice Remissivo
A
Acurcia 558
Ajuste do modelo de regresso 703
Aleatoriedade 469
Anlise
da regresso 472
de resduos 472
de resduos padronizados 503
de sobrevida 671
de varincia 704
de varincia no-paramtrica 635
do quadro vital 673
multivariada 601
ANOVA
de dois critrios 613
de mltiplos critrios 629
de um critrio 613
Aplicao da regresso linear simples 471
B
Base da ANOVA 611
Bases conceituais da estatstica multivariada
602
Behrens-Fisher 439
Bloco 614
C
Clculo
da razo de chance combinada 689
da razo de risco 685
das contagens esperadas 496
das percentagens 497
do coefciente de regresso
padronizado 654
do erro de estimao 430
do qui-quadrado 497
do resduo ajustado 504
do resduo padronizado 503
dos efeitos dos fatores 702
dos indicadores da correlao mltipla
652
Codifcao dummy 651, 661
Coefciente
angular 463
de correlao 472
de correlao de Pearson 454
de correlao de Spearman 587
de correlao mltipla 652
de correlao produto-momento 454
de determinao 460
de determinao mltipla 653
de determinao mltipla ajustado 653
de regresso 654
kappa 593
linear 650
Combinao de mltiplos testes
diagnsticos 563
Condio
de normalidade 468
Condies para o uso da regresso linear
468
Contrabalano 551, 552
Correo
de continuidade 508
de Welch-Satterthwaite 436
de Yates 508
Covarincia 454
Curva
BIOESTATISTICA_VOL02.indb 403 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 404
de sobrevida 676
ROC 554
D
Determinao
da reta de regresso 463
do coefciente de spearman 588
do intervalo de confana para a mdia
de amostras pareadas 446
do intervalo de confana para a mdia
populacional 429
Diagrama
de disperso 451, 452
de pontos 452
Diferena de risco 538
Distribuio
Qui-Quadrado 489
t DE STUDENT 423
E
Efeito
principal de um fator 698
simples de um fator 697
Ensaio 527
Ensaio probabilstico 525
Equao de regresso 461470
Erro
falso-negativo 545
falso-positivo 549
padro estimado 424
verdadeiro-negativo 545
verdadeiro-positivo 545
Erro experimental 614
Escolha do teste estatstico 605
Espao amostral 528
Especifcidade 548
combinada 565
Estatstica
do qui-quadrado de Mantel-Haenszel
673
Durbin-Watson 653
t 653
estimativa conjunta das varincias 432
Estratgia de modelagem reduzida 667
Evento 527
Eventos
independentes 529
mutuamente excludentes 528
no-independentes 530
Experimento 527
fatorial completo 710
fatorial incompleto 693
fatorial no Minitab 709
Experimentos Fatoriais 691
F
Frmula
para calcular o teste t pareado 443
para calcular o valor t 431
H
Homocedasticidade 469
I
Indicadores de um teste diagnstico 548
Interao entre fatores 694
Interpretao do valor r 455
Intervalo de confana para a mdia 625
L
Linearidade 469
Linha
de melhor ajuste 461
de regresso 461
M
Matriz de correlao 652
Medidas de Associao 530
Mtodo
Atuarial 673
de Kaplan-Meier 677
de mnimos quadrados 462
produto-limite de Kaplan-Meier 677
Modelo
de regresso logstica mltipla 665
de regresso logstica simples 662
de regresso mltipla escalonada 655
linear geral 604
O
Objetivos da Estatstica Multivariada 604
Odds ratio 535
One way ANOVA 613
Operaes com probabilidades 528
P
Ponto de corte 551
Porcentagem
de Risco Atribuvel 539
BIOESTATISTICA_VOL02.indb 404 25/06/12 17:24
NDICE REMISSIVO 405
de Risco Atribuvel na Populao 540
Prevalncia 558
Probabilidade
acumulada de sobrevida 674
anterior 530
ps-teste 560
pr-teste 558, 560
Problema de Behrens-Fisher 439
Propriedades da distribuio t de student
427
R
Razo
crtica 436
de chances 536
de Probabilidade Negativa 562
de Probabilidade Positiva 562
de probabilidades 561
de risco 685
de verossimilhana 561
Regra
da adio 528
da multiplicao 529
Regresso
em direo mdia 461
escalonada 655
linear mltipla 649
linear simples 461476
logstica mltipla 661
logstica simples 661
mltipla 649
para varivel categrica 670
Relao entre sensibilidade e especifcidade
550
Repetio 614
Requisitos
para usar o teste do qui-quadrado 511
para uso da ANOVA 616
resduos 462, 469
reta de regresso 463
Risco Atribuvel 538
na Populao 540
risk ratio 533
S
Screening test 544
Sensibilidade 548
Combinada 565
Sinal da correlao 456
Superfcie de resposta no Minitab 727
T
Tabela de anlise de varincia 617
Tabelas de contingncia 490
de dupla entrada 490
Taxa de erro
falso-negativo 548
falso-positivo 549
Teorema de Bayes 570
Teoria da probabilidade 525
Termo de erro 603
Teste
ANOVA 611
de Bonferroni 628
de Cochran para varincias iguais 438
de concordncia Kappa 593
de Dunn 641
de Friedman 644
de hiptese para a regresso linear 466
de hiptese para correlao 458
de hiptese para o coefciente de
spearman 591
de homogeneidade 435
de homogeneidade para duas varincias
435
de Kolmogorov-Smirnov 478
de Kruskal-Wallis 635
de Shapiro-Wilk 482
de Student-Newman-Keuls 626
do logrank 681
do qui-quadrado 495
do qui-quadrado da homogeneidade
498
do qui-quadrado da independncia 498
do qui-quadrado de aderncia 498
do qui-quadrado de McNemar 489
exato de fsher 520
f 611
f para varincias iguais 436
padro-ouro 546
paramtrico versus no-paramtrico
596
Q 641
BIOESTATISTICA_VOL02.indb 405 25/06/12 17:24
BIOESTATSTICA APLICADA PESQUISA EXPERIMENTAL 406
t de Student 423
t de Wilcoxon 582
t para amostras independentes com
varincias desiguais 439
t para amostras independentes com
varincias iguais 433
t para amostras pareadas 442
t pareado 442
Tukey 620
U de Wilcoxon-Mann-Whitney 576
Testes
de aderncia 477
de bondade de ajuste 478
de comparaes mltiplas 620
de rastreamento diagnstico 543
de signifcncia estatstica 681
em paralelo 565
em srie 567
para variveis ordinais 575
Tipos de ANOVA 613
Tratamento 614
Two way ANOVA 616
V
Valor
crtico da distribuio 436
preditivo Negativo 559
preditivo Positivo 559
r 455
Valores preditivos 559
Varincia
dentro dos grupos 611
entre grupos 611
mdia dentro dos grupos 614
residual 614
total 611
W
Welch-Satterthwaite 436
BIOESTATISTICA_VOL02.indb 406 25/06/12 17:24
BIOESTATISTICA_VOL02.indb 407 25/06/12 17:24
BIOESTATISTICA_VOL02.indb 408 25/06/12 17:24