Você está na página 1de 143

Sumrio

~~( .'/1 ii

Soares, Jos Francisco Introdu(;o ii (~statstica mdica/ Jos(~Francisco Soares, Anninda Lucia Siqueira.- -1.ed.- - Belo Horizonte: DeparLamento de Estatstica - UFMG, 1999. vii, 300p.:il L. Estatstica mdica 2. Bioestatstica Illiuda Lucia. n. Ttulo. L Siqueira, Ar-

CDD610.21 CDU61:31

O Papel da Estatstica na Medicina 1.1 Introduo .... 1.2 Alguns exemplos . . 1.3 Bioestatstic:a . . . . 1.3.1 Planejamento 1.3.2 Anlise 1.4 Consideraes finais Organizao da Pesquisa Mdica 2.1 Introduo . 2.2 Estudo descritivo . 2.2.1 Estudo ele casos . 2.2.2 Estudo de uma srie de casos 2.2.3 Estudo baseado em dados institucionais 2.3 Estudo caso-controle . . . 2.4 Estudo de coorte . . . . . ... 2.4.1 Seleo das coortes .. 2.5 Ensaios clnicos aleatorizados 2.5.1 Aleatorizao ..... 2.5.2 Como implementar a alocao aleatria 2.6 Estudos comparativos . 2.6.1 Grupo controle . 2.6.2 Confuso de efeitos . 2.6.3 Controle de fatores de confuso 2.6.4 Generalizao dos resultados 2.7 Exerccios .

lo'jl'llacaLalogrfica preparada pelo Centro de Extenso da Escola de Ili IdiliI,(\couomiada UFMG Il'I'.i~;LI'(l do ISBN: solicitado

!\ 111 li(l: Pr-Reitoria de Graduao - UFMG (~ai>a: Lais Freire dos Reis

I kscri<.;iio (~ Apresentao de Dados ;1.1 IIILJ'I)dlI <.;ii.o :1.'.', {~'lIl1:(!iLos iJ:.sicos :I.:~.I Val'i:.vd. :\.:~.:2 Tipos d(~variveis :\.:~.:I 1)ad(,s Imll,os ... :1:\ (ll',I',alliy,a(,:a(, (' apJ'(~sentao de dados :1.:1.I Tal)(!!:u-;de: rr(~qncias :1.:\. :2 G nfi <:Os . . . . . . . . . . . . :\ I SIILes(~nunl(~rica . Medidas (k tendncia central Medidas ele variabilidade Coeficiente de variao :\.1./1 Escore padronizado :I.I.G Percentis . :\.\.(j Outras medidas descritivas :\!, ()IILI'OStpicos ..... :1.r,.1 Coleta de dados :1.:,.2 Banco de dados. :I.r).;\ Arredondamento :\':).4 Boxplot ..... :\.:)}; Observaes atpicas (outlier) :u; I';x(~mplo comentado: Refluxo vesicureteral primrio , '111 (:rianas . . . . . . . . . . . . . . . . . . :\.h. I Descrio da amostra no incio do estudo :U .2 Acompanhamento :1 'i 1,:X(:l'ccios
:\.,1.1

33

:1.1.:2 :1.1.:1

33 33 33 34 36 39 39 46 52 52 55 58 59 61 63 64 64 65 67 68 70 74 75 75 78
89

o"

4.5.1 Sensibilidad(~ e especificielade 4.5.2 Valor das plulies 4.5.3 Decises incorretas 4.6 Combina(:o de testes diagnsticos 4.6.1 Formas de combinao de testes 4.6.2 Necessidade da combina(:o de testes 4.7 Testes diagnsticos baseado em variveis contnuas 4.7.1 Efeito do ponto de corte na qualidade de uni teste diagnstico . . . . . 4.7.2 Escolha do ponto de c:ort(~ 4.8 Escolha entre testes diagnlsticos 4.9 Consideraes finais 4.10 Exerccios . . . . . .

!)!) 1()'2 11)'\ IIHi I(H.


111

11:1
11;1
Illi 117 I I!) I :21)

l'I'OI';lhilidade e Avaliao de Testes Diagnsticos I I IIILl'odJl(:o . I " 1'I" li )a\lilidade: conceitos fundamentais I.'.~.I Espao amostraJ e eventos U.:2 Clculo de probabilidades ... 1.'.>'.:1 Tipos especiais de eventos ,I ,:~.I1 Propriedades da probabilidade 1:\ I'l'oiJaiJilidade condicional . 11 1';V(~IILos independentes . I!, qllalidade ele testes diagnsticos

89 90 90 91 93 94 95 97 99

1:~ 1 Caracterizao Estatstica de Variveis 5.1 Introduo . 1:11 5.2 Conceitos fundamentais . I ;t~ 5.2.1 Variveis aleatrias e suas distribuies de pro1:1:1. babilidade . . . . . . 1;\7 5.2.2 Populao e amostra I : I'i' 5.3 Modelo de Poisson . 1I11 5.4 Modelo de Gauss . 1/11 5.4.1 Curva de Gauss . 1 1 :~ 5.4.2 Distribuio gaussiana padro 1/1,'-: 5.5 Verificao da adequao do modelo I(I~ 5.5.1 Modelo de Poisson I r,l) 5.5.2 Modelo de Gauss . I r,;\ 5.6 Faixa de referncia .... I r':1 5.6.1 Obteno da faixa de referncia I : I~ I 5.7 Exemplos comentados . I r,!) 5.7.1 Cartas para controle de processos em hospitais 11.;1 5.7.2 Rastreamento de doadores de sangue Ilil. 5.8 Exerccios . . . . . . . . . . . . . . . . . . .
I

Comparando Dois Grupos 6.1 Introduo . 6.2 Conceitos fundamentais . 6.2.1 Hipteses a serem testadas 6.2.2 Critrio de deciso . . . . .

171 I '/1 1'/1.

6.2.3

fi.U
(i. 7

Erros do tipo I e II, nvel de significncia e poder do teste 179 6.2.4 Probabilidade de significncia (valor-p) 180 Resposta dicotmica: amostras independentes 181 6.3.1 Teste qui-quadrado (X2) 181 6.3.2 Teste qui-quadrado com correo de continuidade185 6.3.3 Teste exato de Fisher 186 6.3.4 Teste Z para comparao de propores 187 Resposta dicotmica: amostras pareadas . . 189 6.4.1 Teste de McNemar . . . . . . . . . . 190 Resposta contnua: amostras independentes 192 6.5.1 Teste t 192 6.5.2 Teste Z para comparao de mdias 199 Resposta contnua: amostras pareadas 201 Testes no-paramtricos . . . . 204 6.7.1 Teste de Mann- Whitney . . . . 205 6.7.2 Teste de Wilcoxon . . . . . . . 206 Exemplo comentado: Imunogenicidade de uma vacina 208 Consideraes prticas sobre testes de hipteses. 211 6.9.1 Valor~p 211 6.9.2 Hipteses bilaterais versus unilaterais 211 6.9.3 Concluses a partir de testes de hipteses 214 6.9.4 Significncia estatstica e significncia clnica 214 6.9.5 Fatores de confuso ..... 215 6.9.6 Apresentao dos resultados 215 6.9.7 Pressupostos dos testes 215 Consideraes finais 217 6.10.1 Denominaes de testes 217 6.10.2 Amostras pareadas e amostras independentes 218 6.10.3 Sobre pareamentos 218 6.10.4 Amostragem 219 6.10.5 Extenses 219 Exerccios . . . . . . 221 ou Exposio
234

7.3

7.4

7.5 7.6

7.7

7.2.3 Intervalo dE)confiam;a ..... 7.2.4 Distribu<;o da mdia amostral Medida do efeito: resposta contnua 7.3.1 Amostras pareadas . 7.3.2 Amostras independentes . Medida do efeito: resposta dicotmica 7.4.1 Risco relativo . 7.4.2 Razo das chances . Exemplo comentado: Desnutri(;o hospitalar. Consideraes finais . 7.6.1 Significncia estatstica e significncia clnica 7.6.2 Equivalncia entre teste de hipteses e intervalo de confiana. . . . . . . . . . . . 7.6.3 Diferentes tempos de seguimento 7.6.4 O termo odd.5-'('(),t'io Exerccios .

237 238

241 241
243 244 24

247 251
253 253

254 254

255 255

7 Medida do Efeito de uma Interveno 7.1 Introduo . 7.2 Conceitos fundamentais . 7.2.1 Parmetro de interesse. 7.2.2 Estimadores ....

234

235
235 236

Prefcio
11111 a cow-:ulta aos peridicos meus relevantes de qualquer rea 11I('dica Illostra que a Estatstica hoje a linguagem predominante 11111'11 a CI)III111lica(~o de resultados recentes que devem ser incorpo1'lIdlls :\ pr:Uica mdica. A Estatstica tambm instrumento bsico 1'111'11 a J'(~:\Ji,r,ao das pesquisas que geram estes resultados. Alm (li:iHII, a <',apacidade d(~ atualizao caracterstica essencial do profisIlillllal I)(!1Ilformado. I'( 11'LI)(los estes motivos, dll 1III;; Cllrsos de Medicina, 1,1'111,:1< Ia IIOS cursos mdicos 111l;111 I III~<lados. uma disciplina <l<~Estatstica (~ ofereci-

i-'TJl(TicallWllil~ dI' ,i..',l'1IP' I,., (11' I)llI'il'lll I',.,. V:rios testes estatsticos qlll! apan~CClJl na li1,(~r:\1111'11 1':-.1 lI< I lJii ,II':-'(Til os. Fiz(~mos 11111 (~sfoJ'<.:I) dI' 11'11/.1'1' I'XI'lllplo:-. de nosso traballH> dI! ill tCl'a()i,o C01U J)(~squisadorl's I' clnicos <J1Wternos atendido ao ]Ollgll dll tempo no Depart,anJCllLo de Estatshca da UFMG. Foram (~xp(~l'i{\11 cias lImito ricas e gratiIicant(~s que hc:uam aqui registradas I~qlll! 1'1' presentam o papel da interfaCl~ da Estatstica. Alm disso, illClllflllllH diversos exemplos cuidadosam(~ntl~ sd(~ci01mdos da literatura, v:l'i( IS deles provenientes Seo 6.8 refere-se peridico de pesquisa C0111dados brasileiros. a um excc1ente trabalho publicado em um seminrio

O eX(~lnplo dll
no n~speiLa< II1 por uma d(~ de Medici lia Maria Bl'agll

que infelizmente, durante longos anos foi como um conjunto d(~ regras de apres(~nde organizao de estudo

The Lancei e foi apresentado

Nada se falava sobre formas

nossas melhores alunas da ps-gradua<.;iio da Faculdade da UFMG. Sua incluso uma homenagem Laura

l'IIIIi<'1I, II<~mdas anlises de dados tpicos ela pesquisa mdica. Isto Llll'lIl1Vaa disciplina desinteressante e por outro lado no habilitava os IIIIIIIOS 110essencial: ler com facilidade e de forma crtica e proveitosa 11liLI~raLlll'a mdica recente. Desde 1988, um grupo de professores do I ll'parLamento de Estatstica da UFMG vem procurando adequar a 1I1/\'Iwira de ensinar a esta necessidade. Este livro o fruto de todo
I',',

Borges de Mattos que morreu vtima de acidente em abril de 19D~. Ao apresentar este material em portuguf~s, com ilustraes dnllLI'II da prtica mdica, esperamos estar contribuindo para um ensirH) I11' qualidade da Estatstica para a Medicina. () texto apresenta a pal'!l' elementar da Estatstica Mdica e, embora seguindo o mesmo COnL(!I'1 do de outros textos de Estatstica, seu enfoque diferente. C01111 '(:11 com o problema mdico e depois apresenta as tcnicas estatsL icaH necessria:;; para sua soluo. Ao final dos captulos esto propo:-:!( 1:1 muitos exerccios para possibilit.ar a f1xar:o dos conceitos apl'l~s( ~II tados e em alguns ca:-:os desenvolver () raciocnio necessrio CllI 1111111 anlise de dados. Pode ser utilizado em disciplinas de gradua(Jl.o (', se apropriadamente complementado, em ps-graduao. Pode ai 1J(111 ser t.il para profissionais que at.uem ou tenham interesse na ;,]'(~ada Sade. Um trabalho como este no se concretiza sem a ajuda de ll1lli!aH pessoas. Agradecemos s vris geraes de alunos que usaralll I) !(,~ to na forma de apostila e a todos que com suas sugestes e incI~II!i VII ajudaram a produzir um texto mais relevante. Embora f():-::-:I~ lIoH so desejo no citar nomes, dada sua contribuio especial, qlWl'(!IIJ(IH agradecer acadmica de Medicina Fabiana Barreto Utsch d(~ Ma!1
),'1,

LI ~ processo. () I)rimeiro 111l'~d ica atravs

captulo ilustra a insero da Estatstica na literatura de exemplos simples e relevantes. O Captulo 2 sodo estudo clnico e uma introduo de um tema

111'1 ~II planej amento

dI' grande importncia. O conhecimento mdico avana atravs de l""lldos bmn planejados e no atravs de anlise de dados coletados dI' a<'mdo com convenincias administrativas. O Captulo 3 trata da :;IIILI!SI~ numrica e grfica dos dados tendo como referncia a necesliid:IlI(~ de criao e uso de padres de referncia em estudos clnicos. ( l (:apftulo 4 apresenta ndices que medem a qualidade de testes di1I1',II<')sLil:Os: sensibilidade e especificidade. Discutimos a questo de 111 'I~I'LI)S (~erros no diagnstico clnico, mostrando que estes conceitos :1111 I Lall ti ){ml expresses de conceitos estatsticos clssicos. O contedo

di I ( ~apfL1 ilo 5 pode parecer

excessivamente terico, mas no h como 1,1':11 ai' pl'Oblcmas reais sem tais informaes. So introduzidas duas i1111)( IrLal JI,(!Sdistribuies: Poisson e gaussiana. A princi paI aplica<~iio

que aprendeu Estatstica, competncia e dedicao

editorao, padronizao e com 1~1I01'11J(' nos possibilitou terminar este livro.

IIPI'I's<!IILada no captulo a construo de faixas de referncias de uso l'oLi I \t'i 1'1 1 lia prtica mdica. Finalmente, nos captulos 6 e 7 so a1111 'HI 'li LiuIas formas estatsticas para comparao de tratamentos ou

Belo Horizonte,

Jos Francisco Soares e Arrninda Lv.cia Siq'ueira maro de 1999

Captulo 1

Papel da Estatstica na Medicina

objetivo deste captulo ilustrar o papel que conceitos e tcnicas estatsticas tm na formao do mdico, na sua prtica profissional e de modo especial no avano do conhecimento na rea mdica. Este objetivo ser alcanado principalmente atravs da apresentao e discusso dos resultados de estudos clnicos relevantes. Atravs destes exemplos, argumenta-se que conceitos estatsticos tm importante papel a desempenhar, tanto no estudo da sade de popu\aes, como no tratamento de pacientes individuais. Outros assuntos correlatos, como o possvel uso de computadores no diagnstico clnico e o impacto do processo de quantificao da Medicina moderna, sero sinteticamente apresentados.

Como em qualquer outra rea da cincia, os avanos no conhecimento mdico so primeiramente relatados em artigos publicados em revistas cientficas. Cada artigo, antes eleser publicado, revisto por um grupo de especialistas da rea que, atravs de avaliao criteriosa, procura garantir a qualidade dos trabalhos publicados e, conseqentemente, o prestgio da revista e da sociedade cientfica associada.

NI'~;l.a';1'1::\1) (~ 110n~sto do texto, 11S:I]'('lllOS como exemplos artigos til' l'l'1illllil'IIS 11l(~dicos J'(~spcit.ados illh~rllacionalmente: Ne'W England '/"11/ 111/1 <lI !'''/I'I/:';'''W, JIJ'II:I'no.lof The American lVledical Association, /'//1 /:III/.('d. I/'I';:{,is/i,fV/erl:o.l JO'lLrnal, etc. Estas so tambm fontes 11:111/11: .Ia Illf<lia p:\.l'a Ilotcias sobre avanos na Medicina, to pre,1'ld,':, 11<1 1IIII.il:i:,l'itl di:,rio.

Tabela 1.1: Resultados relat.ados pelo 8f;een>n.q Cornrnitee cians' Heo.lth 8hu/y G'f'(J'/{,J! em 1989 Resposta Infarto AVC Aspirina 139 119 Placebo 239 98 Risco 0,53 1,15 Intervalo 0,42-0,67 0,84-1,58

of Physi-

Valor-r> < 0,00001 0,41

antitrmicas e ant.iinfiamatrias da 11"1 >1111111 1'1 >1':1.111 verificadas h muitos anos. S muito recentemente, "ldll'IIIIII.II, 1'0 i reconhecido o seu potencial na reduo do risco de ,111"111:;1:: 1';II<liovasculares. Alm de um possvel mecanismo bioqumi'" '1"" ,111::l.ilic:u..;se o efeito protetor da aspirina, evidncias prelimiIlill":, 11I111l'1:idas por alguns estudos clnicos e a crenc:a no seu efeito, ,I1I1I11<11<Ia lia sociedade americana, criaram a necessidade e a opor111111.la.l,' <lI' sc verificar, cientificamente, a exist.ncia ou no deste "I, '1111 ('1>111 I'sl.:\.linalidade, foi organizado em 1982 um estudo conhecido '"11111 /'h,l/s':'lo.ns' Health St'lLdy. Neste estudo, 22.071 mdicos ameri1111111:, VI>!llld,:rioscom idade entre 40 e 84 anos foram divididos aleIIIIIII:lllll'lll.l~(~llldois grupos. O primeiro grupo, com 11.037 mdicos, 1"111<>11 a (';I<la dois dias aspirina (Bufferin, Bristol-Myers Products, ,I"i, 111,1',), 1111<jll<lnto o segundo, com 11.034 mdicos, tomou placebo: I1111 1'IIIIII'I'illlido semelhante ao da aspirina, mas sem o seu princpio 111 11'11 I )"I",i:: 111' cinco anos o comit que, independentemente dos pes'jlll:illlll'll':: Illsponsveis pela rotina do projeto, acompanhava e mo1I1111111va li,':<lados obtidos, decidiu terminar o estudo. Os resultados I>I,'IIIIIIII:ITI':~ Illostravam que os efeitos protetores da aspirina eram '1I,I"ldl':: \';ssa informao deveria, pois, ser comunicada aos clnicos 1Il'I>lII;II,;all cru geral. 1\ Talll~la 1.1, reproduzida do artigo original (relato final), in, 1111 111'" 11 a:: IIS casos confirmados de infarto do miocrdio e acidente '",'''llIal 1'1'1'(:111':11 (AVC) e mostra os dados que fundamentalmente ,,"I>::1;lIl1'ial:1.I11 a deciso de parar o estudo e divulgar os resultados. 1\ 1>11'\" 11'l:al) de infartos no grupo que tomava aspirina 139/11.037, "11'111111111' 110ol1tro grupo era de 239/11.034. A questo crucial do
" li

i\:: 1'11 'pl'il~dades analgsicas,

estudo, respondida pelo uso de mtodos estatsticos, foi: ser que a diferena observada nas propores devida ao uso de aspirina ou aparece simplesmente devido ao acaso? Em outras palavras, o mesmo efeito seria observado em outro grupo de pessoas se o estudo fosse repetido? Testes estatsticos mostram que a probabilidade do efeito observado ser proveniente apenas do acaso menor que 1 em 10.000. Ou seja, h uma forte evidncia do efeito protetor da aspirina. Quantifica-se o efeito da aspirina calculando-se a razo do risco de infarto nos dois grupos. Neste estudo obteve-se 0,53, ou seja, o risco de quem toma aspirina quase metade do de quem no toma. Um estudo desta natureza cercado de todos os cuidados: no seu planejamento, na sua execuo e na anlise dos dados. A Estatstica fornece, alm dos mtodos para tomada de decises na pre~ sena de incerteza, as formas de planejamentos do estudo. Atravs da alocao aleatria dos participantes aos grupos, obtiveram-se dois grupos semelhantes em todas as suas caractersticas medidas ou no. Entretanto, a deciso final de se usar este resultado na prtica clnica considera outros fatores alm daqueles obtidos atravs da anlise estatstica dos dados, como, por exemplo, a facilidade de uso da droga e seu preo.

A Sndrome da Imunodeficincia Adquirida (AIDS), logo que apareceu em 1981, constituiu-se de imediato em um srio problema de sade pblica para o Brasil e outros pases do mundo. O sistema de sade no estava preparado para a nova e difcil tarefa de diagnosticar e atender os doentes. Alm disto, a possibilidade de contgio atravs de transfuso de sangue trouxe uma preocupao extra.

1';111 illcio <k 1985, tornaram-se disponveis comercialmente os "li IIIC ,iI'< IS L(~sL(~s ELISA para determinar a presena do vrus da imuli''' l"'ic'il~llcia luunana (HIV). A partir da, garantiu-se maior segu111111:11 IIlIra p(~ssoas dependentes de hemoderivados, como os hemofli( ) :III<:<~SSO do teste criou, entretanto, a falsa impresso de que ele 1'111 pI'ri'l!iLo, ou seja, podia-se acreditar completamente no seu resul1111111, LllgO percebeu-se a existncia de grande nmero de resultados I" li I1I1 VI I~;i111 :orretos, tornando necessrias alternativas diagnsticas, I' "11< 1 II1I !Il1orias tcnicas, desenvolvimento de novas metodologias e ,1,,111 I1 111\'{).o de testes. () IVI i lIistrio da Sade brasileiro, procurando aumentar a c(mfi1I1,i1I1I:"II! para emisso de laudos dos testes e sistematizar os pro1III1I'III.IlS utilizados, publicou no Dirio Oficial de 19 de janeiro de I!l!l,'": 11l'<~gl1lamento tcnico para diagnstico sorolgico do HIV em 111" I\'11 1111 IS acima de dois anos a ser adotado por todos os servios de 111111"1', pl'lhlicos e privados. ~'I'I',lllldo essa sistematizao, cada amostra de sangue dever ser lilll"lll'i.ida a dois testes de triagem (por exemplo ELISA) distintos, 1"111:\.Ill.l~(mOS ou metodologia diferentes. Se negativos, a amostra " 1"II~:illm'ada negativa para HIV. Se discordantes, os testes devem 111'1 Ii'pl'i.idos em duplicata. No caso de positividade em ambos os I, 'I ill ': I, ,\ IlCcessria a realizao de um teste confirmatrio (imuno11111" 'I il'1~lIciaindireta ou Western Blot) que, uma vez positivo, obriga ri I' oI,'l.ad<~ uma segunda amostra para repetio dos testes de triagem .' 111111 i 1llla<Ji.odos resultados da primeira amostra. 1'>;I"sL(~st.c~s, ao resolverem o problema de deteco, criaram vrios "1111"::,associados sua utilizao. Faz sentido seu uso em larga es 111: I "," III I defendido por alguns grupos de opinio? Como comunicar 1III1I' 'I 1i i1Lado positivo do teste a uma pessoa sem outras evidncias 111111'":: da doelll{a? tico avisar o companheiro de uma pessoa com 11'111111:,,111 positivo? Para enfrentar estas questes ajuda bastante co11111'1"1 11I':rall <le confiabilidade destes testes.
I I" I

A partir da clcada de 20, comearam a surgir evidncias de que era possvel, no caso de cncer de mama, optar por uma abordagem cirrgica menos radical que a mutiladora mastectomia preconizada por Halsted no fim do sculo passado. Verificou-se que se podia CC)[lservar a mama da paciente, melhorando desta forma a qualidade de sua vida, sem piorar o prognstico da doew{a. Com o passar do tempo, evidncias cada vez mais convincentes foram aparecendo. Hoje, a abordagern cirrgica conservadora, seguida de tratamento radioterpico com ou sem quimioterapia, tornou-se o tratamento padro em vrias situaes da patologia. Nos Estados Unidos, entretanto, em 1976, a equipe de Bernard Fisher, ao analisar as prticas que conservavam o seio da paciente, era bastante crtica: "Apesar de esforos antigos e recentes, questes importarItes continuam sem resposta, o q'ue impede o. aceitao universal do uso de uma abordagem mais conservadora no, cnceT de mamo.. Mesmo os poucos estudos clnicos aleatoTizculos, qv,e u:ualiaram as d~ferentes opes cirrgicas que mantm, o seio do. paC'iente, no conseguirarn estabelecer alm do. dvida razo.vel, o vo.lo'('desta opto teraputica" Estavam bem estabeleci das a necessidade e a oportunidade de organizao de um ensaio clnico sobre o assunto. Por um 'lado, havia muitas evidncias histricas de eficcia, por outro, dvidas sobre o valor real da opo. Sob a coordenao daquele famoso cirurgio, de abril de 1976 at janeiro de 1984, 2.163 mulheres com cncer de mama em estgios I e II foram aleatoriamente alocadas a uma das trs opes: mastectomia total (MT), tumorectomia e tumorectomia seguida de radioterapia (Tc+RTx). Todos as pacientes fizeram estadiamento axilar e aquelas nas quais se constataram linfonodos positivos receberam, adicionalmente, quimioterapia. A completa descrio dos detalhes de seleo de pacientes e de seu tratamento pode ser lida no artigo original, publicado no New England Journal of Medicine em maro de 1985.

qlll'

n;\O se equivalem no SI' I'!~[ere ao tempo at a recidiva ou tempo Jivn~ de (lo(~lH,a. A 1111'1118:1.1) d(~radioterapia nas pacientes que se sul nnderam a tUlnorec1.'lIllin alllllenta o seu tempo de sobrevi da.
Tempo at recidiva

1\ (t'if!:lll'a1.1 mostra que os dois tratamentos

1:i~~' -~~~~,~
% ::

--.-===::':=:::.~;
... 1m ... To + RTx
A

60 -

Ano

5Q -/~~2~-------1-~-r---f---_--o 1 2 3 4 5
586 625 520 554 356 382 212 241 121 149 67 88

Em risco

I'i/',II!:I \.\: Tempo at recidiva e tempo at metc--;tasepara um grupo .I,' \l:lI'il'III.(~S que receberam dois tipos de tratamento: mastectomia I,lill\ (~;I'I') e tumorectomia seguida de radioterapia (Tc+ RTx) Nldl! (~xcmplo, a Estatstica fornece uma forma eficiente de quanIlIil'I'I,:allda resposta de interesse (recidiva e metstase) e de mtodos 011' ,'11111 \lara(,i'io das curvas referentes a essas variveis para diferentes I.IIII.IIIIII'III.IIS. Como no caso ela aspirina (Exemplo 1.1), a forma de '111',11 Ili'I,;\C,Jill deste estudo o acompanhamento prospectivo das pa1\1'1111':: a\oca(,o aleatria aos tratamentos, procedimentos bsicos 1111111 11\lj'()dIH,;i'io de uma pesquisa com grande poder de resoluo da
I'

Figura 1.2: Incidncia de cncer de clon (1975) em funo do consumo de carne nos seguintes pases: Alemanha Ocidental (AOc), Alemanha Oriental (AOr), Canad (Can), China (Chi), Colmbia (Col), Dinamarca (Din), Estados Unidos da Amrica (EUA), Finlndia (Fin), Holanda (Hol) , Hungria (Hun), Islndia (Isl), Israel (Isr) , Iuguslvia (Iug), Jamaica (.Jam), Japo (Jap), Nigria (Nig) , Nova Zelndia (NZ), Noruega (Nor) , Polnia (Pol) , Porto Rico (PR), Reino Unido (RN) , Romnia (Rom), Sucia (Sue) dos porque trazem informao til para o planejamento econmico e da sade da populao. Podem, entretanto, como o grfico mostra, produzir indicaes de associaes que merecem estudos mais aprofundados. A partir desses dados, nada se pode concluir definitivamente, em termos de associao do fator consumo de carne com a doena cncer do clon. Os valores usados so mdias dos indivduos e, portanto, no se sabe se quem consome a carne a mesma pessoa que desenvolve o cncer. Alm disto, outras variveis no consideradas como, por exemplo, a quantidade de fibras na dieta, podem ser as responsveis pelo cncer.

'111,'::111'11'111 pauta.
1';Xi'lllplo

1.1: Consumo de carne e cncer do clon

/\ 1"il',II!a 1.2 mostra a incidncia (por 100.000 mulheres) de cncer 1111 I" li111 1 (' 11COllsumo mdio de carne na populao de vrios pases 1/\11111:1.1'1I11~', iv Doll, 1975). Uma associao claramente sugerida: 111111' I! 1'1 l11S111111l de carne, maior incidncia de cncer no clon. /\ 1':::laUsl.ica d(~sempenha aqui o seu papel mais tradicional, o .I" Illlil!IIIIII!111.1I di! ('olda de dados para o funcionamento do Estado. 1\ 1111/ ' 1111::1.1) 1.( )I.al (li! carlH" c a quantidade exportada so nmeros 1lIlilll'i!allll'III.I' l'llidados. Por outro lado, todo pas tem uma lista ,I" I, 1/'111:":: 11"1'1::11111' I'(!~',isl.j'() obrif!:atrio. Estes dados so coletaI I

Um grande nmero de estudos clnicos dedicado pesquisa da etiologia das doenas, isto , de sua origem. Etapa importante neste trabalho a descoberta de fatores, usualmente chamados de fatores

de' I'i:;co,associados com o aparecimento da doena. li 11 li\. dificuldade bsica nesse tipo de estudo que no se pode, 1'"1' II10Livosprincipalmente ticos mas tambm operacionais, alocar 11111 raLI11' aos indivduos. necessrio, pois, usar dados obtidos de 111111II llislln'ias. Examinam-se seus hbitos pessoais e as opes clnicas 1\lllIdll:'I'or seus mdicos. -Os estudos que seguem essas linhas gerais 11/111 l'ilal1lados de estudos observacma'is. i\1'1'l~s(~ntamos abaixo, sinteticamente, os resultados dos estudos c'cIIldll'l,idos por R. DoU e A. B. HiU, bioestatsticos britnicos, sobre a 1111111 II'i 111,:110 entre fumo e cncer do pulmo. Estas pesquisas iniciaramlU' I IC'vil lI) ,10 grande aumento da mortalidade causada por este cncer, 1I11r!1'l'vado na Inglaterra desde o fim dos anos 20. NII primeiro estudo, publicado em 1950, compararam-se dois grupclildc' pacientes. O primeiro, constitudo de todos os casos de cncer dI' 1'1 1I111;\,() de um conjunto de hospitais londrinos. Assistentes soci11111, c'HI)(~cialmente treinadas para, o estudo, entrevistaram todos os I'lll'i('IIL(~s internados com diagnstico de cncer de pulmo, levantandll IllIa llistria clnica e seus hbitos tabagistas. O segundo grupo, l'illlllladll de grupo controle, foi constitudo por pacientes dos mes1111 Ir!III)S pitais, sem diagnstico de cncer, na mesma faixa etria, do 1I11'lil110 SI~XO e da mesma regio de residncia que os casos anteriores. i\ Tabela 1.2 mostra os resultados obtidos. A associao clara
I'

foi prospectivo.
Coorfe.

Este tipo de planejamenLo (~chamado de Est'tulo de

Em outubro de 1951, os pesquisadores enviaram um questionrio simples a todos os mdicos da Inglaterra, aproximadamente 60.000 indivduos. () questionrio perguntava se o respondente j havia fumado ou no. Em caso afirmativo, pedia informaes sobre o que e quanto. Mais de dois terVJs dos mdicos responderam com detalhe suficiente para que seus dados pudessem ser includos no estudo. As respostas possibilitaram aos pesquisadores classificar cada respondente corno fumante ou no fumante. A definio de no fumante usada foi: um no fumante uma pessoa que fumou at no mximo um cigarro dirio, em mdia, por perodo inferior a um ano. Atravs de complexo sistema de acompanhamento, observaramse nos primeiros 10 anos, 136 mortes associadas ao cncer pulmonar entre os mdicos includos no estudo. Destas, apenas 3 eram de no fumantes. Para equalizar os perodos de acompanhamento nos vrios grupos, trabalhou-se com a taxa de incidncia por 1.000 pessoas-ano de exposio. Os valores desta taxa esto na Tabela 1.3. O risco de morte por cncer pulmonar das pessoas que fumam mais de 25 cigarros dirios quase 32 vezes maior do que o mesmo risco para quem no fuma. Tabela 1.3: Taxa de mortalidade por 1.000 pessoas-ano devida a cncer pulmonar (nmero de mortes entre parnteses) para no fumantes e fumantes No fumantes 0,07(3) Cigarros dirios 1-14 15-24 25+ 0,57(22) 1,39(54) 2,27(57)

rc 11'1.( ~.

'I 'n\II'ia 1.2: Nmero de fumantes e no fumantes entre pacientes 111' X II I11 asculino com diagnstico de cncer pulmonar e controles Grupo Cncer pulmonar Controle Fumantes 647 622 No fumantes 2 27

do

i\ rIIl'tlla de organizao deste estudo chamada de Estudo CasaI '(I'/I/r()le. poca, esta metodologia era muito criticada, pois, com 111l'1I j( LI.< Il~,podia produzir associaes esprias. Por isto, a evidncia, c'I I li 11'11 c:lara e forte, no foi convincente o suficiente. i\HHilll,os mesmos autores iniciaram um segundo estudo, cuja ca111I'Lcr(HLica bsica o fato de que o acompanhamento dos pacientes
li

Estes dois planejamentos, estudo caso-controle e estudo de coorte, so as formas usuais de organizao da pe~sa.etio.l..gica. Muitos outros estudos como os descritos acima foram feitos em"--p;pulaes variadas para se verificar o possvel papel do fumo. Em todos, a evidncia foi clara. Hoje, o papel de agente causador do cncer de pulmo amplamente reconhecido e justifica a militncia cada vez mais organizada contra o fumo.

I':xmnplo 1.6: Distribuio

do cido rico em homens

Nesta sitlla()io, {,o conceito de distrilmi()io estatstica que ajuda no estudo do fato m{,dico.

Talvmr, a tarefa mais rotineira no exerccio da Medicina seja a 1'llIllpal'a()io de um valor de uma medida de importncia clnica, tais 1'111110 t.(~mperatura, presso, ritmo cardaco e parmetros hematolgil'O:!,colll um padro. Como h entre diferentes indivduos uma grande VI\.l'il\.l;.i\.o nessas medidas, mesmo quando pertencentes a um grupo ho1IIIIl',I~Ii(~O, o padro no um nmero, mas uma. faixa. ()s (lados para a constrm:o desta faixa so obtidos atravs da IllI'dil:ao da caracterstica de interesse em um grupo representativo d,' I)(~ssoassupostamente sadias. Estes valores so sintetizados em 1I11I l',l'ilico,a partir do qual constri-se a faixa de referncia. I'::it.(~ (~squema foi seguido por pesquisadores britnicos na deter111i1111.tJI.O de uma faixa de referncia para o cido rico em homens. () I'l!:ildt.adofoi publicado na conceituada revista The Lancei (Finn ,'I. 1\.1"19(6). O valor do cido rico foi medido em 267 doadores de :11\.1I1',IIl~, gozando de boa sade, obtendo-se os dados apresentados na 1"il',lIt'a1.3.

Mtodos estatsticos so essenciais no estudo de situaes em que as variveis de interesse esto sujeitas, inerentemente, a flutua(:es aleatrias. Este o caso da Medicina. Mesmo tomando-se um grupo de pacientes homogneos, observa-se grande variabilidade, por exemplo, no tempo de sobrevida aps um tratamento adequado. Dosagens de caractersticas hematolgicas flutuam no s entre indivduos, como tambm no mesmo indivduo em ocasies diferentes. Na realidade, h varia(:es entre diferentes pacientes para qualquer varivel de interesse clnico. Portanto, para se estudar problemas clnicos, necessria uma metodologia capaz ele tratar a variabilidade de forma adequada. Convencionou-se chamar de Bioestatstica o conjunto de mtodos estatsticos usados no tratamento da variabilid~d~~~~'~i;~ias IE~clicaebiolgicas., A Bioestatsti~~fornece mtodos para se tornar decises timas na presena de incerteza, estabelecendo faixas de confiana para a eficcia dos tratamentos e verificando a influncia de fatores de risco no aparecimento de doenas . H uma aparente contradio entre a Estatstica e a Medicina. Por um lado, todo ato mdico feito no sentido de se fornecer o melhor a um paciente especfico. Isto se contrape necessidade de considerao de um conjunto de indivduos para a construco de um fato estatstico. ' Deve-se notar, entretanto, que ao tratar um paciente, o mdico se vale da experincia de eventos anteriores, vivenciada pessoalmente ou transmitida por outros atravs de livros e artigos. Assim, a Estatstica pode ser vista como ferramenta de organizao e validao do conhecimento mdico. Resumidamente, o objeto de estudo da Bioestatstica o planejamento e a anlise de estudos mdicos e biolgicos. Ambas as etapas visam reduzir a possibilidade de vcios no estudo.

fi>

40

E
.~ 30

'"
"O

Q.

(])

20

10

1"il',IIt':I. 1.3: Distribuio de cido rico (mg/dl) em 267 homens 1\ faixa ck referncia escolhida fixando-se uma pequena por1I'lll.l\.l':t~11I de pacientes cujos resultados no sero includos e deterIlllll\.llllo-s(~ o intervalo que engloba todos os outros indivduos. Por I'XI'lllpio, para os dados do cido rico excluindo-se 2,5% de cada "XI.II'lllt),ohtJ~lll-sea faixa [3,7 - 7,5] mg/dl.

1\ prillwira classificao til das formas de organizao de estudos 1,lllliel)s {~dada pela dicotomia: descritivos versus estudos ..------ estudos -_ .... _ .. _. --'-'_,._ 1'111111 )arat.ivo,,:. ( ):i pri uwiros descrevem uma dada situa(;o, sem preocupao de 1'llIllpara<;:'t.o. o caso do exemplo sobre o consumo de carne e cncer 11111'1'111111 (Exemplo 1.4) e das enquetes destinadas criac;o de padres ,I,' 1'1 'i'1!1'I!II<:ia. Qualquer conclusil,o no mer:1mente descritiva desses 1':ll.lldIIS <!stsujeita a crticas. NII s(~gundo tipo, existe internamente um grupo ele comparao. I:: I1 t.ii i'azm a distino entre estudos observacionais, aqueles feitos "11111 dados produzidos pela histria clnica de indivduos, e estudos ,'xlll'rillll)utais, em que o pesquisador interfere na alocao do trata1111'111.1>. Tanto o estudo sobre a aspirina (Exernplo 1.1) como o estudo 111"11'1' eil'1lrgia conservadora de cncer de mama (Exemplo 1.3) so " I'xllI'rilll<~lltaise, portanto, capazes de produzir evidncias potencial1111'111,1' 1IIIlito convincentes. J o exemplo sobre o cncer no pulmo (1':x"lIlpio 1.5) pertence categoria de estudos observacionais.
...
,

.. --""

....

"

..

.....

() 111'ullero de tcnicas usadas em Bioestatstica muito grande, \!alllllS t.ratar neste texto apenas de formas elementares de anlise de '\III\IIS, Por exemplo, no estudo da aspirina, a resposta considerada ,I" Illaior interesse era a ocorrncia ou no de infart01 urna varivel ,I il'llLI IllC).L Como vimos ~a reprodu~;ii~-~[~tabela d~-~;rtigo orlglii"l';-" 1i U'<'llieautilizada para a anlise dos dados foi o teste q'ui-qna.dmdo " " (';iklllo da mzo da.s chances. O teste nos permite decidir se o 1.llIl.alll<)llto ef1caz e a razo das chances medir o seu efeito. :--)1' a resposta de interesse no dicotmica, embora o objetivo da llIl,! is<)seja o mesmo, por exemplo, testar a existncia de efeito e qllllllt.iliear a sua eficcia, so usados outros testes, entre eles o teste I II: aiuda testes para comparar curvas de sobrevidas, como no I ':X, '111 pio L.3 sobre cirurgia conservadora no cncer de mama. 11111 I >1 arwj amento e anlise bem feitos so cruciais. Crticas sobre 1i Illi"'1l1a<;i'i,o de um estudo impedem que seu resultado modifique a I 11 ai il'a I"llica. Neste caso, todo esfo[(;o despendido no desenvolvi111"111.1 I dI) <~s1.lIClo estar perdido.

Neste captulo introduzimos, sintdicanwIlte, algumas idias importantes associadas Dioesbl,tstica. Seu tratamento mais cornpleto no objetivo deste texto. A Biocstatstica pode ser vista corno ferrarnenta de avaliac}io crtica da evidi'~ncia clnica ou de acumu1a.c;ocritmiosa de conhecimentos mdicos. A atualizao dos conhecimentos sc~ d atravs da interac;o com especialistas no assunto, mas principa.lmente por leitura constante da literatura recente na rea. A literatura mdica usa hoje um jargo estatstico que ser explicado ao longo dos captulos deste texto. Acompanhar esta literatura fundamental para todos os que querem ser bons prof1ssionais. Na Medicina, entretanto, a necessidade mais premente, j que o conhecimento muda com grande rapidez. Assim, a longo prazo, a capacidade de ler e entender fundamental. A tecnologia e a informtica esto mudando a forma de exerccio de muitas prof1sses. O impacto na Medicina em termos de aparelhagens para diagnstico impressionante. Um bom exemplo a rapidez com que se incorporam o raio-X, o ultra-som, a tomografia computadorizada e a ressonncia magntica. Existe, entretanto, um outro movimento, ainda pequeno e muito controverso, que o uso do computador corno auxiliar no processo de diagnstico clnico. A experincia, de um grupo ele especialistas agregada em um programa, usado durante o processo de diagnstico. cedo para se saber aonde essas experincias vo chegar. Sua existncia deve entretanto ser conhecida. Outro movimento que comea a ter importncia na forma de exerccio do mdico a preocupac;o com a qualidade do servio. No exterior, os hospitais so cada vez mais administrados, incorporandose na rotina esforos para a melhoria dos processos usados. O objetivo no s proporcionar melhores servios, mas tambm diminuir os custos. Este movimento de promoo da qualidade no oferecimento do servio mdico envolve muitas atividades de quantificao, para os quais so utis as noes de Estatstica aqui apresentadas.

(~aptulo 2

()rganizao da Pesquisa Mdica

: 11'1;1111

,11I1'I11\.is, noticirios de televiso e revistas tm usualmente uma Sll1>l'<l sade. Neste espao so relatados os avanos da Medicina Llli: I 1'llIlllInovos tratamentos, associaes recentemente descobertas 1'1 li 11'dida ou outros hbitos pessoais e alguma doena ou forma de I>11 'VI '11<,:ao, etc. 11111 (~xemplo tpico a notcia da primeira pgina do Jornal do 1111I:;il d(~28/07/89, dia da abertura do 13~ Congresso Interamericano di' ( ~al'diologia no Rio de Janeiro, transcrita a seguir:
IlIcor

diz que safena e droga tm efeito igual

{'lua Pesquisa feita pelo Incor, publicada em janeiro no /\'//I,{:,/,;an Journal of Card'iology e apresentada no 13~ ( :llllgnlsso Interamericano de Cardiologia, concluiu que IISpacicmtes com problemas cardacos submetidos a cirur1',iaH de ponte de safena apresentam uma evoluo clnica :,I'III<~lhante a dos pacientes que so tratados com dietas I' Ill<~dicamentos. No entanto, o mdico argentino Ren 1"ll.Valoro, o primeiro a realizar uma operao de ponte de :4i11'1;lla 110 mundo, classifica de "confusos" os resultados de III'SIJ 11 isas como a realizada pelo Incor.

Neste captulo dmnos o primeiro passo para o desenvolvimento de uma avalia{.;ocrtica de notcias COlnoesta. Primeiramente identificando os problemas tpicos da pesquisa clnica,: o estudo da aRsociao entre a exposic.;o a um fator e o eventual desenvolvimento de urna doena, a comparao de op{.;esteraputicas e o estudo de fatores de prognsticos para pacientes submetidos a um dado tratamento. Depois, apresentando aS.9.~latrofOI!E~?J?..<A:~~~2!~!:'_5~,J?~~i.~.9'.ytilizadas na soluo desses problemas: !?.!~1{12~.,_stes{.;.tiYDJ:l, estudos caso-controle, estudos tipo c()()~tee ensaio clnico aleatorizado. "N~s~~t~d;~- d~~critivos, apresentam-se de maneira organizada informaes....~cientes atendidos em um servio ou organizam~ sob uma tica mdTddos produzidos pelas instituies esttais de coleta de dados. Os ~~5:~~e e de coorte so comparativos, ou seja, a concluso final obtida travs de comparao entre dois grupos de pacientes. Nos estudos caso-controle, como o nome indica, a comparao se faz entre um grupo de doentes e um grupo de pessoas sem a doena estudada. No ~studo de coorte compara-se um grupo exposto ao fator de risco em estudo,com outro sem o fator. Esses estudos so observacionais, ou seja, o pesquisador no impe um tratamento mas usa os dados produzidos pela histria do paciente .. Essas formas de organizao so freqentemente, por razes ticas ou prticas, a nica estratgia de pesquisa vivel. A forrpa mais conclusiva de pesquisa clnica o ensaio clnico em que, alm da presena do grupo de controle, a comparabilidade dos grupos garantida pela alocao aleatria dos pacientes aos tratamentos. O estudo detalhado dos planejamentos de estudos clnicos em geral objeto da epidemiologia. Textos da rea, como Breslow & Day (1980, 1987) e Rothman & Greenland (1998), devem ser consultados para descrio completa de cada forma de pesquisa apresentada aqui. A generalizao dos resultados de um estudo clnico a grupos diferentes daqueles usados originalmente tarefa que merece cuidados especiais. De forma geral podemos dizer que, antes de ser incorporado clnica, os resultados de um trabalho de pesquisa so replicados em outras instituies, freqentemente em outros pases.

1';111 11111 I)studo descritivo o objetivo a pura descrio de um 1'111.11 111(\<\ iCII. Sua principal caracterstica a ausncia de um grupo til' ('(1/111 ml'al;;'\.() , Um grande nmero de estudos se encaixam, grosso 1IIIIl I(I, II('sl.a classificao. Sem preocupao de sermos exaustivos, l ,i 1.11/1111::-1 l)S sl)guintes tipos: estudo de casos, estudo de uma srie de ('11: I( 1:1 (' I!S I.lldos baseados em dados institucionais.

Clnicos com inc1ina(:i,o cientfica usam os dados dos arqu i vos de suas institui(:es para produzir artigos que consistem na apl'l! sentao organizada dos resultados dos seus tratamentos pn~fl)ri(II)s, na dcscri(;i',o dos pacientes tratados e na divulgao de outras illJm. ma(:es que julgam relevantes. Os artigos com estas caractersticas so charnados de Estudos de uma Srie de Casos. So de boa qwtl i dade, se baseados em um conjunto de casos em que h unifol'luida<\,! de tratamento e quando todos os casos, satisfazendo a um critl)J'ill objetivo, so includos. Estudos de uma srie de casos no fornecem informaes COIlfiveis para comparao entre tratamentos, nem podem s(~r a base) para opinies sobre etiologia. Isto porque no so estudos comparativos. As opinies sobre etiologia, preveno e teraputica, frcqiimltemente encontradas nas concluses desses artigos, devem ser visl.as como um primeiro elo de uma cadeia de evidncias a serem obtidas, e no como opinio definitiva. Mesmo com tais limitaes, esses (!S" tudos so fundamentais para o avanc:o do conhecimento mdico e111 patologias muito raras.

( ) l',c; I.I Ido de casos consiste na cuidadosa e minuciosa dcscril)io, Ili 11'111I1 l III mais mdicos, do diagnstico e evoluiioda doena de um Ili '( 1111 '111) Ilmero de pacientes. o tipo mais bsico de estudo clni1."111 grande tradio na Medicina. Muitos peridicos possuem 1IIIIil:;l'l:ao especial para o relato de casos interessantes. Inmeros gruI 1'( "'1111 !/Il-se periodicamente para analisar casos especficos. Muitos 1.1'111.111 I 1I'lIl.oS,hoje incorporados prtica mdica, comearam com a (d I:il 'I'val:ao cuidadosa de um ou alguns poucos casos.
('(I "

li ':;

() ol'l.almologista N. Gregg, de Sydney, na Austrlia, observou, no Ill'illll!il'o semestre de 1941, vrios recm-nascidos com catarata con"/'" iI.a. As caractersticas pouco usuais dos casos o levaram a procurar 1IIIIa l!xplicao que envolvesse as mes. Verificou que todas haviill1l :;i<\1Iacometidas de rubola em uma grande epidemia que havia IIl.illl',icioa Austrlia no ano anterior, exatamente durante o primeiro I.li11 11 ',c;I.J'() de gestaes que resultaram no nascimento das crianas ('(1111 cal.arata congnita (Gregg, 1941). As observaes clnicas do 1)1', (:J'(!gg criaram as condies para que vrias pesquisas posteriores "11111' I1I ssem hoje, alm de qualquer dvida razovel, haver associao l'III.I'I!I'lllJi""olano primeiro trimestre da gravidez e defeitos congni1.1.:1. I';ssa constatao e o desenvolvimento de vacinas determinaram 11. iIIi1'\)<1 Il(:iio do procedimento de vacinao das mulheres em idade
11'/1. i I.

Os servios de Oncologia Clnica da Santa Casa de Miseric<'>l" dia de Belo Horizonte e do Centr() de Quimioterapia Antiblstica I! Imunoterapia do Hospital Belo Horizonte trataram, de 1977 a dezmllbro de 1984, 150 pacientes com linfomas agressivos usando o esqll<! ma quimioterpico CHOP-BLEO. Brando et aI. (1987) analisa ram os dados correspondentes com vista identificao de fatol'l!s de prognstico para a obteno de remisso completa e maior tClll pll livre de doena. Em relao remisso completa, a anlise COl\julIl.a dos fatores considerados identificou trs fatores independentes: lJis tologia, estdio e existncia de sintomas. A partir destes fato1'()s l)S pacientes foram classificados em 18 grupos; a remisso completa val'i ava de 17% a 95,7%.

Com este nome agrupamos os estudos que apresentam, I'll.ica clnica, dados coletados por institui(:oes estatais.

com uma

forma<J) de grnpOf-> d<~fOUIl<\. iIJ(l<)pendente, os controles no so <~f->colhidos de forma af->f->ociada a um caso especfico. Preocupa-se apermf-> em garantir que o grupo de caf->Of-> f->eja,na sua totalidade, parecido corn o grupo <le cOlltrolef->. O caso particular do empa.relhamellto em que h apenas um C011trole para cada caf->O denOluirw.do paremnento. No pareamento, para cada caf->O, um control(~ com caracterf->ticaf-> bsicas semelhantes ao do caso () ef->colhido. Os estudof-> de caf->o-contro!Cf->iio uma fonna de pesquisa simp1cf-> e eficiente, por if->f->o muito utili;;,c1da. Atnwf->dela, j se verificararn ou se confirmaram af->f->ocia(:m entr<~ fatoref->de risco e vrios tipof-> de cncer. Niio h dificuldades ticaf->para sua implementao e, portanto, Of-> dad(lf) usadof-> f->iio Of-> de seres hUlIlanos. Isto livra o pesquisador de difceif->generaliza(:es inerentes aos estudos desenvolvidos em animais. O tempo gasto e os custos associados so relativamente pequenos, j que, normalmente, so utilizados dadof-> preexistentes. So particularmente adequados ao estudo de doenaf-> raras, porque o pesquisador come(:a com um grupo de pessoas qu<~ comprovadamente tm a doen(:a. Sua grande limitao a suscetibilidade aos vcios de informa8,(l e de seleo. Um estudo detalhado desses vcios, formas de evit-lof-> na etapa de coleta de dados ou durante a anlise dos dados, regraf-> claras para a escolha dos casos e controles extrapolam o objetivo def->k texto, mas so fundamentais para quem quiser utilizar esta forma eI(~ pesquisa. Existem vrios livros sobre o assunto, entre eles, Breslow & Day (1980) e Rothman & Greenland (1998).

() Ministrio da Sade publicou em 1991 o livro "Registro Nacjollal de Patologia Tumoral- Diagll(n.,tico (le Crmcer - DrasiI1981/85". I) II1 total de 442 laboratriof-> ef->palhadof-> por todo o territrio nacjollal contriburam com maif->de meio rnilho d(~ diagnsticos, que rllram codificados e compiladof->. Apesar d(~essa publica(:o no apresl~lll.artodos os diagnf->ticos durante um dado perodo de tempo, nem 11111<1 amostra probabilf->tica, gera muita informao til. De forma p:uticular, destaca-se a distribuio segundo idade, sexo e rgo de III~senvolvimento dos cnceres.

Estudo caso-controle uma forma de pesquisa que visa verificar se selecionados porque )tm uma doen.0 - os casos - diferem f->ignificativamente, em relao exposio a um dado fator de ris) II<~um grupo de indivduos comparveis, mas que no possuem a doena - os controles. Este estudo comea com o levantamento da histria clnica de to< los os pacientes selecionados. Com as informaoes, 2rocura-.J3sh.er f->e.JL fa t.Qr...Jie-..r:is.cQ. ...es.t.,Lp.I:.eseute."mais. ..Jr~:lJJ~nt~m~[lt. ... ()lL(;'.rrLniYe1 Inat:U~.kyg,-...,ntr:-9..9lilllL_illle ~_.91lj;gJl.tI.Ql~9 .,. Se a evidncia for f->uficiente,o pesquisador concluir que existe uma associ~_]}tIE).o ratord~ ..:risce a. doenc:a. .- Idearnente,';~-~;~evem ser todos os que ocorreram durante Illn perodo de tempo em uma populao definida. Os controles devmn ser pessoas comparveis aos casos, mas sem a doena, ou seja, 1)( ~f->soas que, se desenvolvessem a doena, seriam escolhidas como caf->Of->. Os grupos de casos e de controles podem ser formados de forma 1~lllparelhada ou de forma independente. No primeiro esquema, para cada caso um ou mais controles semelhantes so escolhidos. J na
i ndivduos,

Gomes (1992), em tese de doutorado na Faculdade de Mediei IIiI da UFMG, realizou estudo caso-controle com o objetivo de avaliar ;\ influncia de 'fatores de risco no cncer de mama, utilizando dael<n~ de nosso meio. Como casos foram escolhidas pacientes portador:ls de cncer de mama registradas no Hospital das Clnicas da UF!VI( :, que satisfizeram os seguintes critrios de incluso: idade epoca III diagnstico entre 25 e 75 anos, diagnstico feito entre 1978-1 !JH7 (' confirmado por exame antomo-patolgico, tumor originrio elo I.<,<'j do epitelial e ter sido submetida a algum tipo de cirurgia na 111:111111.
I

( ~"IIIl)controles foram escolhidas pacientes com idade igual elo caso (1llais C)II menos dois anos), data de admisso ao hospital igual data ,I,' ,', li I!i rluao do diagnstico do caso (mais ou menos seis llleses) e ,'\; 11111' c'\nico da mama sem indicao de patologias mamrias. De i 'IIl'c Ic)c:c nn esses critrios, foram selecionados dois controles para caIli\ c';\SC I. O primeiro foi selecionado no mnlllllatrio de ginecologia '" " :;i')',111 \(10 no registro geral do hospital. A anlise estatstica, en111'v:irias outras concluses, mostrem cllw a pn:senc,a na paciente de 1I i::!c 'Iria familiar de cncer de mama aunwuta o risco desta patologia 1'111 :-:,:-:;1 vezes.
II

possvel quantii.car o risco de d(:senvolv(:r a doelH.:a COlup;l,rando-se o grupo de expostos ao risco com o grupo de, nilo exposLos. Estudos de coorte siio grandes, longos e nonnahnentc, caros. Quanto mais rara a dO(l]H,aem questo, maior o nmero de pacienLe:s que precisam ser examinados. Embora, do ponto de vista terico, os e:studos de coorte sejam melhores que os estudos caso-controle, estes ltimos siio mais comuns. Exemplo 2.5: coronariana Personalidade e desenvolvimento de doena

1';sLIll10de coorte uma forma de pc:squisa que visa verificar se 111I Ii vcluos, selecionados porque' foram c:xpostos ao fator de risc~ cl:;i'Ili!C >1 vmn a doena enl q1llstiio, eUI maior ou nlenor proporo do c1111' 11111 grupo de indivduos, comparveis, mas hiio expostos ao fator i I" risco. 1';111 contraste COIllum estudo caso-controle, um estudo de coorte : IV; 11 IC,:a no tempo e c()loca nfase no fator de risco. Identificam-se 11111 ,1'/l1pOexposto ao fator e o grupo controle, constitudo de pessoas 'I' Il' 11;10 foram expostas a ele. Os dois grupos so acompanhados por 11111 1)\ ,rodo de tempo e as taxas de incidncia da doena calculadas. ~;i' \'ssas taxas so significativamente diferentes nos dois grupos, o 1'1 ':IC I'Iisador conclui que h associa(;o entre a doen(;a e o fatoL ( )s estudos de coorte possuem vrias vantagens. O pesquisador II'111 a possibilidade de usar critrios uniformes, tanto na identificao ,Ia I)I'c,sena ou no do fator de risco ao incio do estudo, quanto lia vi,rificao da ocorrncia da doena nos vrios exames de acom11; 1.11 IlaUlento. A comparabilidade dos dois grupos pode ser verifica,Ia IIC)incio do estudo e identificadas as variveis para as quais so IIC 'i'i'ss;.rios ajustamentos na anlise dos dados. 1';111 nm estudo prospectivo, o pesquisador tem muito mais liber,Ial li' s"bre o que medir e como medir, j que no se restringir ao li:;" e1c,dados j coletados. Uma outra vantagem, que s poder ser II 1IIII'idamente apreciada ao se estudar a metodologia de anlise de ,I:u IIIS, (, que os estudos de cOOlte nos permitem obter diretamente 1IIIIa l,sLinlativa de magnitude do risco relativo. Isto significa que

Um estudo de coorte com o objetivo de avaliar o possvel efeito da personalidade no risco de desenvolvimento de doena coronariana foi conduzido ent.re: 3.154 trabalhadores do sexo masculino com idade de 30 a 59 anos (BramI et al., 1976). Os indivduos entraram no estudo entre 1960-61 e foram acompanhados por um perodo mdio de 8 anos e meio. Atravs de entrevista no incio do estudo, foram classificados em dois tipos de personalidade, A e B, sendo os primeiros mais agressivos, competitivos e ansiosos. Os resultados da Tabela 2.1 indicam que nas duas faixas etrias consideradas os percentuais de indivduos do tipo A que desenvolveram doena coronariana so aproximadamente o dobro dos encontrados no outro grupo. Tabela 2.1: Percentual de indivduos que desenvolveram nariana segundo faixa de idade e tipo de personalidade Personalidade doenca coro>

A
39-49 50-59 8,9 15,9

B
4,2 7,6

Grupos de pessoas so selecionadas para o estudo de coorte por uma variedade de razes. Apresentamos a seguir dois exemplos.

() e~studo sobre os efeitos da radiao nos sobreviventes da bomha at/)Iltica descrito por Miller (1969), ilustra uma situao em que 'l ",I'III)C) foi escolhido para com)Ol' a coorte por ter sofrido uma exJlosi(;ao de intensidade pouco COlnum e o objetivo do estudo era verili('lu' IlS (~fe~itos desta expofJie;iio. () ('ilissico estudo de Doll &, Eill (1%4) sobre associao entre 1'1111('1'1' 110pulmo e fumo ilustra a e~scolha da c:oorte pelo fato de 'I 1',I'IIJ)C) possuir caractersticas qne fac:ilitanl a obtene;o dos dados 'ti' d li',~a (~xposio ao fator e o seguimemto dos pacientes. Foram a"'lIIIJlluilmdos mdicos da Inglatc~lTa, um grupo fcil de contactar e 111 1 (1I1altodas as mortes s8.0 rotineirame~nte bem documentadas. 1';111 muitos estudofJ de coorte os grupos de comparao so obtidos ai )('ISIl incio do estudo, de acordo com o nvel de expsie;o ao fator. 1'1 li' (!xemplo, as coortes do Estudo de Framingham sobre doenas 1'III'OII:,rias(Kannel et aI., 1972), foram construdas dividindo-se o ",I'IIJ)C) acompanhado de acordo com hbitos de fumo, nveis de coles1.1'1'01, dc. Nestes caBOSn8.o h necessidade de um grupo externo de ('llIlll>araao. Ij;m outras situae;es, particularmente quando um grupo submetido a uma exposio pouco comum estudado, importante comparar ,l I'(~sultado observado com aquele esperado, caso os indivduos no I.iv(~ssem sido submetidos ao fator de risco. Usa-se a experincia da populao em geral, ao tempo em que a coorte formada, como Iladro de comparao. Finalmente, usa-se tambm como base de comparao outra coorte !'( mnada por pessoas no expostas, parecidas nas caractersticas deIllogrficas com o grupo exposto. Por exemplo, para uma coorte de radiologistas, Seltser e Sartwell (1965) usaram como padro de comI>arao dados de oftalmologistas e otorrinolaringologistas. Detalhes adicionais sobre a seleo de coortes e outros aspectos' relacionados a esse tipo de estudo podem ser encontrados em Breslow ,Iv Day (1987) e Rothman &, Greenland (1998).

Siio usados qnando {~iU('I'I'I<I'I valor de uma nova terapia 011OH mritos da terapia exist,elltr~ (~sl,lil ('m disputa. a metodologia ai l priada para a comparae;8.o ell, tratamentos. Aps um critrio de admissiio ter sido definido, os paciente~s SI\.O, :\ medida que entram no experimento, alocados de maneira aleatria 11.1 l grupo controle, que recnbn a teraputica padro, :~ao grupo I.ral.lI mento, que rncnbn a tnraputica sendo testada. Todo esforo de~v(~ SI'I' feito para oferecnr os mnsmos cuidados aos dois grupos. Termiua( IIl o experimento, tcnicas estatsticas siio usadas para se decidir Se!Illi ou no diferew;a na eficcia das tnr:l,pias envolvidas. Esta uma forma nxperimnntal de pesquisa, isto , o pesquisa( I( li' interfere de maneira deliberada no CllTSO natural dos acontecimenl.os, em contrapc)f)ic;iio aos efJtudos observacionais, em que o pesquisa< I(lI' se restringe coleta de dados, sem alterar a dinmica do ))J'OC!,SSI I em considerac;iio. Por isto est sujeita a constrangimentos {~tiCI l8, disciplinados pela conveno de Helsinque. O conhecimento pelo paciente ou pelo mdico do tratanwlll.ll I1 ser administrado pode infiuir na evoluiio da doena, no atra:v{~sdi' fatores extrnsecos, mas diretamente pelo processo de auto-sug('sl.lI.Il, o efeito placebo, que traz vcios ao estudo clnico. A nica maneira de eliminar o efeito placebo nos grupos COIiIJ liIl'a dos realizar, sempre que possvel, experimentos cegos, nos qllai," 'I paciente ou o mdico no conhece o tratamento, ou duplo-c!,g'l, 11' 1 qual ambas as partes desconhecem o tratamento. Este ideal, (!lil.j'(' tanto, nem sempre . factveI.
)1'(

Ensaio clnico aleatorizado um experimento mdico, realizado C()1I1 o objetivo de \eIifi,ar, entre dois ou mais tratamentos, qual o fuais efetivo. - .. ---

Muitos avanos no tratamento do cncer de mama tm sici() ('H tabelecidos atravs de estudos realizados pelo National Sur:q:(l,! IlrI juvant Breast nd Bowel PTOject (NSABP). Em 1985, discuLiasl' 11 necessidade de se submeter quimioterapia ou hormoniotera,pia, JlII cientes de bom prognstico, logo aps a cirurgia. Em pal'l.i('.lillIl', havia evidncias de vrias origens de que o tamoxifeno pode~rill 1111' lhorar ainda mais o prognstico dessas pacientes. Naquela {'PO<:II, 11 tamoxifeno j era usado largamente no tratamento de pacienl.(!s <:(1111 cncer de mama. Diante disto, o NSABP iniciou o protocolo I\ 1,1 para determinar a eficcia do tamoxifeno em pacientes consici{!l'lIdllll

ch ~ !lc>lUprognstico, isto (~.ilqudas COIntllmOl'es com receptor de esLrc'lglmopositivo ( > 10 Inwl), idade inferior a 70 anos, com cncer de 1IIIIIIIaopc~n\vel e linfonodos axilares negativos ,to exame histolgico. I<'c lI'alJl criados dois grupos de pacientes atravs de aleatorizao ri ,j I.a e1C!1 Il.m de estratos definidos por idade e tamanho do tumor na 1Illllisc~c:illica, tipo de cirurgia e concentrao de receptor de esl,rc'IJ',c'IHI.Um grupo recebeu tamoxifenu (10 Tng por dia, via oral, dllllS V(!Y,(~S ao dia) e o outro, placebo, indistillguvel do tamoxifeno 1111 IIpllrf!tlcia e gosto. Alm disto, o ensaio foi organizado na forma
( IIIJ
li (I

cc~go.

1\ Ilc\s acompanhamento das pacient(-)s por um perodo de at 4 all'I:;, c,JJlstatou-se uma diferen(;a significativa em termos de tempo Ij vr" IIc!cloena em favor das pacientes que receberam o tamoxifeno. N( 1 )',I'llpOtratamento, 83% estavam livres da doena aos quatro anos IIlli'lH a cirurgia, enquanto que no grupo placebo esta porcentagem era, cl(' 'i;\'X,. Este estudo, publicado por Fisher et al. (1989), contribuiu clc'c'i:,;ivamente para a adoo do tamoxifeno como quimioterapia ad.illvaIIL(!logo aps a cirurgia em pacientes de bom prognstico.

Al(~m disto, a alealorizi\I,:il'l l'lilllilli) IIS \'cios dl~ sele(:o. (: ('1:11'l1 que se os indivduos sn alocados ,,11';11 mimlwllte aos diferenj(!s grll pos, n,o lli\' a possibilidade d(~ qlll~ prder(~ncias pessoais do inwsti gador, no qne s(~n~f(~n~ a qual (; o mdhor tratamento para um dd(~r' minado paciente, venllilm a alterar os resultados do estudo. Quando o mnwro de pacientes (~p(~queno, a aleatorizao torna os grupos apenas aproxinladanlent(~ comparveis. Para melhorar a capacidade ele dcteu;,o do deito pdo experimento, dois procediment.os so usados nessa situao: as i~~.~:!2~~,:,:,~2~:.-::stratificao e de ajusk Na estratifica<;,o dividimos os pacientes crn subgrupos de acordo com variveis que reconhecidamente afetam a resposta ao tratamento e fazemos aloca(;o aleatria dentro de cada subgrupo. As t(;cnicas de ajuste, geralmente mtodos estatsticos multivariados, fornecem meios de compara,o entre os grupos, vlidas mesnw quando estes diferem em uma ou mais caractersticas conhecidas. N,o demais ressaltar que apenas a aleatoriza(;o pode produzir comparabilidade em variveis que, embora afetem a resposta, no so ainda reconhecidas como influentes pelo pesquisador.

1\ rmposta de um indivduo a uma teraputica varia de acordo I'111 II SIJas caractersticas pessoais. Assim, para que as diferenas porV(lll.lII'adetectadas sejam realmente devidas diferena na eficcia da:; I.c'I'apias, fundamental que os grupos de tratamento e controle ::",ialll comparveis. 1\ \'lllica maneira completamente segura de se atingir a compaIiIlli I idad(~ a alocao aleatria dos pacientes participantes no ex1"'lilll(III.O aos grupos de controle e de tratamento. Existem vrias 1,'c'llicas de aleatorizao, como discutidas por exemplo em Soares &
WII

(I!)K:~).

1\ )';Iande vantagem do uso da aleatorizao est no fato de que os d"i:; ,I'YIIPOS obtidos sero semelhantes em todos os aspectos, exceto, (' ('I:u'", 110que diz respeito ao tratamento recebido. Isto acontece 1"lI'qll(' a I.endncia aleatorizao fazer com que os grupos apresen1"111a:; 11}(~SmaS distribuies para as caractersticas dos indivduos, ("lIilll'(:itias ou no. Isto especialmente verdade quando o tamanho d( 1:1 J',rllJ)()S(~grande.

A alocao aleatria pode ser implementada atravs de esql W mas bastante simples tais como o lanamento de moedas ou dados. No entanto mais comum o uso de nmeros aleatrios, gerados [l0l' programas de computador ou lidos de tabelas especiais, como a ap]'(~ sentada na Tabela AI do apndice. Para usar esta tabela basta escolher uma linha e uma COlUlJaC~ seguir em qualquer direo de forma sistemtica. O nmero de dgi 1,( IS a ser usado depende da situa.o. Para se alocar 100 indivduos a dois tratamentos (A e B) so necessrios dois dgitos. Os 100 indivlllos so primeiramente associados aos nmeros 00 a 99. Por exemplo, (I~, nmeros mpares so alocados ao tratamento A e os pares ao LraLa mento B. A alocao aleatria amplamente utilizada em ensaios clnicos c' em estudos experimentais com cobaias e trata-se de um procedilJH!111,1 I com regras claras. O termo aleatrio no deve ser entendido COlllo alocao desordenada ou feita de forma ambgua ou confusa.

1';HLudocomparativo um termo genrico usado para designar I)HI~HL11doH caso-controle, os estudos de coorte e os ensaios clnicos. ( )HIIIliH primeiros so principalmente eHtudos etiolgicos: procuram d('HI'ni>rir associao entre fatores de riHco ambientais ou caractersl.il:aH 1)(~HHmS e a doena. Criam maiH um elo na determinao da l'allHalidade da doena em estudo. 1(1)( 11~1l1 ser estudos observacionaiH HO OHpaci(~nt(~H no Ho alocados all'al.oriamente aos fatores em oHtudo. NOHHe caHo, UHam-se apenas os d:u loH obtidos no exame da vida pregrcsHa dm pacienteH. IHto em 1'llIll.l'aposio aos ensaioH clnicoH, em que OHlJaci(mteH Ho alocados ali 'al.Ilriamente aos tratamen/,OH. Ao He iniciar um estudo comparativo fundamental identificar a I'!':''1 )(lH 1.'1de interesse. PodemoH esta,}' intercHHadoH apcnaH na, ocorrl~llI:ia da cura da doen(:a ou na remissi'io do tumor, caso em que a I'!~HpoHta uma varivel dicotmica. Alternativamente, a resposta de 111 ail lI' interesse pode HeI' o tempo de sobrevivncia, ou o tempo da l'I~lllisHiioat a recidiva. Nm ltimos anos, ndices de qualidade de vida comearam a ,ser considerados como respostas de interesse, ao lado d(~medidas clnicaH de efeito de tratamentos.

como no caHOd(~eHtudoH caso-controle. Hoje aceita por tOdOHa necessidade de um grupo de cOlltl'Oll\' Historicamente, entretanto, iHto nem sempre foi assim. MuitoH IlI'!l cedirrwntoH mdicoH inciicienteH, colno o congelamento do esttJlllal'.( l no tratamento de lcera gHtrica (Rc!ffin et al., 1969), foram uHadoH por longo tempo simplcHmente porque, ao se estabelecer sua dic;kia, no se fez nenhuma compan1(~o. O estabelecimento de um padro de comparao usual na prtica mdk. O clnico compara o paciente Hob Heus cuidados, hoje, <:0111 outros que j tratou ou estudou. Baseado nessas experincias, clecid(~ o procedimento que usar. Assim, a exigncia de grupo control(~ (~ mera explicitao de procedimento mdico padro. A aceita(;o do resultado do estudo depende, fundamentalrll(~IIL(' da comparabilidade dos dois grupos. Parte pondervel dos cuidados no planejamento dos estudos comparativos visa garantir esta comparabilidade.

I(kalmente, a comparao dois tratamentos, A e B, consiste em :,1'aplicar o tratamento A em um grupo de indivduos e medir o efeito (11)tratamento. A seguir, determina-se o efeito do tratamento B, no IIWHtllO grupo. Qualquer diferena observada seria devida unicamente aoH tratamentos. Isto permitiria estabelecer diferenas na eficcia I" d,l'I~eles. 1';Htcexperimento ideal, por razes prticas ou ticas, impossvel "I~ HITrealizado na maioria das vezes. Por exemplo, como aplicar o :'1')',1111(10 tratamento se o paciente morreu? A soluo a criao de ,11 )iHgrupos de pacientes, to parecidos quanto possvel. Cada grupo 1'I'I'ld)(~ um tratamento e os resultados so comparados. Como usual11"~llt.l~ OHdois tratamentos comparados so o padro e um tratamento :dI.,'1'1 mtivo, os grupos usados recebem os nomes de grupo controle e .rf'l'1I1)() tratamento. Estes nomes so mantidos em todas as circunstnf'i:\:" IIWHmoquando a comparao no mais entre dois tratamentos ,

Quando a contribuio de um fator, identificada em uma aw't.JjHI' individual, pode ser total ou parcialmente atribuda a outro, dizm 111 lS que estamos diante de uma situao ~~mque h confuso de deiLIls (Datta, 1993). Um fator de confuso pode ocorrer em qualquer tipo de eHtlldo, incluindo os experimentais. Em muitos estudos epidemiolgicoH, a idade e o nvel scio econmico si'io potencialmente important(~H I'a tores de confuso. Por exemplo, suponha que a idade um l'aLI lI' de risco para uma doena e um estudo tem como objetivo avaliar se esta doena est associada a uma determinada exposio (pol.(~J 1 cialmente fator de risco). Se pessoas expostas so 'mais velhaH '1111' pessoas no expostas, como se poderia saber se o efeito observa( 11) para a exposio realmente devido exposio ou idade? EIILI\() neste caso a idade um fator de confuso. Para que se possa dizer que uma varivei um fator de risl'l) para uma patologia, preciso produzir evidncias de que no 1~J(isLI'JII fatores de confuso, isto , variveis associadas ao fator e dl)(!Jll'll que explicam a associao observada. Em geral, uma manif<~Ht;U,:I;1 l necessria, mas no suficiente, de um fator de confuso em 1.1111 11111 III estudo que ele esteja associado ao 'fator de risco e docIll~a, <:1111111

I r::ator de risco I --------

.. - I

Doena

'\
Fator de confuso

/
a re1ae,o entre fator de confuso,

1"i",lll'a ~.I: Diagrama ilustrando l'aLI li' (lI! risco e doena

1';xisLI!m duas maneiras de abordar a inHuf!ncia dos fatores de 1'lllIl'llsao: control-Ias na etapa de planej amento do estudo ou na I'Lal'a di! anlise dos dados,

Considere um estudo caso-controle planejado para estimar o poso. sve1 efeito do uso de plula anticoncepcional e cncer de mama. COllle) o nvel scio-econmico (NSE) um conhecido fator de risco para I\. doeHe;a, para avaliar a associao com o uso de plulas anticoUcCI) cionais, recomendada urna anlise estratificada por NSE. Um outro exemplo um estudo de coorte para estimar o efe~i LI) da exposio serragem da madeira na ocorrncia de doenas ]'(~spiratrias crnicas mn trabalhadores de fbricas de mveis, do sexe) masculino e de meia idade. Corno o fumo conhecidamente um fato!' de risco para a doem;a, deve-se considerar o hbito de fumar corno um fator de confuso e usar urna anlise mtratificada por este fator. Outra forma consiste na utilizao de tcnicas multivariadas espl~cialmente desenvolvidas para isolar a contribuio especfica de cada fator. Elas exigem o uso de programas de computador especficos I! s conseguem, entretanto, controlar o efeito de fatores conhecidos. A identificaco de fatores de confuso e de estratgias de controll! terna importc~nte da epidemiologia, O leitor interessado pode lI!!' mais sobre o assunto, por exemplo, em Kleinbaum et aI. (1982) I! Rothman & Greenland (1998),

I\s IJrillcipais estratgias para contornar o problema criado pelos 1'111,1 II'I'Sdl~ confuso so descritas a seguir. 1\ I'ri fileira, na fase de planej amento do estudo, usar a aleatori'/.1\.1::111 1'/llIl a homogeneizao, 1\ all!:tJorizao faz com que os outros fatores que, alm do trata1111'lilll, al'dam a resposta tenham a mesma distribuio nos diversos )',11'1)( 1:1de' c:omparao, deixando assim de constiturem fatores de
1'11111'11:::111,

1\ illllllogemeizao consiste em selecionar indivduos com carac11'I'I:ill'a:;sl!l1lclhantes em relao aos fatores que afetam a resposta, di' Lal I'llrllla que a nica diferena relevante entre os diversos grupos liqlll' :iI'llIlo o tratamento, Esta estratgia, no entanto, dificulta o uso 1111 Ilr:i,Lil:ados resultados obtidos, 1\ :;I:l',lllIda estratgia usar, na etapa de anlise dos dados, tcI il'Ii:; l'c:LaLsbcas para tratar a questo da no comparabilidade, A 1'1'1 IIl1'iI'a (! a construo de anlises estratificadas, isto , em subgru1)( I:! 11111111 Ig('~IWOS de pacientes.

Os pacientes cujos dados so usados em um estudo comparati VI 1 quase nunca constituem uma amostra representativa de uma pOpl1 lao de interesse. Assim, a generalizao de resultados,de pesquisa clnica no se d, usualmente, via inferncia estatstica, mas atraV(!H da repetio do estudo em outros grupos de pacientes, RecentememLI', a agregao de resultados de vrios estudos recebeu o nome de m,da anlise e hoje importante forma de acumulao de conhecimellLl1 mdico, admirvel a sntese feita sobre quimioterapia em cl1(:I~r111' mama, publicada em janeiro de 1992, e preparada pelo Early lh'('I/,,~1 Cancer Trialists Collabomtive GTOUp. Hedges & Olkin (1985) (! 1111111 referncia sobre mtodos estatsticos para meta-anlise e Rothrnall 1\' Greenland (1998) trata o assunto de forma mais conceitual.

1. Para cada uma das situaes descritas a seguir, indique qUid dllH seguintes formas de pesquisa foi utilizada: estudo descriti VO,I:H

Oli

1.11< l() caHo-controle, estudo de coorte, cnHaio clnico aleatorizado 11<~1l111lma das anteriores. (a) 1'ara avaliar o efeito protd~or da vacina BCG em crianas COTIl menos de 15 anos, mtudaram-He as crianas que receI )(~ramalgum tratamento antitubmculose durante o ano de Imn na cidade de BuenoH AireH, tanto intcrnadoH em hospiI.ais ou tratados na forma amlmlatorial. Para cada caso, (~uc(mtrou-se uma crian<{ada nWHTua idade, HCXO, condio scio-econmica e que tiulra alguma doena aguda, dife"(~nte de tuberculose, no meHmo perodo e que havia sido tratada no mesmo estabelecimento. Em ambos os grupos . considerou-se como vacinados os que tinham a cicatriz correspondente vacina BCG em urna ou ambas regies deltoidianas. Esta descrio foi publicada no Boletim OPAS (Calvete et al., 1986).
,

com o naHcimento de b(~bH com baixo peso ao nascer, isto , menOHde 2.500 g. (a) Como voc encaminharia um estudo de coorte e um estudo caso-controle para avaliar a conjectura do pesquisador? Identifique clarameute os grupos de comparao. (b) Cite pelo menos 3 fatorm que voc deveria controlar para tornar os grupos comparvciH. (c) Por que, neste caHO,no Hepode usar a forma de ensaio clnico?

(a) A plula anticoncepcional boembolia?

um fator de risco para trom-

(Il) Os primeiros 700 caSOH de cncer de fgado diagnosticados que ocorreram em vrios estados americanos aps o 1"- de janeiro de 1990 foram seguidos at 31 de dezembro de 1994. Os nveis de consumo de lcool foram medidos para cada caso. Trezentos casos morreram durante esse perodo de cinco anos. (C) Um estudo foi conduzido em um grupo de gmeos monoligotos e dizigotos do mesmo sexo, sendo que um gmeo do par tinha cncer no clon e o outro no. Todos foram casos incidentes observados em 6 grandes centros mdicos de universidades do sudoeste dos Estados Unidos durante mu perodo de 5 anos. Informaes sobre o teor de fibras (la dieta foram coletadas para cada um dos indivduos afim (1eestimar seu efeito na ocorrncia de cncer no clon.
~I,

(b) Usinas nucleares podem causar defeitos congnitos nos filhos de mes que moram em reas prximas a usinas? (c) A poluio do ar pode causar cncer de pulmo? (d) A anestesia com o halotano pode causar problemas de fgado? (e) O fumo um fator de risco para problemas coronarianos? (f) Para algumas formas de doena coronariana o uso de medicamentos to eficiente quanto a cirurgia? Explique que tipo de estudo voc usaria para estudar estas questes, aqui no Brasil. Descreva os grupos que seriam usados e possveis fontes de vcios. 5. Que tipo de estudo voc usaria para verificar a associao entre um fator ambiental e um cncer raro. Justifique sua resposta. 6. Freqentemente ouve-se a afirmativa que a nica opo realmente correta para se investigar uma hiptese clnica o uso prospectivo de uma coorte de pacientes. Explique porque voc concorda ou ou no com esta afirmao.

lllsidere a seguinte hiptese: "O DIU predispe para o cncer d(' <:<'llon uterino". Resumidamente descreva alternativas de plallejamento para conduzir um estudo que discute este proId(~llIade pesquisa.
(~(

:\. Ibs(~ado na observao de vrios casos, um clnico su~peita que () ['ato de a me ter menos de 20 anos de idade est associado

7. Em um Congresso de Ollcologia, dois trabalhos foram apresentados comparando-se tratamclltos para o mcsmo tipo de cncer. Os autores, em ambos os casos, apresclltaram os rcsultados obtidos em suas clnicas. lJm participant,(~, analisalldo as duas comunicaes, resolvem adotar o tratamellto com a Illelhor taxa de resposta. Esta uma dccisl.ocorreta'! JUStifiqlll' sua resposta.

Captulo 3

(a) Em um ensaio clnico garante-se a comparabilidacle dos grupos atravs de uma escolha aleatria dos dois grupos. (b) Em um ensaio clnico deve-se usar uma amostra aleatria de pacientes. (c) Este estudo vlido, pois os pacientes foram escolhidos de forma aleatria. D. Como em um estudo caso-controle obtm-se a comparabilidade dos dois grupos de pacientes a serem contrastados? Ul. Corno pode ser controlado o efeito de um fator de confuso em um estudo caso-controle? LI. Diga o que um grupo controle e qual a sua importncia em pesquisas clnicas. Exemplifique sua resposta usando um ensaio clnico.

Descrio e Apresentao de Dados

(a) Em um ensaio clnico, dois tratamentos (A e B) sero tnstac10s atravs da comparao de dois grupos de igual tamanho, cada um com 30 pacientes. (I) Ij~mum ensaio clnico envolvendo 100 pacientes, decidiu-se que 40% deles receberiam o tratamento A e os restantes o tratanlCnto B. (c:) U.<~pita o item anterior para 50 e 20 pacientes mantendo o 1t\(~SIllO percentual em cada tratamento.

Os dados obtidos dos pacientes participantes de estudos m(~diC:IIH devem ser analisados e interpretados com o auxlio de mtodos I!N tatsticos. A primeira etapa desta tarefa, a organizao e sntl!sl' cios dados. Para isto, foram desenvolvidos mtodos que recebem o 1101111' genrico de estatstica descritiva, ou ainda, anlise descritiva, LI!IIIII deste captulo. A anlise descritiva consiste basicamente na organizao r~d(!sni o dos dados, na identifica,o de valores que traduzem o ell!lll( '11 LI tpic;o e na quantificao da variabilidade presente nos darlos. ()II elementos bsicos para essa anlise so: tabelas, grficos e nll!dicl/l.iI ou. snteses numricas. O uso de tcnicas descritivas deve sempre preceder anlis(~s IIl/1.ill avanadas. Alm de propiciar a familiarizao com os dados, IlIl:-1 sibilita a deteco de estruturas interessantes e, eventualnH~IILI',11 presena de valores atpicos nos dados.
I

Neste texto a palavra varivel deve ser entendida como a IEiI,ili

cao da caracterstica

do intereSHedo estudo, Corresponde ao termo

'p~~im'-et:outllIz~Lc1'cr:il rrlliffiifi'-Dj'i5:;riEl" MccIi'(,inrl.


'Drri-qestionrio de um inqurito opdomiolgico quo contm as seguintes perguntas: Qual a sua idade? Qual o nmero de pessoas da sua famlia? Qual a renda total de sua famlia? Qual o seu estado civil? Voc tem emprego fixo? produ~ informaes nas variveis: idade, tamkmbo da famlia, renda familiar, estado civil e emprego. Em geral, a mera identificar;i'io da caracterstica de interosse leva, de forma natural, a urna quantifica(~o adoquada. No h problema na definio de variveis quando o interesse recai sobre parmetros hematolgicos, presso sangnea ou dados antropomtricos. Em outros casos, entretanto, antes que a quantificao da caraterstica possa ser feita preciso padronizar os procedimentos de avaliao. Por exemplo, na.o imediatamente claro como quantificar intensidade de dor, falta de ar (dispnia) e estado geral do paciente. Escalas especficas foram desenvolvidas para isto. Em outras situaes, embora a varivel medida seja claramente definida, a variv,el de real interesse obtida atravs da manipulao de outras variveis. Para avaliar a obesidade de um indivduo comum a utilizao do ndice de massa corporal (IMC) definido como a razo entre o peso (kq) e a altura ao quadrado (m2). Chamamos vaT'ivel Tesposta aquela a ser explicada no estudo. Alm dela, h sempre outras variveis que devem ser consideradas na anlise, denominadas 'uaT'iveL5 de contmle ou covaT'iveis.

varivel hbito de fumar, pode-se classificar um indivduo COIIIO 1'11 mante ou n8.o fumante ou ainda usar urna classificao mais ddl\.l I 11\. da: no fumante, ox-fumanto, fumante ocasional, fumante invd(!I'IUIII, etc. A classificar,:o de pessoas atravs de nveis pressricos, pode H(!I' hipertenso ou normot(mso ou, entre outras, normal, hipertenso I(~v(', hipertenso moderado e hipertenso grave. FreqUentemente os dados so reduzidos a duas categorias PI\.I'I\. simplificar a ami,lise e a sua apresentao, mas isto pode em algllllH casos resultar em considervel perda de informao.

Facilita o tratamento tegricas e quantitativas. Variveis categricas

estatstico de variveis classific-las em ca-

Podem ser do tipo nom'inal ou oTdinal (caso exista uma ordem entre as classes). Sexo e estadiamento de -;:;ma doena so exemplos de varivel nominal e ordinal, respectivamente. Variveis categricas podem ter duas ou mais categorias (por exemplo sexo e tipo sangneo, respectivamente). O nmero de categorias pode depender ~lo interesse do estudo. Por exemplo, para a

Variveis q'lw:ntitat'i'uas podem ser (ScTeto,s. ou contn'uas. Em uma varivel d-iscTcta, os valores diferem entre si por <]1 1<1.1 Il.i dades fixas. Tamanho da famlia uma varivel discreta, j qlw ifllli vduos diferentes tm tamanhos de famlia que diferem por oxelllJI1II por 0, 1, 2, 3 ou 4 indivduos. Nenhum valor intermedirio pOSHfv(!1. Variveis discretas so geralmente o resultado de contagens, e01111l por exemplo, nmero de bactrias em um volume de urina, 1l\'lIl1el'll de consultas mdicas durante um perodo e nmero de batillll~III.IIH cardacos por minuto. Variveis contn:uas, tais como presso sangnea, peso (! 11.11.111'1 so usualmente medidas atravs de um aparelho (aparelho de PI'l!HHI\.II, balana, etc.). A diferena entre medidas de indivduos distint()s 1)( 1111' ser arbitrariamente pequena. N a prtica, as variveis contnuas so anotadas at a pn~cisll,l)d/l medida usada. Por exemplo, quando dizemos que o tempo de' 811 brevivncia de um indivduo foi de 2 anos, estamos proVaV(~IIIII!lIII' simplificando a unidade de medida tomando-a em ano, mas lia \1111 dade poderia ser 2 anos, 1 ms e .10 dias. Quando dizemos <1111' 1I tempo de reao de um indivduo foi de 1 minuto, a leitura (~IIII1II1 cronmetro com maior preciso poderia ter sido 1 minuto, 27 se)',lIll dos e 10 milsimos de segundo. Algumas variveis podem ser classificadas em mais de: 1II11 1,IpII dependendo da unidade usada. Por exemplo, idade urna val'il'l.Vld contnua (tempo intrinsicamente uma medida contnua), 1I1i\.H Plldl' ser classificada como discreta. Renda medida em salrios 1111'1 ti I\I HI tambm pode ser classificada como uma varivel discreta, IlIaH1"" h, ser ordinal se categorizada como baixa, mdia e alta.

A diferena entre uma varivel discJ'(~tae urna varivel categrica md i 1 lal que a ordenao tem urn significado diferente, como ilustra () I'x(mlplo a seguir. Suponha duas variveis: cstadimnento de cncer d(~ IlIama (I, II, III c IV) c nrnero de CriarH?l,S(O, 1, 2, ~), etc.). Nao s(~pode dizer que o estgio IV (~duas vey;es pior do que o II, 1I( ~III que a diferena entre o I e II (~ equivalente quela entre III e I V. I '01' outro lado, 4 crian(;as corrmponde exatamente ao dobro de 2 niall(;.as (obviamente no n(x:essarimllente o dobro de trabalho para (IS pais) e diferen(;as no nmero de criaIlf;as tf~m sempre o mesmo :di',11 iIicado para todos os valorm, isto , llnJa famlia com 4 crianas LI~1I1 (~xatamente uma criam;a a mais que urna famlia com 3, que por :llIa V(~y; tem uma a mais que urna famlia com 2 criaIlf;as, e assim por (liallt,(~. Finalmente, todos estes tipos de variveis so encontrados comu111I~IILe em dados biolgicos e da rea mdica. A importncia dessa classiI1cao justifica-se porque cada tipo de varivel exige um trata1I1(~IILo estatstico especfico. Portanto, importante ter em mente que II Li po de varivel resposta um ponto d~ partida para se determinar (IS ItI(~todos de anlise mais apropriados ou mesmo vlidos.

Tabela ~~.1:Teor de gordura (g/24 horas) em 43 crianas

:1,7 L, Ci 1,8 1,4 0,8 3,1 I,Ci 2,9 2,4 2,1

2,5 2,7 1,8 2,0 1,3

;~,O

2,1 1,0 1,0 2,7

3,9 3,3 2,0 2,7 2,1

1,9 3,2 2,0 3,0 2,8

3,8 2,3 2,9 1,3 1,9

1,5 2,3 3,2 1,5

1,1 2,4 1,9 4,6

Apesar de todos estes valores terem sido obtidos em crianas Sll. dias, nota-se uma grande variao nos resultados. Esta variabilidlu 1(' exige que o padro de referncia procurado seja expresso por 1111111. faixa e no por um nico nmero.

Dados brutos so aqueles obtidos diretamente da pesquisa, isto (~,que ainda no sofreram qualquer processo de sntese ou anlise. 1';111 geral so apresentados em tabelas e freqentemente omitidos na IlIaimia das publicaes, quase sempre por questo de espao. O conjunto de dados constitui uma amostra. O tamanho da a1I10fiLra geralmente denotado por n.

Embora os gastroenterologistas infantis reconhecessem a utilidade Iliagllstica do teor de gordura fecal, at 1984 no existia-um padro (I(~J'(~fernciadesta medida para crianas brasileiras. Para preencher (~sLa lacuna, o Prof. Francisco Penna, titular de Pediatria da UFMG, ('xalllinou 43 crianas sadias que produziram os valores da Tabela 3.1 I'XpJ'(~SSOS em g/24 hoTO,s (Penna, 1984; Penna et aI. 1987).

Framingham uma pequena cidade americana localizada perL(I de Boston, Massachusetts. Em 1948 foi selecionada como local lU1(' quado para desenvolvimento de um estudo prospectivo cujo objdi V( I era verificar como os hbitos de vida das pessoas influenciam o ri:-:('( de desenvolvimento de doen(;as cardacas. Muitos resultados, II(I.i(' completamente integrados prtica cardiolgica, como a necesfiidadl' de controle do nvel do colesterol, foram primeiramente obtidofi 111 ~:-:L(' estudo. Os valores da Tabela 3.2 so as medidas em mg/dl do COI(:fiL!H'(II, referentes ao segundo exame realizado em 1952 em 80 pacierlt(~fi. ():I pacientes que no compareceram esto representados por 9. Observando estes dados, na maneira como esto apresmlL;ulos, pouco apreendemos sobre o nvel do colesterol poca do exallll~. I~: impossvel saber o valor em torno do qual as medidas esto agrllpadlls, a forma da distribuio e a extenso da variabilidade.
I

Em 1969 foi realizado um estudo na populao de Honollllll (dl'H crito em Kuzma, 1998). Para 7.683 indivduos, foram pesql1il':uIIlH1111 seguintes variveis: nvel educacional, peso (Kg), altura (1:'/11,), idlllll'

Tabela 3.2: Taxa de colesterol (mg/dl)

em 80 indivduos

278 118 171 179 212 175 242 248

182 247 219 255 213 233 167 192 233 250 194 221 180 255. 184 291
~,;' i

227 201 226 277 243 233 170 185

277 9 209 317 150 9 209 242

194 209 200 146 209 184 161 276

196 219 200 217 184 217 196 243

276 228 363 292 199 150 165 229

244 209 209 217 250 167 234 242

192 209 200 255 479 265 179 250

'1-'

tre os indivduos consi(l<~rados. Os mtodos estatsticos so fuudl\." mentais para o estudo de situaes em que a variabilidade inereuLll. A Estatstica Descritiva ajuda na percepo, avaliao e quantifica(Ju) da variabilidade.

3.3

Organizao e apresentao d
. . ..
.~, . ~_-

Mas
1{-"".,{
,l.f5l' ;,_~

(anos), glicemla (rnp/dl), colesterol srico (mg/dl) e presso sistlica (mrnHg). Q1,<t:t indivduo foi classificado quanto ao hbito de fumar (fumante.oJtn) e quanto atividade em casa (pouca, moderada e muit);"::~ddos referentes a uma amostra de 100 indivduos esto dispotif~s po site ido Departamento de Estatstica da UFMG (http://www.est.ufmg.brrvestmed).

Nesta seo apresentaremos formas de organzat~hp;resenta(J.() de dados at;avs de tabelas e de grficos. ConstriJdM:.~;partir de d(~ terminado conjunto de dados, proporcionam informaoes sm:elhantcH ou que se complementam, constituindo formas apropriadas de se organizar dados. Existem normas para a construo de tabelas e gr;f?-cos, mas rll1Hl,e texto daremos nfase interpretao. Ressaltamos, ~'I\.trtanto, Hm essencial a apresentao de forma clara e comprMnsvel', inclusive dOH ttulos. A seguir ilustramos atravs de exemplos a construo de taboll\.H de freqncias e grficos para uma varivel ou para o cruzamento de variveis, considerando os vrios tipos apresentados na seo anterior.
~ fI-:

Em sua tese de Mestrado em Pediatria da Faculdade de Medicina da UFMG, Andrade (1994) estudou a prevalncia da toxoplasmose entre crianas de O a 12 anos de idade matriculadas no ambulatrio geral de pediatria do Hospital das Clnicas da UFMG. O banco de dados das 278 crianas estudadas, tambm disponvel no site citado no Exemplo 3.3, compreende 12 variveis: idade, sexo, motivo do exame, resultado do hemograma, contato com gatos domsticos ou vadios no domiclio, contato com areia e/ou terra na regio peridomiciliar, ingesto de carne crua ou mal cozida, RIFI-IgG (ttulo e classificao: positiva ou negativa), RHA (ttulo e classificao: positiva, negativa ou no realizada) e resultado do exame de fezes. Nos exemplos 3.3 e 3.4 ainda mais difcil tirar alguma concluso a partir dos dados brutos. Torna-se necessria uma descrio dos dados, e neste~ casos o uso do computador imprescindvel. Nos quattQ exemplos pode-se perceber a grande variabilidade en-

Uma maneira de sintetizar os dados atravs de distribui'w dr' freq'ncias, que consiste na construo de uma tabela a partir (11 IH dados brutos em que se leva em conta a freqncia com QU8 cac11\. observao ocorre. A interpretao dos resultados obtidos em tabelas de freq{\lIcil\.H pode ser auxiliada pela anlise de grficos construdos a partir dell\.H.

Em um estudo retrospectivo, Fernandes et aI. (1995) fi\(lrl\.lll levantamento de tentativas de suicdio por intoxicao aguda l'UgiH tradas no Ce~tro de Assistncia Toxicolgic do Hospitql p.p UnHedI' So Paulo. No perodo de 01/92 a 02/93 con~~guiram \afa.~er\ll.I':\()~ casos, que correspondem a 27% do total de te~im~?t~ ~? prlr(O( Ii I. :.. ~ ./ .
.;

..

'
;'

Das tentativas de suicdio, h predomnio do sexo feminino (67%). 1:-::-:0 difere dos xitos letais, em que doi:-:dos tr{~:-: bitos so masculi1\ Tabela 3.3 mostra a distribuilJin da proLis:-:iio de pacientes po1.1'1 wiaitlwnte suicidas. A maior incidncia foi obs()l'vada entre profis::iollai:-:lnal remunerados e com sobrecarga de trabalho, S8TnperspecI.iva dl~ ascenso social. O alto percentual dl~ menores e estudantes (li, (i'I', +4, 6% = 11,2%) confirma o fatl) relatado na literatura de que 'I 1111 Ii< :l~de tentativas de suiclio entre adolescentes preocupante. 'I 'aiIId;1 :1.3: Distribuil{iio el(~ profiss<\es eutre pacientes potencialmente
:i1licida:-:

Tabela :3.4: DistrilnllJ.o de idade dos pacientes potencialml~lILI~:-:lli cielas Idad(~ (aUlls) 10 f- 20 20 f- :30 30 f- 49 40 f- 50 50 f- 60 GOf- 70 ::o: 70 Indetennillacl,l Total Freqii(~ncia il.llsl)luta 57 1l:l 57 32 19 7 2 1:3 302 Freqncia relativa 18,54 37,42 18,87 10,62 6,29 2,29 0,G7 4,3 100

Profisso Servios gerais * Domstica ** Do lar Indeterminada Emprego especializ:ado*** Menor Desempregado Estudante Lavrador Autnomo Aposentado Total

Freqncia 75

53 29 23 20 15
14

12 04 02
302

Proporc~o 0,248 0,182 0,175 0,096 0,076 0,066 0,050 0,046 0,040 0,013 0,007 1

incluso elo extremo inferior da classe e a excluso do limite superil lI'. Por exemplo, na clas:-:e10 f- 20 so includas crianas a partir d(~ 10 anos ele idade e pessoas com at 19 anos. Uma indicao altemaLiva poderia ser 10 a 19. Etapas para a construo dados agrupados
1. Encontrar

de tabelas

de freqncias

pilril

* garom,

encanador, pedreiro, frentista, operrio, padeiro, aogueiro, borracheiro, etc.

o menor e o maior valores (denominados mni IIlO mximo) do conjunto de dados.

I'

** copeira, faxineira, costureira e bordadeira *** enfermeira, modelo, prottico, escrivo, professor,
digitador e vendedor

2. Escolher um nmero de subintervalos ou classes, prefen~lIcial mente de igual tamanho (amplitude), que englobem todos 1):1 dados sem haver superposio dos intervalos. Os extremo:-: dllH intervalos so conhecidos como limites de clCLsses.
.

----------

/\ Tabela 3.4 mostra a distribuio de tentativas de suicdio seJ',llllllo faixa etria. A faixa etria mais prevalente de 20 a 29 anos 1:1111.0110 geral (37,42%) como para cada sexo separadamente: 36,12% " :\S,()(;% para o sexo masculino e feminino, respectivamente. ()I):-:(~rve que as idades foram agrupadas em 7 classes, quase todas, ,'x,'do a t'i1tirna, de mesma amplitude (10 anos). O smbolo f- indica a

3. Contar o nmero de elementos que pertencem a cada c1w,H('; este nmero denominado fTeqT~~~C:!. __ 0.~.~.~.I,~t~) usualnwlI 1.1 ~ dI' notado por !2:.:4. Determinar a fTeqncia Telativa de cada classe, dividi Ildl I freqncia da eI~ssep~lo nmero total de observaes.
I1

No existem normas fixas para a constnl(~;:io de tabelas de disI.l'ilmio de freqncias, entretanto, algumas regras prticas e emprl'icas podem ser citadas. O nmero de classes deve variar de 5 a Ir). Alm disso, a experincia tem mostrado que o nmero de classes lixado como ./Ti ou 1 + lo,c12n, para tamanho da amostra n, so escoIllas razoveis. Feita a escolha do nmero de classes, o tamanho de I'ada classe escolhido como o quociente entre a amplitude (diferena 1!lll.n~ o maior e o menor nmeros) do conjunto e o nmero de classes I'SI 'olbido. Se for conveniente, este valor pode ser modificado de forma 11 I'acilitar a constru()io e interpreta()io ela,tabela. O limite inferior da primeira classe eleve ser um pouco menor que a menor observaco o IiIllite superior da ltima classe deve ser um pouco maior qu~ a Illaio!' observao.
I'

Tabela :L5: Distribuio ele ielael(~ elas pacientes com cncer de lW\.I1I1I. segundo estadiamento Idade (anos) <; 60 :c 60 Total Estdios I e II
TI,

Estdios III e IV
TI,

IX)
65,4 48,5 57,7

%
34,6 51,5 42,3

53 33 86

28 :35

6:~

Total n % 81 100 100 68 149 100

I)(~ 1.938 pacientes atendidas no Departamento de Mastologia do Ilospital Amaral Carvalho de Ja/SP, no perodo de 1987 a 1990, I/I~) (7,7%) tiveram diagnstico de cncer de mama confirmados pelo I'x ;\.11 J(~ antomo- patolgico. () tipo histolgico mais comum foi o carcinoma infiltrativo de d 1 I doe: mamrios sem outras especificaes. Ocorreu em 128 casos U-:r,,!J%), sendo que em 38 (29,7%) as pacientes tinham 60 anos ou
III;W'.

Caldeira & Budin(1995) preocuparam-se em avaliar o nmero de 'asos avanados (estdios III e IV) nas faixas etrias. A idade foi di<:ol.mnizada como menos de 60 anos e 60 anos ou mais; 45,6% das I)nCil~Iltes pertenciam faixa de idades mais avanadas. A distribuio do estadiamento para cada uma das duas faixas dI' idaele consideradas est na Tabela 3.5. A maioria das mulheres I'llIll Il.Ienosde 60 anos teve uma classificao I e II do estadiamento, l'llqllallto o percentual de mulheres nos estdios III e IV da outra I'aixa d(~idade foi apenas ligeiramente superior (51,5%) do que o do J',I'IIJH) com estdios mais iniciais (48,5%).
I

Em trabalho realizado na dcada de 80, Cunha et al. (198r)) avaliaram 308 idosos (261 mulheres e 47 homens com idade variando entre 60 e 100 anos) residentes em dez asilos da regio da Gralld(! Belo Horizonte. Para anlise do grau de distrbio cognitivo (demncia) aplicoll se um teste mental de doze perguntas e, de acordo com a soma elas perguntas respondidas corretamente, os residentes foram classifica( ll)s em: sem demncia (9 a 12 pontos), demncia leve (7 a 8 pontos) I! demncia grave (O a 6 pontos). As funes do comportamento foram testadas atravs da escala de avaliao geritrica de Crichton, composta por onze itens: ll]l) bilidade, orientao, comunicao, cooperao, agitao, vestw.rio, alimentao, continncia urinria, sono, humor objetivo (idias ddi rantes e/ou alucinaes) e humor subjetivo. Em cada item, as lIol.a" variaram de 1 (normal) a 5 (muito alterado) e a partir da soma di n4 11 itens foi adotada a seguinte classificao do grau de deterioral~;III: sem deteriorao (11 pontos), deteriorao leve (12 a 20 pontos), di' teriorao moderada (21 a 30 pontos) e deteriorao grave C: :\ I pontos). As tabelas 3.6 e 3.7 apresentam a distribuio de variveis dll funo de comportamento de maior interesse relacionadas com a pl'l' sena ou ausncia de demncia. Note que a coluna "totalmentl~ all.l' rado" parte da coluna "com alguma alterao" e foi separada pal'lI destacar os casos de total incapacidade. Os percentuais refere 1 11.1 \8 1I alguma incapacidade das quatro primeiras funes do comporl.allll'll

listadas so significativamellt(~ llWlJOl'(~S para idosos smll demllcia. () 1>s(~rve tambm que no faz selltido calcular o p(~n:(~lltual da ltima linha (Total) pois no fica claro o total do dellomillador, j que um I'(!sidnnte pode apresentar mais de unja disfullii.o d(, comportamento.
1,0

Tal da 3.6: Distribui(:o elos 81 idosos sem demi'~rl(:ia para algumas rIIlI<J)(~S de comportamcllto Funes de (:omportamento M()bilidade Agitao (:( lntinncia urinria Souo IlllnJor objetivo 'I'oLal Grau de incapacidade Sem Com alguma Totalment('! altenv:iio alterao alterado Gl (75,3(YcJ) 20 (24,7%) 7 (8,G%) 60 (74,1%) 21 (25,9%) 1 (1,2%) 75 (92,6%) G ( 7,4%) 2 (2,5%) 56 (69,1%) 25 (30,9%) O (O,(J%) 46 (5G,8%) 35 (43,2%) 6 (7,4%) 298 107 16

Mclanoma (~urna neoplasia de grande potencial maligno respollsvel por grande parte das mortes por cncer de pele. O reconhecimento clnico do tumor em estgio inicial difcil e de fundamental importncia, j que o nico procedimento teraputico realmente eficaz a eXClsao cirrgica precocn. Na anlise de 35.695 bipsias realizadas entre 1982 e 1992 no Hospital Universitrio da UFES em Vitria-ES, Lucas et aI. (1994) encontraram 55, casos, sendo 30 primitivos de pele, 4 primitivos do globo ocular e 21 metastticos com sede primria no confirmada. A Tabela 3.8 mostra a distribui(:o da localizao anatmica dos melanomas primitivos de pele, sendo a cabea/pescoo mais comum.

Localizao anatrnica Cabea/pescoo Tronco

NQ ele casos 10 7 6 2 5 30

Percentual 33,3 23,3 20,0 6,7 16,7 1QO

'1'111)( da 3.7: Distribuio dos 227 idosos com demncia para algumas rlll)(,:O(~S de comportamento Funes de comportamento Mobilidade Agita(:o ( ~ollLinncia urinria S()I)O 1IIIIIIm objetivo 'lf)Lal Grau de incapacidade Sem Com alguma Totalmente alterao alterao alterado 117 (51,5%) 110 (48,5%) 40 (17,6%) 121 (53,3%) 106 (46,7%) 6 (2,6%) 145 (63,9%) 82 (36,1%) 59 (26,0%) 131 (57,7%) 96 (42,3%) 7 (3,1%) 23 (10,1%) 204 (89,9%) 55 (24,2%) 537 598 167

Membros superiores Membros inferiores Acral Total

A Tabela 3.9 compara os casos confirmados de melanoma n o diagnstico clnico. O grande percentual de diagnsticos incorr<~Los (23,3%) pode prejudicar a adequao do tratamento.

Diagnstico clnico Correto Duvidoso Incorreto Total

N- ele casos 13 10 7 30

Percentual 43,3 33,3 23,3 100

A ll1aioria dos idosos sem demncia no apresenta alterao no 1',1'1111 d(~ incapacidade. No grupo com demncia, a maioria (89,9%) IIpl'l's(~I)Laalguma alterao de humor objetivo.

Representao Existem inmeras formas grficas intere:-;:-;antcs(ver por exemplo Tufte, 1983).' Limitaremos a mostrar tipos dr) grficos mais simples, mas possivelmente os mais teis para a identifica(;o da forma de um conjunto de dados e de sua descriiio: diagrama de barras, histograma, polgono de freqncias, ogiva e grMico de linhas.

grfica para variveisqu.<l~~tL~~lYol?

As variveis categricas podem ser representadas por um diagrama de barras, em que o tamanho d(~cada barra, proporcional ao nmero de indivduos na categoria. Um exemplo ilustra melhor o processo de construo e a utilida,de desta descriiio grfica.

Resultado:-; rcferent"e:-;a varivei:-; contnuas freqentellWIlL(~ :-;I\.() organizado:-; em tabela:-; de distribui(;es de freqncias atrav(~:-;(I() agrupamento dos dados em clas:-;e:-;. Trs tipos de grficos gera!IIl(!IlL(' so utiliza<1o:-; neste caso: histograma, polgono de freqncia:-; ()ogivl\.. O lsto!jTo,'rwJ, um grfico de barra:-; ju:-;tapostas em que lIO (~ixo horizontal est a varivel de interesse, dividida em classes gerahll(!IIL(~ de mesmo tamanho. No eixo vertical, constri-se uma barra parI\. cada classe com altura igual freqncia absoluta ou relativa COJ'l'(!S pondente. A barra centrada no ponto mdio da classe. Para construir um histograma, temos, portanto, que ordenar dados e escolher uma escala apropriada para sua descrio. 1';:-;1,1\.1-1 tarefas, embora simples, so trabalhosas se o conjunto de dados (, grande. Por isto usual construir-se a tabela de freqnc:ia:-; C( )111<) etapa preliminar na construo do histograma.
()8

Em uma amostra de 130 casos de fraturas de face registrados no Pronto Socorro do Hospital das Clnicas da Faculdade de Medicina da USP, Almeida et ,a1, (1995) encontraram grande maioria de vtimas do sexo masculino (78,4%) e na faixa etria entre 20 e 40 anos. A Figura 3.1 apresenta o diagrama de barras com os agentes etiolgicos.

Para os dados do Exemplo 3.2, TI, = 78, o maior valor 47!J (' () menor ,I 118. Escolhas razoveis para o nmero e o tamanho de ('Iassl' so 8 e 50, aproximao de (479 - 118)/8 = 45,125. Escolh(!lldu incio da primeira classe 100, obtemos a Tabela 3.10.
I)

Nvel de colesterol 100 I- 150

Freqncia absoluta simples acumulada

Freqncia relativa /1 simples acumulada

Figura 3.1: Diagrama de barras carro (C), ferimentos de arma de pelamento (A), moto (M), queda (QB), ferimentos de arma branca

dos seguintes agentes etiolgicos: fogo (FF), espancamento (E), atrode altura (QA), queda de bicicleta (FB) e outros (O)

150 I200 I250 I300 I350 I400 I450 ITotal

200 250 300 350 400 450 500

2~ 24, 35: 14, 1

2 26 61 75 76

1 78

77
77

78

0,03 0,31 0,45 0,18 0,01 0,01 0,00 0,01 1,00

0,03 0,34 0,79 0,97 0,98 0,99 0,99 1,00

Com uma simples inspec;iio do histograma da Figura 3.2 vemos qllc~a grande maioria dos indivduos tem colesterol em torno de 225. T(~lllOS ainda uma boa descrio de como os diferentes nveis se disLrilmem em torno deste valor.
40

t,()

,1!
()

2 c
1I1

30

o..

20

"O
o

<l>

10

Urna das caractersticas da go/;a, distrbio hereditrio que ocm'l'(! especialmente em homens, a hipcruricemia (excesso de cido ric() no sangue). Embora nem todos os indivduos com hiperuricemia desenvolvam manifestac;es clnicas de gota, h muito tempo telllse reconhecido que o componente hereditrio da doena est ligado a urna tendncia para hiperuricemia. A forma da distribuio de cido rico um aspecto importante para o estudo dessa relac;iio, especialmente quando se compara diferentes tiPORde indivduos, por exemplo, indivduoR doenteR e sadios.

cido rico (mg/dl) 3,0 f- 3,5 3,5 f- 4,0

Freqncia abRoluta 2 15 33 40 54 47 38 16 15 3 1 3 267

Porcentagem simples acumulada 0,7 5,6 12,4 15,0 20,2 17,6 14,2 6,0 5,6 1,1 0,4 1,1 100,0 0,7 6,3 18,7 33,7 53,9 71,5 85,7 91,7 97,3/ 98,4 98,8 100,0

A partir do histograma pode-se construir o polgono de freqn('l.,';, que consiste em unir atravs de segmentos de reta as ordenadas ('(lT'I'cspondentes aos pontos mdios de cada classe. A og_iva ll!?_grA.C::.o de fI~~q~rt..ci.?:s_.~~~2:1:.ladas (usualmente relaLi vas). Para constru-la, coloca-se no eixo horizontal os intervalos de (:Iass(~nos quais a varivel em estudo foi dividida. Para cada limite (I(~intervalo assinalado no eixo vertical sua porcentagem acumula(Ia. Em seguida, os pontos marcados so ligados por segmentos de rda. Embora a palavra ogiva no sugira, trata-se de urna poligonal ;1St :endente. O histograma e o polgono de freqncias servem para visualizar iI I<H'IIla da distribuio da varivel estudada. Atravs da ogiva pode:;(' (~stimar percen/;is da distribuio, isto , o valor que precedido Ili li' cmta porcentagem de interesse pr-estabelecida. Por exemplo, ('slilllar o valor da varivel abaixo do qual se tem 50% dos indivduos.

4,0 4,5 5,0 5,5 6,0 6,5

ffffff-

4,5 5,0 5,5 6,0 6,5 7,0

7,0 f- 7,5 7,5 f- 8,0 8,0 f- 8,5 8,5 f- 9,0 Total

A Tabela 3.11 apresenta a distribuio de freqncias das dosag(!IIH de cido rico srico em 267 homens sadios, obtidas por Fillll dai. (1966). O histograma, o polgono de freqncias e a ogiva Si1.o apf'(! sentados na Figura 3.3. Estes grficos mostram que a distribuio da dosagem dI! i.c:i do rico em indivduos normais do sexo masculino razoavc~lJlI(llll.(!

Dados colctados ao longo do tempo silo muito comuns em pesquisas mdicas e em registros de Sade Pblica. Tais dados so denominados temporais ou longitudinais, ou ainda d(~medidas repetidas. comum o uso do diagrarna ck~barras, discutido anteriorment(), especialmente quando o perodo est agrupado (por exemplo, menos de 1 ano, 1 a 5 anos, 5 a 10 anos, etc.). Entretanto, o grfico de l'inhas uma representac)io mais apropriada para este tipo de dados. Consiste em colocar no eixo horizontal do grfico a escala temporal" (ano, ms, dia, dc.) e no eixo vertical a varivel a ser estudada (freqncia, taxa ou medida tomada). usual unir os pontos atravs de segmentos de reta, da o nome recebido. Atravs desses grficos possvel constatar algum tipo de tendncia e identificar alguns eventos inusitados, corno por exemplo, o surto de uma determinada doena.
"O

:; '"
E
Q

"
E
~

00

7$-

" ro
!'!
~

fdJ

j5"

"
(;

JI)-

o..

Ir,

Figura 3.3: Distribuio da dosagem de cido rico: (a) histograma, (b) polgono de freqncias e (c) ogiva simtrica. A variao desta dosagem est entre 3,0 e 9,0 mg/dl com uma maior concentrao em torno de 5,0 a 5,5 mg/dl (20,2%). Alm disto, 96,6% dos homens desta amostra apresentaram valores de cido lrico srico de 3,5 a 7,5 mg/dl. Pode-se estimar que 50% dos indivduos normais do sexo masculino apresentam uma dosagem de cido rico abaixo de 5,4 mg/dl (~95% abaixo de 7,25 mg/dl. Essas estimativas, denominadas percentis, foram obtidas pela projeo das porcentagens desejadas no (~ixohorizontal da ogiva. Este assunto ser tratado novamente na Sec;o 3.4.5.

de casos de AIDS notificados ao Ministrio da Sade) periodicamente publicado no Boletim Epidemiolgico de AIDS. Na Figura 3.4 vemos o nmero anual de casos notificados no Brasil no perodo de 1983 a 1995 segundo o sexo. A incidncia no sexo masculino bem maior que no feminino. Essa tendncia mantida, mas h maior proximidade das curvas.

o nmero

Figura 3.4: Nmero de casos notificados de AIDS no perodo de 1DH:I a 1995 segundo o sexo

() hormnio luteinizante (LH) produzido na adenohipfise e eXI!!,CI! efeito trfico sobre testculo e ovrio. Uma de suas principais : U;I )(!S na mulher consiste no estmulo sntese de progesterona, ao iI i1111(nlciada pela variac:o da concentrao dessa substnc:ia ao longo ,,11) ciclo menstrual. I<~m estudo relatado em Diggle (1990), pesquisadores avaliaram os Ilfv(!isde LH em uma mulher por um perodo de oito horas atravs (11'(l()~-mgens sucessivas com intervalos de dez minutos. Os valores das tiS 11Iedidasesto dispostos na Figura 3.5.

a distribuic:o da varivc1 de intcr'aS'S(-'No caso de um a d'lS t'l ' n )]11(,:/1.0 S slmetnca, tal elemento a (l'(";trr'e Se a d'lSt n'b Ul<"\() . - ,. . md';(1 ,. ,'" ,'" 'o t';ca "o . (lI' assimtrica, a medida a ser usada c~' "rrred,;clrra Em d'lS t 1'1 '1" '. '".. )1I1C()(!S simtri:;as, .a mdia e a mediana na amostra devem ser aproxilll::c1I1: mente 19uars.
,." . J , , ",,' '"

...

Existem vrios tipos de mdia (aritmtica ponderada geornc. "I,11" ca, har~om.c~t, e~c.), mas estudaremos apenas a mdia aritmf1tica. Com~ slmphfic:aao, a mdia aritmtrica ser chamada apenas rn(~dia daqUI por diante. A mdia aritmtica de n observaces (T , d enotada , "1,:1:2,.. ,Xn ) e por X (l-se x barra) e dada por ..
A "

:1:= :r1

+ ... + 'I:n
n

'\','.~1 :1:'i _D _

, A mdia pode.s:r ~nterpre~ada como o "centro de gravidade", isto e, o ponto de eqUIhb1'1odas dlscrepnc:ias positivas e negativas.

Figura 3.5: Dosagens de hormnio luteinizante obtidas em uma mulher num perodo de 8 horas com intervalos de 10 minutos Para exemplificar os clculos , va . c mos u t'l' 1lzar os segumtes P(!8( 18 em kg de 10 recm-nascidos:

A anlise descritiva de dados, alm da construo de tabelas e grficos, consiste tambm no clculo de medidas que ajudam na produo de uma viso global dos dados. Tais medidas recebem o nome genrico de estatsticas.
A

x=

3,2

+ 3, 2 + 2,8 + 2, 1 + ... + 4, O
10
.'

= 3,1

Medidas de tendncia central vo sintetizar em um nico nmero o conjunto de dados. Procura-se definir um valor que represente bem

O peso mdio de 3 1 kq ,u o 310'0 g. Ob'Vlamente alguns l'nd!111 naSCIdos te,~ peso abarxo e outros acima deste valor, mas a lll(!di/l.(, um valor tIp1CO.

lJ 1I u\, medida de centro adequada para distribui(;es assimtricas (, a 111(~diana, que ser denotada por :J; (1[:-se x til). Por definio I1 II\('diana o valor que divide a d.,triimi<;iioao meio. Em outras jlalavras, 50% das observa(;es ficam acima da mediana e 50% abaixo. "ar;\, calcularmos a mediana necessrio primeiramente ordenar 111I11111stra para que possamos 10cali7,a,ra posio da Tnediana e assim f'lll'olll.rar seu valor. Para amostras ordenadas, a posi(;o da mediana 1 f' I\a(\a pelo elemento de ordem se n for mpar e pela mdia dos 2 f'I('IIII!lltosde ordens ~ e se n for par.

nt

n1

Quase mura uma nica medida de t<:ndncia central suficiente para descreve, de modo satisfatlrio, lUU conjunto de dados. No basta saber ovalor em torno do qual os dados se concentraml. preciso conhecI' tamb(~m o grau de agrega<;i1,o, ou seja, definir e usar medidas da dipcrsiio dos dadm:. Podem sedefinidas vrias Iuedidas de variabilidade. Apresentaremos a seguir ;,S duas mais utilizadas em anlise de dados: varifuncia e desvio-padriO.

12[[)67
()s ()lementos marcados localizarn a mediana. Na primeira amostra, a II\('diana O prprio elemento 5, isto , 5';1= 5. Na segunda, a medialla () dada pela mdia aritmtica dos elementos grifados, isto _
7:2 .

= -- 2

+6

= 55 '

Voltando aos pesos dos recm-nascidos e dispondo-os em ordem l'I'l'Sf'I!llt(), obtemos:

= 3,1 + 3, 2 = 3 15
2 '

N II dk 1110da mdia, todos os valores da amostr a so levados f'111 I'IIIll.a, ao passo que no caso da mediana isto no acontece. Por 1':iI,1I r:VI,ao,valores muito grandes ou muito pequenos, comparados 1\1111 dl'lllais valores da amostra, causam grandes variaes na mdia, 1i tjllf' 1'111 )';(,ral ni1,oocorre com a mediana. Por isso, dizemos que a II\('dalla {!IllIta Illedida robusta, isto , resistente a valores atpicos.

A varinc uma medida da variabilidade dos dados em tiDrno da mdia. ntural procurar uma medida de disperso que dependa dos desvios dccada observao em relao mdia (Xi - x), e seria razovel consi~erar a soma de todos estes desvios. A idia sera que, quanto maiores fossem os desvios, maior seria a variabilidadl presente nos dados. Entretanto, pela definio de mdia, L;'~l(Ji - x) = O para qualquer conjunto de dados. Uma alternativa seria, portanto, elevar os desvios de cada observao em rdao mdia ao quadrado, isto , a quantidade 81 ser calculada seri3L~~1 (:Di - x)2. Desta forma somamos somente val.ores positivos, Torna-se ncessrio considerar o nmero de observaes, pc>is o acrscimo de bservm;es aumenta o valor deste somatrio. Uroa idia sria considerar a mdia, isto , L;'~l(Xi - x)2 /n. Em palavras, a varincia l mdia dos desvios ao quadrado das observaes, em relao mdi~. Neste text( usaremos uma outra definio de varincia que ~onsiste em dividi! por n - 1 ao invs de n. A justificativa meramiBnte tcnica. O im~ortante ser consistente, usando sempre uma mei?Sma (l<:finiodentn de um mesmo trabalho. Recomendmos a diviso por n - 1 por ser o padro das caJculadoras e progamas de computador. Se as amostras so grandeS3, os valores obtidos dividindo-se por n ou n - 1 so praticamente iguais.

Exemplo 3.15: Peso de recm-nascidos

(continuao)

Para o clculo da varincia dos pesos de recm-nascidos do ExOIupIo 3.14, organizamos os dados na Tabela 3.12. Indicamos na Ta1>ulll, 3.13 o clculo da varincia atravs das trs frmulas.

'I,

:r-;, 3,2 3,2' 2,8 2,1 2,9 3,1 3,2 3,0 3 ,0 " 4,0 31,0

. "i

'['2

;r;'i -

;1:

(.Ti - x)2
0,01 0,01 0,09 1,00 0,04 0,00 0,01 0,01 0,16 0,81 2,14

1 2

~:;
8 2

= -----------

2 6i=1 Xi
"'11

(""I'/, )2/ 6i=1 :Ei

4
17

n-1

Como as frmulas (3.2), (3.3) e (3.4) so algebricamente equivalentes, a varincia pode ser calculada por qualquer uma delas. Entretanto, em geral, a frmula (3.4) induz a menos erros de aproximao e a expresso (3.2) deve ser usada se os nmeros envolvidos so grandes. Desvio- padro Note que a unidade de medida de 82 a unidade de medida das observaes elevada ao quadrado. Por exemplo, se as observaes foram medidas em em, a unidade de 82 em2. Logo, para obter uma medida de variabilidade com a mesma unidade das observaes, extramos a raiz quadrada. Esta medida denominada desvio-padro e dada por

5 6 7 8 9 10

10,24 10,24 7,84 4,41 8,41 9,61 10,24 9,00 12,25 16,00 98,24

0,1 0,1

-0,3 -1,0 -0,2


0,0 ' 0,1

-0,1
0,4 0,9 0,0

Total

82

2,~4

= 0,24
-,

"''fi,

6i=

1 :Ei -

-)2 X

,2_
-

98,1-10(:3,1)2
9

O 24

n-1
Portanto, para obtermos o desvio-padro, calculamos primeiramente a varincia e ento extramos a raiz quadrada. Portanto, a varincia e o desvio-padro deste conjunto so 0,24 kg2 e 0,49 kg, respectivamente.
dll dl\.dlll'l

lJ ma pergunta que pode surgir se UIll desvio- padro grande ou III'I1111 !110;questo revclante, ])01'exemplo, na avalia(,o da preciso de 111(!1.1 lIlos. Um desvio-padro pode ser considerado grande ou pequeno c!lolll'II(l<,ndoda ordem d(, grande~a da varivel. Por exemplo, um e11 ~~w jo-padro de 10 pode ser insignilicante se a observao tpica for I(I.()()O, mas ser um valor lmstante significativo para UIll conjunto de c!:lllos cuja observa(,o tpica (~100. I'Oltanto, por vezes, (~conveniente exprimir a disperso em ter1111 lS relativos, ou sej a, expressar a variabilidad{; dos dados tirando a i I i1111l'ncia da ordem de grande~a da varivel. jlode-se obter um ndice relativo de disperso comparando-se o c!losvio-padro(s) com a mdia (x). A medida utilizada denominada ('(/('.I:'iente de VU,TJ,e"O e (~definida por
8

Em um grupo ele jovens mdicos resid(~ntes obteve-se, ao medir o colesterol, a mdia de 205 'fnq/dl e um desvio-padro de 22 mg/dl. Para um grupo de mdicos especialistas, entretanto, a mdia obtida foi de 244 'fnq/dl e desvio-padro de 45 mg/dl. O grupo de mdicos mais idosos apresenta no s uma rndia mais alta como tambm maior variabilidade em torno da mdia. O coeficiente de variai'i.() capta esta diferena. Neste caso, o coeficiente de variao - 10,7% para os residentes e 18,4% para os especialistas.

CV=-

() coeficiente de varia{,o (CV) adimensional, isto , um nmero jlllJ'O e usualmente expresso em porcentagem. zero quando no IIOIIV(~r variabilidade entre os dados, ou seja, quando s = O, o que IIl:orl'(; quando todos os valores da amostra so iguais. Suc.t.ytilida.de fornecp:~yma medida para a homo~.Q:~da<i~ __ (,lo I'Ii1ljIlnto_.ge9ad()s.quanto menor o coefic~.f.!1:~~.ge"IJariao, IIlif': 11 I1I1I I19ne(),o,c<?Il.ill.Il,t() <:l,8. (l-1Q_9... Um valor de CV menor ou igual a 0,25 geralmente indicar que I I'Illljunto de dados razoavelmente homogneo. Entretanto, esse Ilac!rilo varia de acordo com a aplicao. Uma possvel classificao to a seguinte: baixo (inferior a 0,10); mdio (de 0,10 a 0,20); alto (de Il,:.m a 0,30) e muito alto (supoerior a 0,30). SI' por um lado pode ser difcil classificar um coeficiente de vari:U::1l l como baixo, mdio, alto ou muito alto, esta medida pode ser 11:lsl.al1tetil na comparao de duas variveis ou dois grupos que a I'ri 11 <:piono so comparveis (por exemplo, com ordens de grandeza eIa:, variveis diferentes).
I

N a seo anterior vimos como relacionar a mdia e o desviopadro para caracterizar a homogeneidade de um grupo. Esta sei'i,o tambm trata de uma forma de relacionar estas duas estatsticas, mas l2.,-rac'-c.laindivduo. A idia que, na comparao dos resultados de dois indivduos, importante a padronizao em relao ao grupo. Por exemplo, Ulll aluno que tenha obtido nota 7 numa prova em que a mdia da class(, foi 5 apresentou melhor rendimento do que numa prova em que tiro 11 8 mas a mdia da classe foi 9. Alm da comparao da nota individual com a mdia da classe tambm importante avaliar se em cada cas() a variabilidade das notas foi grande ou no. Assim, o desempenJIl l deste aluno que obteve nota 7 seria bom se o desvio-padro da class(! fosse 2 e apenas razovel se o desvio-padro da classe fosse 4. Vamos tomar como referncia os mesmos 10 bebs do Exemplo 3.14 e suponhamos que nasa um beb de 4,1. kg. Este peso cst.: praticamente dois desvios-padro acima da mdia porque 4,1 - 3, 1 O , 49 = 2,04 Sejam Xl,'" ,Xn os dados observados em uma amostra de tallla nho n, x e s a mdia e o desvio-padro, respectivamente. Definimos
Xi

Zi

= ---,
S

-x

() valor Zi denominado (;SUin: p(u!nn!iiz(u!o da obsnrvao ;J:,i e o d(~svio da i-sima observar):io nm rnl;H):io i1m(~rlia dividido pelo desviopadrii.o. Portanto, esta rnedida fOl'IlCcno nnwI'O de desvios-padro I1I1(~ a obf3.t:l!'.YEloo dista da. mdia da amostra. Esta interpretao j IISL i[ica o uso do termo dmvio-padril.o como a unidade segundo a qlml os desvios em rehH):n rI,mlia dr~V(~111 snr nwdidos. Surge ento o interesse enl saber quando um escore padronizado III!VI~ ser considerado grandn.Para responder a esta pergunta necessiLalllOSde conhecimentos qun ultrapaCisanl o nvel pretendido para este L(!xLo.Atravs de um rnsultado dn ECitatstica Matmncitica conhecido 1'(1111) Desigualdade de ChebCidwv, podn-Cie obter a Cieguinte regra:
I 'o:ra a maiOTia dos UiTl:f'0:nfos de d(lJ!os, 80% dos dados esfo no i.nl;eT'ualo cenfnu!o 'lU/' 'rnd/' cmn o:rnpldv,de de 4- desvio8-padnLo. I'(I'{U:O,,~ obseTvaes esfrLo alm, de doi.s desvJs-]JadTo e TaTamente h 11:111.0, obseTvao alm, de S desvio8-]J(u!'('(Lo.

A paciente A apresentou um resultado de colesterol basuIL(! alLo (dois desvios-padro acima da mdia). A paciente B no ap),(~sl~IILI)11 nenhum resultado pl'l~ocupante.

Diante disto, o bebf~ de 4,1 :,r; tem um peso muito diferente dos \111 L!'os dez. No se esperava, a priori, um valor to grande como o q lI(' ocorreu. Devem-se procurar razes substantivas para este fato.

/\ Tabela 3.14 ,'iolir:iLados a duas 111l~111.1! GO e 40 anos p:1.l1 f'()11 iZ':adospelo

apresenta os resultados de exames laboratoriais pacientes, me (A) e filha (B), com respectivade idade. Tambm so apresentados os resultados grupo de adultos do sexo feminino.

'I'nlllda :3.14: Mdia (x) e desvio-padro (8) para adultos do sexo i'1'lllilliIlOe resultados de exames laboratoriais de me (A) e filha (B) Exame

Resultado original
A 90 3,5 97 251 B 79 3,1 66 185

Escore padronizado
A 0,40 -0,78 -0,27 2,04 B -0,48 -1,22 -1,30 -0,60

Dados que produzem histogramas simtricos so adequadauwlIL(' descritos e sintetizados pela mdia e pelo desvio-padro. NesLe ca so, vrias perguntas sobre o comportamento dos dados podmll SI!!' respondidas usando-se somente estes dois nmeros. Isto niio ocorre quando os dados siio assimtricos. Vimos COltlo a mediana identifica mais adequadamente o "centro" de um conj 11111,0 de dados com distribui(:o assimtrica. Alm disso, para entmld,!!' bem uma distribuiiio, precisamos conhecer valores acima ou almixo dos quais se encontra uma determinada porcentagem dos dados: 1):-\ percentis. A mediana o percentil de ordem 50. Usando uma fornm] Hl:IU) mais precisa que a da Seo 3.4.1, definimos mediana como o VII. lar que deixa pelo me'nos 50% das observaes acima de si (~ l}('!o menos 50% abaixo. Esta definio, embora possa parecer deslwr:I!:-\ sariamente complicada, a forma correta de se tratar qualquer LiP(l de dados. De forma geral, o percentil de ordem .1:, representado por l~", (. C{ valor que precedido (maior ou igual) por (xn)/100 dos valo]'(~~(' seguido (menor ou igual) por [(100 - .1:)'11,] /100. Os percentis de ordem 25, 50 e 75 so chamados, respectivallH!III.I' primeiro, segundo e terceiro quaTfis porque dividem a distrilrllil:w) em 1/4, 2/4 = 1/2 e 3/4. Siio representados por Ql, Q2 e (h (', evidentemente, Q2 outra notao para a mediana. O clculo dos percentis feito aplicando-se a definio ou P(ldlHII ser obtidos de forma aproximada a partir de projees da agi VII..

(i Iicmnia em jejum

cido lrico 'I'l'il':lic{~rides ( ~l )I('st.r~rol total

85 4,2 105 200

12,5 0,9 30 25

O nvel de albumina no sangue, um indicador do estado IlIIl.ri cional, foi medido em um grupo de 60 pacientes, obtendo-se ()~mslll tados (g/dl) apresentados em forma ordenada na Tabela 3.15,

Tabela 3.15: Nvel de albumina 11,114


1\ ,(ir\ 11,:-;7 4,47 4,69 4,88 5,00 5,10 5,26 4,48 4,71 4,90 5,01 5,11 5,27 4,51 4,73 4,90 5,01 5,11 5,27 4,54 4,54

no languc (g/dl)
D

4,61 4,7G 4,9G 5,04

4,G4

4,66 4,86 4,98 5,08

4,68 4,86

Kill \12ill
4,95 5,01 5,1G 5,29 4,95

ro ro "3

1,0

4)H
4,97 5 05

0,8

/l,~m .. :1,OD :),211

5,02 5,18 5,17 . 5,.35 5,:~2

~iIDBJ9\
5,4G 5,50

5,09 5,24 5,85

'u
C
<O) O) L-

::l U ro ro

0,6
t\5

/
/1/

./

.,//'/

.'

~.

_______ e

~-------.

-~.
40

'::l
LL

0,4

CY

./

0,2

.,/
10

15

20

25

30

35

~5

() primeiro quartil, conforme a definio anterior, deixa pelo menos 2:,11:) dos dados abaixo e pelo mcnOl 75% dOldados acima dele. CotllO 25% de 60 igual a 15, (h tem pelo nwnOl 15 valores abaixo de li (~ pelo menos 45 acima. Contando-lc 15 valorel do menor para o Illaior, teremos o paciente com valor de albumina igual a 4,76 g/dl. ( :1 'lIlnl<ando do maior para o menor e contando 45 valores, enconI.ralllol tambm 4,76 g/dl. Assim, a dosagem 4,76 g/dl o valor do prillleiro quartil. Podemos dizer que pelo menos 25% dos pacientes da amostra apresentam nvc1 de albumina inferior ou igual a 4,76 ,I//dl. () percentil de ordem 80 (Pso) deixa pelo menos 80%, ou seja 48 vall,n~l abaixo de si e pelo menos 12 acima. Contando 48 valores a parl.ir do menor, chegamos ao valor de 5,18 g/dl e contando 12 valores dI) IIlaior para o menor obtemos 5,19 g/dl. Portanto, Pso qualquer valor Imtre 5,18 e 5,19. Por conveno, usa-se a mdia destes dois Vall)n~l, ou seja, o valor 5,185 g/dl. () clclll-_dos percentis P.cH~cL_dados agrupados $.JJ2i.tQ_,_at.Lg,Y-B-do 1',I'ilicodas freqn(3i?:s..rel3:t.i::'3:~?:<::l1!J1:11I;:lgl aogiv?:. __ 1'ara obte~ ~per~entil traamos uma reta paralela ao eixo horizonI.al, a partir do percentil que se quer calcular. No encontro desta reta ('11111 I) grfico traamos uma reta perpendicular ao eixo horizontal, 1'111'llIltrando assim, no eixo horizontal, o valor procurado. A Figura ;U; I'xmnplifica a regra de clculo. /\. 111)1<8,0 de percentil especialmente usada em Pediatria, em que 1\ : li I.lI1'ae o peso so utilizados como ndices do estado geral de cresci1111'111.1 I. Por isto existem tabelas e grficos apresentando, para cada

Presso intraocular (mmHg)

idade, o valor mdio para o peso e altura, assim como a sua variw;1lI I normal. Dada a importncia destas informaes, foram dell!lIvolvi dos padres em vrios pases do mundo. Hoje, no entanto, lu, 1111111 clara tendncia para a adoo de um nico padro mundial. I';HI.I' est disponvel em um antigo programa de computador, distri!>lIidl) pela Organizao Mundial da Sade.

Atravs da Figura 3.3, vemos que o percentil 95 da taxa de ;ddl) rico igual a 7,25 mg/dl, isto , P95 = 7,25 mg/dl. Isto ligllilil'll, que cerca de 5% dos indivduos da amostra tm taxas acima dl~ 7,2:1
mg/dl.

Existem muitas outras medidas descritivas. So particuiarllll'III.(' importantes os coeficientes que descrevem as condies da saI li! 111'11 li i ca de um pas. Existem, por exemplo, inmeros indicadorel I!pidelttl olgicos de mo,rbidade e mortalidade.

(; socialmente muito importante saber,para todos os nascidos vivos de uma regio, sua condi(Jio (se vivo ou morto) ao fim do \ll'illl(~i]'() ano de vida. Estes dados permitem a construo do coeI11' i(!II I,(~ (le mortalidade infantil (Cl\![[) da regiiio dado por de bitos de menores de 1 ano, rea A, ano t l' 1 . , A t x 1000 nQ c e nasclCos VIVOS, area ., ano ~

nS!.

( '1111 =

i\ 11l<~dida que vo melhorando as condi(,es de vida, e de sade da 1"11 li ilal.;i1.o, em uma rea, vai diminuindo a mortalidade infantil. A 111I11'1.1! (Ie menores de um ano diretamente infiuenciada por condies li,' Sall<~amento, nutrio, (xlucao, habita(,o, assistncia pr-natal I' iIl) parto. Enfim, pode-se dizer que o C]vI I est ligado diretamente )): i (:( 1I1( lic,:esscio-econmicas da populao. () ()studo de ndices como () C 111I () objeto da disciplina de Epidl'lllioiogia ou Sade Pblica.

I';;.: istem vrias maneiras de se coletar dados, sendo que o instru1111'111.0 dI) medida pode depender do tipo de estudo ou tipo de varivel 1llIlllisada. Por exemplo, em um experimento envolvendo cobaias, I'I" 1111111 a medida direta das variveis de interesse. Em um inqurito, o 11111'Hi i(1I1rio o instrumento de medida mais utilizado. Em pesquisas ,'llllic:as, o instrumento de medida pode ser um formulrio de inforIIIIII:I)('S, () pronturio do paciente, ou a ficha que ser preenchida na 11111111111I!SC. V :il'ilIS cuidados devem ser tomados na elaborao e utilizao li' III1IiIlsl,rumento de pesquisa. A definio de quais dados devem :11'1' I"ddados, como captar as informaes, a clareza das questes do IIIII'HI, illll:,ri()so extremamente importantes. Para esse ltimo item, :11111 I'ld'(!l't~llcias teis Mucchielli (1979), Barros & Victora (1991) e 11"11111'1,1, 8.:, H,itchie (1975).
I

Aps a coleta elos dados, opnxiIno passo ()a constrlll,:o do banco de dados. Conto, em geral, a consolida(,ilo dos dados f()ita atravs de uso do computador, silo necessrios os conceitos bsicos de entrada de dados em programas computaciollais e de)uso de planilhas c1etrnicas. O grau de dificuldade para a constru(,,o de um banco de dados pode variar, dependendo do nmero de variveis, tipos de dados, tamanho da, amostra, etc. Nunca demais lembrar a importncia da realiza,o da conferncia de dados especialmente para amostras grandes e quando vrias pessoas est.o envolvidas na coleta, organiza,o e preparao do banco de dados. Essa conferncia deve ser baseada em informaes existentes, como, por exemplo, verificar a existncia de valores fora da amplitude esperada da varivel e verificaes lgicas. Observaes suspeitas devem ser conferidas e os erros encontrados, corrigidos. Quando no for possvel fazer a correo no dado identificado, recomenda-se codific-lo como se fosse um dado omisso. Tempo gasto no incio da anlise para verificao dos dados um tempo bem empregado; erros nos dados no identificados no curso da anlise principal dos dados exigiro que toda a anlise sejarefeita.

Para variveis categricas devem-se criar cdigos para cada categoria. Eles so arbitrrios e a escolha pode depender dos objetivos da anlise. A mudana de cdigos essencialmente no muda os resultados, mas uma escolha adequada, pode facilitar a interpretao. Para variveis dicotmicas, os cdigos mais convenientes so O e 1. Por exemplo O pode representar ausncia e 1 presena de determinada caracterstica. Para variveis com k categorias devem ser criadas k - 1 variveis indicadoras (O e 1), pois elas definem completamente cada categoria. So assim denominadas porque apenas indicam a que categoria o dado pertence. Usualmente a categoria de referncia corresponde situao em que todas as variveis indicador as so iguais a O (ou aI).

I'ar a variveis contnuas recomendvel entrar com os dados ori",i IllIis (~nb os codificados para classes de interesse, pois pode haver 111'1'I'ssi<!ade de mudana nas classes durante a anlise. Por exemplo, 1'111'11 idad(; s se deve entrar com faixas drias se houver interesse 1I1'1'llas mn faixas pr-fixadas. I'ara dados omissos, deve-se usar um cdigo que facilmente idenl,iliqlll~I~SS() tipo de dado. A forma mais usual consiste em completar 1I 1I1'IIII1~ro de dgitos com o valor 9 (9, 99, 999, de.), naturalmente :U' I~SSI~ no um possvel valor para a varivel. Por exemplo, para 1'1'1 ':,sall arterial usamos 999 e para sexo o cdigo seria g. 1':xc~lIlplo 3.20: Tentativas de suicdio (continuao)

Categorias Idade < GO 2': GO Estadiamento Estdios I e II Estdios III e IV

Cdigos O 1 O 1

1\ Tabela 3.16 exemplifica o banco de dados do Exemplo 3.5 . Os dldigos usados para sexo foram O para msculino e 1 para feminino I' I,ara a varivel profisso foram os seguintes: 1 - servios gerais, 2 dlllll{~si,ica, 3 - do lar, 4 - indeterminada, 5 - emprego especializado, 6 1111~llor, 7 - desempregado, 8 - estudante, 9 - lavrador, 10 - autnomo I' I I - aposentado. O indivduo n~ 1 um homem de 25 anos de idade , i.rahalhor de servios gerais. O indivduo n~ 2 uma domstica de 48 1IIIIlS (~o indivduo n~ 302 uma estudante de 13 anos.

Suponha agora que os estdios no sejam agrupados e que o estadiamento tenha 4 classificaes (I, II, III e IV). Neste caso, podemos criar trs variveis indicadoras (fI , h e h), como indicadas na Tabela 3.18.

Estdio

fI

r
II III
IV

o
1

h h
O

o
o

o
1

o
o

o
1

Indivduo

Sexo

1
2

O
1

Profisso 1
2

Idade 25
48

I'

1\ Tabela 3.17 mostra possveis cdigos para as variveis idade I'si.a<!iamento conforme as categorias usadas no artigo descrito no 1'>((~lIlpJo 3.6.

Na regra bsica de arredondamento, os dgitos excedentes devem ser descartados se o ltimo deles menor que 5 e, em caso contrrio o ltimo dgito retido acrescido de 1. Por exemplo, se os dados forem anotados como 87,72; 90,58 e 98,04 e quisermos usar apenas uma casa decimal, ento os arredondamentos sero respectivamente 87,7; 90,6 e 98,0. Como cada vez mais os clculos so feitos atravs de computadores e calculadoras que fazem os arredondamentos automaticamente , este assunto no to importante em termos de clculos. Entretanto, para

11111:\, boa apresentao d('v(!1!lser observadas:

dos resultados,

as seguintes rec:omendac:es (a) encontrar um extremo (valor mximo ou mnimo) ou

I. Sempre que possvel, usar o mesmo nmero de casas decimais

mn uma anlise. :2. I'~rngeral duas casas decimais silo suficientes, a no ser que o nmero seja menor qU(~1 (; muito pequeno, tal que um nmero 1 naior de casas decimais seja necessrio para distinguir uma observao de outra (por exemplo 0,0001 c 0,00(2). :\. Niio se deve arredondar um nmero mais de uma vez, pois pode resultar em um arredondamento incorreto. Por exemplo, o valor K7,348074 arredondado para um nmero com duas casas decimais 87,35 e se este nmero for arredondado novamente para um nmero com uma casa decimal 87,4. Entretanto, se o valor original for arredondado para um nmero com uma casa decimal, o nmero resultante 87,3 (diferente do primeiro esquema de arredondamento). ~. Arredondamentos no devem ser feitos at o final apresentao dos resultados, isto , a preciso completa deve ser mantida durante toda a anlise.

(b) um valor correspondente a 1,5 DQ, se o extremo corn~spondente estiver a mais de 1,5 DQ do quartil respectivo.

Os pontos que estilo a mais de 1,5 DQ do quartil correspondellt.(~ at 3,0 DQ so chamados .1.!!!!!.tos e~2s e os que esto a mais d(~ 3,0 DQ, pontos soltos. Existem smbolos especiais para representar no bo;x;plot os pontos externos e os soltos. Sero utilizados os smbolos * e O para indicar os pontos externos e soltos respectivamente. Um esquema de bO.'Eplot apresentado na Figura 3.7.
Ponto solto

Ponto 8xter'no

1
o,

Valor mximo

-~~-

'1,500 ___________ ]

Valcw~" tprccls

3,000

Um tipo de grfico muito til para a descrio de dados, visualiy;acJiode sua variabilidade, comparao entre diferentes grupos o J',I';\'[ic:o em caixas, bo;x;plot, ern ingls. Foi introduzido pelo estatstico allH!ricano John Tukey em 1977. Para a construo do boxplot obtm-se primeiro as seguintes esl.aLfsticas: 1Q quartil (Qr), mediana (Q2), 3Q quartil (Q3) e a distncia ilil,{~rquartlica(DQ), definida como DQ = Q3 -Ql. O boxplot obtiI II I seguindo-se os seguintes passos: L Numa reta so marcados o 1Q quartil (Ql), a mediana (Q2) e o 3Q quartil (Q3)' :2. Acima dessa reta constri-se um retngulo com limites iguais <1S posies do primeiro e terceiro quartis, cortado por um segmento de reta na posio relativa mediana.

O boxplot tambm fornece informaes importantes sobre o c{1111 portamento do conjunto de dados, como simetria e variabilidade!. SI' a amplitude for muito maior que a distncia interquartlica c~a 11)(' diana estiver mais prxima do 1Y. quartil do que do 3Q quart.i I, 11(1 fortes indicaes de assimetria positiva e de grande dispersi1.odas (lI, servaes.

Mota (1992) faz um estudo comparativo de crianas filhas di' 111111'il chagsicas com filhas de mes no chagsicas (grupo COll LI'il H'

N()ste estudo foram consideradas dosagens obtidas em exames lah()J'atoriais, medidas de variveis vitais, antropomtricas e de desenvolvimento motor (firmar a cabea, sentar e andar). Para o grupo de mes chagsicas, os dados j ordenados da dosagem d(~hilirrubina (mgjdl) so os apresentados na Tabela 3.19 'I'ahda 3.19: Dosagem de bilirrubina (Tnqjdl) 1I1:\,(~S chagsicas de 46 crianc:as filhas de

concluses obtidas atravs de uma anlise estatstica padrii(), I l( li' tanto, de fundamental importncia detectar e dar um tratamellto adequado a elas. sempre boa prtica fazer-se uma inspe(i,() d()H dados no incio da anlise estatstica. Tcnicas descritivas de I(lH tm um papel importante nesta fase.
(h,(

1,3 :\,1 :\,9 ,3 D,7

1,5 3,2 4,0 6,6 10,1

1,9 3,2 4,3 6,7 10,7

2,0 3,2 4,3 6,8 11,2

2,1 3,2 4,4 6,8 11,3

2,8 3,2 4,9 7,8 12,5

2,8 3,3 6,0 8,2

2,9 3,7 6,1 8,3

2,9 3,7 6,2 8,8

3,1 3,8 6,3 9,5

Dentre as possveis causas doaparecimento citar as seguintes:

de outliers, podem-s(~

Mudanas no controlveis nas condies experimentais ou d()H pacientes. Caracterstica inerente varivel estudada (por exemplo, gralld(~ instabilidade do que est sendo medido). Por exemplo, em um experimento oftalmolgico sobre os efeit()H do trauma devido fotocoagulao com laser na ris de coelhos, pesquisador mediu, entre outras variveis, a concentrao de pro1d nas totais no humor aquoso (lquido contido no espao entre a crrH~a e o cristalino). Observou que uma medida era muito maior do qu<)as outras. Procurand_o a causa, verificou que havia cado um mosquit(l na amostra analisada aumentando consideravelmente seu teor proU,j co.
(I

:l:llIilX

As estatsticas descritivas so :r =5,404, s =2,967, Xmin =1,300, =12,500, Ql =3,175, Q2 = 4,300, Q:3 =7,050. O boxplot correspOlldente apresenta:do na Figura 3.8.

:l.G.!) Observaes atpicas (outlier') I;; Illllito comum aparecerem entre os dados coletados, observaes IIl.lpicas (mdliers), isto , valores muito grandes ou muito pequenos ('111 1'l.J:\,(,::'i.o aos demais. Um conjunto de dados pode apresentar ape111111 11111 011vrios outliers. ()hs(~rva(;es atpicas alteram enormemente as mdias e variabili,11U1, (I,lS grupos a que pertencem e podem at mesmo distorcer as

As questes bsicas so quais observaes devem ser consideradas como outliers e como detect-Ias. Existem procedimentos para n~H ponder a essas perguntas. Os outliers podem ser detectados simplesmente por uma verificao lgica dos dados, atravs de grficos especficos ou ainda atraV{~H de testes apropriados. Uma forma grfica usual o boxplot apreSl,ll" tado na Seo 3.5.4.

N a verificao lgica dos dados, pod-se t{)star se as observa{;es

l!st.ao dentro de faixas de valores espc:)rados, confirmam-se c1assifi(';U:(I(!S dos dados, entre outros procedimentos. Em conseqncia 1 Issrvd eliminar inconsistncias e erros encontrados.
li

Foram identificados dois outliCTS: um ponto externo (o vaIo]' li) (' um ponto solto (o valor 17). Baseado na literatura mdica, o prillll~il'o valor detectado no foi tido como aberrante e assim optou-se por lIa() retir-Io da anlise. A cric.ulC;<l que firmou a cabea aos 17 mes{)s (~]'a portadora de paralisia cerebral.

1\ {listribuio de idade em que as criarl<:asfilhas de mes chagsi('a,', lil'll1aram a cabea apresentada na Tabnla ~1.2(). '1';J1I1.Ja :3.20: Distribui(;o ela idade ao firmar a cabe(;a de 51 crianas lillla:-;dI) mes chagsicas Idade ao firmar a cabea (meses) 2 3
4

Freqncia absoluta

5 6

17
Total

Porcentagem simples acumulada 19,60 19,60 54,90 74,50 19,60 94,10 1,96 96,06 1,96 98,02 1,96 100,00 100,00

() valor 17 meses est muito fora do padro (3 meses segundo a lii(l'at.lIT'a),o que confirmado no boxplot apresentado na Figura 3.9.

Quando um mltlicT detectado, duas medidas podem ser tomadas: abandon-Io ou conserv-Io. Existem justificativas para cada UUla dessas medidas e o tipo de anlise pode variar, dependendo se o (J'II,/,l'iCT foi ou no eliminado. Um OUtliCT deve ser eliminado da anlise quando houver uma jllstificativa convincente para isto, por exemplo quando a observa(;il.o (! incorreta ou houve erro na execuo do experimento ou na medida tomada. Aps a eliminao do ov.tlicT pode-se fazer a anlise estaLfstica usando-se apenas as observaes restantes, ou uma anlise mais sofisticada, assunto que foge ao nvel deste texto. Por outro lado, se nenhuma explicao pode ser dada observa(;;'u) atpica, o ov.tlie:r pode refietir uma caracterstica do que est smI(11) estudado. Neste caso, tal observao deve ser includa na anlise e 11111 tratamento especial deve ser dado aos dados. Por exemplo, pod{!-sl' usar uma ponderao da infiuncia das observaes ou alternativa mente uma transformao (y'X, log x, etc.) da varivel estudada, Para mais detalhes consultar Snedecor & Cochran (1989) e Altulall (1991).

-D-*

A Tabela 3.21 mostra os resultados de Shapiro et aI. (1986) rl!!'(! rentes a contagens de linfcitos T CD4 de 20 pacientes em reIlliss;u) de doena de Hodgkin (x = 823,2; S = 566,4) e de 20 paCi{mt.I'H em remisso de malignidades disseminadas no Hodgkin (x = G22, I; s = 293, O). O valor 2415 do paciente n'i- 20 do grupo com doena de Hod/',kill parece estar um pouco alto. Se for considerado como um O'l/,u..,. ('

d(~scartado do conjunto de dados, a mdia e desvio-padro das 19 (11 )s(~rva(~es caem respectivamente para 739 e 436.

N-

Hodgkin

No Hodgkin

1 2 3 4 5
6

7 8 9 10 11 12 13, 14 15 16 17 18 19 20

171 257 288 295 396 397 431 435 554 568 795 902 958 1004 1104 1212 1283 1378 1621 2415

116 151 192 208 315 375 375 377 410 426 44C) 503 675 688 700 736 752 771 979 1252

Todas foram estudadas a partir d(~surto ele ITU, suspeitado pela sintomatologia, sendo hipertemia o fato rnais importante. Cultura quantitativa com mnwro d(~coltmias igualou superior a 105 por ml de urina, colhida em condi(~esadequadas, confirmou o diagnstico. Estudos anatJmicos do aparelho urinrio realizaram-se a partir de urografia excrctora (UE) e uretrocistografia miccional (UCM). Os refluxos foram classificados a partir da UCM nos graus I, II, III, IV e V conforme Comit Internacional de Refiuxo. Avaliaram-se ainda medidas renais (dimetros longitudinal e transversal e espessura do crtex) e presen(~a de cicatrizes renais.

Um total de 48 crianas foram acompanhadas sob protocolo por perodo mdio de 4 anos. Todas as crianas eram portadoras de RVU sem outra anormalidade do trato urinrio, sendo que em 26 pacientes era unilateral e 22 bilateral, totalizando 70 unidades renais. Considera-se unidade renal o conjunto envolvido no fenmeno de refluxo vesicureteral representado pelo rim, sistema excretrio intrarenal, pelve e ureter at sua juno com bexiga. Houve predominncia do sexo feminino (81 %), com a idade no incio do estudo variando entre um ms e oito anos e nove meses.

:J.H

Exemplo comentado: Refluxo vesicureteral primrio em crianas


No perodo compreendido entre 1971 e 1985, a Unidade de Nefro-

l"I',ia (>(~ditricado Hospital das Clnicas da UFMG desenvolveu um

I'HI.IJdo com crianas portadoras de infeco do trato urinrio (ITU) (' 1'I'!IIIxo vesicureteral (RVU) descrito em Diniz et aI. (1996).

Seguindo o diagnstico de ITU, as crianas foram submetidas teraputica antimicrobiana por 10 dias. Aps melhora sintomtica, a droga foi suspensa por 5 dias e nova urulcultura realizada para confirmao de esterilizao da urina. Pacientes com urina comprovadamente "livre de bactria" receberam quimioprofilaxia por tempo prolongado com sulfametoxazol associado ao trimetoprim ou nitrofurantona. Exames radiolgicos dos 48 pacientes foram repetidos com intervalos de um a trs anos durante o perodo de observao, tendo cada paciente pelo menos dois estudos radiolgicos no perodo de estudo. A Tabela 3.22 mostra a distribuio dos graus do refluxo no incio do estudo e a distribuio de casos de cura e de quadros estveis. O RVU foi tratado clnica ou cirurgicamente, salientando-se qlW os pacientes submetidos correo cirrgica do refluxo possuam, (~TIJ

Tabela 3.22: Distribuio dos graus do refluxo no incio do estudo, de casos de cura e de quadros estveis segundo o grau de refluxo Grau de RVU I II III IV V Total Inicial n % 10 14,3 25 35,7 11,4 8 15 21,4 12 17,01 70 100 Cura n % 3 6,tS ltS 40,9 11,4 5 7 15,9 11 25,0 44 100 Estvel
11

H indicao de melhora.do RVU se IERVU < 1 (AO < Ai), de RVU estvel se IERVU = 1 (AO ~ AI) e de piora do RVU H<l IERVU> 1 (AO> AI). ' A relao temporal entre o incio dos sintomas e os diagnsti<:oH de ITU e RVU mostrada na Tabela 3.23. Tabela 3.23: Distribuio segundo faixa etria no incio da sintomatologia, poca do diagnstico de ITU e de RVU Grupo etrio (anos) 0f--1 1 f--5 ~5 Total Incio da sintomotologia n % 32 67 14 29 2 4 48 100 Diagnstico eleITU n % 30 63 16 33 2 4 48 100 Diagnstico eleRVU
11

%
33,3 33,3 6,7 20,0 6,7 100

5 5 1 3 1 15

%
27 58 15 100

grande maioria, graus mais graves de refluxo alm de apresentar~m com maior freqncia leses de cicatrizes renais antes mesmo da 1Ilterveno teraputica. . Apesar do tratamento (conservador ou cirrgico) estabelecIdo, houve 8 casos de piora: duas unidades passando de I para II, duas unidades de III paTa IV e quatro unidades de IV para V. Em trs unidades houve melhora: duas de II para I e uma de IV para 1. A partir de grau do RVU observado a cada verificao radiolgica e do grfico de linhas correspondente, criou-se um ndice de evoluo do refluxo (IERVU). Foi definido como o quociente entre a rea observada (AO) e a rea sob a curva que seria obtida caso o grau inicial fosse mantido (AI), isto , IERVU = AO/AI. Esse ndice reflete trs situaes distintas, ilustradas na Figura 3.10.
GrauscleRVU I'} GrlUl>Oe RVU
GrAUS d~ RVU

13 28 7 48

No houve retardo considervel para o diagnstico do ITU, 111,(1 ocorrendo o mesmo com o diagnstico do RVU. Esses fatos so claramente identificados ao se observar que 63% das crianas estudadas tiveram diagnstico de ITU com idade inferior a 1 ano e que, no nws mo perodo, somente 27% tiveram o diagnstico de RVU estabelecido. interessante destacar que o diagnstico de ITU em crianas muito novas no to freqente, devido m interpretao de hipertmnin nessa faixa etria. A distribuio de cicatrizes renais iniciais, sua evoluo ao lOII)J;O do acompanhamento e o surgimento de novas cicatrizes so apnlS(llltadas na Tabela 3.24. Das 21 unidades renais com cicatrizes no ill(c:jo do estudo, houve progresso em 16. Em cinco casos houve piora COII. comitante do grau de refluxo (quatro de IV para V e um de I pal'a II). Nas sete unidades renais em que apareceram novas cicatriy,cs, e I refluxo j havia sido curado, trs com tratamento conservador (gl'all II) e quatro cirrgicos (graus III e IV). A tabela 3.25 mostra a distribuio etria dos pacientes segulldo a ocorrncia de cicatrizes no incio do estudo, com notvel predolll (rlie) no primeiro ano de vida.

v
N. Ul'

~.;AI II I

"

~~]
TMlpO" d~ ob$MvaAo

" " '"

" '" '" " '"


(meses)

00

D"

"L :
I!) '0 :;o Ml

Ibl

::-~~-~-;71
lU'

,,'

.
, ,

A.:,=A,

-'~-'-'

"
I

A,

A,,>A.

... ,... _-,-........-~


M 10 ~,' ~ 100 (mesa!l)

Tempo de obs.:::rval'lo

"

H>

Tampo

" " "


de

observao

., '"

ao

(ma-$es)

'"

'00

Figura 3.10: Grficos exemplificando a evoluo do grau de refluxo: (a) melhora, (b) estvel e (c) piora

Tabela 3.24: Distribuio de cicatrizes renais segundo grau do refluxo Cicatrizes renais Iniciais Estveis Progresso Novas Final Grau de RVU rI III IV V
2
O

madamente 68. Usando essa regra, obtenha intuitivamente uma estimativa para o desvio-padro das idades de estudantes que cursam no primeiro ano de Medicina. 6. (a) Se um mesmo nmero somado a todos os elementos de um conjunto de dados? (b) Se cada elemento de um conjunto de dados for multiplicado por um valor constante?

I
2 1 O
O

Total
21 5 16 7 28

1
O

10 Li 2 1 7

6
O

3 3 6

1
O
]

10 :3 13

'I'aIH:la 3.25: Distribuio ctria dos pacientes dl~c:icatrizes no incio do estudo Grupo etrio (anos) 01-1 11-5

segundo a ocorrncia (a) Sempre a metade dos dados est abaixo da mdia. (b) A mdia o valor tpico de um conjunto de dados. (c) Enquanto tivermos alunos com rendimento abaixo da mdia, no poderemos descansar. 8. Apresentamos a seguir os resultados da segunda prova da turma C do 1~ ~emestre de 1990 da disciplina de Estatstica para Medicina.

Rins com cicatrizes TI, % 8


1

38
5

25
Total

21

100

6 I. Classifique as variveis dos Exemplos 3.3 e 3.4. (use os tipos descritos na Seo 3.2.2). .) r~sboce um banco de dados para a pesquisa descrita na Seo :1.6, incluindo a codificao das variveis envolvidas. :\. lJsn a sua calculadora para obter o desvio-padro dos 10 pesos de recm-nascidos, usados como exemplo na Seo 3.4.2. Est sendo usada a frmula que contm n ou n - 1 no denominador?
,I. Diga com suas prprias palavras o que o desvio-padro de um

17 22 24

12 18 22 25

12 18 22 25

14 19 23 2-5

15 19 23 27

15 19 23 27

15 20 23 28

15 \ 16 ' 21\ 21 l 23 23 32

(a) Calcule a mdia e a mediana. (b) Calcule o primeiro e terceiro quartis. Explique o significado destes nmeros. (c) Considere tambm os resultados das turmas A e B. Compare as notas das trs turmas quanto a sua homogeneidaclll.

(:c lujunto de nmeros. Turma Mdia

r,.

IJma conseqncia da regra da Seo 3.4.4 que a amplitude dos dados (a diferena entre o maior e menor valores) vale aproxi-

A B

22,5 24,0

Desvio-padro 4,5 5,4

9. Utilizando os dados do Exemplo :).2 construa uma tabela de freqncia com os dados agrupados para um nmero e uma amplitude de classes convenientes.
10. Consideremos 12 observa(;cs (ordenadas) do tempo de inter-

Escore 33 f36 f:39 f42 f36 39 42 45

Freqncia absoluta simples acumulada 1 1 3 1 4 3 7 15 23 16 24 21 21 15 4 4 5 9 12 19 34 57 73 97 118 139 154 158

nao (dias) de pacientes acidentados no trabalho, em um certo , hospital: 1, 4, 7, 9, 10, 1:3, 15, 17, 17, 18, 19, 21. Obtenha os quartis e interprete estes valores. 11. O tempo (em meses) entre a remisso de uma doena e a recidiva de 48 pacientes de uma determinada clnica mdica foi registrado. Os dados ordenados so apresentados a seguir, separadamente para os sexos masculino (M) e feminino (F):

45 f- 48 48 f- 51 51 f- 54 54 57 60 63 ffff57 60 63 66

9 F 2
7

10

44447 15 15

15 4 8

16 5 10

18 5 10

778 18 22 6 11 6 11

22

9 24

66 f- 69 69 f- 72 72 f--75

7
12

7
18 (a) Construa o histograma e a ogiva. (b) Localize as classes que contm o 1!2. quartil (Q1), a mediana e o percentil de ordem 90 (Pgo). (c) Acima de que nota encontram-se 80% dos indivduos? A que percentil corresponde este valor? Os dados da tabela a seguir referem-se taxa de colesterol (mg/ dl) de um grupo A de 50 estudantes com idade entre 10 e 19 anos de determinada escola pblica encontra-se na tabela:
Taxa de colesterol 112 f- 132 132 f- 152

(a) Calcule a mdia, o desvio-padro, a mediana e o coeficiente de variao para cada sexo. Interprete. (b) Repita os clculos pedidos em (a) para todos os 48 pacientes. Compare com os resultados de (a).
12. Um laboratrio

resolveu divulgar, alm do valor da dosagem, a ordem do perc-entil para pessoas sadias a ela associada. Interprete os seguintes resultados de uma pessoa que fez exames neste laboratrio: Albumina 5,3g/dl percentil 95 Colesterol180 mg/dl percentil 5

Freqncia absoluta simples acumulada 1

Freqncia relativa simples acumulada

1 :\.

A tabela a seguir apresenta os dados de um teste de psicoanalogia (um teste de inteligncia c:f!l que um indivduo tem que resolver uma srie de analogias). A amostra contm 158 indivduos que receberam notas de acordo com o rendimento !lO teste.

3 6 9 14
9

_5
2

_/

1 50

(a) Complete (I Construa

a tabela. o histograrlla e a ogiva.


Puo Qual {~o seu significado?

(c) Calcule graficamente

( I) Outro grupo de indivduos (B), com faixa etria entre 50 e 60 anos, apresentou uma taxa d(~colesterol mdia igual a 254 mg/dl com um desvio-padro de 48 'my/dl. Qual dos dois grupos mais hOIllOgllCO? Por que? (~) O que podemos suspeitar, grupos?
I;l. \';\u urna pesquisa

(a) Calcule medidas de tendrmcia central e de vari abilidade , o coeficiente d() variiu;iio e os quartis. Apresente essas estatsticas em urna tabela contendo inclusive o ttulo. Comente os resultados.
.
_.

comparando

as mdias dos dois

(b) Verifique, construindo bO:I:J!lof:s, se h afirmativo, classifique-os.

O'IJ.f):T8

e, em caso

(c) Quais grficos seriam indicados para esses dados? Urna das formas que um pediatra usa para avaliar o grau de controle do diabetes a dosagem da glicohemoglobina, que medida em % da hemoglobina total. Valores acima de 12 indicam que o paciente no est sob controle. Em um grupo de 15 criam;as obtiveram-'se os seguintes resultados para 13 delas:

sobre a conccntra(;iio de minerais no leite IIl<1terno, foram coletados no perodo dc 1984 a 1985 dados de ;)[) mes do Hospital Maternidade Odete Valaelares em Belo Horizonte. As m~tCs foram divididas em dois grupos, segundo () perodo de lacta(;iio: colostro c leite maduro. Os minerais considerados foram ,cob~), magnsio e zinco. Os dados a seguir, (~xtrados de Nunes et al. (1988), referem-se ao clcio e zinco:

10,5' 12,4 Clcio (p,g Iml ele leite) - Grupo colostro


113 163 181 225 241 175 238 279 254 275 303 181 242 281 311 313 325 334 372 375 145 163 437 231 275 221 231 256 296 312 323 344 375

11,2 12,4

11,7 12,5

12,1 13,1

12,3 13,1

12,3 13,5

167 159 238


277 1,07 G,07 7,45 0,52 1,55 2,63

Clcio (p,g Iml de leite) - Grupo maduro


188 200 206 213 214 217 244 256 259 260 263 264 293 302 303 314 344 394 Zinco (~Lg rnl de leite) - Grupo colostro 1,20 1,30 3,13 3,20 3,70 4,40 4,57 5,20

Por motivos associados limitao do aparelho de anlise, sabese apenas que os valores observados de dois pacientes so maiores que 14, Para mostrar que este grupo tem um alto valor de glicohemoglobina, ele igualou a 15,5 os dois valores maiores que 14 e tirou a mdia dos 15 valores. Comente o procedimento usado, proponha e obtenha uma forma alternativa de sntese dos dados.
\"'\E~,f'\;'l'l'"

6,13 8,25 0,60 1,60 2,92

6,50 8,40 0,78 1,92 3,02

6,82 8,77 0,86 2,15 3,05

6,82 9,54 1,08 2,27 3,57

6,90

7,23

7,42

7,43

5,82 7,43

kEd?

Zinco (~Lglrnl ele leite) - Grupo maduro


1,23 2,40 3,88 1,28 2,41 5,50 1,31 2,52 7,38 1,40 2,57 1,55 2,60

t
t

ti !

17. O grfico a seguir mostra as composies, ordenadas por ano, de Robert Schumann, compositor alemo que viveu entre 1810 e 1856 (Jaminson, 1995). As obras esto representadas por seus nmeros de opus.

(a) Comente e quantifiquc a variao encontrada nestes resultados. (b) O jornal apresentou a notcia com a seguinte manchete: "Mdico constata erro em exames para colestcrol". O jornalista que escreveu esta manchete usou uma expresso adequada para apresentar os resultados?
184 133 '1"1:~132 131

o')',
00;<

1:~(; 128 -1'2"1

08e

119 1"1'1'117 113

07I120'11;' 078 '125 '111

0700971'10 07 072 060 l'l 06507-1070 07'1 0';,;',109

O~XI "107 '1'17 104

0:,:008'1073

tO '1'10'125 '13G 123 118

19. A tabela a seguir mostra a distribuio do peso ao nascer dos 7.225 nascidos vivos no ano de 1992 na regio urbana do distrito sede de Juiz de Fora (Souza & Costa, 1993). No foram includas na tabela 99 crianas com peso ao nascer ignorado.

Aproximadamente a qual percentil corresponc.le uma das mais conhecidas pcas para piano elo composItor: Cenas Infantis (opus n.'.'. 1G),( Em que ano Schurmmn completou 75% de seu tr:a~alho'( Qual o percentil correspondente e qual a composIao que marca essa rca.lizao'( Em 1833, St':humann tentou suicidar-se pela primeira :rezo Se ele tivesse conseguido realizar seu intento, qual sena o percentual de perda de suas obras para a humanidade? Os anos 1840 e 1849 foram extremamente produtivos. Qual , dO.7 o percentual de sua obra foi composto nesse peno
I~,

Peso ao nascer

(g)
500 1000 1500 2000 2500 3000 3500 4000 4500 5000 5500 Total I- 1000 I- 1500 I- 2000 I- 2500 I- 3000 I- 3500 I- 4000 I- 4500 I- 5000 I- 5500 I- 6000

Freqncia absoluta simples acumulada 33

Percentual simples acumulado

60 147 614
2077 2875 1113

184 20
1

linal de 1988, o Prof. Eder Quinto da Escola Paulista 11' Medicina submeteu dez amostras do mesmo sangue a dez 1:I1>oratrios 'da cidade de So Paulo. Segundo delarao do I lI'S< lIsador (Folha de So Paulo de 3/08/89). os ~,abor~trios ('sClllldosforam "os dez maiores e mais conhecIdos da CIdade. 1.\ lI':un obtidos os seguintes resultados para o nvel de colesterol (' I.l'iglicrides (rng/dl).
Nll

(a) Complete a tabela. (b) Em que classe est a mediana da distribuio? (c) Acima de que peso encontram-se 90% dos nascidos vivos? Qual o percentil correspondente? (d) Construa o histograma e comente. 20. Obtenha os escores padrqnizados para os dados do Exemplo 3.14. Comente. 21. A seguir apresentamos tabelas obtidas pelo cruzamento de variveis do estudo descrito no Exemplo 3.7.

Colesterol Triglicrides

284 335 135

295 361 166 82

330 333 158 150

228 294 202 86

365, 318 162 121

NIll.a:

- significa dado ausente

84

Faixa de idade

SI~XO

60 f- 75
75 f- 100 Total

Masl:111) Feminiw) 30 (21,1 %) lU) (7D,D%) 142 (t:\D,3%) 17 (lO,7%)

(e) Segundo os autores, 54,2?1) dos residentes que tinlmlll li.\.' gum grau cl<~ dderiorae,o nas funes do comportalll<!11 to necessitavam dl~ ajuda importante nas tarefas di;\,l'ias. Identifique (~sscs casos. (f) Baseado nessas tal)(~las e/ou na tabela apresentada 110 Exemplo 3.7, C:Olnplc~te se possvel o seguinte pargrnJo: "A anlise das vari<i,vlsern separado mostrou que IX, elos residentes apresentavam distrbios ela mobilil lal lI!; .......... % eram agitados; % necessitavam de ajllda para se alimentar; % eram incontimentes de urilla; .......... % apresentavam distrbios do sono e % alll cinavam e/ou tinham idias delirantes" . 22. Para o exemplo sobre reHuxo vesicureteral anas, apresentado na Seo 3.6: (a) Quantas do? primrio enl cl'i~

Grau ele deteriorao Nulo Leve Moderado Grave Total

Sem

Demncia Leve~

Grave

lG (D4,1%) 51 (41,1%)
10 (11,5%)

1 (5,D%)
')7 ('Xl
,;...; ,:...J

O (0,0%)
4G (37,1%) Gl (70,1%) GD (86,3%)

QO/) ,o /0

4 (5,0%)

1G (lt:\,4%) 7 (8,8%))

meninas havia no grupo de pacientes desse mi,lIda utilizao do ndice de evolllcl\l ) ' de cica

Funef1 de comportamento Mobilidade Orientao Comunicao Cooperao Agitao Vesturio Alimentao C:ontinncia urinria SImo Ilmnor objetivo Illunor subjetivo

Nenhuma
178 (57,8%) 95 (30,8%) 84 (27,3%) 89 (28,9%) 181 (58,8%) 203 (65,9%) 242 (78,6%) 220 (71,4%) 187 (60,7%) 69 (22,4%) 70 (22,7%)

Alterao Alguma
130 (42,2%) 213 (69,2%) 224 (72,7%) 219 (71,1%) 127 (41,2%) 105 (34,1%) 66 (21,4%) 88 (28,6%) 121 (39,3%) 239 (77,6%) 238 (77,3%)

Completa
47 (15,3%) 34 (11,0%) 17 (5,5%) 95 (30,8%) 7 (2,3%) 40 (13,0%) 21 (6,8%) 61 (19,8%) 7 (2,3%) 61 (19,8%) 36 (11,7%)

(b) .T ustifique a importncia elo reHuxo (IERVU).

(c) Em quantas unidades renais houve constatao trizes no incio do estudo?

(d) Para as tabelas a seguir, compare os grupos com ou SI!1I1 cicatrizes em relao ao padro de infeco urinria I! aI) acometimento unilateral ou bilateral dos rins.

Infeco urinria Sem recorrncia Recorrncia ocasional Recorrente Persistente Total

Sem cicatrizes
TI,

Com cicatrizes

% 32,0 24,0 32,0 12,0 100

n
8 8 3 4 23

%
34,8 34,8 13,0 17,0 100

8 6 8
')

(a) Complete os totais das tabelas. (I)) Comente os resultados (c) qual a prevalncia apresentados nas tabelas. \",V'\-A-b'f~
"\)'\''''

da demncia?

25

(d) qual o percentual de idosos com algum grau de deteriome,o nas funes de comportamento?

Ocorrncia RVU de cicatri~es Unilateral Bilateral TI, n % % 5* 23 18 69 Sim 31 17 77 No 8 26 100 22 100 Total

Captulo 4

~:l. Faa uma anlise descritiva completa dos dados apresentados na

Tabela 3.2 da 8eo 3.2.3 (recomendvel o uso de computador).

Probabilidade e Avaliao de Testes Diagnsticos

~;). Com uso de um programa computacional, faa uma anlise descritiva completa dos dados dos Exemplos 3.3 e 3.4. ~(;. Apresente exemplos de aplicao do que foi estudado nesse captulo retirados de revistas, jornais e publicaes cientficas. Comente a adequacidade do uso da estatstica nesses exemplos e se for o caso sugira modificaes da anlise e/ou da apresentao. Uma das experincias mais rotineiras da prtica mdica a solicitao de um teste diagnstico. Os objetivos so vrios, incluindo a triagem de pacientes, o diagnstico de doenas e o acompanhamento ou prognstico da evoluo de um paciente. Para chegar ao diagnstico, o mdico considera vrias possibilidades, com nveis de certeza que variam de acordo corn as informaes disponveis. Um objetivo deste captulo , usando a linguagem da Probabilidade, mostrar como se mede o nvel de certeza da ocorrncia de um (:~vento, por exemplo, a presena de uma doena aps a observao de um teste positivo. Consideraremos o teste positivo quando indicar a presena da doena e negativo quando indicar a ausncia. No existe teste perfeito, aquele que com certeza absoluta determina a presena ou ausncia da doena. Assim, o objetivo principal deste captulo estudar os ndices nos quais o conceito de qualidade de um teste diagnstico usualmente desmembrado. Freqentemente, um nico teste no suficiente, e portanto deveS(~ combinar dois ou mais testes. O ideal seria que, para cada paI.ologia, fossem determinados os testes a serem includos no processo diagnstico e a nlelhor forma de combin-Ios. Neste captulo tamb(~1I1 SilO apresentadas as formas mais comuns de combinao de test(~s (~ como medir a qualidade do teste conjunto.

Para atingir estes objetivos introduYJimos de forma intuitiva con1:I~jtos elementares da Teoria das Probabilidad(~s. Apresentamos 1'01'IllalulCnte os conceitos de sensibilidade, especificidade, valores de III'I!( [i ()io positivo e negativo.

(~ventosd(~inter<~sse,por exemplo, F: "a sorna dos dois valores 10 "; G: "os dois valores so iguais"; H: "urna das faces maior que 3 ". fcil ver que F tem trs elementos, isto , F = {(4, 6), (5, 5), (6, 4)}, G e H tm seis e vinte e set(~dernentos, respectivamente.

(;onceitos probabilsticos so necessrios para se estudar fen1111 !IIOS aleatrios, isto , sitwtl{es em qu<~ os resultados possveis so ('.1 li1I j(~cidos,mas no se pode saber a prior i qual deles ocorrer. Os primeiros resultados da Teoria das Probabilidades foram obtiIIIiSqnando matemticos do sculo XVII tiveram que responder per1',lllltas de amigos sobre jogos de aYJar. Usarmllos esta mesma motival{ao para ilustrar os conceitos bsicos. Nosso objetivo, entretanto, I" allalisar situa({es muito mais complexas, colocadas pela medicina dlllica. Nesta seo apresentamos alguns resultados, essenciais para o cl1'1 ilo de probabilidades na maioria das sitlull{es prticas.

Na etapa de pesquisa para a detennina({o do grau de confiabilidade de um teste diagnstico, o pesquisador utiliYJa-oprimeiramente em dois grupos muito especficos de p(~ssoas: um de portadores da doena perfeitamente caracterizada e outro de pacientes sem a doena em questo. O diagnstico, nesta etapa, deve ser feito por um meio dif(~rente do teste em estudo, o chamado lHul'('(l,o O'/J,T'O. OS resultados desta etapa da pesquisa podem ser resumidos na forma da Tabela
4.1.

Tabela 4.1: Esquema padro de sntese dos dados para verificao da qualidade de um teste clnico Doena Teste Positivo Negativo a b c a+c b+d

O conjunto de todos os resultados possveis de um experimento :dl!ai,{)rio chamado de espao amostral e ser denotado por E. Um 1'/lI"II'!;() um subconjunto do espa({o amostra!. Quando constitudo de 111 li !llaSum elemento, chama-se evento simples.

Presente Ausente Total

Total a+b c+d n

Para definir os ndices que descrevem o grau de confiabilidade de um teste, precisamos trabalhar com os seguintes eventos: ( ~1)llsideremoso experimento "lanamento de um dado". Trata-se e11' 11111 (!xperimento aleatrio. O espao amostral {I, 2, 3, 4, 5, 6}. ~;il,l) (:VI!ltt,OS simples: { 1 }, { 2 }, { 3 }, { 4 }, { 5 }, { 6 }. Outros "V"lltoS: A = {1,3}, B = {2,4,6} = {nmeros pares}, C = {3,5,6}. T+ corresponde a teste positivo T_ corresponde a teste negativo D+ corresponde a indivduos portador da doena D_ corresponde ir indivduo no portador da doena.

1\ situa({o menos simples quando se lanam dois dados. O "::lliU,:O amostral tem agora 6 x 6 = 36 elementos, j que cada face IIIIIII!ocorrer associada com todas as outras. Muitos podem ser os

Nos exemplos 4.1 e 4.2, os eventos simples so equiprovveis. Suas probabilidades sao, portanto, calculadas contando-se o nmero de

J'( ~Sl 11 tados favorveis ao evento de iIlt(~reSsee dividindo-o pelo nmero t.ot.al (k possibilidades. Nestas circuustfmcias, o clculo da probabiIidadl~ de um evento requer simpksuwnt,(~ a coutagem do nmero de J'( 'SI 11 t.ados favorveis e o muwro total de possibilidades.

A ocorrncia simultfmea dos eventos A e B chamada de (~V(~llt.O interse(:o e representada por A n B. Contm todos os pontos dll espao amostral comuus a A e B, sendo ilustrada pela rea sombn~ada
na Figura 4.1.

No Exemplo 4.1, a probabilidade I' l'llll: .;(~qentemente: .


2

de ocorrfmcia de cada face 1/6

Fr(A)

= G

P,.(B)

p,.(C)

t
27

No Exemplo 4.2 os eventos simples S80 tambm equiprovveis. I'IIl't.allto, as probabilidades dos eventos F, G, e I-I S8.o:
;) =-

Fr(F)

3G

PT (C") =-6
T

3G

P'I'(I-I) = -, 36

Na maioria das situa(:es prticas, os elementos do espao amostral IliII)s;i() igualmente provveis e, deste modo, a probabilidade dos even1., I,';Ikv(~ ser calculada utilizando-se da noo de freqncia relativa, i:iI,l) {', a proporo do resultado de interesse em sucessivas observaes :il.II 111<~SlllaS condies do fenmeno aleatrio. 1)1)1' exemplo, a probabilidade de infeco nos leitos de uma ala l'ill'II'!',icade um hospital s pode ser calculada atravs da freqncia 1I,Iat.ivad(~infeces, j que diferentes pacientes tm riscos diferentes. Na J'(~alidade, a freqncia relativa apenas converge para o valor 01/1 I'l'olml>ilidade do evento. Esta idia s pode ser colocada sob bases li' di.Ia:, at.ravs do estudo da teoria axiomtica da Probabilidade. Isto 1111' I :~I'I'; !'nito neste texto. Registramos simplesmente que a a freqnI'ia 1"'lat.iva {~diferente do valor da probabilidade, mas no faremos, ,1" a)','II';\'I~mdiante, diferena entre os dois valores. Estaremos adII1 it.ilI< 10 qlll~ o nmero ele repeties suficientemente grande para 11111' ;I IIi ri ~l'eIl(:asej a desprezvel.

evento unuJ,O de A e B equivale ocorrncia de A ou de 1/, ou de ambos. Contm os elementos do espao amostral que esto I~III pelo menos um dos dois eventos. Denota-se por A U B, representada pela rea sombreada da Figura 4.2.

o evento cO'lIljilc'Inc'II'/;(),'r de A conthn todos os c1enwlltos do espa(.;o 1I.IIIostral que no pertecem a A, 011 seja, trata-se da nega(.;iiodo evento /1. I;; usualmente indicado por A. I)ois eventos A e IJ si1.o'min!ilUl,'rnC'II.!;c c;r;r;l-ndc'I/,/;c8 se a ocorrncia ,1,- 11111 deles impossibilita a ocorr(\]Jcia do outro. Eln outras palavras, (I:; (I. lis eventos niio Wm nenhuru c1emento do espa.r.;oamostral em "'IIIIIllIl, isto , AnB = 0.
11.2.4

Em muitas situa(.;()(~S o objdivo {~ c;t1cular a probabilidade de 11111 evento restrito n, determinada condi(.;iio. ]~;a chamada probabilidadc condicnud. Por exenlplo, na avaIia(.;iiod(~um teste diagnstico, interessa conhecer a prolmbilidade de o teste ser positivo, dado que o paciente ou nilo doente. Portanto, podemos calcular probabilidades cO'l/,rciO'l/,r8, representar Ias por:

Propriedades

da probabilidade

I. ()::::: Pr(A)::::: 1, para qualquer evento A


~. PT(E)

1, onde E o espao amostral exdudentes, entiio

:\. Se A e B so eventos mutuamente

Para introduzir o conceito de prollabilidade condicional, voltamos entretanto motivao simples forrwcida pc10 lam.;amento de dois dados. Suponhamos que se lancem dois dados niio viciados. Existem 36 resultados possveis, todos com probabilidade 1/36. Se dispusermos, entretanto, da informaiio de que o resultado do primeiro dado 3, qual ser a probabilidade de a soma dos dois dados ser 8? Para calcular esta probabilidade, raciocinamos da seguinte maneira: como o resultado do primeiro dado 3, existem somente seis resultados possveis em nosso experimento:

I\. partir das regras anteriores, pode-se mostrar que valem as


:H !I';II iIItos

relaes:

I;;fcil justificar o termo subtrativo considerando a Figura 4.2. S.~tomassemos apenas PT(AuB) = Pr(A)+Pr(B), estaramos ('ousiderando duas vezes a probabilidade de interseo.

a dificuldade de clculo da probabilidade dos eventos A (! /1 {~usualmente muito diferente, esta propriedade tem muitas aplicar.;es na prtica.
( :01110

Note que agora o espao amostral ficou reduzido a apenas 6 pontos. Intuitivamente, como cada um desses resultados era equiprovvel antes de se conhecer o resultado do primeiro dado, o mesmo deve continuar acontecendo, aps considerar-se aquela informao. Como apenas o par (3,5) satisfaz a condio desejada, a probabilidade procurada 1/6. Naturalmente a probabilidade condicional, dado que o primeiro dado produziu 3, dos outro:;; 30 resultados ento zero, j que sua ocorrncia impossvel. Vemos que a probabilidade de um evento A modifica-se quando se dispe de uma informao sobre a ocorrncia de um outro evento associado. A probabilidade do evento A, quando se sabe que o evento B ocorreu, chamada probabilidade condicional de A dado B; denota-se por PT(AIB) e se P.r(B) > O calculada por

PI'(AI13)

T'I'(An 13) P'I'(13)

que estamos fazendo precisamente estabelecer PT(AI13) a plll'UI' dt. Pr(A n 13) = 0,10 e PI'(13) = 0,25. Assim, PT(AI13) = O, 10/0, '2r, 0,4 a probabilidade condicional de A dado 13. Em palavras, 1'111.1'1' as pessoas com ex<:<~c-:so de peso, 40% tm presso elevada.

Ajuda a entender a expresso (4.1) pensar que, quando escrevemos


I )'I'(AI13), o espao amostral ficou restrito ao evento 13. Reescrevendo

(11.1), obtemos a exprec-:s8.o da r<~grada multiplica(;o. Dois eventoc-:A e 13 sU.o'lTl,dqw'II,dr:'II,tcs se o fato de um (kll~s 1.(:1' ocorrido niio altera ,J, probabilidade de ocorrncia do outro. 1 ';c-: 1.11 definio expresc-:aem frmula (~

Um grupo de pessoas foi classificado quanto a peso e presso arI.erial de acordo com as propores mostradas na Tabela 4.2. Tabela 4.2: Distribuio de um conjunto de pacientes segundo peso I~ presso arterial Presso arterial Elevada Nonnal Total Peso Normal 0,08 0,45 0,53

ou seja, a probabilidade condicional de A dado B igual ,1. pl'!11111 bilielade niio condicional de A. Em outras palavras, a ocorl'{\!H:i 11 do evento 13 no fornece nenhuma informa(;o sobre a ocorrC~lIciadi) evento A.

Excesso 0,10 0,15 0,25

Deficiente 0,02 0,20 0,22

Total 0,20 0,80 1,00

Para a extrao sucessiva sern repOSH;aode duas cartas d(~ 11111 baralho comum, vamos calcular a probabilidade de ambas sereml ":i,s", Antes da primeira extra(J.o, hei 4 ases em 52 cartas. Por L: \.I Ii,( I, II probabilidade elo evento A: "s na primeira extrao"

PI'(A) Qual a probabilidade de uma pessoa escolhida ao acaso naquele gl'llpo ter presso elevada? Considerando que a pessoa escolhida tem (~xcessode peso, qual a probabilidade de ter tambm presso elevada? Chamando de A o evento tr:T pTcsso elevada, e lembrando que a pl~ssoa escolhida ao acaso, em um grupo em que 20% tem presso (dl~vada,temos que PT(A) = 0,20. Clmmemos 13 o evento teT excesso de peso. Diante da informao d(~qne a pessoa tem excesso de peso, passam a no nos interessar as colunas correspondentes s pessoas de peso normal e deficiente. N a primeira coluna, vemos que, no grupo dos que tm excesso de P(~,'4i), a proporo dos que tm presso elevada 0,10/0,25 = 0,4. O

=-

4 1 =52 13

J na segunda extrao, o espao amostral se reduziu pOI'<j 111' II primeira carta extrada no foi reposta. Restam 51 cartas, (~ellI. I'! ' elas apenas 3 ases. Chamando 13 o evento "s na segunda extr:lC,:/U)"

P(13IA)

= ~

51

PT(A

n 13) = Pr(A)PT(13IA)

= -

4 3 x 52 51

=-

1 221

Os eventos no S,)()illd('I)('lld(~nl(~s.A pl'ollabiljdad(~ do SCl..',uudo I'V(~IILo depende do resultado do prinwiro. Se cOllsiderannos a mesma ~:i Llla(:,),o, porm com reposi(:i",o da primeira carta, o espa(:o amostral :;1' Illallter inalterado aps a primeira extra(;iio, como tambm a prol'al li1 idade de extrao de um ,\.s
1

PI'(BIA)

PI'(B)

1:J

Um casal possui 2 filhos. QnaJ a pr()hahilidad(~ de ambos serem do sexo masculino'! Os eventos M: "nascer urna criarl<.;a (10 s(~xo nrasculino" e F: "nascer urna criaw:a do sexo feminiuo" siio equiprovv<s. Logo a probabilidade de nascer um filho do sexo rnasculino 1/2. A ocorrncia do evento A: "o primeiro f-ilho{~ do sexo masculino" no infiuncia a ocorrncia do evento B: "o segundo filho (~do sexo masculino", e ento:

PI'(A n B)

1 1 52 x 13

1 676 P(A

n B) = P(A)P(B)

= "2 x "2 = 4"

Qualidade de testes diagnsticos


1';sL<: o primeiro problema que De Mer props ao matemtico I\Iais(~Pascal, que ao resolv&~-lo iniciou () desenvolvimento da Teoria ,I;,s I'mbabilidades. Qual {; o resultado mais provvel: obter a face (i Ill'j(l menos uma vez em quatro jogadas de um dado, ou obter a ::"llla 12 pelo menos urna vez em 24 jogadas de dois dados? Como as ,I"!',a( Ias do dado so independentes, temos: O bom uso de um teste diagnstico requer, alm ele consideraes clnicas, o conhecimento de medidas que caracterizam a sua qualidade intrnsica: a sensibilidade, a especificidaele e os parrnetros que refietem a sua capacidade de produzir decises clnicas correta's: valor da predi.o positiva e o valor da predi(:o negativa. Usando os resultados da Teoria de Probabilidades apresentados nas sees anteriores, vamos nos ocupar desses quatro ndices nos ,quais usualmente decomposta a idia de qualidade de um teste diagnstico.

I l",

ao menos urn 6 ) em 4 jogadas

1 _ PI' (

nenhum 6 ) em 4 jogadas 0,518

1_

(~}1 =

1'1' (

a(l 111l~nos uma sorna ) 12 (~m24 jogadas

nenhuma soma ) 1- P T ( 12 em 24 jogadas 1-

Na anlise da qualidade de testes diagnsticos, interessa conhecer duas probabilidades condicionais que, pela sua importncia, recebem nomes especiais: sensibilidade e especificidade. A sensibilidade, denotada por 5, definida como

(35)
-, 36

24

= O 491
' ou seja, a probabilidade de o teste ser positivo sabendo-se qlW () paciente que est sendo examinado doente.

Tabela 4.3: Resultadoc: da aplicar;o do teste ergomtrico cia a excrccioc: em 1.465pec:c:oac: Docnr;a c:oronarian,l. Presente (D_ Ausente (D_) Total Teste ergcimtrico Poc:itivo (7~1_) Negativo (T_) 1)15 208

de tolenln-

'111c:(ja, a probabilidade de o teste ser negativo lIa' :i(~llteexaminado no portador da doenr;a.

c:abendo-c:e que o

Total

1_)

1023
442

115
930

327
535

()c: nomes so dcscritivoc:: sensibilidade mrx1c a capacidade de I'C 'IUJ\.( l do teste em um paciente doente enquanto que ()c:pecificidade, II lIao I'<~aodo teste em pacientes no portadores da doena, isto , 'I 1.1'c:I.I~ () especfico para a docna em questiio. A anlise da defini(;o desses dois ndicec: (8 e c) mostra que, :illlljaccntemente a estes conceitos, estamos assumindo a exisWncia .I,' 11111 padro onro, ou seja, um teste diagnstico que sempre pro,IIIZ ('(~sultados corretos, Alm disso, assumimos que os pacientes so l'lac:c:ilicados apenas como doentes e no doentes, no se admitindo I':d,l.)',ioc: intermedirios. l )c:ando a notao da Tabela 4.1 e a defini(;o de probabilidade I"~ IlIcI icional, os ndices s e c so estimados por:
a ,---

1465

8 -

815 102:i :327 442 =

()

797 ,

e =

O, 740 de 79,7%, ligeiramente

ergomtrico tem uma sensibilidade superior que sua especificidade (74%).

o teste

, - a+b

e==--

c+d

Lind & Singer (1986) estudaram a qualidade da tomografia computadorizada para o diagnstico de metstase de carcinoma de fgado, obtendo os resultados sintetizados na Tabela 4.4. Um total de 150 pacientes foram' submetidos a dois exames: a tomografia computadorizada e a laparotomia. Este ltimo tomado como o padro ouro, isto , classifica o paciente sem erro, Tabela 4.4: Resultados da tomografia computadorizada cientes com metstase e 83 sem metstase do carcinoma em 67 paheptico

Wil'III')' d aI. (1979) compararam os resultados do teste ergomtri" , ,I" L, dl'l'll.llcia a exerccios entre indivduos com e sem doena coro1111I11111a. () i;()ste foi considerado positivo quando se observou mais di' 1/11'/11, d,~ depresso ou elevao do segmento ST, por no mnimo 11,11:-': 8, ('111 comparao com os resultados obtidos com o paciente em I' '11' IWiI), () diagnstico definitivo foi feito atravs de angiografia. A 'I'alll'la 11.:\ sintetiza os resultados encontrados,

Metstase de carcinoma heptico Presente (D+) Ausente (D_) Total

Tomografia computadorizada Positiva (T+) Negativa (T_) 52 15 9 74

Total
67

83

61

89

150

Si\.()

A sensibilidade e a especiJlci<lad(~(la tomografia cOIuputadoriy,ada (~stimados por:

Tabela 4.G: Pro]mbilidades Vpp eVPN Popula(;o Doente Sadia Total

necessrias para o clculo dos (lIdicnH

Proporc)io com resultado Positivo Negativo


P 1 - J}
]).'1

p(l -

8)

I)ifnrentemente do exemplo anterior, a <~Sl)(~ci(icidade (89,2%) Illaim do que a sensibilidad(~ (77,(jeXJ).

p+(1-p)

(1-p)(1-c) ps+(1-p)(1-c)

(l-p)e p(1-8)+(1-p)c

1\ sensibilidade e a cspec:ificidade, embora semdo ndices ilustrali vos (~bons sintetizadores das qualidades gerais de um teste, tm IIll1alimitao sria: uo ajudam a d(~cis;ioda equipe rndica que, re('I-1 1(~lldo um paciente com n~sultado positivo do teste, precisa avaliar :iI' o paciente est ou niio doent(~. No se pode depender apenas da :1l'lIsi I>ilidade e da especificidade, pois estes ndices so provenientes d(' IlIlla situao em que h certey,a total sobre o diagnstico, o que 11111) acontece no consltrio mdico. Da a necessidad<:; destes dois (1lltros ndices que refietem melhor a realidade prtica. Neste mo1III'IILl), interessa mais conhecer os seguintes ndices denominados valor da predio positiva (V P P) e valor da predic;o negativa (V P N), 111-1illidos respectivamente por:

prevalnc:ia da doell<;a na popula(;o de interesse, isto , a propoI'<;iu) de pessoas doentes, ou a prolmbilidade de doen(;a pr-teste. O valor de predi(;o positiva {~obtido dividindo-se a freqIH:ia dos "verdadeiros" positivos, aqueles oriundos de pacientes doeut(~s, pelo total de positivos. Obtni-se a seguinte expresso
ps

VPp=-----ps + (1 - p)(1De forma anloga, considerando-se obtemos o valor da prcdi(;o negativa


VPN

c)
negativos

os "verdadeiros"

= __

(_l_-_p_)E_'~ -p(l - s) + (1 - p)e

Ambas as expresses dependem do conhecimento de p, uma (~Stimativa da prevalncia da doena na populao de interesse. Estas so probabilidades de resultados corretos de diagnstico. Exemplo 4.11: Metstase ao) 1';111 palavras, V P P a probabilidade do paciente estar realmente dll('111,1' (Jllando o resultado do teste positivo e V P N, a probabilidade IIII IIIU 'il~I tt,l~n.o estar doente quando o resultado do teste negati\'ll. 1';sL(~s valores so probabilidades condicionais, tal que o evento 1't1ll<lil'il)llallt(~ o resultado do teste, aquele que na prtica acontece 1111111< 'Iro. 1\ IlIal)(~iramais fcil de se calcular o VPN e o VPP atravs dn '1':11>(-1" iJ.5, sugerida por Vecchio (1966). Seja p = PT(D+) a de carcinoma heptico (continu-

Para uma populao cuja prevalncia de metstase de carcinoma de fgado de 2%, os valores de predio da tomografia computadorizada so:

VPP

=
0,02 x 0,78

0,02 x 0,78 + (1- 0,02)(1-

=
0,89)

O 13 ,

(1 - O, (2) x O,8D V P N = (1 _ 0,(2)0, 8D + 0,02(1 _ 0,78) = 0,99

I'I ntanto, o valor de predil{::opositiva baixo enquanto que o valor dl~ pn~elio negativa bastante alto. Se o resultado da tomografia 1'1 11 111 >utadorizada negativo, a chance de no haver mctstase de !)!l%,. Se, antes de qualquer informao, o pacientc tinha uma chance 111' ~(!', de apresentar a cloclH{a,aps o resultado do teste negativo esta l'II:IIICI~ {,de apenas 1%.

Entre as vrias tccnologias para detectar a presena do TI I V, a primeira a se difundir no Brasil foi o teste de ELISA (Enz;Ij'lIu' linked n:m:u:no8oT!Jcrd o,88o,;tj). Em lD85 esta tcnica foi simultmwa mente cOIIwrcializada por vrios labortorios americanos: ABBOTT, DUPONT, ELECTHO-NUCLEONICS, LITTON, TRAVENOL. () Laboratrio ABBOTT reportou, em seus testes preliminares, sensibilidade ele 95% e especificidade de 99,8%. Os valores para os outros laboratrios so parecidos, segundo Marwick (1985). A Tabela 4.6 apresenta os valores dos ndices V P P e V P N para a implemental;o ABBOTT do tmte ELISA e vrios valores da prevalf~lICla.

Tabela 4.6: Valores ela predio (V P P e V P N) e proporo de falsos resultados (P F P e P F N) do teste ELISA para deteo do HIV, verso ABBOTT Prevalncia 1/100.000 1/10.000 1/l.000 1/500 1/200 1/100 l/50 VPP (%) 0,47 4,54 32,21 48,77 70,47 82,75 90,65 VPN (%) 100,00 100,00 99,99 99,99 99,99 99,99 99,89 PFP (%) 99,53 95,46 67,79 51,23 29,53 17,25 9,35 PFN (%) 0,00 0,00 0,01 0,01 0,01 0,01 0,11

1'1 -1'1 ~n ~III-se,respectivamente, ao falso-pos'ivo e falso-negativo, isto , dl'('is()(~sincorretas basaclas no teste diagnstico. 1I ddizmente, no h na literatura padronizao relativa a nomes dos flldicl~sde um teste diagnstico. Por exemplo, as probabilidades ,11' .Iil,l80-pos'it'ivo e falso-negativo so muito freqentemente usadas li/Ira as quantidades 1 - seI - e, quando deveriam ser reservados 1IIII'a 1- V P fel - V P N. Por isto, na medida do possvel estes 1.1 '1'111< ISsi\.oevitados neste texto. ()III.I';\' dificuldade que muitos autores admitem, implicitamente, '1111' a pn~valncia que ocorre na tabela. a mesma na populao de illl,l'n~:,SI~ I~assim usam a tabela 2 x 2 para calcular os valores de j!I'I'dil::Ul.Nada justifica esta hiptese e este procedimento, se usado IliHI.I'lIlal.icaulImte, leva a erros srios.

Considerando-se a populao total de um pas, a AIDS urna doena de prevalncia pequena. Os resultados da Tabela 4.6 mostram que em um programa de uso do teste em larga escala, grande parte dos pacientes com resultado positivo consiste na realidade de falsospositivo; em outras palavras, o valor da predio positiva muito pequeno. Por outro lado, pouqussimos no doentes deixaro de ser detectados e, portanto, o valor de predio negativa alto. Isto sugere um cuidado bsico: um resultado positivo deve ser reconfirmado atravs de teste baseado em tecnologia diferente do ELISA.

Combinao de testes diagnsticos


Muitas vezes, para o diaglH'>sticodl~certa dOClH{a, dispomos apelias d(~ testes com V OH N baixo OH,se existe um bom teste, 1':il.l'(! muito caro ou OfeI'l~CI~ graude risco e/oH desconforto ao pal'il'III.I!. Nestas circunst<1,llcias, UIU.aoj)IJio freqentemente usada o 11:,1) Ill~uma combinal{iln de tesj;I!Sllmis simj)l(~s. A associa({iio de testes 1.j(!V:t a qualidade do (liagn()stico, diminuindo o nmero de resultados illl:llI'I'ctos. qltando dois ou mais testes siio usados para se chegar a um clia)',llstico preciso sal)(~r ccimo siio obtidos os ndices de qualidade (11)I.l~stemltiplo, aquele COIUpostOpda agregal{iio de dois ou mais I.I'SI.I~S individuais. R(~stringiremos ao caso de apenas dois testes e a:-:i(l{~iasapresentadas a seguir podem ser estendidas para o caso de 11 mis tmtes. Alguns dctallws podem ser encontrados em Hirsch & Itil.jgdman (1996).

rr

vr

Nesse caso, o resultado do teste ser considerado positivo, S(!1)(' de mai()l' utilidade em casos d(~ urg(~llcia, quando se necessita de uma ab()l'dagem rpida, ou por outro tipo de convellincia, como para pacientes provenientl)s de lugares distantes. A Tabela 4.7 apresenta de forma explcita o procedinwnto proposto.

10 menos um dos testl~s apresentar resultado positivo.

Tabela 4.7: Resultado do testE) em paralelo dependendo da classificao dos testes individuais A e B

+ + + +

+ + +

I\s maneiras mais simples de se formar um teste mltiplo a partir IIIISI'l~sultados de dois testes sil,oos esquemas em paralelo e em srie. NI) caso do teste em paralelo, se um dos dois testes positivo o teste l'l)lljllllto tambm o . O teste em srie considerado positivo apenas ::1'IISdois testes individuais so positivos. A associao de testes em ::('I'il~ (~bastante empregada, tanto em triagens como no diagnstico illllividual, sendo de grande utilidade quando a questo do custo 1'1.j( ~vallte. (:Immando os testes originais de A e B, o teste em paralelo de Tp I' 1I(!11l srie de T", e usando a linguagem de eventos da Seo 4.2.3
1.( '1111 IS I pIe:

Em analogia expresso (4.4) e aplicando a propriedade da probabilidade de unio de eventos, a sensibilidade do teste em paralelo calculada como:

Pr[A+ U B+ID+J Pr[A+ID+J + Pr[B+ID+J

- Pr[A+ n B+ID+J

Pode-se calcular a especificidade de um teste em paralelo usandose a definio (4.5). Admitindo-se que os resultados dos dois testes so independentes, pode-se escrever I\s slmsibilidades e especificidades de Tp e Ts so calculadas com o 1111:dlio das regras de clculo de probabilidades de eventos explicadas 11I1i,1 'I'iIIl'Illente.

Pr[A_ nB_ID_] Pr[A-ID_J


x Pr[B-ID_J

utilizando-se regras de clculo para a probabilidade do evento illLm seo. Por exemplo, para o clclllo da sensibilidade temos que

Portanto, facilmente calculamos a sensibilidade e a especificidade di! 11111 teste em paralelo a partir das sensibilidades c especif1cidades IIIISLI~stes A e B. Alm disso, os par:lmetros V P P e V P N so calculados aLravs de (4.10) c (4.11) para testes isolados, utilizando-se agora 11 ~,( !llsibilidade e especif1ciclade ela combirwf{o em paralelo, obtidas al.rav{!sde (4.16) e (4.17), e;a pnwalncia da populal{o de; interesse.

A partir de raciocnio anlogo, obtemos a expresso para a especificidade:

N(!sse caso, os testes so aplicados consecutivamente, sendo o se1',ll1ldoteste aplicado apenas se o primeiro apresentar resultado po::il.ivo. O teste s ser considerado positivo, se o resultado dos dois 1.1 'SI.I~S for positivo. Esse procedimento indicado em situaes em que 11 aI111:. necessidade de,rpido atendimento e quando o paciente pode 81'1'acompanhado ao longo do tempo, e se a considerao de custo {, i111 portante, seja pela questo f1nanceira, pelo risco ou desconforto illllllzidos pelo exame. A Tabela 4.8 apresenta de forma explcita o 111'1 Il'I~( limento proposto. 'I'aiIl!la 4.8: Resultado do teste em srie dependendo da classificao (I(IS I.I~sLns individuais A e B Teste A Teste B desnecessrio Teste em srie

Os valores de V P P e V P N sao tambm obtidos usando-se as expresses (4.10) e (4.11) substituindo s e c calculados atravs d(! (4.18) e (4.19). Para os clculos da sensibilidade e especificidade da associaeJi,,) em srie e em paralelo, a independncia dos dois testes crucial. Entretanto, no se pode garantir que isto ocorra sempre. Quando 1):-4 testes no forem independentes, no h uma forma analtica simplc!:-4 para se obter tais ndices para um teste composto.

( ~(IIII1) S(I se~rao aplicados dois testes se o primeiro for positivo, o ('11::1,11 dl'sSI! Lipo de combinao menor. Uma discusso sobre a 'lI'd('111 IIlais iIldicada para a aplicao dos testes a serem combinados 1'111 s{~ril! pod(~SI,]'mrcontrada em Soares & Parenti (1995). SI! os dois testes A e B so independentes, a sensibilidade (55) n l!sp(!ciJicidade (C8) para o teste combinado em srie so obtidas
I'

Imagine um paciente idoso com dores persistentes nas costas (~IIII abdomem e perda de peso. Na ausncia de uma explicao para e~sL(~:j sintomas, a possibilidade de cncer do pncreas freqenterIH~ltI,(' levantada. comum para se verificar esta possibilidade diagnsLicn, que ambos os testes de ultra-som e tomografia computadorizada (111 pncreas sejam solicitados. A Tabela 4.9 apresenta dados hipot{~LicoH sobre os ndices 5 e e dos testes, quando utilizados separadamcnLI! (' em conjunto (Griner et a1" 1981). Note que os esquemas C e D correspondem respectivamcIIL(! /I testes em paralelo e em srie. Admitindo que os resultados do:!

'l'al)(da 4.9: Sensibilidade e especificidad() dos testes (l(~ultm-som e 1.IIIIIografiacomputadorizada no diagnstico do cncer de pncreas, illdividualmente e em conjunto Teste A: Ultrasom I~: Tomografia C: A ou B positivo D: A e B positivo Sensi bili(lade (%) ~O 90 98 72 ESI)ecificidade (%) 60 90 54 96

Tabela 4.10: Sensibilidade, especif-icidade e valores de pnxli(Jio de testes individuais A e B (~ dos testes em srie e em paral()]o considerando-se uma prevalf)ncia de 1(X) Teste A B Paralelo Srie

1111'\' ,\ .

0,9500 0,8000 0,9900 0,7600

""

VPP
0,O~?6 0,1391 0,0645 0,6056

VPN
0,9994 0,9979 0,9999 0,9976

0,9000 0,9500 0,8550 0,9950

jl'

dI lis testes sejam independentes e usando as expresses (4.16), (4.17), (,1.IK) e (4.19) temos as seguintes sensibilidades e cspecificidades:

quando um ou outro teste positivo, a sensibilidade combinada (, Illaior que o mais sensvel dos testes, mas a especificidade menor. 1\1 I contrrio, quando o critrio para a positividade do teste que 1.11111.1) I) ultra-som como a tomografia sejam positivos, a especificidade I" 1\ I11 liIlada maior que o mais especfico dos dois, mas a sensibilidade
I'
111' '11111'.

A combinao em paralelo apresenta alta sensibilidade (0,99) mas sua especiI1cidade menor que a dos testes isolados. J a combinao em srie apresenta alta especificidade (0,995) enquanto que a sensibilidade relativamente baixa compa.ra,da com testes isolados. Gomo esperado, os valores de predil,o m;gativa so altos, tanto para os testes isolados como para as duas formas combinadas dos testes. Entretanto, os valores de predio positiva no so altos, sendo que a combina(,o em srie proporcionou o melhor resultado (0,6056). importante lembrar que, na maioria das vezes, os testes usados na combinao so dependentes entre si. Portanto, os valores acima tendem a superestimar o verdadeiro valor dos ndices dos testes combinados. Nesse caso, no possvel detenninar os valores dos parmetros de qualidade conhecendo-se apenas os valores de cada teste em separado. Torna-se necessrio um trabalho de pesquisa realizado em um grupo de pacientes nos quais so utilizados o teste padro ouro e teste combinado (DiMagno et aI., 1977).

1';XI!1l1plo pilr:ddo

4.14: Sensibilidade e especificidade de testes em (; em srie

H pelo menos duas situaes em que a necessidade de combinao de testes surge naturalmente: triagem e diagnstico individual.

( :11\ Isidmcmos dois testes A e B com sensibilidade e especificidade 1I111'I'~H'III.:l(los 1m Tabela 4.10 e suponhamos uma prevalncia de 1%. llHlllllll1a:, t)XI)J'()SSes (4.16) a (4.19) e a seguir as expresses (4.10) e (11.11), PI'I'I'IWIII'lllllS as outras entradas do corpo da Tabela 4.10.

Triagem um tipo de procedimento que visa classificar pessoas assintomticas quanto probabilidade de terem ou no a doena.

aplicado em grande nmero d(~ pessoas d(~ UlIla populao. Dessa 1'01'1 lia, a triagem no faz por si S(J o diagnstico, mas aponta as pes:H Ias que tem maior probabilidade de estarem doentes. Para essas, ili' Ii,:ado um teste diagnstico para comprovar ou no a presena da ,I, )('II<,a. . triagem indicada em caso de dOeIH?lsria, se o tratamento lia fase assintomtica mais benJico do que na fase sintomtica e "111 casos de alta prevalncia. Na linguagem desta sec;iio, o teste de I.l'iag(~m considerado o primeiro dos testes de UlIla combinao em :i{'l'i(!, j que o segundo teste (no qual o diagnstico definitivo ser Ila:H !ado) s ser aplicado se o resultado da triagem for positivo. I)jagnstico individual

4.7

Testes diagnsticos baseado em variveis contnuas

No diagnstico individual, aparecem os dois tipos de combinao: "111 s{Tie e em paralelo. A combinac,iio em paralelo usada, como j:i. foi citado, em casos de urgncia ou para pacientes residentes em Illi',an~sdistantes. (;omo exemplo da necessidade de se usar testes em paralelo, podeIIIOS pensar em um paciente que chega ao hospital com suspeita de iIIl'al'l.o. Como se trata de um caso de urgncia, o clnico poder indi"al' vrios exames, tais corno, eletrocardiograma, dosagem de LDH "dosagem de CPK-MB, que sero realizados imediatamente e ao mes1110 L(!mpo. Ao final dos testes, o clnico analisa os resultados e aponta diagnstico. Muitas vezes, estabelecida uma norma para orienI.al' a deciso do clnico. Por exemplo, se forem realizados 4 testes, d iagllstico seria de infarto se 3 ou 4 resultados fossem positivos ( :abl & Gambino, 1975). . combinao em srie usada em consultrios e clnicas hospiLalan!s e em casos de testes caros e arriscados. Nesse ltimo caso, " I, 'sl.(~mIl srie se torna de grande validade. O paciente realiza l'lillwiramente um teste simples e barato e, se apresentar resultado I ':Iil.ivo, indicado o teste de maior custo ou que oferece riscos ao l'il,i('IIL(~. Com esse procedimento, menor nmero de pessoas sadias ,I,'v' -r:.s(~submeter a esses testes.
'I (I li

Os ndicc~s usados neste captulo para definir qualidade de um teste clnico requerem que o resultado do teste seja, por simplicidade, classificado corno positivo ou negativo e que a classificao do diagnstico tambm seja dicotmica (por exemplo doente ou sadio). Para dados dc~variveis contnuas, tais como dosagens, surge a questo de corno dicotomizar de forma que os dados sejam colocados no formato da tabela. 2 x 2 considerada anteriormente. preciso ento estabelecer o limite entre o que ser considerado sadio ou doente, isto , um valor a partir do qual o teste considerado positivo ou negativo. Este limite chamado de valoT de TefeTncia ou ponto de cOTte. Assim, cada teste clnico ou critrio de classificao caracterizado por um valor de referncia e variando-se este ponto de corte, a sensibilidade e a especificidade tarnbm variam. Para cada situao preciso escolher o valor que fornece a combinao de sensibilidade e especiJicidade mais adequada.

4.7.1

Efeito do ponto de corte na qualidade de um teste diagnstico

A cada valor crtico est associada uma sensibilidade e uma especificidade. Freqentemente pode-se alterar a sensibilidade e a especificidade de um teste trocando-se o ponto de corte, como ilustra o exemplo a seguir, adaptado de Ingelfinger et aI. (1987).

Os digitlicos (digoxina e digitoxina) podem ser de grande benefcio para pacientes com falha congestiva do corao porque produzem reduo de batimento cardaco e aumento da fora de contrao do miocrdio. A terapia com essas drogas pode, entretanto, resultar em uma complicao sria, a intoxicao, que ocorre em 5% a 30% de pacientes hospitalizados que fazem uso de digitlicos. O diagnstico da intoxicao pode ser difcil porque muitos dos sintomas de intoxicao, como por exemplo, contrao ventricular

pl'mnatura, nusea e fadiga, siio tamb{~msintOIna~ de falha con~esti~a col'adaca. A concentnl()io srica de digitlicos fornece um chagnost.ico til para a toxiciclacle. Um nvel de digoxina (l<~ 1,7 Tu}/rnl e um nvel de digitoxina de ~;) ny/ml so essencialmente equivalentes e s~).consi~eraclo.s como (:ollclmtraes altas. () resultado do tl~stl~ de toxlcldade e comnderado I lilsitivo para concentral{cs acima desses nveis. ~ 13eller et aI. (1971) examinaram a rd,u)io entre concentrao~s ~,(~I'icas de digitlicos e sua toxiciclade. Das 931 admisses consecutlvas do hospital Boston Oity, foram investigados todos os 135 p~ci~ntes qll(~ estavam fazendo uso de digoxina ou digitoxina. Na admlssao, a (:1 li11 :(mtrao dessas drogas foi anotada e c1ctrocardiogramas fornece1'/1.111 informaes do acompanhamento de cada paciente. Atravs de critrios clnicos bastante apurados, os pacientes foram c1:\,ssili.cados como intoxicados ou no, como mostra a Tabela 4.11. Tabela 4.11: Resultados do teste eletoxicidade de digitlicos aplicado a I :\5 pacientes que faziam uso de eligoxina ou digitoxina Classificao ele toxicidacle baseada em critrios clnicos Intoxicado No intoxicado Total Teste de toxicidade positivo negativo 25 18 14 78 39 96

21 pacientes intoxicados e 62 nao intoxicados, sendo que aml)(IH(lI-! grupos de pacientes faziam uso de digoxina. Tabela 4.12: Distribuio da concentrao srica de digoxina (ng/ml) para pacientes intoxicados ou no pelo uso da digoxina Digoxina (ng lrnl)
O I- 0,5 0,5 I- 1, O

Pacientes Intoxicados No intoxicados

1,01-1,5 1,51-2,0 2, O I- 2,5 2,5 I- 3, () 3,01-3,5 3,5 I- 4, () 4, O I- 4,5 4,5 I- 5, O Total

Total
43

92 135

111: 1I

!\ sensibilidade e a especificidade elo teste que usa o nvel srico igoxina ou digitoxina para classificar o indivduo como intoxicado

Suponha agora que o critrio de classificao quanto toxicidadl~ fosse trocado, isto , o ponto de corte do teste para o nvel de digoxina fosse alterado. Considere ()spontos de corte para classificao em relao aos nveis ele digoxina para diagnstico de intoxicao: J ng/ml (critrio 1) e 1,5 ng/ml (critrio 2). Os resultados para estes dois critrios ele classificao nos 83 pacientes em uso de digoxina esto organizados nas tabelas 4.13, 4.14.

78 C = 92 =

0,80

t":

1':~it.I~S c:;.1culos mostram que esse teste tem uma boa especificidade I' 11111i\. s(~llsibilidade apenas razovel. III11 (~studo anlogo ao anterior porm com outro grupo de pal'il'IIt.I'Sroi conduzido. A Tabela 4.12 representa a distribuio de

Classificao de toxicidade baseada em critrios clnicos Intoxicado No intoxicado Total

Teste de toxicidade positivo negativo 18 3


38 24

Total

56

27

21 62 83

em Bex:k & Shu}ty, (lDi)0), Fle~tcher e~taI. (1989) e no Captlllo I dI' Hirsch & Riegdman (lDD0). Classificao d(~toxicidade baseada em critrioc; duicoc; Intoxicado No intoxicado Total 'rec;t(~d() toxicidade jloc;itivo Jl(~gativo 14 7 Total

4.8

Escolha entre testes diagnsticos

21 02
i)3

A Tabela 4.15 IJlOstra a senc;ibilidadc) c~e~sI)ecific:idadede cada l'I'ith.'io. Note que o critrio 2 produY-uperda. de c;enc;ibilidadee ganho ,I() ()c;pecificidade.

Critrio
1

Sensibilidade (s)
18 21 -

O, i)0

Especificidade (e) 24 = O, 39. 62


54 - O 87 62 - ,

~{ = 0,07

:\.7.2

Escolha do ponto de corte

Idealment(\ oc; tec;tec; utiliy,ac1oc; devem ter alta sensibilidadc) () especificidade. Entretanto, na prtica nem c;empre existem tec;tc)c; disponveis com caractersticas timac;. relativamente comum a situao em que h m;-c; de um teste e ento surge a necessidade da comparao entre elec;para urna escolha mais adequada. Suponha que dois tec;tes diagnsticoc; ec;to disponveis: um COlJl alta sensibilidade mas relativamente baixa especificidade e o outro com alta especificidade e relativamente baixa sensibilidade. Qual seria a melhor escolha? Embora a avaliao de um teste no seja trivial, j que vanoc; fatores devem ser considerados, apresentaremos aJguns argumentoc; baseados nas medidas de qualidade definidas neste captulo, que po_ dem ajudar na escolha de um teste diagnstico. O primeiro fato importante que, como visto na Seo 4.5.2, os valores de predio (V P P e V P N) dependem conjuntamente da sensi bilidade (s), da especificidade (e) e da prevalncia (p). Soarec; & Parenti (1995) apresentam um estudo detalhado atravs de grficos que ilustram claramente o efeito da prevalncia nos valores de predio. O exemplo a seguir ilustra numericamente este fato.

l J IlIa possibilidade pa,ra a escolha do ponto de corte seria calcular a especificidade para vrios valores de referncia e "111.;\.11 adotar aquele que produz uma combinao mais desejvel para I':;:;a;:dllas medidas da qualidade de um teste. Por exemplo, Galen ,\, ( :alllIJino (1975) sugeriram uma medida de eficincia definida pela : 111111 a da c;ensi bilidade e especificidade. 11111 procedimento alternativo a anlise das curvas de operao "lIlal'i.(1'c;l.ica (em ingls ROC, a abreviao para receiveT opemtor t'!I/I,I'tI,t'i.(","isi:ic), nome recebido porque o mtodo originou-se em es1.11<10:" dI) (ldeco de sinais por operadores de radar. Esta uma I' '111'( ':;()I d,;),({o grfica da sensibilidade (eixo vertical) e o complemen1.111 (Ia I)c;pc~cificidade (eixo horizontal) para diversos pontos de cortes. I)dallil)c; c;obre a construo e interpretao da curva como tambm a illlc;l.l'a<';i\o com exemplos reais podem ser encontrados por exemplo
;\ :j, )llc;iIJilidadee

O teste Gonosticon Dri-Drot, desenvolvido para o diagnstico de gonorria, tem sensibilidade de 0,80 e especificidade de 0,95. Os valores da predio positiva e negativa so apresentados na Tabela 4.16 para quatro populaes com diferentes prevalncias. Embora o teste tenha parmetros de qualidade razoveis, o V P P baixssimo para populaes de baixa prevalncia, tornando o exame sem utilidade nessas condies. Para simplificar o raciocnio sobre a escolha de testes diagnsticos, vamos inicialmente considerar duas situaces extremas , obvia, mente sem interesse prtico, e depois vamos estender para situaes

Tal ll~la4.16: Valores dcpredi({~,() (VP P I~Vl'N) do t(stc G(Hlosticon Ill'i I)rol, para quatro prcvalf~ncias (fi) Popula().()
))

Tabela 4.18: Va]()]'(~s d(~p]'(~di(;i\.o (V c V P N) para alguns valores de scnsibilida,de (~CSl)(~cificidadl~ pi\Ja prcval&mcias de 1% e 90% Prevalf~IH:iade 1%
8

rr

V]>P VPN
0,940 O,8:m O,(j40 O,~)80 O,2GO O,!J!JO 0,020 1,000
e

Pr<~valncia de 90%

A B
C D

O,GOO O,J 00 0,020 0,001

VI)]>
0,5000 O,O!JOD O,047G O,47G2 0,08:13 0,0435 04469 , 0,0748 0,0388

VPN
O,ODDD O,D90D 0,9999 09090 , O,998D O,D987 09980 , 09978 , 09975 ,

VPP
O,OD8!J O,988!J 0,9780 0,9988 0,0878 0,9759 O,998G O,98G3 0,9730

VPN
0,9167 0,0091 0,8989 0,52:)8 O,SOOO 0,470G 0,3548 03333 , 0,3077

Illais i);I~rais.Suponhamos qlW]i = O, isto , ningum tem a c~oena, 1111 qlll~ fi = 1, isto , toda a popula(;~,()tcm a docIH{aem questao .. ~nillil.ivalnente ou atravs das cxprcss(\(~S(4.10), (4.11), (4.12) e (4.13), 1': 11: illlH~nte chegamos nos valores apn~sentados na Tabela 4.17, para '1IIaisqlleI' valores de sensibilidade e espccificidade. 'I'aIllda 4.17: Valores ele pn~di'{8,()(V r P c V P N) e proporo de 1'1 ':11 li L:\.{ [os falsos (PF P e PFN) para casos extremos de prevalncia
p

O,!J!J O,D9 090 , O,!JO 0,90 0,00 0,80 0,80 0,80

O,!J!J O,DO 0,80 O,9D 0,90 0,80 0,99 090 , 0,80

ciado mais pela sensibilidade do que pela especificidaele. Embora este no seja um estudo exaustivo, existem evidncias para as seguintes concluses: 1. Um teste com alta especificidade deve ser usado quando a prevalncia ela doena relativamente baixa (doena rara), mesmo que o teste tenha relativamente baixa sensibilidade. 2. Um teste com alta sensibilidade deve ser usado quando a prevalncia da doena alta (doena. com'um,), mesmo que o teste tenha relativamente baixa especificidade. comum a idia de que se a, doem{a rara, um teste com alta sensibilidade deve ser usado para achar os casos e para uma doena de alta prevalncia, um teste com alta especificidade deve ser escolhido. Esse raciocnio no coincide com os argumentos apresentados. No caso de associao de testes, outros procedimentos podem ser recomendados, como aqueles descritos em Soares & Parenti (1995).

VPP

O
1

O
1

PFP 1
O

VPN
1 O

PFN
O

A (~xt<~nso para o caso mais geral de p pequeno (doena rara) e


/1 ",I':lIldl~(doena comum) pode ser feita pela anlise das e~~r~sses

(,1111) (~ (4.11) variando-se as quantidades envolvidas (senSIbIlIdade,

,':qll','ilicidade e prevalncia), mas nos restringimos a apresenta~~s 1IIIIa1lIll,lisenumrica. A Tabela 4.18 mostra os valores de predIao pl'l~valfmciasde 1% e 90%. . _ .. qllalH[o a prevalncia baixa, o valor de predIao PO~I~lva(V P~) I' Illili::illlluenciado pela especificidade. O valor de predIao negativa ( \ ' I' N) (~ pouco influenciado tanto pela sensibilidade quanto pela ":'Ill"'ilicida,le e alto, como era de se esperar. I'al'a a prevalncia alta, o valor de predio positivo (V P P) . IIIII~ i 1110 dl~1, independente dos valores da sensibilidade e da. espeCIlil'id:llll~. Alm disso, o valor de predi({o negativo (VPN) mfiuen1'111'11

4.9 Consideraes finais


Na definio dos importantes ndices VPP e VPN, o valor de p, a prevalncia da doena na populao de interesse, desempenha

papel crucial. Este vaJor pode variar lllui t.o dependendo do tipo de pl)pllia()io considerada. O rndico que trabalha elll Ullla clnica de 1'1.f, '1'!llcia para doenas cardacas encontra Ullla prevalncia dn angina 1IIIIil.o maior do que aquele qun atc~mlna popula()io (;m gmal. Assim, I 11I1 !SlllOteste ter utilidades difnren(;ns para nstm dois profissionais. ()lll.ra interpretao possv(~l para p tonr-lo como a probabili,1;\111' II(~ocorrncia da donn(~a, assumida pc10 m{~dico,antes do teste "li 'I' I'I!i 1.0. Recebe neste caso o llOllWde pn}/JO,/ri,llwle (J, PTJT"l ou pTIt . ll'. I';sta probabilidade no leva crIl conta apenas a freqncia da II'II'III,:;\, na comunidade a qun o paciente; pert.ence, mas tarnbrn a sua Ili::II'II'iafamiliar, idade, sint.omas, fatores de risco, etc. V;l'ios trabalhos tm sido desenvolvidos com objetivo de se de1.1'l'lllillarprobabilidades pr-teste para vrios tipos de pacientes, em 1',,1:\1:;\1) a uma dada doerH:a. Esse tipo de estudo auxilia o clnico lia :1I1:Jisedo estado do paciente e tambm de grande utilidade, Ilal'a o clculo corret.o do valor ela predi<:o positiva. Diamond & I,',)1'I'(~sl.m (1979) realizaram ampla pesquisa bibliogrfica e, para cada I'aixa dria, sexo e tipo de "int.oma, estabeleceram a probabilidade 111 I.(!sl.(; de um paciente ter doena coronariana. Por exemplo, a 1IIIIaIlIlllher com 35 anos de idade e sem queixa de angina associa-se 1IIIIaprobabilidade de t.er a doena de 0,008 antes do teste. J para 11111 IlolllCm.ele65 anos de idade e com angina tpica associa-se, antes ,I,' 1',!;\,li~ar o test.e, uma probabilidade de 0,906. Da podemos no1:11' COIIIO dois pacientes de uma mesma populao podem apresentar 1'1" d )ahilidades pr-teste bem diferentes que resultaro em valores de 1'1'1 'IIi<.: ao distintos. IJ:;alldo esta interpretao possvel quantificar quanto muda a "'I'II'/',a do diagnstico depois de realizado o t.est.ee, portanto, verificar :1 ::1111 Ill.ilidade relativa. O leitor interessado deve consultar Diamond ,\ 1"')I'I'I!sl.er (1983).
I '1"

DaltollisIllI) Pn~seIlt.(~ AUSeI]tl~ Total

Masculillo
4,2:l }{)
4(-),4(-)%
l

F(~minillo O,GS%
4G,G4% 47,29%

Total
4,88% 9S,12% 100,00%

S2,71%

(a) UIlJa pessoa {!escolhida, ao acaso, dessa popula(Ji,o. Calcule a probabilidade de ela s(~r: i. Daltnica;
11.

Do sexo feminino;

m. Daltnica sabendo-se que {~ do sexo feminino; IV. Daltnica sabendo-se que (; do sexo masculino. (b) Trs pessoas so selecionadas ao acaso, com r"po c; ~ SIao, dessa populao. Qual a probabilidade de:
o,' -

I. 11.

Apenas uma ser daltnica: , Todas serem daltnicas;

m. Duas ou mais serem daltnicas; iv. No mximo uma ser daltnica. (c) Os eventos ser daltnico e ser do sexo masculino so independentes? O que isto significa na prtica? . (d) Se 1000 indivduos so selecionados ao acaso, qual o nmero esperado ele daltnicos? 2. Se A e B so event.os mutuamente de Pr(AIB) e de Pr(BIA)? excludentes, qual o valor

3. Durante o ms de julho de 1985, a imprensa, atravs de editori-

ais, tratou freqentemente do assunto AIDS. Um dos pontos em questo era o teste recm-descoberto para a deteco do HIV. I, I:; Iwm conhecido que daltonismo hereditrio. Devido 11,)gime responsvel ser ligado ao sexo, o daltonismo Illais freqentemente nos homens do que nas mulheres. 1',l'alld(~ populao humana, a distribuio de daltonismo ao fato ocorre Numa da cor (a) A verso do teste do laboratrio Abbot produziu 37 resultados positivos em 17.420 amostras ele sangue de pessoas sadias e 123 positivos em 129 pacientes comprovadamente com AIDS. Calcule a sensibilidade e a especificidade do teste. Comente.

(b) Se a prevalncia da AIDS de 15/100.000, qual o valor da predio positiva do tc~ste? 4. A faixa usual de normalidade da pressiio sangnea diastlica para adultos jovens (~de 75 a 85. Explique os riscos para o diagnstico mdico d(; se modificar as faixas para 75 a 120 ou 50 a 80. Use na sua resposta os conceitos de especificidade e sensibilidade e considere corno doentes apenas os indivduos com presso alta. fi. (a) Os testes clnicos usuais tm sensibilidade e especificidade acima de 70(/("). Qual a influncia nos valores das predies destes testes ao se passar de uma situao de baixa prevalncia para uma de alta? (b) De maneira geral o que se deve fazer para no se incorrer no erro falso-positivo muito freqentemente? e. t t
(i.

(a) Calcule a sensibilidade e a especificidade do raio X teste diagnstico para tuberculose.

COlllO

(b) Calcule as propol'(;es de falso-positivo e falso-negativo. (c) Se um mdico tem 75% de certeza sobre o diagnstico d(~ tuberculose em um dado paciente, quanto aumenta esta probabilidade depois de se observar um teste de leitura de raios X positivo. S . ~)- / PCDlt);:.-

Pl

.'0

9. Pesquisadores que tratam de doen(;as hepticas em uma clnica especializada sugeriram urn novo teste para detectar cncer 11<) fgado. Os resultados do experimento, para uma amostra d(~ 2.22fi pacientes atendidos nessa clnica, foram: Cncer heptico Presente Ausente Total Teste Positivo Negativo 90 17 39 2.079 129 2.096

Em que condic;es o valor de predi(;o positiva (V P P) igual a o,j(a + c) para os dados da Tabela 4.1?

Total 107 2.118 2.225

7. Para o Exemplo 4.9, sobre o teste ergomtrico, calcule V P P, VPN, PFP e PFN para as seguintes prevalncias 0,05,0,10 e 0,15. Comente os resultados.

Pelo modo como os dados foram obtidos, a prevalncia de cncer heptico, nesta clnica, pode ser calculada usando os dados da tabela. (a) Calcule a sensibilidade e a especificidade do teste. (b) Calcule a probabilidade de um paciente, atendido nessll clnica e que no tem cncer no fgado, tenha um resultado positivo no teste. (c) Calcule o valor da predio positiva e o valor da predi(;.i.() negativa.

\(8J

Foram examinadas radiografias do trax de 1.820 indivduos, dos quais 30 estavam com tuberculose e 1.790 no apresentavam a doena, por diagnstico feito de forma independente da leitura dos raios X e com uma margem de erro desprezvel. Os rmultados do experimento esto resurnidos na tabela abaixo. Leitura dos raios X Positivo Negativo Presente Ausente Total

Total

22
51 73

8
1.739 1.747

30
1.790 1.820

a !l]'()valnciada doena, tanto neste grupo quanto na populao d(~interesse de p = 30/1.820 = O, C1l65.

I ldo modo como estes 1.820 pacientes foram selecionados,

(d) Os pesquisadores que desenvolveram o teste sugeriram S(~II uso como um meio simples para os clnicos em geral de" cidirem se devem ou no encaminhar o paciente para 1.111111 clnica :specializada. Critique esta recomendao. ~lb \t) p ~..c' '01\,\'1-1.,- '.. ~f ~(' b1n.~ 1 10. Os valores da sensibilidade e especificidade de um teste; larll li deteo da diabetes so s = 0,95 e e = 0,95.

(a) Um paciente assintomtico sulmH:te-se ao teste. Se o resultado for positivo, qual a probabilidade d(~ele ter realmente a doena? P( ']) ~'("N~ .~ \'tI

lt)

<

r)

(b) Um outro paciente que apres(~nta alguns dos sintomas da doena (como sede anormal e pnrda de peso) e possui histria de diabetes na famlia, tambm se submeteu ao teste. Se o resultado for positivo, o q1H~ voc espera que acontea com o valor do VP FI Por quf~,( Foi feita avaliao para cncer de prstata em 300 homens hospitalizados devido a sintomas de obstr1H:o urinria. Um dos testes realizado foi o exame digital do reto. O resultado foi classificado como "positivo" segundo o critrio padro. Os resultados do exame digital e da bipsia so apresentados a seguir:

VPP deste teste inaceitavelmente baixo. Jamais lisa ria mil tes~e que enl urna dada populao produz VPP de: 0,01%. \-Il'<L, Hr drcr~~ ck 'f \hc\K' 'Q~\tf- f:.l.:)A, A cspccificidade dest(~teste alta, logo a maioria dos test(:s negativ(2s corn~pondem a pessoas no doentes. P( t' b) t </
. ['<-1$). \\,,.,.....
l 1\;

-_

t'

IJ'

O VPN abaixa 9uando a prevalncia aumenta.

i ~F-=-

f(-I})

13. No dia 28 de janeiro de 1995, O Jornal do Brasil publicou a seguinte notcia: Teste detecta tumor de prstata em fase inicial BOSTON, EUA - Um teste sangneo que detecta precoc(:mente cncer de prstata a partir da presena de um antgm no sangue bastante preciso, apontando a presena da docw:a w . . em 80/0 dos homens afetados pelo tumor, segundo estudo r()alizado por pesquisadores do Br'i,qham and Women's Hosp'i/,a/ de Boston. Quando o teste foi aplicado em amostras de sanglH) de 1464 homens coletadas em 1982, poca em que o exame ni'io estava disponvel, verificou-se que ele poderia ter revelado 80% dos cnceres que s foram detectados cinco anos aps a realiy,ao dos exames de sangue disponveis na ocasio.
i()

Resultado da bipsia Presente Ausente Total

Resultado do exame digital Positivo Negativo

Total

48
25 73

21
206 227

69
231 300

(a) Admita que o resultado da bipsia completamente preciso na determina(:o de presena do cncer de prstata. Qual a sensibilidade e a especificidade do exame digital na deteco de cncer de prstata? (b) Nesta populao de homens, qual o valor de predio positiva e o valor de predio negativa do exame digital? (c) Um clnico geral est considerando a possibilidade de realizar o exame digital do reto em todos os homens com mais de 50 anos que procuram seu consultrio, mesmo no apresentando sintomas de obstruo urinria. Da literatura, cl(~ sabe que a prevalncia de cncer de prstata nesta faixa dria ele 0,005. Usando os valores para a sensibilidade e ()spccificidade obtidos anteriormente, calcule a proporo (I(~homens com resultado positivo no exame digital que n)almente tem a doena.

Critique a forma de divulgao deste novo teste. 14. Comente a seguinte afirmativa: A qualidade de um teste clnico medida pelos ndices s e e, enquanto que a qualidade do diagnstico pelos ndices VPP e VPN. 15. Suponha que aprevalncia de uma dada doena 1/100 e CllW um teste de diagnstico para esta doena est sendo proposto. Se em uma verificao preliminar deste teste 99% das p(~Ssoas testadas que estavam realmente doentes e 1% das pessoas testadas que estavam realmente ss produziram resultados positivos, quais so os percentuais de falso-positivo e falso-negativo'( Na sua opinio este teste confivel?

'~~'\-\b)

( 16). A deteco precoce do cncer cervical uterino crucial para o tratamento e cura da pacient(~. O papanicolau um dos testes utilizados no diagnstico. Na tabela a seguir temos os resultados deste teste para 600 mulheres. As mulheres foram classificadas como portadoras ou n8,o da doeIH{a atravs de bipsia cervical.

CFC < 80' 80::; CFC < 280 CFC 2': 280
Total

Infarto agudo Sim No 15 114 118 15

Total 129

133
98
360

97
230

1
130

Com cncer Sem cncer Total

Teste Positivo Negativo 94 6 250 250


344 256

Total 100 500 600

(a) Considerando como resultado positivo valores de CFC li 1I\. i ores ou iguais a 80 (teste 1), calcule a sensibilidadn (~a especificidade. (b) Considerando como resultado positivo valores de CFC IUl\.i ores ou iguais a 280 (teste 2), calcule a sensibilidad(~ n I\. especificidade. (c) Considerando que a prevalncia de infarto em hospiLais dll corao seja aproximadamente igual deste estudo, <:1\.1<:111(1 VPP e VPN para cada teste. Comente os resultados. 19. A hemorragia peri-intraventricular (HPIV) uma das <:aIIHI\,H mais freqentes de agresso ao sistema nervoso central no 1)( ld( I do ne0!latal e a segunda causa mais freqente de morte em pl'l' maturos, precedida apenas pela doena da membrana hialilllL Atualmente, o mtodo de escolha para diagnstico consisL(~(lIll tcnicas no invasivas (ultra-sonografia e tomografia COlllpllLI\. dorizada) . Tavares (1995) estudou a ocorrncia desta enfermidade nt.ll I:.elO dos 129 recm-nascidos com peso menor que 2000 g, nascidllH no Hospital das Clnicas da UFMG, no perodo de 18/0 I /1),1 a 17/05/95. O critrio nico para excluso foi morte lWOII 1\,1. 1\.1 precoce, anterior possibilidade de realizao do exanw 1111.1'1\. sonogrfico. (a) Para avaliar a eficcia do exame clnico neurol()gico, IlN crianas (com exceo de uma) foram examinadas pOl' 11111 p'ediatra clnico com formao em neonatologia, snlll li ('(I nhecimento prvio dos exames ultrasonogrficos, (pll~ ('1111 firmam ou no o diagnstico fornecido pelo 11I{~di<:lI. (l/I

(a) Calcule a prevalncia de cncer na amostra. (b) Calcule a sensibilidade e a especificidade do papanicolau. Interprete os valores obtidos. (c) Calcule o VPP e o VPN usando a prevalncia obtida no item (a).' (d) Considere a seguinte afirmao: "O papanicolau til para excluir a presena da enfermidade, embora um resultado positivo no possa ser confivel para diagnosticar a presena da doena". Voc concorda com a afirmao? Justifique sua resposta. Um clnico considera uma pessoa diabtica se a concentrao de glicose no sangue maior que LI, Um outro clnico toma como valor de referncia L2 (L2 ~ LI)' Compare as sensibilidades e a especificidades dos testes utilizados pelos dois mdicos. A creatinina fosfocinase (CFC) um marcador para o diagnstico de infarto agudo do miocrdio. Pacientes com infarto agudo do miocrdio apresentam valores elevados de CFC. A tabela a seguir apresenta os valores de CFC para 360 pacientes de um hospital do corao, sendo 230 com infarto agudo do miocrdio.

Exame neurolgico Alterado Normal Prsent(~ Ausent(~ Total

25 31 5(j

1;~ 50
Ci;~

Total 38 81

artroscopia foi indicado. Vinte e cinco pacientes tiveram 1lI11 011 mais diagnsticos secundrios, em que no se acreditava S(~J' 11 causa da maioria dos sintomas ou pensava-se ser conseqii()II<:il1 do diagnrstio primrio. As tabelas a seguir representam os resultados obtidos para 1"1 I ptura do menisco nwdial e condromalcia. Para cada tipo leso, calcule a sensibilidade e especifidade. Comente.
(t()

119

Calcule a sensibilidade e especificidade do exame clniconeurolgico e a prevalncia dessa condio na populao em questo. (b) O baixo peso ao nascer usado freqentemente para rastrear HPIV, sendo 1500 q o limite sugerido para tal fim. Considerando essa informao e os dados mostrados a seguir do peso ao nascer (,q) de ;39crianc:as com HPIV, qual seria a sensibilidade resultante do rastreamento? Abaixo de que peso encontram-se 95% das crianas com HPIV? Quais as conseqncias de se alterar o valor de referncia para o nov:o valor encontrado?

Ruptura do menisco medial Presente Ausente Total

Teste Positivo Negativo CiO 8

Total

20
80

68
76

68 88 156

Teste Positivo Negativo Presente Ausente Total

Total

1530 1000 1280 1150 1420

1520 1020 1410 1230 1760

1350 1690 1750 1660 1670

1260 1140 800 1430 1520

1160 1160 1020 1590 1680

1120 1290 830 1280 1650

1500 1410 1620 1040 1180

1020 1850 1430 1810

11 O 11

18 130 148

29 130 149

21. Dor persistente

~(l.O'Shea et a1. (1996) testaram

a exatido do diagnstico de leses traumticas no joelho a partir da histria do paciente, exame fsico e radiogrfico (comparados com artroscopia posterior) como forma de verificar at que ponto uso da tcnica de imagem ressonncia magntica (exame de alto custo), que ()st se tornando o estudo suplementar preferido na avaliao de I()ses no joelho, necessrio. O estudo incluiu 156 pacientes com 156 leses no joelho (72 agudas e 84 crnicas) que foram ai,(Tldidos durante um ano no Mo,r-t'in Ar-my Community Hos7J'illl.l, Georgia, EUA. Por se tratar de uma base do Exrcito, a IlIaioria dos pacientes era composta de homens jovens, ativos e (1()lm~a maneira geral saudveis. Cada paciente recebeu pelo 111<)1I0S urrl diagnstico primrio para qual o procedimento de

no tendo de Aquiles (tendo calcanear) d 1i rante mais de seis meses pode ser causada por ruptura parcial do tendo. Essa leso geralmente refratria a tratamento COlI servador, sendo freqente a necessidade de interveno cirrgicil. para alvio da dor. Para avaliar o valor diagnstico da ultl'a sonografia nesses casos, 37 pacientes tiveram seus achados do exame pr-operatrio comparados aos da cirurgia (Kalebo <do a1., 1992). Os 30 resultados positivos encontrados na 11]1,1'11. sonografia foram confirmados, mas dos 7 resultados negativ( IS, 2 eram na verdade positivos. (a) Calcule a sensibilidade e especificidade da ultra-sonogl'afi li . para diagnstico de ruptura parcial de tendo de Aqui I(~H. (b) Por que se pode afirmar que a prevalncia calculada a pil.l' tir desses estudo diferente daquela encontrada na JlOpl1 lao em geral?

(c) Urna bailarina chega ao conf->ultrio eleseu ortoped,ta com histria clnica, f->US e f->intOlnas que o fazem tcr 70% de certeza no diagnstico de ruptura parcial elo tendo de Aquiles. Com resultado lH~gativoda ultra-f->onografiaqual a probabilidade dela no t(~r a les8o? () que aconteceria se o resultado fosse pOf->itivo? 22. Suponha que a sensibilidade (~a especificidaele de dois testes (A e B) para o diagnstico ele uma determinada doena sejam: Teste A B Sensibilielael(~ Especificidade 0,90 0,70 0,70 0,90

Captulo 5

Caracterizao Estatstica de Variveis

(a) Assumindo que os testes sejam realizados de forma independente, qual a ordem que produz as melhores caractersticas gerais do teste conjunto em paralelo, isto , o resultado positivo se ambos silo positivos? (b) Baseado na resposta de (a) e na informao de que os dois testes so 'igualmente invasivos e os custos para aplic-los em um indivduo s,o os mesmos, em que ordem elE;sdeveriam ser aplicados para urna populao cuja prevalncia p = 1.000/11.000? (Sugesto: para as duas ordens, simule o que seria esperado para urna amostra de 11.000 indivduos.) Neste captulo vamos apresentar urna forma de caracterizar va riveis, que consiste em agrupar situaes envolvendo variveis do mesmo tipo em classes denominadas 'modelos. Descreveremos apenas os modelos de Poisson e de Gauss, respectivamente para variv{~is discretas e contnuas. Eles tm grande importncia porque POC1<;111 descrever muitas situa({es prticas. No possvel conhecer a priori o valor de urna varivel intrinsecamente sUJo . eita variabilidade , da ela ser chamada varivel aleatrl" Portanto, para estud-Ia, temos que identificar os valores que pode assumir e a correspondente freqncia de ocorrncia, isto , a sua distribuio de probabilidade, ou seja, o modelo que ser usado para caracteriz-Ia. Embora no exista um padro geral para a distribuio de dados provenientes de variveis biolgicas, destaca-se uma forma c1<~ distribuio que, pelo menos de maneira aproximada, encontrada muito freqentemente. a distribuio gaussiana, que recebe alternativamente o nome de distribui,o normal, termo que ser evitado neste texto pelas bvias dificuldades que traz no estudo de variveis com interpretao clnica. Esta distribuio ser utilizada para a determinao de faixas de referncia para medidas labora~oriais. Este um captulo conceitual e nem sempre possvel apresentar

Illol.ivaes simples e intuitivas. Apn~sentamos, entretanto, aplica({es i1111)( lrtantes, como a dctermiw1<)io de faixa de rcferncia de medidas cifllicas. Ressaltamos que as idias aqui estudadas siio absolutamente 1'111)( Iamentais para o entendirnt~nto das solues de problemas mdicos /l.pn~s(mtadose discutidos a partir do prximo captulo.

A partir da distribuiiio de probabilidade podemos calei dar pl'll babilidades da ocorr(~ncia de um determinado evento. Assi 111,I'I'I! qentemente estaremos escrevmHl(l:

r,.2.1

Variveis aleatrias e suas distribuies de probabilidade

para indicar a probabilidad(; de a varivel aleatria X tomar um valor no intervalo [a, li]. Outros exemplos apresentados a seguir ajudaro a melhorar o entendimento do conceito de varivel a.leatria e de distribuio d(~ probabilidade.

I}evido variabilidade inerente aos seres hurnanos, a maioria das val'i:,veisde interesse clnico aleatria, ou seja, produz valores dife1'I'III.es quando observadas em repeti(:es feitas mesmo sob condi~{es idl\IILicas. Da a importncia de se estudar o conceito de varivel Idl~al.riaantes de se considerar outros problemas clnicos resolvidos' I'0111 o auxlio de tcnicas estatsticas. Crianas de mesma idade, mesmo sexo, mesma classe scio-eco11(lIl1ica, mesma raa, medidas pelo mesmo pediatra, tm pesos di1'I'I'I~lltes.Ento, o peso de urna cri~tn({adeve ser estudado atravs do <:llnceito de varivel aleatria. A palavra aleatria indica aqui :'1)('11<1.8 que o peso est sujeito variabilidade e exige para seu estudo II cllllhecimento de seus valores possveis e da respectiva freqncia. Valores possveis e freqncia so duas informaes que identilil'llIll a distribuio de pmbabil'idade da varivel aleatria, conceito kl:,i<:llpara todas as idias apresentadas neste texto. As variveis aleatrias, usualmente representadas por letras mais1'lIlas, podem ser classificadas em discretas ou contnuas, se algumas 11'('11 ic:alidades forem desprezadas. A varivel discreta pode assumir um nmero finito de valores, III,ia:;probabilidades de ocorrncia so conhecidas. O nmero de conIllillas 111(;dicas anuais de um associado de um plano de sade uma \'lIlilivc~1 aleatria discreta. H urna probabilidade de um associado 11111' ra:t,I~r nenhuma consulta, de fazer urna, duas e assim por diante. A varivel contnua pode assumir todos valores de um intervalo I' 11:1 pmimbilidades necessrias ao seu estudo so calculadas corno a 1111'11 ai laixo da curva da distribuio, usualmente chamada de funo t!"II,'iullUle de pmbo.biliade. A presso arterial um exemplo.

Se X o nmero de rneninos em urna famlia com duas ___ criancas 3' seus valores possfveis so O, 1 e 2. A probabilidde das crianas ser;;;:;; do mesmo sexo 1/4 e indicamos como Pr[X = O] = 1/4 para duas menimas e Pr[X = 2] = 1/4 para dois meninos. A probabilidade de apenas um rnenino 2/4 = 1/2 e indicamos por Pr[X = 1] = 2/4 = 1/2. A distribui({o de probabilidade de X est apresentada na Tabela 5.1. Tabela 5.1: Distribui(:o de probabilidade do nmero de meninos em uma famlia com duas crianas Nmero de meninos (:r:) O
1

Pr(X

= 1;)

2 Total

1/4 2/4 1/4


1

Em um lanamento de um dado, seja Y o nmero da face voltada para cima. Os valores possveis para Y so 1,2,3,4,5,6 e Slla distribuio de probabilidade dada na Tabela 5.2.

'l'abela 5.2: Distribuio Illcnto de um dado

de probabilidade

dos resultados

do lanc;a-

R.esultado (y) 1
2

Pr[Y

= y]

3 4 6 Total

1/6 1/6 1/6 1/6 1/6 1/6


1

fazem sua avaliac<o fundamental na prtica Ild~<!iC:lI. A Figura 5.1 mostra a distrilmic;o da presso diastlica dn J:IH.!)()(; pessoas entre 30 e 69 anos de 14 comunidades nos Estados lJlli<!II:1 (Cin;ulatio'/l, Rcsco,'rch, 1977). Para pessoas, mesmo pertencnu<!1 I I\. uru grupo homogneo, S3.0 observados valores diferentes de p]'(~ssal) arterial, da ser considerada urna varivc1 aleatria. No entanto, lIWS mo coru sua diversidadn natural, percebe-se um comportamento COI I I clara estrutura, que pode ser sintetizada na sua distribuio.

presso arterial

cada vez maior o nmero de pessoas que utilizam planos sade c:omo forma de garantia de atendimento mdico. Na elaborao destes planos, devemos considerar um grande nmero de variveis aleatrias. 1';1]treelas, por causa do alto volume de recursos que exige, destaca-se o nmero de consultas mdicas por ano por associado (T). cujos valoI'c)spossveis so 0,1,2, etc. O nmero mximo de consultas depende (10 plano. Neste caso, a distribuio de probabilidade no conhecida Illas podemos obter a distribuio emprica a partir dos dados.

() termo presso sangnea refere-se presso do sangue nas I\.I'U~l'ias,da a denominao presso arterial usualmente empregada. ( )s I I(vcis pressricos alteram-se ao longo do ciclo cardcaco, atingindo lI( ~II ponto mais alto quando o msculo do corao est mais contraIIII, I'on;ando sangue nas artrias, e seu menor valor quando o msculo l'l.Jax1l.,ao fim da batida. A contrao elo corao chamada sstole e 1)111' isi.o a presso medida naquela circunstncia chamada de presso I:icd/>Iic:a.Analogamente existe a distole e a presso eliastlica. disponibilidade ele mtodos simples e fidedignos de medida as:i' wia<!a ;1 grande incidncia e importncia dos distrbios relacionados

Corno o peso ao nascer urna varivel com grande importilll<:il\. prognstica, h todo interesse em estud-Ia. Trata-se de urna vari;,vI.J aleatria contnua e para se chegar sua distribuio necess;,l'i, I assumir urna expresso matemtica baseada em algum conhecim()IIi.I) prvio ou a partir de um trabalho emprico. Na realizao de um estudo importante primeiramente ser 1I111iH especfico e estabelecer critrios de incluso, corno crianas do S(~XII feminino nascidas de gravidez a termo, e critrios de excluso, 1)1)1' exemplo, presena de diabetes na me. Em urna maternidade, tornando os pesos de 100 recm-nasci di n1 que satisfizeram os critrios estabelecidos e construindo o histogl'1l.1111\. de seu peso, obtemos o grfico da Figura 5.2.

O,4U

'" .~
>

0,30

"
'03

c ,"
.;0
O'

'"

0.20

LL

1:

0.'10

Embora o comportamento da varivel possa ser sugestivo, 100 valores pouco para se determinar a distribuio do peso ao nascer, pois o histograma no apresenta forma bem definida. Elevando-se o ""'Iucro de observaes para 1.500, obtemos o histograma da Figura !.:\, cuja forma da distribuio bem mais clara.

Uma varivel aleatria e sua respectiva distribuio muiLo fl'l' qentemente chamada de l)()p'u,lo,o, conceito estatstico difenmL(~dI) significado usual desta palavra. Ref~~n~~se a todos os valores possv(~is, com as respectivas freqncias, de uma medida especfica, e no a 11111 conjunto genrico de pessoas. Podemos, pois, nos referir populac{i"i.<) da presso diastlica de todos os alunos admitidos em uma univm'sidade em determinado ano. Neste contexto, o,Tno8tn/, um conjunto de observaes extraf das da populao. O processo ele se obter uma amostra chamado amostTO,geTn e visa garantir representatividade da populao. Para isto so necessrias tcnicas especializada.s que geralmente incorporalll especificidades das variveis estudadas e elo tipo de estudo. Na prtica, tipicamente dispomos de apenas uma amostra c~a partir dela pretendemos fazer inferncias para a populao. Assilll, baseados na amostra estimamos parrnetros populacionais de iuL(~ resse (por exemplo mdia, varincia e proporc:o que apresenta IUlla determinada caracterstica). A teori(.\. da estimao estatstica foi desenvolvida para resolver este problema.

g;
~ 0,3

~ '0: '" c
u::

," '::l

0.2

2"

0,1

o modelo de Poisson freqentemente usado para descrever Vil. riveis aleatrias que se expressam atra,vs de contagens .. Suponha que a varivel aleatria X represente o nmero de or:o'I' rncias de 'UTnevento em um peT'odo de tempo. Muitas variveis C1<~SSI' tipo seguem o modelo desenvolvido pelo matemtico francs POiSSOIl, cuja distribuio de probabilidade dada por
Pr(X

x)

= -' -,-,
;X;.

e-X/:

Na I'l~alidade, por maior que seja o nmero de recm-nascidos

IIIHidl~l'ados,s conhecemos de fato a distribuio desta varivel 1I11'al/ll'iaquando identificamos a expresso matemtica de sua disIl'illllil:IIO,isto , a sua funo de densidade de probabilidade. Neste 1'/IHo, !',lIiados pela Figura 5.3, razovel admitir que o peso ao nascer 11'111 disLl'ilmic.;iio gaussiana, que ser apresentada na Seo 5.4.
1'1

onde e ~ 2,7183, xl = 1 x 2 x ... >< x e (l-se lambda) {~11111 valor positivo. O parmetro interpretado como a taxa md:/, dI' ocoTrncias, isto , o nmero mdio de ocorrncias por unidadc~ dI' tempo. Observe que neste modelo n&o h limite superior para as contagens que podem ser observadas.

A Figura 5.4 ilustra a distribui<{(lode Poisson para alguns valores


(te .

0,3

:g :.
eu ..a
D..

eu

0,2

0,1
..... L,_.

;I i I II ,
; 'I
I

LLu.l.L~_'

I J1lliL1
iii I i
j

__ ..---'--

JJ.! i illll!I
I ;

~: I~

<

Suponha que o nmero de pacientes que chegam a um pronto so corro de uma pequena cidade durante a madrugada tenha distribui({I.l) de Poisson com mdia 3 ( = 3). Para a obteno da distribuio d(~ probabilidade apresentada na Tabela 5.3, a probabilidade de chegadas de :1: pacientes calculada como

Note que a distribui({Lode Poisson pode ou no ser simtrica, d(~pendendo do valor de . Tende a ser assimtrica para valores pe<[ll<mos de . Alm disso, pode-se perceber que a concentrao das probabilidades ocorre ern torno da mdia (). Essas observaes tamI )(~ln podem ser notadas na Tabela A2 do apndice. Os pressupostos bsicos para a utilizao do modelo so: l. As condies permanecem estveis no decorrer do tempo, isto , a taxa mdia de ocorrncias () constante ao longo do tempo. ~. Intervalos de tempo disjuntos so independentes, isto , a informao sobre o nmero de ocorrncias em um intervalo nada revela sobre o nmero de ocorrncias em outro intervalo. Alhn do tempo, pode-se considerar a ocor-Tncia. do evento pOT cer-/11 'l}()l'll:rne ou por- cer-ta ,r-ca. Nmero de registros anuais de cnceres, 111'11I1(~1'O de bitos dirios em um grande hospital, nmero de bactrias Ili Ir 'III-l de urina e nmero de pacientes que chegam diariamente em ('('II!.I'()8 d(~sade so exemplos de situaes que podem se ajustar (li~iI,l'ill\Ii(Ji,o de Poisson.

:r O 1 2

3
4 5 6

Pr(X = :r) 0,050 0,149 0,224 0,224 0,168 0,101 0,050

:r
7

8 9 10 11 12 2:: 13

Pr(X = :1:) 0,022 0,008 0,003 0,001 0,000 0,000

~O

1. muito pouco provvel que nenhum paciente chegue em 1111111 determinada madrugada, pois Pr(X = O) = 0,050. 2. muito provvel que pelo menos um paciente chegtw (~III di' terminada madrugada, pois Pr(X 2:: 1) = 1 - P(X = O) 1 - 0,050 = 0,950. 3. improvvel que cheguem 13 ou mais pacientes durarl!.(' madrugada, j que Pr(X 2:: 13) ~ O.
I1

11. A maior concentrao da distrilmi(.;i'i.oest nIn torno de :r = :~, que o nmero mdio de dwgadas de pacientes de madrugada.

r). Se fossem consideradas duas madrugadas, o nmero mdio de: chegadas seria 6 = 2 x ;~ ; em um ms espera-se que cheguem
DO= 30 x 3 pacientes.

A curva que vamos estudar nesta se(.;odeve-se a Gauss, eminente: matemtico alemo, e por isto ficou associada a seu nome. A curva da distribuio da varivel X caracterizada por dois parmetros: f.L (lse mi) e rT (l-se sigma). definida matematicamente pela seguinte equaao

() nmero de consultas rndicas anuais de um associado de um de sade , naturalmente, um mmero iinito. Uma aproxi11111(';:\.0, que simplifica a especificao de sua distribLli(.;o, supor que IliliI(~tomar qualquer valor do conjunto {O,1,2,3,4, ... }. I<;mum plano com 5.694 filiados, ao firn de um ano fizeram-se I:I.()DH consultas, segundo a distribuio mostrada na Tabela 5.4.
plnllo

A Figura 5.5 a representao grfica desta equao. A curva de Gauss sempre positiva, embora parea anular-se para valores fora do intervalo [/" - 3rT, /" + 3rT], regio em que assume valores muito pequenos. simtrica em torno de fi. e engloba uma rea total de 1, ou seja, 100%. As constantes li e rT so, respectivamente, a mdia e o desvio-padro populacionais.

N!.'. de consultas

O 1 2 3 4

Freqncia 589 1274 1542 1144 663

N- de consultas 5 6 7 8 9

Freqncia 304

126 39
10 3

11-'"Q

total de consultas

n total de associados 1 x 1274 + 2 x 1542 + .. 8 x 10 + 9 x 3 589 + 1274 + 1542 + .. 10 + 3 13.098 5.694

= 2,3

Se uma varivel aleatria X tem distribuio caracterizada pela curva de Gauss, representada na Figura 5.5, dizemos que segue a distribuio ga:ussiana e indicamos como

() valeli' 2,3 a mdia de consultas anuais. Isto significa que o 1lllIilll'iacie) Upico deste plano de sade faz cerca de duas consultas 1IIIIIIIi:, (~ (~spma-se aproximadamente 23 consultas em 10 anos.

Inmeras variveis clnicas, pelo menos aproximadamente, seguem a distribuio gaussiana: valores da hemoglobina em pacientes sadios, presso arterial sistlica, temperatura corporal, altura de crian(;:as de uma mesma idade, etc.

A distribuio gaussiana com mdia O e desvio-padro 1, isto , 11, = O e (J" = 1, chamada de gaussiana padro. Seu grfico est na Figura 5.6.

propriedade decorre da simetria da curva gaussiana padro em tomo de zero. Da Figura 5.8, vemos que, para calcularmos a probabilidado (111 X estar entre dois valores, a e b, precisamos fazer a seguinte conta

(l

Uma varivel que tem a curva de Gauss padro como distribuio usualmente identificada pela letra Z e representada por

Para o estudo e uso de tcnicas estatsticas, fundamntal conhee saber usar a tabela da curva gaussiana padro, reproduzida na Tabela A3 do Apndice. Esta tabela d, para cada nmero x entre -3 e 3, a rea abaixo da curva gaussiana padro no intervalo (-00, x]. Ou seja, fornece o valor de Pr[Z :S x], correspondente rea sombreada da Figura 5.7. Observe que nmeros negativos tm valores tabelados menores qllll 0,5 enquanto nmeros positivos, valores maiores que 0,5. Esta
em'

Figura 5.8: Probabilidade de ocorrncia de valores entre a () h Portanto, para o clculo da probabilidade desejada, basta conHIJI~ tar a tabela duas vezes: uma para obter Pr[Z :S b] e outra para obt;(l/' Pr[Z:s a] e ento fazer a diferena entres os dois valores lidoH.

Para calcular reas sob a curva de Gauss com parmetros 11, (! (T, basta redmjr o problema ao uso da curva padro atravs do segllilll.l resultado Neste exemplo ilustramos todos os tipos de uso da tabela da disI.riI JIlic~o gaussiana padro necessrios em problemas prticos.
I. Pr[Z::; 1] e PT[Z ::; -1] X-li,
rv IT

rv

N(fI',

IT)

===? --

N(O,

1)

Os valores dessas probabilidades sao obtidos diretamente tabela: Pr[Z ::; -1] = 0,1586 e PI'[Z ::; 1] = 0,8413. ~. PT[-1 ::; Z ::; 1]

da PI' [X ::; a]
=

X - 11, PI' [-IT-::;

-IT-

a -

fi,]

p,. Z::;

-IT-

a-lI]

Atravs da expresso (5.6), P,.[-1 ::; Z ::; 1] = PT[Z ::; 1] Pr[Z::; -1] = 0,8413 - 0,1586 = 0,6827. Ou seja, o intervalo centrado na mdia com amplitude de dois desvios-padro engloba 68,27% da distribuio. :1. Pr [1 ::; Z ::; 2] Pr-[1 ::; Z ::; 2]= PI'[Z ::; 2] - Pr-[Z ::; 1] = 0,9773 - 0,8413 = 0,1360. Ou seja, 13,6% dos valores da distribuio esto no intervalo [1; 2].
11.

Esta ltima probabilidade, como vimos, obtida facilmente atrav{)s de uma consulta tabela da gaussiana padro. A Figura 5.9 most.ra graficamente o resultado enunciado em (5.7).

['o1'[Z?: 2,33]
Para o clculo desta probabilidade podemos usar a simetria da curva, reconhecendo que Pr'[Z ?: 2,33] = Pr[Z ::; -2,33] = 0,0099 (valor lido diretamente da tabela). Alternativamente, podemos lembrar que a rea total 1 e portanto Pr[Z ?: 2, ~~3] = 1 - Pr[Z ::; 2,33] = 1 - 0,9901 = 0,0099. Ou seja, 2,33 o percentil de ordem 0,99 da gaussiana padro.
~1-20" J.l-G

~ o

l!.I-a

~L+2cr

J.l+3a

X Z

-3

-2

-1

rI. !'T[Z < 1,64] e Pr[Z < 1,96] Pr-[Z < 1, 64] ~ 0,950 e Pr[Z <
I, !J6] ~ 0,975.

Figura 5.9: Correspondncia de percentis de uma curva geral (x) os da curva padro (z)

COIII

1{I)slIluindo,1,64; 1,96 e 2,33 so respectivamente os percentis de IIl'lil'lll O,!J5; 0,975 e 0,99 da distribuio gaussiana.

Freqentemente, tem-se interesse nos intervalos cujos limites S;l,( I mdia 1 desvio-padro, mdia 2 desvios-padro e mdia :I ;\ desvios-padro. Pata o modelo gaussiano, as probabilidades da vari vel estudada estar nestes intervalos so mostradas a seguir:

da gaussiana padriio obtemos a' = -1,96 e b' = 1,9(j. CI'II~iI' ", j-' -'-j-' !/.--J20 1, 96 . Ou seja, . a qllcn,U11ClL<', I() -, _-I ge" ) <. 1i-120 10 -- I()()"I b = 139,6. Para essa popula<Jio de joV(~ns saudveis, o intervalo [100,4; I ;\!), til engloba 95% dos va.lor<~s pressricos, isto , aproximadament(l <~II(.rl: 100 Tn:rnH:r; e 140 'm:mJ!q.
I'

'1 . _. gauSSlaua, - cerca (-I l' Em palavras, em uma c1 181.1'1 JUH;(),() e 6'8! 10 c 'c populao apresenta resultado entre a mdia e o desvio-padro; aproximadamente 95%, entre a mdia e 2 desvios-padro e praticamente toda a populao (99,7%), entre a mdia <~ ;3 desvio-padro.

Suponha que a presso arterial sistlica em pessoas jovens gozando de boa sade tenha distribuio N(120, 10)'\ 1. Qual a pr~babilidade de se encontrar uma pessoa com presso sistlica acima de 140 m:rnHq?

- P.,.

[X-120 10

>

140-120J 10

= 1- PT[Z::;

2] = 1- 0,9772

= PT[Z > 2] = 0,0228

Desde o isolamento em 1983 do Hel:obo.ctCT pyloT'i na mw:osa gstrica humana, inmeros estudos tm sido realizados objetivau( 11) determinar umapossvcl n;la(;o causal entre sua presena e algulllas entidades gastroduoc1enais: lceras, gastrite crnica, etc. A prescn<;a do microorganismo tern sido diagnosticada atrav{~s(11) exame de cultura (com uma margem de erro desprezvel). Um 011 tI'O mtodo, mais simples e rpido () teste respiratrio que emprq',a uria marcada com carbono-14 (CI4). Por possuir uma urease, CIIzima capaz de degradar uria a gs carbnico CO2, a presena da bactria pode ser evidenciada pela detec<;o de carbono marcado ar expirado aps administrao, por via oral, da uria marcada. Suponha que a quantidade de C14 , liberada sob a forma de C< )~~ p'ara pacientes no portadores da bactria H. pylo'{"i" seja uma vari <.V I 0/ gaussiana com mdia 0,07 unidades de C14 e desvio-padro igual a 0,03 unidades de C14 . A partir dessa informao podemos calcular:
I)()

Ou seja, 2,275% das pessoas jovens e sadias tm presso sistlica acima de 140 mmHg. 2. Quais so os limites de um intervalo simtrico em relao mdia que engloba 95% dos valores das presses sistlicas de pessoas jovens e sadias? Neste caso queremos encontrar a. e b tais que: P.,.[o. ::; X ::; b] = 0,95. Primeiro padronizamos essa probabilidade, isto , a. - 120 X - 120 b - 120] < --- 10 < ---10 = 0,95. 10 (a) Entre 0,04 e 0,10 unidade de C14 PT [O , 04
.

<'Z' _ /< _ O , 10] = PT "-

[0,04-?,07 0,03

< Z < -

0,10-0,07] 0,03

PT [Z ::; 1] - PT [Z ::; -1]

= 0,8413 - 0,1587 = 0,6826.


O,1~~~,7]

(b) Mais de 0,15 unidades de C14.

P.,. [X > 0,15] = Pr [Z >

= PT [Z > 2,67].

P'r[o.
<)Il

<X < b]

PT [

seja, Pr[a' ::; Z ::; 1/] = 0,95. Escolhendo uma soluo ~~illl(d.ri<:a temos -a' = b'. Como PT[Z ::; 1/] = 0,975, da tabela

H duas solues:

rabda 5.5: Pm'centllais obsCl'vados e os esperados segundo o de Poissou N'-'-ck consultas O


1

IIIIHII-III

> 2,67] = PI' [Z < -2,67] = 0,0038ii. 1 - Pr [Z < 2,67] = 1 - O,9D62 = 0,0038.
1.

Pr [Z

( '2. ,Quais valores, simtricos em rc1ac;8,o (),mdia, incluem 80% dos / pacientes no infectaclos?
I

Pr [ a <Z<

[] ) -

r, [a-O,07 <Z < I o,m -

(1-O,07] 0,0:\

:3
4

Pr [ai :s: Z:s: b']


Como
[I _

= 0,80.

Pr- [Z

< 0,1] = PI'

[Z

>

b']

= 0,10

=? 0,'

= -1,28

- -1 ')0, iJ-O,07 - 1 28 = O, 03' ) _ 1, 28 . A"',' ssnn, (J,-O,07 0,0:.\ , ~O c O,f);) -, =? a e b = 0,11. O intervalo [0,03; O, 11] engloba 80% dos indivduos

Pcn:entual obscrvado esperado 10,34 10,0:3 22,37 2:3,06 27,08 26,52 20,09 20,33 11,64 11,69 5,34 5,38 2,21 2,06 0,68 0,68 0,18 0,19 0,05 0,05

no infectados.

5.5

Verificao da adequao do modelo

Aps a escolha de um modelo para descrever uma situac~o I\(~cessrioverificar a sua adequao aos dados. A verificao pode sl~rbaseada nas caractersticas do modelo, em grficos especiais e em t.1~stes de aderncia. Citaremos alguns desses procedimentos para os dois modelos tratados neste captulo.

A partir desses valores podemos calcular os valores previstos pelo modelo, conf~rme mostra a Tabela 5.6. Por exemplo, o nmero esperado de assocmdos com duas consultas obtido pelo seguinte clculo: 5.694 x O,2652 ~ 1.510. A comparao dos dois percentuais indica que o modelo de Poisson parece ser adequado. Tabela 5.6: Freqncias de associados segundo nmero de consultas efetivamente feitas e previstas pelo modelo de Poisson

Uma forma para a verificao da adequao do modelo de Poissou consiste em comparar as propores observadas com as probaI,ilidades obtidas pelo modelo ou equivalentemente, as freqncias I1I )servadas com as esperadas segundo o modelo. Se as discrepncias rI H'em "pequenas" existem evidncias de um bom ajuste do modelo aos dados. I'~xemplo 5.11: Nmero de consultas mdicas (continuao)

NQ de consultas

Freqncia observada prevista

N'-'-de consultas

Freqncia observada prevista

O 1 2 3 4

589 1274 1542 1144 663

571 1313 1510 588 666

5 6 7 8 9

304 126 39 10 3

306 117 39 11 3

As propores de ocorrncia de cada nmero de consultas obtidas no Exemplo 5.7 so prximas das probabilidades obtidas pela I\xpresso P(X = x) = (e-2,32, 3 )/x!, como mostra a Tabela 5.5.
X

A maneira mais simples para veriL-icara partir de uma amostra se a varivel estudada pode-)ser adequadamente descrita por uma disLl'i hnie,o gaussiana consiste em examinar graficamente a distribuio dos dados, por exemplo, atravs elo histograma. Se o grfico apresenLa I'alovel simetria e forma aproximada da curva gaussiana, tem-se i Ildicae,o de adequacidade do modelo gaussiano aos dados. Alm disso, importante verificar as proporc,es de) observae;es ('111 determinados intervalos que envolvam a mdia. Para uma disLl'ilmie;ogaussiana com mdia fi, e desvio-padro IT, sabemos que os illLel'valos (jl-IT; j-1+IT), (IL-2IT; IL+2IT) e (11-3IT; 11+3IT) compreendem I'l!spc)ctivamente 68,3%, 95,4% e 99,7(Yr, da distril:nJic,o. Em geral, Lalil,oI' quanto IT so desconhecidos, mas com uma amostra razoavel111(!IILe grande, digamos '/I, 2: 30, de se esperar que a mdia amostral :i: esteja prxima de Ir e que o desvio-padro amostral s esteja prxi1110 de IT. Podemos ento, com base nos dados amostrais, calcular x (! ,'I, e contar o nmero de observaes nos intervalos (x - s;x + s), (:I: - 2s; x + 2s) e (x - 38; X + 38). Dividindo essas contagens por n, C)Lamanho da amostra, obtemos as freqmcias relativas observadas IIIH!devem ser comparadas com as probabilidades tericas (0,683; (),DG4 e 0,997). Grandes discrepncias entre as freqncias relativas "hs(~rvadas e as probabilidades acima indicam uma possvel falta de II( bJlrao ao modelo gaussiano. Em resumo, existe indicao de que os dados so adequados ao IllOddo gaussino se:

computador. construdo ele tal forma que se h uma boa ad(~I'(~lIcill. dos dados ao n~()delogaussiano, as observaes estaro alinbadas ('111 torno de UIna reta destacada no grfico.

Os alunos de uma turma de 60 estudantes do sexo masculillO mediram a pre'sso sistlica (m:mHIJ), uns dos outros, obtendo os resultados da Tabela 5.7, Tabela 5.7: Presso sistlica (m:mHg) de 60 estudantes 142 136 118 104 124 152 138 108 120 124 142 120 122 116 14Q 118 132 112 128 132 134 118 128 110 108 140 118 941, 108 132 110 130 128 100 146 128 120 130 120 130 98 116 114 128 116 116 122 130 124 102 130 140 138 128 114 110 120 118 110 118

I';xistcm outros critrios mais precisos para se verificar se h uma IH 111 ad(~rncia de um conjunto de dados ao modelo gaussiano. Uma 1,1111 I'derncia o Captulo 1 do livro de Madansky (1988). Destaca: 11' I1111 grfico denominado Q- Q plot, disponvel nos programas de

O histograma desses dados, apresentado na Figura 5.10, enlhora ligeiramente assimtrico, tem aproximadamente a forma gaussi;l.Il:1., Portanto, razovel pensar que a presso sistlica possa ser de)scl'i LII pela distribuio gaussiana. Para esses dados tem-se: x = 122,70 e 8 = 12,21. Espc)l'a-sl' cerca de-08,3%, 95,4% e 99,7% da populao respectivameni,() IIIIS faixas (122,70 -12,21; 122,70 + 12,21) = (110,49; 134,91), (122, 7() 2 x 12,21; 122,70 + 2 x 12,21) = (98,28; 147, 12) e (122, 70 ~ :\ ;. 12,21; 122,70 + 3 x 12,21) = (86,07; 159,33), enquanto que os IH'I' centuais observados so 63,3%, 95,0% e 100%. Como no h gl'1I.lldl' discrepncia entre estas porcentagens e as probabilidades tc!6l'iclIH conclui-se que o modelo de Gauss para esta varivel razovd. O Q-Q plot apresentado na Figura 5.11 indica uma C)xcc~bIL(' aderncia dos da,dos ao modelo gaussiano.

que neste caso o modelo gaussiano no razovel. Isto cOllfi1'1 11 a<i II pelo grfico (J-(J pio!; da Figura 5.12.

A hemoglobina um parmetro hematolgico de uso rotineiro 1111 clnica mdica. Tomando o histograma da Figura 5.13 como :"I)J'( I ximao para a sua distribuio entre mulheres, vemos que vaJol'I'~; menores que 12 g/dl so pouco comuns. , pois, razovel considl!I'HI' um diagnstico de anemia ao se observar uma paciente com valm di' hemglobina de 11 g/dl.

1\ lnclia e o desvio-padro para as 78 observaes do Exemplo ;1:1, do Captulo 3 so x = 221,27 e 8 = 51,02. As faixas (221,27 ~II,I)~; 221, 27+51, 02) = (170,25; 272, 29), (221, 27-2x51, 02; 221, 27+ '. ;)1,02) (119,23;323,31) e (221,27 - 3 x 51,02; '~:"I, ~7 + ~1x 51,02) = (68,21; 374, 33), englobam 79,5%, 98,3% e ! 1;,,7%1 dos dados. O primeiro percentual difere significantemente do (G8,3%). () ilistograma mostrado na Figura 3.1 assimtrico, indicando
il'lili('()

I".

Por causa da variabilidade entre iudivduoe:, a anlie:e de um valor ('e:I)(~<:fico de hemoglobina em mlhe]'(~e:dev<~e:er feita confrontando-o ('0111a faixa 12-16 g/dl. a chamada .!a';a de Te.!'c'rbu;/,. '1'< )da medida laboratorial analie:ada confrontando-e:e seu valor ('(1111 \Una faixa. Isto tiio commll que, na prpria aprmenta()io do I'Pe:ldl.ado, muitos laboratrioe: j indicam oe:limitm inferiores e SUP(;I'illl'(!e: para o valor da medida que dcvelll e:crvir de bae:e ao raciocnio I'lfllico. () procedimento di; defini()io de faixa de rcferfmcia baseia-se na I1 i I)(\I.<~e:e de que as popula<;ee: de pee:e:oae:sacliae: e ae: de pessoas II)('IILesproduzem, para aquela m(xlida, valores que Hutuam em torno li' Illlias diferentes, gerando curvae: com pequena interse(;o. A 1"i)',lIl'a5.14 ilustra um possvel nlodelo.

to, inmeras dificuldades para definio desta popula(Jio (!div(!l'g(\lldll entre os autoree: a ee:e:(; ree:peito. preciso considerar tarn1J{~1I1 (111l.t'IlH caractersticas al{~m daquela em estudo: idade, sexo, peso, II (VI d 111' atividade, tabagismo, dida" ra(;a, local de residncia e nv(~1s<')(:i( I econmico. Esses elelnentos criaro uma forma de comparn<,a() (I()~; valores com aqueles (Ia popu1a<.,u,() estudada. Todo mdico qur iIJ( '()I' pora criticamente sua experincia anterior desenvolver, ao long() (1;1 vida, critrio di; valoriza(,o de desvios dos valores de referncia.

(\
~

(\

~) \
1';e:l.asfaixas devem ser utilizadas de maneira crtica. A associlU:al) de valores fora da faixa com a condio de doente no pode ser 11111.( llw\,tica. O conceito ele sade complexo e no pode ser reduzido 11('111 a uma nica dimenso, nem a uma sucesso de exames labora1.( Il'iaie:. l~ necessrio unificar todas as informaes disponveis, tarefa I.I 111{~dico. ,;; L\,cilprovar que a probabilidade de uma pessoa apresentar valo1'1';; dmil;ro da faixa de referncia em todos os exames de uma grande IIIII.('l'ia d(~ testes muito pequena. Ou seja, o uso ingnuo destas I'lIi x a" pode levar a concluses clinicamente sem sentido. 1\ I:OlIstruo de faixas de referncia baseia-se no uso de infor1111I(,:()(!e: d(~pessoas pertencentes a uma populao sadia. H, entretan-

Existem, essencialmente, duas marwiras de se obter uma faixa di! referncia. A primeira, baseada na curva de Gauss, s apropriada para variveis que tm distribui<;o definida por esta curva. Apesal' disto, a forma mais usada. A segunda, mais recomendada, baseada nos percentis e vale para qualquer tipo de distribuio. Em algumas circunstncias, h outros fatores relevantes qlW 1.01' nam inadequada a simples utilizao desses mtodos na constrll<,iI() de faixas ele referncia. Este o caso da presso arterial, em Cjll(!(IS limites para diagnstico de hipertensiio baseiam-se tambm IlO riscll aumentado de complicaes cardiovasculares e na interveno m{~t!ica para reduzi-Io. Nesses casos, torna-se necessrio incorparar ese:(~e: 1)11 tros fatores na construo de faixas de referncias atravs de mot!(!!os multivariados.

Na Seo 5.4, vimos como obter valores, simtricos em torno (Ia mdia lI, tais que a rea sob a curva de Gauss, delimitada por (~e:I.(' intervalo, seja um valor pr-fixado. Em particular, sabemos q11<~ (I intervalo (1-1,-2J, l-i+2J) engloba 95,6% da rea sob a curva gause:ialla, Em ouiras palavras, uma varivel com esta distribuio produzir:., (~III mdia, 95,6% de valores naquela faixa. Como na prtica lidamos sempre com uma amostra , a distribuicall no completamente conhecida e, portanto, utilizamos o intervai()
,

'\

como faixa ele referncia. Na expresso acima, o nmero 2 est,\, HH sociado ao valor de cobertura 95,6%, valor prximo de 95%. ()lILl'oH

II1Idtiplicadores produzem intervalos CUlU(liferentes porcentagens de cobertura. Por exemplo, 2,5 prodnz luua faixa de) l'(~ferncia que engloba 98,75% dos valo1'()s da medida d(~ interesse. Apresentamos a SI!gllir as faixas de ref(~rl~ncias para as col)(~lturas mais COlIluns. Cobertlua 90 l/(') 95% 99% Faixa (le refc~rl~ncia

(:i: - 1,048;;}; + 1, (48) (:1: - 1, %8; ;1'; + 1,9(8)


"0 (

:};-

2t":8 '-+')t":8) , de8;;}; ~, ,)

I';m muitas sitml.</ies se) irlt(~ressa o limite inferior ou o limite suI'1!l'ior de referncia. Nestes casos, faz-se a extenso elo procedimento da construo de faixas de ref<~rncia. Os limites so determinados racilrnente utilizando-se a tabela da elistribui(;o gaussiana padro. 1'1)1'exemplo, o limite superior de referncia que engloba 95% dos VI ti ores da medida de interesse ;1:+ 1, 048.

exemplo, valor negativo para o limite inferior em urna si I.I Iltl,:1I1 I 1'111 que as medidas tomam apenas valores positivos). Corno, entrdanto, nem sempre as pessoas que constroelll 1)1 1111'< 11 'i; de rderncia estilO atentas a esses problemas, a metodologia dI! ( :ali:,:> utilizada com grande freqlmcia, s vezes indevidamente. Para superar as limita(,es do mtodo baseado na curva d(~Cal"""';, basta usar o mtodo do,..;percentis, adequado a qualquer tipo dI! di,..; tribui(;o. Por (~xernplo, para lllWl.cobertura ele 95% utilizamo,..; CI)1111 I limites de rcfer'mcia os percentis de ordem 2,5% e de 97,5%, ou 0111.1'11"'; mais convenientes sitwlI,o. No Captulo 3 vimos como calcular os percentis. Entrdallt.l), quando so poucos os dados, uma forma aproximada, mas ba,..;t.allt.l' efetiva de se obter a faixa, descrita a seguir. Ordenam-se os valI >1'1 's a serem usados e diante de cada um coloca-se o valor i-~,G, IJllIll!i o nmero de ordem e TI, o nmero total de observaes. Esk valI 11' uma boa aproximac)io para a ordem elo percentil, correSpOndl!lIt.l' ao valor de ordem ,i. Procura-se ento os percentis mais prxiulI)s :ti 1:1 percentuais fixados.

Utilizando os dados da Tabela 3.1 do Captulo 3, referentes ao 1.1'1)1' de gordura fecal de 43 crialH,as que no eram amamentadas pela 1111\1" calculamos a rndia e o desvio-padr.o (;1: = 2,303, 8 = 0,872) (' ()iJt.emos os seguintes valores de referncia com cobertura de aproxillladamente 95%:

(:l'Licas podem ser feitas ao clculo de faixas de referncia pelo 111(o!,otlIJ da curva de Gauss. A principal delas que os limites do illl.l!],vlllo (;1: - 28, x + 28) so muito dependentes da suposio de que 1Idisl.ri Imir,o da medida de interesse gaussiana e nem sempre isto (' VI !I'da(h Usar este intervalo em populao no gaussiana produz, 11:1 V(!ZI,S, valores pouco razoveis para os limites da faixa (como, por

Glaucoma uma sena doena oftalmolgica que pode l(!val' :1 cegueira. A presena de presso intraocular elevada a pri IIci1'111 indicao de que a doena est em desenvolvimento. Por isto (! 1'1111 damental para a prtica oftalmolgica estabelecer faixas de refm(lllI'ill para a medida da presso intraocular. Muitas populaes j foram estudadas, o que permite estal >1'11' cer limites estatsticos de referncia com bastante segurana. (JI Ia"'; I, todos estes estudos indicaram que a distribuio da presso oClilal' entre indivduos normais assimtrica direita, como ilustradll 1111 Figura 5.15. A forma de clculo dos limites no pode ser, portanto, alllllolll baseada na curva de Gauss. Aqui s interessa o limite sup(~l'i()f'. 1\ Tabela 5.8 apresenta percentis obtidos em algumas pesquisa.s. Estes estudos justificam o uso do valor 21 mmHg conlO lilltil.l' superior de normalidade para uma medida isolada da pressiJ,o OCI 111\.1', Para cada medida utilizada em sua prtica, o mdico c]'it.(~ril)HII deve conhecer estudos como estes que justificam os limites cscIJlI1 idl ':1.

N-'-'- d(~

de ordmn
]

2
')

5 G 3G :37 38 39 40 41 42 43

Ordem do Valor ()])iiervado percentil 0,012 0,78 1,00 0,035 1,00 0,058 1,12 0,081 1,28 0,105 0,128 1,:31 3,12 3,22 3,24 3,27 3,G8 3,81 3,91 4,58 O,82G 0,849 0,872 0,895 0,919 0,942 0,9G5 0,988

'I 'ai lda 5.8: Informa(:e:,; sobre vrios trabalhos 1'(~IILis para a presso intraocular Autores, ano N-'-'- de pessoa:,; 1.235 4.049 4.652 19.880 Tonmctro Aplana(:o Aplan;),(:o Aplanao Sc:hiotz

que obtiveram

per-

I~I ~chrakis,l969 Ilollow & Graham, 1966 I\nnaly, 1965 I ~'ydheckr et a1., 1958
J(

Percentis 97,5 99 24 21 21 22 20 21 26 29

99,9 30 30 28 32

5.7.1

Cartas para controle de processos em hospitais

( )s clculos necessrios para se obter a faixa de referncia para o LI~' li (te gordura fecal atravs do mtodo dos percentis esto na Tabela

rI.!).

1\ partir desses resultados, uma faixa razovel seria (1,00 - 3, 91) >Ir'~iipondente aos percentis de ordem 3,5% e 96,5%. Atravs do IliI'oI,'lIlode Gauss obtivernos (0,559 ~ 4,047). Observe que mtodos ti i r, 'I(~I iI,(~s produzem valores diferentes para a faixa de referncia.
I"

Freqentemente h a preocupao em monitorar problelll :1:: ,I" Sade Pblica, como surtos de doenas, e em detectar deiiv j, lii ,I:I:: normas aceitas em hospitais. Sellick .Ir. (1993) apresenta Ulll illll li 1i tante procedimento para o controle de processos em hospitaiii. li;::!" controle feito mantendo-se o resultado mensurvel e imporJ,;\1 Ii(' til' processo dentro de limites. Por exemplo, no processo de COULlllll'ti" /infeco hospitar, pode-se contar o nmero de infeces porlllll 1:1'11", perodo. Analogamente para determinados acidentes de traI )all \I I 11I I hospital, bitos, etc., pode-se considerar as freqncias de 1)(',I>I'I'I'1l cias, mas poderia ser definido um outro indicador ligado aI) I) 'S:" " Os dados so as observaes referentes ao processo tOllla( Ias 111' longo do tempo. Alm de freqncias, pode-se tambm CIlllsitil'lal medidas, como tempo de espera ou presso sangnea. COliJOa II laill
1'( )(:,

I'ia dos dados relacionados ao contwll~ dl~ processos ()lUhospitais so ;d,l'illlltoS, por exemplo preselll,a ou nil.o lk il1f<~cl,o, as fr<~qii(mc:ias :;;u I 1I1<11S comuns. () artigo de Sellick.Ir. (l9!);l) apresenta aplic:ali)es para variveis , lil" podem ser descri tas atrav(~s do ruoddo dl~POiSSOll e discute tmn11('111 outros casos dl~ variveis discrd,as. Niio trata, eni,rda,llto, dl~ :d",lllllas situaes de lltl~resse, COlHO por l~xemplo de variveis Ull11Illllas, embora apreseutl~ rcfl~r()llciaspara eSSI~ caso. () princpio bsico do procedillwut.o (~qlW todos os processos tm 1IIIIavariabilidade inerent.e e que podem ser descritos em termos esl:iI,I:,l.icos.A forma de avaliar se o pwcmso l~st sob controle atravs ,Ia cOllstruo de um grhco conhecido COlUO caif'ta de cO'I'dTole. Ce)ll::i:;I(~(~m construir um grfico de linhas (discutido na Seo 3.3 do ( 'aptulo 3) e adicionar linhas paralelas ao eixo do ternpo na altura da 1111':<Iia, da mdia 2 desvios-padril.o e da mdia 3 desvios-padro, l'ollrOnne mostra a Figura 5.16.

De uma forma geral, considera-se que as seguintes situa(,()(~s1111'1'1' cem ser investigadas, pois podem indicar que o processo esl.:.rOl'; 1 <lI' controle: Um ponto encontra-Sl~ acima da liuha LCS ou abaixo da lildlH LCI. Dois de trs pont.os COllSI~CUtiVOS esto entre as faixas Li\S I' LCS ou entre as faixas LA1 e LeI. Quatro de cinco pontos consl"cutivos est8.0 entre a linha ln(~dia +1 desvio-padr8.o e a linha LAS ou entre a linha mdia I desvio-padr8.o I" a linha LAI.

Quinze pontos consecutivos esto dentro das linhas m(~dia I' mdia + 1 desvio-padr8.o ou das linhas mdia e mdia - 1 d(~svj() padro. Estes testes refletem no s a distncia de um dado valor (~III1'1' lao mdia, mas tambm padres no naturais para pontos delil.l'l' de linha de controle. Portanto, as cartas de controle podem ser lIsal Ia:: para detectar alguma causa de variao. Essas variaes so geralmente relacionadas com influncias ;\ lheias ao processo, tais como troca na populao de pacientes, II1 IV' , mtodo de vigilncia, novo pessoal de atendimento, ou podem n~sllll.al' de caractersticas intrnsecas ao processo. Os testes de controle podem tambm ser usados para mon i LI lI':11' mudanas em causas comuns de variao durante ou aps a impll' mentao de atividades de melhoramento de qualidade do proc( ~s:",-

Lei Mil,

I\s linhas correspondentes a dois desvios-padro so chamadas I1111 iL, 's ateno superior (LAS) e inferior (LAI) , e as linhas cor1I'::!'OlIllmltm a 3 desvios-padro, limites de controle superior (LCS) I' illrl'I'jol' (LCI). No h um critrio claro sobre quantos perodos de 1."1111 I (Ills, ano, etc.) devern ser considerados para o clculo da 11I1'<Iia. ,'-)I~ o perodo de tempo ms, geralmente so usados 12 a 24 11I1 '::( 'o': (' I)S perodos de epidemia devem ser excludos. ,
(I(~ I(

Colite associada a antibitico relaciona-se com altera(~s lia II1 Il'il microbiana normal que podem levar a supercrescimento de UI1l8/'I'1 di'um d~fficile e produo de toxina pelo mesmo. Os sintomas Val'ialll de diarria leve colite pseudomembranosa, condio potencia!lllC'lIil'

I'al,al (~mque esto pn~s(~lI,I,(~s Jd n'(:, (1m ahdolu in;I!, dial'la, muco ou ,';all,!~II(~ nas fezes. O dia~I\('JSi.icoUSIl;tllll(~ld,(~ {~ Jii,o pda delllollstr;u;8,O I11'I,oxina nas fc/',es. A pl'iJcl.1 Jscopia ]'(~v(~1 a placas I)l'al1G1Se (jJuardas ::1I111'(: a mucos a do (/)]OU. C(:ralIlWld,(~IJ(,rellLss80 COlUa int<~rTUp(;8'o dll liSOdo antibitico, UlaS r(~cidivas pod(~ul OC()]]'(~l'.AI~unlas ve~/',es III :ssria terapi a eSI)(~dJica, 1';111 um hospital I] I W (~sj,;\, IU(lIlii,oraudo o pr()IJI(~IUade colit,e as:;III'iada a antibiticos por C!o,')l:ri'i,'II,'III, di.lJ:e, vaulOS assUJuir que o 1111 i Vi:I'SO de pacientes {~(:stvd (~1]11(: uin llollve troca d(~llrtodos de I' I)',i I:'t Ilcia, nos procedinJ(~ntos, IlOS(~XnJIl(~S e~ CIlW aproximadamente I'I1I1sl,ante o nmero de~sse~s (~xmues n~;tlj/',ados por mf~s. Na Tabela 5.1() encontra-se o muwro luensal de resultados po::11,1 VI lS no exame deh~/',es para a i,oxilla pl'Odll/',ida pelo C!o,')(;r'II:m
I' '1:(

preocupaeJio, ou se~.ia,s(~{:rmlul(~ute mna contagem estatisticalll(~III,(' improvvel. Parn resp()]ld(~r (~ssa per~unbt construmos a cal'l,a di' controle COl]}mlia 2,H e desvio-padr;\,o l,G. Como pode ser visi,o lia Fi~lIra 5.17, nenhum ponto do ~r;\,liciI atinge os crilh'ios elo t(~st<~estatstico d(~ vnriae;iio significant(~.lsl,( I no significa CIlWa lu{~dia IIH~IIS;II de resliltados positivos apropriada ou acejtvd, luas sonlente~ CIlW,b;lse~ado na experincia anterior, (l nmero est;, de~lJtro da variaeJin espentda.

o
'>

:'r:'?'

~t"
'i

,
~,A,

, i\
/

LAS" 132

111.!li('ile.
~; "t,)

\'1
,

2
J:

'

Tal da 5.10: Nruero ulellsal de resultados positivos de toxina proI111!'i( Ia pelo C!o,')(;ru'/J!, difJ:'i!e em e~x;mws de fezes M0s do exame Feve]'(;iro Marco , Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro Total N!.!.de resultados positivos 4
1

2
Q) ,,1/

/\

\
\ \ / /

/\/
I \

1
\

"",1

x ::.: ;~,8

T)

Z "

'V
I

\/
-i--....;-.L~;,:
l--_.1-

"

~~
1

5.7.2

Rastreamento de doadores de sangue

4
O

~~ 4 3 G 3 34

posi111'11:;, aproximadamente duas vezes maior que a mdia mensal de 2,8. :\ III'1',1', 1IIII,a{~se~ esses seis resultados positivos devem ser motivo de

I~ li 11 \(A~S de novembro houve o maior nmero de resultados

Esta seoo tem como objetivo, alm de ilustrar o uso da di:: tribuio gaussiana, esclarecer alguns elos princpios bsicos dos 111'1 I gramas ele rastreamento de massa. A dosagem srica da enzima alanina transaminase (ALT) , alll.i)',:1 mente designada transaminase glutmico pirvica (TGP), (~ w,adn desde 1955 como indicador a ele danos hepatocelulares, encolll.l'alldl I se pronunciadamente aumentada nos casos de hepatites virais, a)',lliIa:I e crnicas, sendo mais especfica para detectar doena lwp;\.I,ica :1,'; sintomtica em pacientes no alcolicos. Nos bancos de Sall!',lIi', 11:1 doadores so rotineiramente avaliados para a elevae;o CbSil (~II'/'illl;1 antes da transfus8,o. Apresentamos a seguir uma adapta(;o de um exenlp!o (bl'l'i LI)1'111 Colton (1974), baseado no artigo de Prince & Gors]loll (!!)(i:,) Ijlli'

I.ral.a da transmisso da hepatite virtica na transfut>iio de t>angue. Na (!poca foi implantado um programa de rat>treamento de t>angue 1"lIll.:l.Iuinado com vrus da hepatitc) em doadol'()t> de um banco de) :illlll',II(),baseado na medida de ALT. I()t>ultados empricos de vriat> I)()t>qllit>at> indicam qUC) o logaritmo 1111 c!dmminao do ALT tem aproximadamente dit>tribuic;il.o gaut>:illll:J (a distribuio do ALT dellominada log-normal) nat> popula':i SI)11l e com danos hepatocc1ularet>, ret>pectivamcnte denominadat> ,'/1/11/11, ') doente. Os parmctros destas populac;cs na escala logart11 1 Il'II 1!1tl UI/Z esto mostrados no quadro abaixo:
':' I(

Populao Sadia Doente

Mdia 1,25 1,55

Desvio-padro 0,12 O,U atravs da sobreposie;iio das curvas correspondentes s populaes sadia e doente. O percentual de amostras aceitas indeviclamente bastante alto e pode ser diminudo mudando-se o ponto de corte para um valor menor. Idealmente deveria ser obtido um ponto de corte tal que o percentual de sangues contaminados fosse o menor possvel. Entretanto, isto implicaria no aumento do percentual de sangues rejeitados indevidamente, o que poderia inviabilizar o programa de rastreamento. Uma soluo seria ento fazer uma anlise variando-se o ponto de corte e ento calcular ot>percentuais de sangues aceitos e rejeitados indevidamente. A partir destes clculos seria escolhido um ponto de corte timo, definido a partir de algum critrio (por exemplo, em termos de valores de predio). No Captulo 4 vimos como os valores de predio dependem da prevalncia na populao. Ilustraremos estes clculos para uma prevalncia de danos hepat'ocelulares de 12%. Podemos usar as frmulas da Seco 4.6.2 ou alternativamente podemos simular uma populao de determinado tamanho e construir uma tabela 2 x 2 a partir dos percentuais fixados. Por exemplo, em uma populao de 1.000 indivduos, seriam 120 doentes (correspondendo a 12% que a prevalncia) e 880 sadios. Considerando o ponto de corte de 1,45 e portanto os percentuais de sangue aceitos e rejeitados indevidamente respect0amente de 21,8% e 5%, espera-se que 44 (880 x 0,05) doadores saudveis rejeitados e 26 (120 x 0,218) doadores doentes aceitos. Resumindo, temos a Tabela 5.11.

I'ara definir o rastreamento proposto, foi necessrio estabelecc~r 11111 ponto de corte de X = log (ALT). Assim, o sangue de um doador 1'111 pol.cmcial com x acima deste ponto de corte seria rejeitado e abaixo :;('rill aceito. Foi estabelecido que este ponto de corte seria tal que Ili',)(:edimento de raseamento aceitasse 95% dos doadores proveIli(!III.I)t> ela populao sadia. A determina.o do ponto de corte (:T) 11::IlIIc!O c;8te critrio facilmente obtida, lembrando-se que o percentil , 11'(11'< Imn 95 da gaussiana padro 1,64. Assim,
'I

'/,-1,25 -~----r,L1 ,.6'4 -

-'- ., -

1 , 4to: ;)

'1"(' c:o]']'()sponde dosagem de ALT igual a 28,18.

I" lrtanto, se para um doador, :r fosse maior que 1,45, seu sangue ::,'rill rl)jcitado. Obviamente um doador nestas condies poderia ser "11 11110 portador do vrus da hepatite. Pelo critrio adotado, 5% dos :11I11I',II('S sero rejeitados indevidamente, isto , a rriedida x seria maior '1"(' I"H') mas o doador n.o portador do vrus. Por outro lado, o fato ,I" ,I' ::"1'lucnor que 1,45 no garante que o doador n.o seja portador do 1'11'11:;. Sllrge ent.o a pergunta: qual o percentual de sangues aceitos 1I1l11'vic!:Jllwnte?Para este clculo, basta padronizar o ponto de corte 1111 "llrVil da populao doente (z = (1,45 - 1,55)/0,13 = -0,77) e I','rili('ilr 1111{; a rea abaixo deste percentil 0,218. Portanto, espera:li' ," 11':2 I ,-',l).{l dos portadores do vrus teriam seu sangue aceito. A 1,'11',11111 :l. IK mostra esquematicamente este programa de rastreamento

Tabela 5.11: Distribuio de sangues aceitos l~ rejeitados populao de 1.000 indivduos Doador provenilmtc~ de popll1al,il,o Sadia Doente Total Sallglll~ ACl~itO lll~j(~itado Total i'3:\G 44 880
2G 8G2 D4 Ui'3

em UlWl

padril,o de 80 tiveram madauwnte quantos se

4,5. Todos os alunos que obtiveram nota d(~ 7() II conceito 13. Se as notas tm distribuio apmx i gaussiana e se 10 estudantes obtiveram conceito 1\, sulnnetcram ao exame?

120
1.000

:3. Suponha que o nnwro de novos casos de cncer diagnosticados mn urna dderrllil1ada regio siga a distribuio Poisson COI11 parmetro ).. = 2, 2. Interpret(~ esse valor e apresente possv(~is apliutc,es prticas do uso desse modelo neste caso. 4. Na curva gaussiana padro obtenha o valor entre a mdia da curva e Z(J seja 0,40.
Zo

tal que a n~a

A efetividade do rastreamento pode ento ser avaliada atravs dos valores preditivos ou equivalentementl~ de falsos-positivos e negativos. I';utre os 862 doadores aceitos, apenas 26 (3(X)) so doentes. Por OlltI'O lado, dos 138 doadores rejeitados, 44 (32%) poderiam ter sido aceitos. Em resumo, usando o ponto ele corte de 1,45 tem-se um alto percentual de falso-positivo (32%) e um baixo percentual de falso1J(~gativo(3%). A detivielade deste programa bastante boa, mas pode no ser vivel na prtica. Se, em uma tentativa de minimizar a rejei(,o de sangue em doallores saudveis, passarmos a aceitar 97,5% dos doadores originados da populao sadia, o ponto de corte seria 1,49. Nesse caso, apenas 2,5% de sangue seriam rejeitados indevidamente, mas o percentual lIl~doentes com sangue aceito passaria para 32,3%. Para a prevalncia de danos hepatocelulares anterior (12%), o I)(~rcentual de sangue rejeitado de indivduos sadios cairia para 20% (~o percentual de doentes com sangue indevidamente aceito passaria para 4%.

5. Um teste de aptidii.o para o exerccio de certa profisso (~X I ge lHW1,seqncia de opera(;es a serem executadas rapi( Ia mente uma aps outra. Para passar no teste, o candidato d(~v(' complet-lo em 80 minutos no mximo. Admita que o tClIli)() para completar () teste seja uma varivel aleatria N(90, 20). (a) Qual a porcentagem aprovados? elos candidatos tem chance d(~ s('[

(b) Os melhores 5% recebero um certificado especial. Qual tempo mximo para fazer jus a tal certificado?

(I

A distribuio

da altura de 500 estudantes do sexo mascnl iII11 de uma escola aproximadamente gaussiana, com mdia 1,7() m e desvio-padro 2,5 em. (a) Quantos tm altura inferior a 1,75 m? (b) Quantos tm altura entre 1,72 e 1,80 m?

1. A vida de certo aparelho cirrgico pode ser descrita

pela distribuio gaussiana com mdia de oito anos e desvio-padro de 1,4 anos. O contrato de garantia diz que o fabricante substituir os aparelhos que apresentarem defeito dentro do prazo de garantia. Se ele deseja substituir no mximo 5% dos aparelhos que fabrica, qual deve ser o prazo de garantia a ser estabelecido? a nota mdia foi 70 com desvio-

(a) Determine os valores de referncia. (b) Um livro de referncia estabelece, para adultos jOV(~IIS dll sexo masculino entre 20 e 24 anos, os valores de ]();) a I'11) mmHg. Os resultados obtidos em (a) so compatv(~is ('11111 estes limites?

2. I;~mum exame de Estatstica,

~. Calcule a mediana n o pnn:c~ntil dc onlmn 7G para uma varivel com distribuic;:o gaussiana com mlia fi. u desvio-padro (T. 9. Os seguintes valorcs n~pl'(~sentam os tnmpos gastos, um sngundos, por pessoas corll docIH;:acardaca ,mr'a a realm(;:o de um teste simples d(~csfol'(.;o. 2~9, 2Gl, 20:3,
24G, :)G9,

(a) Se considerarmos 1000 elessas pessoas, quantas sn riam com tnmpnratura entre 36,8 e 37,2 graus?

(~:"q)( '1'1\.

(b) Em qual intmvalo dn tempnraturas est.o 98% dos adlll t,os llLasculinos sadios dnsta popula(;:o? 12. Um pesquisador dnsnja criar unI padr.o para identificar Pl'<:' sena de infec(;:.obacteriana (Psc'lulornona.s sp) no trato rnspiratrio at1'av{,s ele cultura. de nscarro. Para isto, coletaram-si; dados de pessoas sabidamnnte sadias e determinou-se o nmel'() de colnia.s encontradas nm cada cultura. Foram encontrados os seguintes resultados: 17 24 2G 35 51 22 24 26 35 54 2:3 24 28 35 56 23 2G 28 36 56 23 2G 29 40 56 23 25 30 41 58 24 2G 30 41 60 24 25 31 41 68 24 25 31 42 79

24:3,
2:)9,

2:)2,

224,

220,

210 211

(a) Calcule a mdia, mediana, desvio-padro n os percentis de ordem 2G e 7G. (b) Estes dados foram gmados dn uma popula(;:o gaussiana? Justifiqu<') sua rusposta. (Sugesto: usn o resultado do exerccio anterior).
10. A distribui<.;.oda press.o sistlica por faixa etria em uma po-

pulao masculina apresentada na tabela abaixo. Considerando o modelo gaussiano adequado para a clescrio dessa distribuio, as faixas de referncia esto abaixo. Comente as repercues da ~idoo elos valores encontrados como limites para classifica.o ele hipertenso. Idade (anos) 16 17 1~ 19 20 f- 25 25 f- 30 30 f- 35 35 f- 40 40 f- 45 45 f- 55 55 f- 65 Mdia 118,4 121,0 119,8 121,8 123,9 125,1 126,1 127,1 129,0 132,3 139,8 Desvio- padro 12,17 12,~~ 11,9G 14,99 13,74 12,58 13,61 14,20 1G,07 18,11 19,99 Faixa de [94,06; [95,24; [95,90; [91,82; [96,42; [99,94; [98,88; [98,70; [98,86; [96,08; [99,82; referncia 142, 74] 146,76] 143, 70] 151,78] 151,38] 150, 26] 153,32] 155,50] 159, 14] 168,52] 179, 78]

(a) Determine uma faixa de normalidade ele95% para o nn}(~I'<) de colnias de bactrias no trato respiratrio de pessoas sa dias, usando o mtodo dos percentis e o mtodo da curva de Gauss. (b) Qual dos dois mtodos o mais indicado neste caso .. tifique.
J1IS

13. Para a populao masculina nos Estados Unidos (1976-1!)KO) com idade entre 18 e 74 anos, a presso sistlica tem distribuj(;:al' aproximadamente gaussiana com mdia 129 mmHg e desvill padro 19,8 mmHg. Recomendaes do Jozt Ntional Com:m tee of Hyper-tension e America.n Heo:rt Association, 1993 cOllsi deram nveis pressricos normais menores que 130/85 m:m.ll,l/.

(a) Qual a probabilidade de um homem dessa popula8.o suir presso sistlica normal?

pllS

I I. sabido que, para os adultos do sexo masculino,

gozando de boa sade, em uma certa populao, a temperatura corporal sngue distribui.o gaussiana com mdia de 36,8 graus e desviopadro de 0,15 graus.

(b) Selecionando-se ao acaso 1000 homens dessa popnl aI;:: I.l I, quantos seriam diagnosticados com hipertenso modmaila (presso sistlica entre 160 e 179 mmHg)?

Id. A figura a seguir representa colnias de baet{~rias (pontos negros) que se desenvolveram elU Ulna muostra de sangue colocada em uma placa de Petri dividida eUl pequenos quadrados em condies ideais.

Expcrin)()lli,( )

M{)dia

Experimento E F

Mdia

A 13
1-

C D

2,~):1 1,52 1,45 1,92

G H

2,30 2,44 3,78 1,21

1-'

-_.-

(c) Podemos calcular probabilidades associadas ao modelo de) Poisson para cada um dos parmetros apresentados na
_.

tabela anterior e ento obter os nmeros esperados de) quadrados contendo ;r; colnias. Os resultados so apresentados na tabela a seguir. Complct(~ a linha correspondente ao experiruento A e fa(,a uma avalia(,o da adequacidad() do modelo, comparando os valores observados com os previstos pelo modelo.
Experimento Pontos negros (colnias)

(a) Realizaram-se oitoexprimentos com oito diferentes tipos de bactrias. O nmero de quadra,c1os em que foram observados exatamente ;r; pontos negros (colnias) est apresentado na tabela ,1, seguir. Comente os resultados encontrados em um dos experimentos. Experimento A 5 19 B 26 40

O
28,0 57,2 75,6 7,3 4,8 2,3 62,6

1
42,5 82,9 145,2 16,8 11,7 8,6 75,8

2
32,4 60,2 1:39,4 19,4 14,3 16,3 45,8

3
16,4 29,1 89,2 14,8 11,6 20,5 18,5

4 6 ,~ ') 10,5 42,8 8,5 7,1 19,4 5,6

5
1,9 3,1 16,4 3,9 3,6 14,7 1,3

6
0,5 0,8 5,3 1,5 1,4 9,2 0,3

7
0,1 0,1 1,4
O,[)

A PontoH negroH O 1

C
59 86 49 30 20 O

D
83 134 135 101 40 16

E
8 16 18 15 9 7

F
7 11 11 11 7 8

G
3 7 14 21 20 19

C
D E F G H

2
3 4 5 6 7 Total quadradoH colnias

26
26 21 13 8 O 118 346

38
17 /7 O O O 128 195

0,5 5,0 0,0

O O
244 354

7 O
516 989

O O
73 168

O O
55 134

7 9
100 378 210 254

15. A fosfatase alcalina em uma populao de pessoas gozando de) boa sade tem distribuio gaussiana com mdia 42 rnUlell () desvio-padro 13 rnUlell. Calcule a porcentagem de pessoas com fosfatase alcalina entre 15 e 69 rnUIdl. vezes, necessrio usar o mtodo de um padro de referncia. (los

16. Explique
(h) A mdia da distribuio de Poisson (),) para cada experimento mostrada a seguir. Comente os resultados da percentis

porque, algumas na determinao

17. Sabe-se

que a distribuio proximadamente gaussiana menores que os de adultos. normalidade so arbitrrios

de presso arterial na criana () a e os valores encontrados so 1)()]jl Os critrios usados na defini(,iJ.o de) e complexos. J foram propostos

nveis limites como dois desvios-pad6.o aciula da mdia, acima dos percentis 90 ou 95 ou limites fixos d(~ l;30-140mimHIJ para presso sistlica e 85-90 '{II/rnHI} para a diasilic;\. (L()]]de ct al., 1971; Rance et al., 1D74). O relatrio da Tas/;; Fmn: de 19K7 proptls qlW fossem consideradas nOT7na'is as criauI:as COlU uveis de pressi.o sistlica e diastlica inferiores ao perceutil 90 para a idade; 'nO'l"m,()/lS altos os valores de presso arterial entrr~ os percentis 90 e 95 e hilpeT!;enS08 os valores persistentenlente acima do percentil 95. Essas crianas hipertensas (~ramcousidmadas portadoras de hipeItenso significativa quando os nveis pressricos mtiveRsenl entre o 95-e 992 pcrcentil,e hiperteus'-w grave para ORnveis persistentemente acirua do perr:entil 9!J. Para uma POPU1aI{i.o de crianas entre 10 e 12 ano~:, o percentil 95 da presso sistlica corresponde a 126 Tnm,HIj e da diastlica. a 82 mmJIg . .J o percentil 99, 134 e 90 'm/mJi,l} para presRo sistlica e diaRtlica, respectivamente. (a) Calcule a mdia e o desvio-padro da distribuio da presso sistlica em crian({as de 10 a 12 anos. (b) Acima de que valor de presso sistlica encontram-se 80% das crianas da populai.o? 1:--\. No estudo de Framingham relatado em Pagano et al. (1993), mediram-se os nveis sricos de colesterol em um grande nmero de homens saudveis que foram acompanhados por dezesseis anos. Ao final do perodo dividiram-se os homens em dois grupos: aqueles que desenvolveram doena cardaca coronariana (DCC) e aqueles que no apresentaram este problema. A disI.ribuio dos nveis iniciais de colesterol srico para cada grupo (\ aproximadamente gaussiana. Para os indivduos que evenI.lIalmente desenvolveram DCC, tem mdia II = 244 mg/dl e d(~svio-padro IT = 51 mg/dl e, para aqueles que no desenvolveram, 1/ = 219 mg/dl e IT' = 41 Tng/dl. (a) Suponha que um nvel srico de colesterol de 260 mg/dl ou superior seja usado como prognstico para desenvolvimento de DCC. Qual a probabilidade de se prever a doena em um homem que nunca a desenvolver?

Ainda para esse valor (le referncia, qual a probahilid:u li' de fallla ua pJ'(~dil.:ii.o d(~DCC para um homem qUl~a di' S(~IIV(llv(~r;j? O q\l(~acouteceria COlU os valores da sensibilidade e esp(~ci ficidad(~alteraudo-se o valor d(~referncia para 250 'my/dl? Nessa populal.;i.o,o uso dos uveis iniciais de colesterol s(~ri co pareCel]] adequados para previso de DCC? 19. Para exemplo da Sel.;o5.7.2 sobre o rastreamento de sangue. de doadoT'l~s

CalculcVPP, VFN, FFP e PFN para o novo ponto d(~ corte (1,49) sugerido no final da sel:o. Compare os l'I~sliltados com o primeiro ponto de corte considerado (1,4G). Repita os clculos anteriores considerando a preval('~III:ia igual a 1%. Compare com a prevalncia de 12 % usada 1111 exemplo. 20. O teste de conjuntos mede a furll{omental. um teste r8.pidll (' simples e requer que um indivduo se recorde de itens de qnal.l'll categorias connll1s. O teste foi aplicado ern 65 voluntrios idosll:; sem disfulll{o mental e os resultados apresentados na talH:!a a seguir. A mdia, de;,;vio-padro e mediana foram: x = :lO, (;:1, 8 = 7,67 e i: = 32.

4 25 30 35 39

11

26 30 35 39

12 26 30 36 39

15 26 31 36 39

15 26 32 37 39

16 27 32 37 39

20 27 32 37 39

21 28 32 37 40

22 28 33 37 40

22 29 33 37 40

23 29 34 .37 40

2~ 29
:)~

~!I
:\ll :I;l :):--\ /1(I

;)K

40

(a) Calcule o limite inferior de referncia, que seja SIlIH~I':1.I111 por aproximadamente 85% dos idosos testados. (b) Calcule e interprete a especificidade deste teste. (c) Neste caso podemos calcular a sensibilidade?
PIlI' (1111!':'

(d) Se calculssemos O valor de referncia inferior has(~:ul(1 ('111 95%, ao invs de 85%, o que ocorreria COIl!a I'SIH'I'iiil'i dade? Por qu?

Captulo 6

Comparando Dois Grupos

I<~m todas as reas do conhecimento humano h uma busca conIfIlIIa e ininterrupta por novos mtodos e novos procedimentos que 111<!lhorem em algum sentido aqueles j existentes. Na agricultura IIIINcam-se variedades mais adequadas e mais produtivas de cereais I' lia indstria automobilstica procuram-se motores de maior rendi1I1<!IILo e de menor rudo. A pesquisa rndica tem como objetivo por l'xl!lIlplo a obteno ele drogas mais seguras, com maior poder de cura I' Illaior tolerabilidade. I';m todas essas situae~es preciso comparar as tcnicas usuais I"111 I os mtodos alternativos. Esta comparao , pois, uma questo i II11 IIIrtante que surge freqentemente no trabalho de pesquisa e de:"'livolvimento. No se trata, entretanto, de tarefa simples como a Jil'iIlcpio pode parecer. necessrio coletar informaces e fazer inl'I'f"(~IIcias a partir de evidncias experimentais ou obs:rvacionais. I) lua questo importante que surge no trabalho de pesquisa na :11'1',\ II1dica a comparao de drogas, de mtodos cirrgicos, de I11'1 I~:I~( limentos ele laboratrios, de dietas ou de tratamentos. N a comparao de um tratamento novo com um tratamento pa111:t.l 1 Jiode-se levar em considerao, entre outros aspectos, o custo, iI LIIX icidad~ ou ainda a. f~cilidade de implementajobjetivo I"" 11'SI~1' verIficar a superIOrIdade de um tratamento ou a equivalncia 1'111.1'1' Id(!s] Aps ter-se estabelecido o critrio para se considerar um IlaLal1I<!I ;-(;0 mais eficiente do que o outro, a prxima etapa a escolha

!!?

desse tratamemto. Considerenlos o caso de duas terapias. Se todos os portado]'(~s dI' determinada doeIH,a se conlpoI'tassenl de maneira idntica em rei i\.(,:; 1.1 1 aos tratanwlltos utili~ados, bastaria examinar o comportamenL( 1 (1(' um ou no mximo dois deles, frente s alternativas existentl~s. /\ decis-o sobre qual a melhor seria bvia, e portanto; nenhuma an;,lis(! estatstica seria Iwcessria. Tal, entretanto, no (~o caso. A re;).(,80a um tratamento varia di! indivduo para indivduo e, via de regra, no h um tratamento LilllO para todos. Como, em geral, no se conhece Q, priori a realJuI dI! cada indivduo, prescreve-se o tratamento que apresenta em m:!l'r, IIS melhores resultados. Em outras palavras, a situa-o ideal da e~scol lia do Inelhor tratamemtc), para cada indivduo n-o possvel na pr;.t.il:iI, Conseqentemente, :sgnsidera-se como o melhor tratamento aI111< dI' que p;'cxluz bons resultados para a grande maioria da populal"ul 1'111 estudo. " Extrapolaes dos resultados obtidos no grupo estudado para 1111111 populao de interesse exige cuidados especiais no planejamenLo LallL() de ensaios clnicos quanto de estudos observacionais. Fatof"(!s '1111' afetam a resposta sendo avaliada devem ser controlados, j',allLoII11 fase de coleta como na anlise dos dados. Por exemplo, no e~sLlldo dll presso arterial, a idade, a raa e o sexo so fatores que (ll~VI!III :;('1 levados em conta. O procedimento para determinar qual dos dois tratamentos t, I'liI mdia o mais eficiente envolve geralmente a seleo de duas aUIONLI'i1:; e a comparao dos resultados obtidos. Neste captulo disCl1 Li1111,:; como comparar os efeitos mdios de dois tratamentos, q11<\.Ildll ;,11:1 resposta medida para uma varivel contnua ou dicotmica. Para isto, o primeiro passo a clara identificao dos ,1-;1'11 JiO,';:I serem comparados. Depois necessrio definir a varivc1 ]'(~sJio;;LiI ;\ ser usada como critrio de comparao. Nos estudos caSll-CI 1111.1'1 >1(', os grupos so os doentes e os no doentes, e o objetivo podl! 1'1'1', Jilll exemplo, comparar a proporo daqueles que foram eXJiosL( lI' ;1.1 I 1'11 tor de risco. Neste caso, a resposta de interesse (presmll,a do l'aLIII') .' dicotmica e existe um teste estatstico especfico ellw dl!vl~S('I'IIlIlIdll como critrio de deciso. Em estudos de coork, os gl'1ljlllSSilO1'(11'111:1 dos entre Os que foram expostos ao fator de risco I! IIS'1111' III1lI1""'11111 expostos. Se a resposta de interesse for mlla val'i;V<'1 '11I:t1l Li 1.11 LiI'll

(l'I)!llIl por exernplo nvel de colesterol () pj'()ss~\,() sangn()a) tambm 1'x i,stl' Inu teste apropriado para est(~caso. li'iualulent(), ()preciso saber :,I' IISti ados foram obtidos de forma illdepelLdelli;(~ ou pareada, pois os I. ',';1.1 's s,l,o especficos para cada tipo (le I)1an(),i anwnto, I''i'<)qentemente, para coru[mracJ.odI) dois tratamentos obsm-vam::.' I'al'adersticas ou mede-se o valor da vari<ivd resposta de interesse 1'111 IJII,'/'C8 de indivduos. No p1<llwjallwnto do ()st.udo, cuida-se para 11111' as caractersticas inlportanb)s dos indivduos qlW int.egraru o mes11111 Ilar sejam to semelhant.es quanto possvel. O tratamento ad111 i 11 isl.rado a um dos c1ementos do par (~o outro (~mantido como 1'11111.1'(11). A vantagem do procediment.o (~clara. Os indivduos no par :;:111 sl)ludhantes, exc8to no que se rdre ao tratanwnto recebido. Em :l1,1',II11las situaes o par (~constitudo do mesmo indivduo em duas ':tsillI)Sdiferentes. 1';111 resumo,go teste estatstico a ser usado depende do tipo de vari:IV':! I)do tipo d;]5lanejament2"\ A seguir seril,o apresentados os testes IIlais comuns para quatro situac;es:(~rivel dicotmica (amostras inII1 'Ili)IIC lentes e pareadas) e varivcl contnua (amostras independentes J>al'l)ada~
111 I'

AZT Placebo T()t.al

Sit.ua(;il.o Vivo Morto 144 1


121 2GG 1(j 17

Total

145 137 282

() procedimento estatstico denominado Teste de Hipteses usa.111 :\I11plamente nas reas do conhecimento humano em que as vari\'I'i,',1)llvolvidasesto sujeitas a variabilidade. Neste texto, entretanto, 1'::l.alllosinteressados no problema especfico de comparao entre dois )',111 J>0S' Assim, embora as idias bsicas desta seo sejam de apli1:1\':11 l geral, sero ilustradas apenas no contexto da comparao de ,1,,i,,:tratamentos mdicos.

Esse experimento foi cercado de muitos cuidados e, embora a anlise estatstica dos dados seja fundamental, a deciso final de liberaco do AZT foi tomada levando-se ern considerao muitos outros re~ultados fornecidos pelo estudo, como aqueles referentes a efeitos colaterais. A anlise dos dados da Tabela G.1 consiste basicamente na comparao de duas propcm;es. Entre os pacientes que receberam o AZT, a proporc;o dos que estavam vivos depois de 24 semanas de tratamento foi de = 0,993, enquanto a mesma proporo para o grupo placebo foi de = 0,883. Como a alocao dos pacientes aos grupos foi feita de forma aleatria, 3, diferena entre essas duas propores parece indicar que em pacientes com AIDS o AZT tem o efeito de prolongar a vida. Antes de se aceitar esta concluso, entretanto, preciso afastar o acaso como explicao alternativa. Ou seja, deve-se responder pergunta: ser que este resultado ocorreu por mero acaso ou por ser o AZT de fato uma droga efetiva?

i1~ i~~

6.2.1

Hipteses a serem testadas

Geralmente podemos formular os problemas, como o do AZT, atravs das hipteses seguintes. I"i,'-wlll et aI. (1987) publicaram o primeiro relato de um ensaio ,lllIil'(1 qlle comprovou a eficcia de zidovudina (AZT) para prolongar iI l'i'!:1 dI) pacientes com AIDS. Os dados centrais do trabalho esto 1111 '1': ti lI)la G.1. Hiptese nula No problema de comparao de dois tratamentos usual fixar como hiptese de interesse a inexistncia de diferena entre os dois tratamentos comparados. Como freqentemente a comparao feita entre um tratamento padro e um tratamento novo, esta opc;o implica colocar o nus da prova de efetividade no tratamento novo,

1IIIIaOP(J,oconservadora mas pnldm(~.Por estas rail,es,0 hiptese a S(!I'j,(~stada usualmente chamada hip()j,es(~ nula (II;], nonlC que se 1',I'II(!l'alizou mesmo para situDl{iesem que o problenJa no 1l1,S de I'IlIlljlar ao entre dois tratamentos.

ResumilJ(lo,ij.;~jeita-se a hiptese nula se o valor da estatstica do teste "gralld(:-J Ess(~ valor dev(~ portanto ser comparado a alguma distriln(Ji.o (le probabilidade que depende de cada caso, COlHO veremos nas s(~(i)esa seguir.

6.2.3
hiptese nula ,,;~eve' s(~rCOlllpD.radaCOIllUllla hiptes(~ alternaI-h .:~ Para cada situa(;iio existem muitas hip(lteses :ti 1,1 !I'I mtivas adequad"~. Neste t(~xto, entrd,anto, seguindo converH:o I':;I.abdecida pelos editore~s de revistas cientficas na rea mdica, a \11i p(jtese al:t~rnativa ser s(~mpre a inexistncia de igualdade entI'._Qe, 1~1';II.;llnento~J No Exemplo 6.1 a hiptese nula (~
Li va, denominada

1.,0

Erros do tipo I e 11, nvel de significncia e poder do teste

IlIlde Pc e PT so respectivamente as prolmbilidades de se observar a 1'1 !sposta de interesse entre os controles e entre" os pacientes do grupo I.1'; \,I.amento. De acordo com a opo feita acima, a hiptese alternativa ser

H1:

"';;~:";;7:')

Ikcididas as hipteses a serem testadas, o prximo passo cons1.I'IIil' 11mcritrio baseado no qual a hiptese Ho serjulgada. Embora IIIlal(IILCr critrio possa em princpio ser considerado, a Teoria EstatsI.il'a ,j;, desenvolveu para um grande nmero de situaes testes que :,I' 1'1 ~vdaram as melhores opc:es e que so apresentados com detalhes '111 Ii vros textos. () critrio de deciso baseado na estatstica de teste. De uma rlll'lIla bem genrica e intuitiva podemos dizer quer estatstica do l" I.,':d,('l\l(xle a discrepncia entre o que foi observado na amostra e o I/li" :il!l'ia esperado se a hiptese nula fosse verdadeij,:'aJ Uma grande d i::i,;lIl(:iamedida pela distribuio de probabilidade indicao de 1"" 1/0 lIo verdadeira, devendo portanto ser rejeitada.
""'f<_d'

No exelnplo do AZT havia a possibilidade de se rejeitar a hiptese de igualdade entre o AZT e o placebil, mesmo se de fato eles fossem iguais. , Em te:'mo:') tcnicos, f1.,1. decis,'ii.o d(,~ re.ic::.\tarn, O, q:l(~ndo de fato Ho e verdadmra e chama(li" ili~ e'(''('() do tZI}() L,Para eVlta,-lo escolhemos _1' ' um critrio de deciso (que corresponde a um percentil de uma distribuio de probabilidade) que torna este erro pouco provvel. Na literatura, ~ probabilidade de cometer este erro recebe o nome de n'uel de s'ig:ryj,f:n,cio. do teste, sendo usualmente representado pela letra grega .2J(l-se alfa). H, no entanto, um;i:egundo tipo de en:~l No exemplo do AZT ele consists em mo rejEitar a hiptese de ig~aldacl~\ entre o AZT e o placebo \~,:lando ele fato estes dois tratamentos so diferente~Isto implicaria na no libera<:o elo novo tratamento, cujo efeito real no estaria sendo percebido. Para um tamanho fixo da amostra, no h.1. como controlar simultaneamente ambos os erros, Convencionou-se que o erro mais srio seria o erro do tipo 1. Em um segundo momento, calcula-se o tamanho da amostra que reduza a probabilidade do erro do tipo II,usualmente representado pela letra grega fi (l-se beta), a nveis aceitveis. A Tabela 6.2 sintetiza os e[1:ospossveis associados a cada deciso tomada em um teste de hipteses.

Concluso do teste Nao rejeitar Ho Rejeitar Ho

Situao real Ho verdadeira Ho falsa deciso correta erro tipo II erro tipo I deciso correta

1\ rapacidade

de um teste identificar

diferelH:as que realmente

e-

xistl~li21ou sej~, de Fejeitar Ho \Jl~alld(),t:r:()ah.lWld,eJals(l., {~denOlllirmda /1(i(Ir:'1' do test e definida con;;ri 1---\

Resposta dicotmica: amostras independentes


Comparar dois ~rupos atnw{~s do l'l~sultado observado em uma varivel dicottnnica {~ unI probleLua COllllUllna pl~squisa mdica, aparecendo com fl'(~qfmcia em todos os tipos de estudos clnicos. A varivcl de int,erc~sse {~a ocorrfmcia de um evento, como o desenvolvimento de urna doelll:a, ou a preselH.;a clr~certo atributo, por exemplo, albinismo. () problema de comparar.;i1o das probabilidades de ocorrncia do evento ou do atributo formulado atravs das hiptcsc~s nos dois ~rupos

I';xistem duas opr.;es lJD.[a expl'I~SS<lT a COIIClusi\o final dc~lUll teste


(11'

hipteses. A primeira consist(~ elll COlllpllrar o valor da estatstica IIl~tl~ste com o valor obtido a partir da distrilmic:iio terica, especfica para o teste, para um valor prclixado do nvd de si~nificflIlcia (por ('x(~lllplo 5% ou 1%), Na segunda aborda~elu, atualmente luais usada, o interesse llllautificar a chance do que foi observado ou resultados mais exIr(~lllOS, sob a hiptese ele igualdade dos grupm.i. Assim, essa ope:o, I)as(~ia-se na probabilidade dc~ocorrncia de valores iguais ou superi')J'(~Sao assumldc)jJell, estatstica de teste, sob a hipt~se de Clll(;'H()
1\

(Pl e

])2)

v(~rdadeira. Este nmero chamado de liT'Oal)'i,llade de S'i(j'l7i~fi:c,ncJ,ou valoT'Ii (~ freqentemente indicado apenas por p. Corno o valor-p cal-

dado supondo-se que Ho verdadeira, pode-se fazer duas conjec11II'as quandc)se obtem um valor muito pequeno. Um evento que ,\ (~xtremamente raro pode ter ocorrido ou a hiptese Ho no deve
l:1

A Tabela 6.3 apresenta dados genricos de urna situao envolvendo a comparac{o de dois grupos e que a resposta de interesse dicotmica: a ocorrncia ou no de um evento.

s(~r verdadeira, p Iaus vel.

isto , a conjectura
1--

inicial e conservadora

no parece Ocorrncia Sim do evento No Total

, . Portanto, ~;lanto menor o v~lor-p ~n~ior a e~idncia par~L se re.ll~ltar um modo geral, na area mechca, conSIdera-se quei::'alor-p 1I1(~nOr ou igual a 0,05 indica que h diferenas significativas entre os

H'iJDe

o.
c:
'(11'1

I)
ri

Ir
Total

";01"

!',I'IIPOS~

= a

+ c:

'111,2

b+d

+ b = '!'LI c + d = '!'L2 '!'LI + 'n2 = N


(f

Pci'Ta cada um dos testes calcular pode-se

das sees a seguir vamos mostrar

como Se no h diferencia l~lltl'C ilS Jlmpol'(,:(Jes de ocorrncia nos dois grupos, ento elo ('vento

e interpretar o valor-p. Por exemplo, baseado no valor-p avaliar se o fator sob investigao um possvc~l fator de ficam mais claras tambm aps
II

risco ou de proteo. Todas as idias aqui apresentadas

llis'1/,1 '11-i /11,/12

':lIsso de situaes especficas. Apresentamos adicionais sobre valor-p na Sec:80 6.D.

COI)WIII lrios

JV
escrever
'!n2

A partir

dessas igualdades

podemos

rI=

----

X 17,2

Tmuos, portanto, dois conjuntos (k valores: os ob.s.,cT''Ila,dos, (O,) tlll!! Si\,() denotados por a, b, ce,rl e os (8J?r.~:m,dos(E,) ,cc:)]l11ados sob 11 IlipL(~sede igual,dade dat>pl'OponJes de sucessQ,ntre osgruposc 11:1l1( lS I)(;las expresses anteriores. S(~as propores de sobrevivncia siio iguais nos dois grupos, a ,lisl:l'I~p{lnciaentre os dois conjuntos de nnwros acima niio dev(~ser J',I'l\.lldn.Pearson, importante estatstico do incio do sculo, props 111(~dil' a/discrepncia entre os valores observados e (~sperad;~das quai.l'll(~lltradas de uma tabela 2 x 2 atravs da expresso

1 2 3 4 Total

O, 144
121
1

O;-E,
13G,2G 128,74 8,74 8,2G 282 7,74 -7,74 7,74 7,74 O

(O, - Ei?
59,91 59,91 59,91 59,91 239,64

(O;.-Ei)2

Ej

lG
282

0,44 0,47 6,85 7,25 15,01

I;;possvel mostrar que o valor do X2 obtido atravs de G.6 pode ::, 'I' calculado de maneira fcil e algebricamente semelhante usando-se li:, 1~llLradasda tabela 2 x 2 atravs da expressiio:
2

./Y

,)2 N ( fuI - !)c

Supondo que o AZT e o placebo so equivalentes, \':dlll'l~S esperados mostrados na Tabela 6.4. 'I':dllda 6.4: Valores esperados de sobreviventes "li 11 ivalencia entre AZT e placebo Situao Vivo Morto 136,26 8,74 128,74 8,26 265 17

teramos os

sob a hiptese de

AZT Placebo Total

Total 145 137

282

( )s clculos necessrios paraa obteno do valor da discrepncia I lpllsLa por Pearson so mostrados na Tabela 6.5.
li'l

Calculado o valor da expresso X2, preciso decidir se este ou no um valor "grande". Devido ao efeito amostral, mesmo se na realidade as propores fossem exatamente iguais, possvel obter qualquer valor para X2. Entretanto, valendo a hiptese de igualdade entre as duas propores, valores "grandes" ocorrero pouco freqentemente. Assim, para se tomar uma deciso sobre a igualdade ou no das duas propor(~es, preciso conhecer o comportamento, isto , a distribuio estatstica dos valores de X2 quando as propores so iguais. Esta distribuiiio foi obtida e recebeu o nome de qui-quadrado com 1 grau de liberdade, indicada por e est sintetizada em tabelas de fcil utilizao (Tabela A4 do apndice). /-' O valor da estatstica de teste foi de 15,01. Como este valor {maior que 3,84, valor obtido da distribuio do para um nvel de significncia de 0,05, rejeitamos a hiptese de igualdade entre os grupos de tratamento e controle. Em outras palavras, decidimos com , 95% de certeza que h evidncia de efeito do AZT. Para obtermos a probabilidade de significncia devemos calcular a probabil.idade de encontrar valores maiores que 15,01, isto , Pr[xr 2: 15,01], sendo verdadeira a hiptese de igualdade das propores. Da tabela da distribuio do vemos que este valor aproximadamente 0,0001, ou seja o valor-p 0,0001. Baseado nesse estudo podemos dizer com grande certeza que o AZT tem efeito de prolongar a vida de pacientes com AIDS, primeira evidncia necessria para a liberao do medicamento.

XI

XI

""o"

XI,

."_.~

vVelin et aI. (1987) rdaLaraul os ]'(~suILadosde UlUestudo reali1';;1( [o com o objetivo d(~dderlUinal' os faj,or(~sd(~risco para acidentl~ vascular cerebral (AVC) eUI hOlLWIJS dl~,11L(~ia idade. Todos os hoIII(~US nascidos Clll Goteminu-;.;o, l~llll~)Ll, el11dias nultiplos de trt~s, Il1lm total de 973 hOlllens, foram convidados a participar do estudo. I)(~stes, 789 aceitaram particilJar. No perodo d(~dural)io do estudo (d(~1967 a 1986), 57 homeus sofreram AVC, enquanto 7:12 n::ioforam acometidos. A Tabela 6.G, rcprodu\ida do artigo original, apresenta as proP( l]'(;es de presen(;a de alguns fal~ores de risco nos indivduos que SIlfreram, AVC e naqueles que ni,o foram acometidos pela doena. Os valores-p apresentados na t;tbda tm interpreta(;o conforme descriI.()anteriormente. Por exemplo, ;.1 ocorrncia de AVC na m::ie como cansa principal de mOlte pode ser considerada um possvel fator de I'isco para o aparecimento de AVC no filho, urna vez que a diferena ollsmvada foi altamente significativa (valor-p = 0,0005). Tabela 6.6: Percentuais e valor-p para a c:omparaao do grupo que S(lfreu com o que no sofreu AVC Fator AVC como causa principal na mae no pai AVC como causa principal contribuindo para a causa na mae no pai Doena coronariana Sinais eletrocardiogrficos hipertrofia do ventrculo doena coronariana da morte 29,8 7,0 ou da morte 29,8 7,0 7,0 esquerdo 3 ,0 t:: 10,5 14,2 9,2 6,3 1,0 6 ,0 t:: 0,002 0,59 0,83 0,08 0,23 11,2 7,5 0,0005 0,72 AVC Sim No

')
X~ =

tv(1 (ul- bc 1-2)

N 2

ao invs da (~xpr(~ssil.() (G.7), oh1.(~mosum valor mais apropriado ;1 ser comparado com a distribui(;il.o do XI (~ conhecida como q II i quadrado com a COT'l'c(:o dc conl;'i'l1:u:io.dc em cOT'reo de Yo.!.cs. t\ justificativa {~CllW a distribui<;::io de frequ&~nciasobservadas, (JlIl! (, discreta, est sendo aproximada pela distribuio qui-quadrado, qUI' contnua. Note a semdhan(;a, das duas expresses: a dif(m~IIl,:a (' apenas o fator de corre(;i,o de continuidade. Recomendamos (1'11' I1 teste qui-quadrado seja sempl'i~ feito usando-rie essa expressil,o.

Em um estudo sobre a associao entre o uso corrente dl~cOIIII':I ceptivos e o infarto de miocrdio, Shapiro et aI. (1979) obsel'Val'all1 os resultados entre pacientes com idade entre 30 e 34 anos m08LI';J.( II):1 na Tabela 6.7. Tabela 6.7: Distribui(;o de uso ele contraceptivo oral segundo que sofreu ou no infarto elo miocrelio
~';rl11 liI

Valor-p Grupo Casos Controles Total Uso recente Sim Niio 9 12 33 390 42 402 Total 21 423 444

Entre os casos, ou seja, entre as pacientes qu~ tiveram lU11 ilil':ll'lo elo miocrelio, a proporo ele uso recente ele contraceptivo8 (, ~:II 0,43 e entre os controles, = 0,08. A diferena entl'(~(~8La:, d 11;,:: propores (0,35) parece indicar que o uso de contracepLi Vi)8I Hlli: I mais freqente entre os casos. 1\Ilas ser que este ]'(~s,ilL;l(lo IIl1il ocorreu por mero acaso?

~3i~3

lJsando a notao da Tabela G.3, !/, = 9, li = 12, I: = ;33, lI, = ;190 2 COlnCOlT(~(;8'o I' N == 444. A express.o do X d(~continuidade nos d ~~,1,7(;. A tabela do nos infonna que diJ(:r<~Ij(,:as iglIais ou maiores 11111' a observada s ocorreUl caso 118.0 llaja associa(;8'o entre infarto I' liSOrecente de contrac(~ptivo corn fr(~q iiucia uwnor que O,O()l, ou :;(',ja,I) < 0,001. PodeuJos, portanto, COlnalto grau de certeza alinuar IIII1 I (Ixiste associa.o (>U!,r<) o uso de contrac(~ptivos orais c infarto do 111 iO<:;,rdio para pacimJtes (~ntI'() ;30 (~ :14 anos.

Xf

dificuldade ih:nica na aplica(;8.o do teste qui-quadrado, '11111 ou sem Corr<-X;8.o de continuidade, qml.nd(~,,() valor esperado em :t1J"llIllacasela na tabela 2 x 2 {~menor qlW Neste caso o uso Ia distribuio no mais completamente ailropriado. Ou seja, o )'.1':111 de certeza na clecis8'otomada no exatamente aquele fornecido I d a distribuio () uso da correl;8,Ode Yates no remove a exigncia de tamanho ;lIbluado das freqncias esperadas. A alternativa usar o teste I')(al.o de Fisher, que ('~a verso exata elo teste do qui-quadado. A Illaioria dos sofbuo:res de anlise estatstica de dados fornece como 'i H,:;tO o teste de Fisher. No discutiremos aqui, entretanto, as etapas II~ sua construo. Embora simples, so muito tcnicas para o nvel IlId,endido neste texto. Entretanto, apresentaremos o resultado do IIIsl,eaplicado a uma situao em que seu uso apropriado.
I I

t~!;uma

Foram observados (~feitos adversos em quatro casos: um (3,1%,) no grupo qlW n~cebml cefadroxil, C0111 ocorrncia de nuseas que d(~salxlr<x:eranl conl o tratamento siutonltico institudo; todos os tr()s casos (9,71l',) do grnpo cefal(~xilla tiveranl diap'ia, dois se recuperararn espontanemIl<mt(~ (~llnl teve que intmTompcr o tratamento, Para comparar os percellj~lmis d(~cura e de ocorrncia de efeitos adversos, por s(: tratar dI) alnostras pequellls, utilizou-se o teste exato de Fisher. Os valores-p S80 l'l)SI)(:citvanwnte p = 0,5886 e p = 0,5898. No h portanto evidncia de diferew;a entn: os dois tratamentos tanto em termos de cura como na ocorrncia de efeitos adversos. Os achados deste trabalho esto resmnidos na Tabela 6.8. Tabela G.8: Percentuais de curas, de efeitos colctarais e valor-p na compara(;o de cefadroxil e cefalexina Quadro Cura Efeitos adversos Cefadroxil 96,9% 3,1% Cefalexina 90,3% 9,7% Valor-p 0,5886 0,5898

Xf

5.\

".-i>

li

xf.

Pasternak et aI. (1992) avaliaram a eficcia e segurana de dois :11 11, i biticos no tratamento de pneumonia bacteriana de origem comu11 i I:\ria em adultos. Foram estudados 63 pacientes, sendo 32 doentes Iral.ados com cefadroxil e 31 com cefalexina. A avaliao da resposta 1I 'raputica foi baseada na evoluo do quadro clnico e do exame 1;lIliolgico do trax feito na admisso ao estudo e no 10- dia de Ir:l.l.amento. I)os pacientes avaliados, a cura completa ocorreu em 31 dos 32 (%,D%) pacientes do grupo cefadroxil e em 28 dos 31 (90,3%) pa('il'11Ces do grupo cefalexina.

Denotamos os dois resultados possveis da varivel dicotmica por sucesso e fracasso. Sejam])1 e ])2 as propores de sucesso referentes aos tratamentos a serem comparados, que so estimadas por ir e ih, as propores amostrais baseadas em amostras de tamanhos 'n1 e 'n2, respectivamente. Queremos testar as hipteses: Ho: P1 = P2 versus H1: P1 # ])2, isto , estamos investigando a equivalncia entre os dois tratamentos. Apresentaremos uma alternativa para o teste qui-quadrado para a compara\;o de propores. Trata-se de um teste aproximado que requer amostras grandes par.a.lla aplicao. Um critrio exigir que 'n1P1 e 'n212 excedam o valor 5. }'\ o teste baseado em
1)1 yiJ(l-yiJ)
'0,1

1)2

P2(I-YJ2)
'0,2

Alternativamente, pode-se prillJei]'iU1I<!lli(' (,st.illJa]'a prolmbilidadc) de' SIH:qSSO nas duas amostras COllJiJillildil.'-;. d('llotada por i; e calculada -fri2'! ,,[ , . , 1'11I1J(\11 = nl+n2,," OllC e '1/1,] (, '111,:2 sao u)spectl\Tallwnte o nUllero ck ::11<:( !SSS decadaarnostra. Neste caso, calculamos
\' m]

nusea COIl11mrada ;\ plula 13.O puxillJO passo quantificar a di I'('J'( :11 a dos eh,itos das duas phllas atravs da construo de um iu!.(!]'vall) de confiaw;a, assunto tra!.ado llO prr'lximo captulo.

Z* =

7.}:2 --;:::======')

J}] -

6}.4 Resposta dicotmica: amostras pareadas


\

(6.10)

V/IJ(l - JJ)(~, +~)


I/,J

1/,',2

\J:

/'
, ) I

() valor Z (ou Z*) dc,v()s()r con1lmra<loao per:centil cla distribui(;o


1

Ia ,';ans .'.sia~a paclrilo :) rej eita-s(, H" S() I ~ I> ...2 ,,"(:2 (.o,.u .' ~* I> 2"'/:2)' ('>lldl' 2"'/2 e o percentIl de ordenl (1- n/2) da (llstnbm(,;ao N(O, 1). - I'ode-se mostra.r que Z:2 = ./y:2, isto (),[:;) o valor da cstat-:tica ((i.~)) for elevado ao quadrado obterenlOs o valor da estatstica 7). 1:-;1,0 mostra a equivalncia dos dois testes para amostras grande:,!

i!?

O exelnplo a sei,!;uirilustra a necessidade de desenvolvimento (11' um teste espc)cfico para a situa(;o de dados pareados eln qu<)a ]'(!S posta dicotmica. Suponhamos que dois patoloi,!;istas examinaram, separadaJJJ(lI1!.'!, o material de 100 tumores e os classificaram como benignos ou .!lIa lignos. A questo de interesse saber se os patologistas diferel] I 1I0S seus critrios de deciso. Neste caso, a forma adequada ele apresenta(,;o dos dados mostra da na Tabela 6.9. Tabela 6.9: Classificao de dois patologistas lignidade de tumores Diagnstico de B Malignos Benignos Total (A e B) quanto :l. Illa

Com o objetivo de comparar a eficcia de dois preventivos contra Il:.llsea, dividiu-se aleatoriamente uma amostra de 400 marinheiros (:111 dois grupos de 200. Um grupo recebeu a l:ilula A e o outro a pflnla B, sendo que no primeiro grupo 152 no enjoaram durante 111I1a tempestade e no outro grupo apenas 132. H indicaes de que a diccia das plula A e B a mesma? Sejam PA e PB as propores de marinheiros que no enjoam, J'('spectivamente para as plulas A e B. Temos que nA = 200, nB = '/()() " 152 - O 76" - 1:32 - O, 6'6 , P ,'- - 200+200 152+132 ., ,PA 200 , , Pn - 200 = O,71. C omo 1111)strado abaixo, os valores das duas estatsticas (Z e Z*) so quase i,I';uais. Z

Diagnstico de A Malignos Benignos 9 1 9 81 18 82

Total

10 90
100

=
=

J ()

0,76-0,66 0,7G 1-:0,7G + 0,GG(1-0,GG)


20U 200

0,10
o,(),~

2 22
,

Z*

0,76-0,66 )0,71(1-0,71)(260+260)

= 0,10 =
0,05

2 20
'

Fixando-se o nvel de significncia em 5%, rejeita-se Ho. Os valorcs-p encontrados para Z e Z* so respectivamente O,026 e 0,028. 1'(ntanto, pode-se concluir que as duas plulas no so igualmente efeli vaso H indicaes de que a plula A oferece maior proteo contra

importante observar que a unidade de anlise aqui o I:II,'I/WI', avaliado por dois patologistas. Embora tenham sido feitas 200 ;1.I1;ili ses, o total de tumores , na realidade, apenas 100. Alm disto, alguns tumores sero claramente mais maliguos 1 11) que outros e, portanto, a hiptese fundamental na construc;ao dI) teste de probabilidade constante de malignidade no razovel :lq 11 i. Isto explica a necessidade de desenvolvirrinto de teste especfi<:o, iHII , para dados pareados. Apresentamos a seguir o teste de McNemar, que apa]'()c(! ('(I111 mais freqncia na literatura, embora existam alternativas IImis i11 teressantes.
I

()s dados a serem analisados no proccsso dc companvJio podcm :ic 'r rcsumidos no formato da Tabela (i.IO. Usamos a nomcIldatura :,II<:C~SS() e fracasso para a ocorrncia ou niio do cvento dcintcn~ssc. Ta1>da 6.10: Apresentc1(~ode dados obtidos em uma classific:aciio de dados pareados '. . Controle Sucesso Fracasso Total Tratamento Sucessso Fracasso
/;; T

ondc XI,J ~(\. h o pcn:clltil d(~mdcm l-a com 1 gnUl (h~lii)('nLtdc'.

da distribuio qui-quadrado

Total

s
'fi!'! 'Tn2

s(~Pl e P2 so as probabilidades de sucesso nos grupos controle e I.ral.mnento, respectivamente, a hiptese de interesse

Jolmson & .)ohnson (ID72), ao analisarem retrospectivamente a histria clnica dc pacientcs dc do(m(~adc Hodgkin, um tipo de cncer no tecido linfide, no encontraram evidncias que sustentassem a hiptese de que a amigclaleetomia aumenta a suscetibilidade doena, pela remo(~iioda "barreira linftica" representada pela amgdala. Neste estudo, usaram um planejamento do tipo caso-controle pareado. A concluso relatada no artigo foi feita, entretanto, com uma anlise apropriada para dados provenientes de grupos independentes. Logo aps a public<1(~o, vrios autores observaram a impropriedade da anlise e, utilizando as informaes no artigo, fizeram a anlise correta, que baseada nos dados da Tabela 6.11. Tabela 6.11: Distribuio de pacientes com e sem doena de Hodgkin em um estudo caso-controle pareado segundo amigdalectomia

Os pares que produziram sucesso ou fracasso nos dois elementos di) par no contm informao para discriminar Pl de P2. Se Ho vI'l'Iladeira, ou seja, os dois grupos so equivalentes, as discordncias Id)smvadas so fruto do acaso. Noutras palavras, se l' e s tm valores ::I'lllIdhantes, sob Ho espera-se a rnetade do nmero de discordncias ( I'~..::'.). A hiptese Ho deve, portanto, ser rejeitada se a distncia I'III.I'I! os valores observados e esperados for grande, de forma anloga lU) qllc foi visto para amostras independentes. I}sando a correo de continuidade, a estatstica do teste

Doena de Hodgkin Operados No operados Total

Controle Operados No operados

Total

26
7

15
37

41 44
85

33

52

x2
McN

= (115 - 71 - 1)2 = 2 23
15 +--7 '

x'iJ cN

= ------'-T + S

(11' -

si -

1)2

> /\. v21 1 , -O<

Este valor deve ser comparado com 3,84 para um nvel de significncia de 5%. Ou seja, com uma confiana de 95% acreditanlOs que no h associao entre a doena de Hodgkin e a amigdalectomia. Esta conclus'o no est de acordo com trabalhos anteriores, como o de Vianna et al. (1971).

()'5

Resposta contnua: amostras independentes

a md,o( lologia para comparar doisgruIIIIS de pacientes (por exelllplo, doentes v(~rsus 11i'.o doentes) em n~[Iu .. :ao a uma resposta coutnua, por exeluplo, pn~ssi'.osistlica. Testa::1', Ilmte caso, a igualdade das ln{~dias das respostas de dois trata1111~lltOS. S(am I-L1 e /"2 as m{~dias da vari:.vc1 (~studada para os dois grupos, If'SI)(~ctivamente. As hip()teses a serem t(~stadas so

N (~sta seo apresent;unos

Vamos apresentar aqui o teste mais conhecido, o teste j; para duas ;lIllostras, adequado para situa(;es em que as respostas aos dois trata1111!lltOS so varicivcis quantitativas com distribui(;o gaussiana com pal'llJnetros (/L1,!T) 8 (1"2,!T), respectivamente. Assim, as suposies Ilal'a se usar este teste so que as variveis estudadas tm distribuies ,1',;lIlssianas com o mesmo desvio-padro. Note que 1-1'1' I-L2 e !T so Ilal'l\luetros populacionais e, portanto constantes desconhecidas. Para testar a hiptese 6.14, coletamos um amostra de tamanho /lI 110grupo 1 (;(;11' ;rI2' ... , ;rl J c uma aruostra de tamanho '17,2 no ,1',I"llpO 2 (X21lX22, ... ,.T2n2)' A partir desse dados, calculamos as m,lias (:r1 e X2) e os desvios-padril.o (81 e 82) dos dois grupos. () critrio de deciso para se testar a hiptese nula acima consiste "111I'<eitar Ho se
n

pelo numerador da (~statstica T. Por outro lado, quanto 1I1aiol' rol' " variabilidad(~ das I'(~Spost,as, um1s2l s(~r a dificuldade de s(~ ddl'I'i.111' difernII<;as nntre os d'(~itos m{~dio~.,() desvio-padro, no dcnolllilllldlll' da expressi'.o acima, rdlet(~ ess(~fato, fornecendo a unidade na (11 lal a:, clifernII<;as obsnrvadas d(~VeIU sm me( lidas. Em outras palavras, CII111 1i estatstica T (~st<1mosmedindo a, diferena entre as mdias em LI !I'IIIIIS de Flcsvios-padri'.o. iDcvernos re.i(~itar Jlo s(~ T for "grande" em valor ab~Qluto. I'al'll tomarmos nsta decisi'o, usamos a distribui<.;o t de Stude~ (Stn<lI!IIL, 1908). Essa distribui(;o {~caraderi/\ada por um parmetro qlll! as sumI' apenas valores inteiros positivos que so chamados de gralls <11' liberdade. muito parecida com a distrilmi(;o gaussiana ~ sua ["01'111;1 tpica mostrada na Figura 6.1. Os percentis da distribuio t dn Student para vrios gralls 111' liberdade so mostrados na Tabela AS elo apndice. Para gralls 111' liberdade muito grandes, seus percentis so praticamente iguais ;111;, da cljstribuio gaussiana. ~ a compara<;iio de mdias de amostras independentes, os ~118 de liberdade so '17,1 + '17,2 - 2, o nmero total da amostra menos ~:\

Xl -X2

T = DP(X1

X2)

(6.15)

" ",,';rande~J sendo Xl e X2 as mdias das respostas dos indivduos do IIIj 11 \(!ro e do segundo grupos e o denominador o desvio-padro da d irl'l'l~\J(,:a destas medidas. 1\ d;~ciso baseada nesta estatstica de teste intuitiva, pois~~anI1I Illaior for a diferena entre as mdias amostrais, In~tior a cha~e de '-::!;II'IIIOSdiante de dois grupos realmente diferentes,J Isto captado
....-.#

Para efetuarmos os clculos necessrios ao teste, preciso CIII ri \(' cer a expresso para a varincia de Xl - X 2. Para isto usall \(18 resultado demonstrado pela Estatstica Matemtica

li

tnd-n~-~;l-%

2: 2,00. Ou s(~.ia" se a razo Ti em valor absoluLo, r<ll' maior que 2 (;stanlixc;diante de uma diferem:a significativa ao nvd de 5%. No entanto, dev(~-se prcfmir os valores exatos em trabalhos cientficos. Com as facilidades d(~Clclllotrazidas pelos programas d(~ computador esp(~cializados e111 clculos estatsticos, cada vez mais freqentc o uso do valor-p, ao inv{~sde s(~comparar o valor de T com um valor tabelculo.

L.-i.~~ I

,--V//'2

(,.

;-,

'/'~i -

.L~

'/I.~ -

(:omo a suposi<)o que as varillcias dos dois grupos so iguais, p'ld(~mos usar tanto a (~xpresso (G.17) ou (G.lS) para estimar (T2. EnLl'danto, pode-se mostrar que a melhor estimativa para (T2 a rnd'io. 11(}'II.r!em,do., com pesos proporcionais aos tamanhos elas arnostras, ou .) sI ('11'1 - 1
'li,] . + ('/I.~ -

')

+ '11,2

1)32

')

A frutosamina um ndice do controle metablico no diabetes mellitus podendo refietir as variaes da glicemia nas ltimas duas a trs semanas. Representa um conjunto de protenas glicosadas, cuja frao principal a albumina. Com o objetivo de estabelecer os valores normais da frutosamina em homens, mulheres gestantes ou no, Camargo et aI. (1994) realizaram um estudo que inclua um grupo composto de 42 indivduos normais, 21 mulheres (22 a 71 anos) e 21 homens (24 a 81 anos). O outro grupo era constitudo de 36 gestantes (17 a 37 anos) atendidas no ambulatrio de Ginecologia e Obstetrcia do Hospital de Clnicas de Forto Alegre. A idade gestacional variou de 17 a 37 semanas. Como recomendado, os autores apresentam as mdias e desviospadro de todas as variveis consideradas para cada grupo (tabelas 6.12 e 6.13), de forma que possvel repetir os clculos de cada valor-p apresentado. Tabela 6.12: Mdia (x) e desvio-padro (s) de variveis para mulheres no gestantes e homens Varivel Idade (anos) Glicose (rng/dlj Frutosamina (rnrnol/l) Triglicerdios (rng/ di) Mulheres
,....Xl 31

'"() teste t para compara(:o de duas amostras consiste em se rejeitar


//11 (~mfavor de H] ao nvel ao de significncia, se

Homens
X2 32

1'1

IHHI(~ 1'/I,I+n2-2;1-% o percentil de ordem 1- ~ela distibuio t com /lI I '/1.2 - 2 graus de liberdade e facilmente obtido fonsultando-se lal lidas, corno a Tabela AS do apndice. 1';JI1borao valor de tnl+n2-2;1-% varie para c,",dasituao, uma HlslIlLas tabelas da distribuiot mostra que se ao = 0, OS ento

39 95 2,70 145

14 20 0,26 135

43 84 2,99 124

14 24 0,32 62

,I

Tabela 6.13: Mdia (:Y:) e d(~svillpadrilo (8) d(~variv(~ispara gnstant(~s Varii.vd Idade (anos) Idade gestacional (senmwl.s) Glicos(~ ('!fuI/di) Frutosamina ('llIiIlWI/I) Albumina ('!fUI/di)
;}; 8

2G 2K

7
[)

10:3
2,40 4,1

17
0,22

O,G

grupos d(~ paci(~JLi~(~s, COlllpo::-:tos dn forma aleatria, e quall1.iIje:li' /I depressil.o atrav(~s da escala dn Montgomery-Asberg (MADIU';), "111 que os valores maion~siJldieam maior gravidade da deprnss:1l I, () escore foi obtido para cada pacientn 7, 14, 21, 28 e 42 dias ai )('IS incio do ensaio. Pelo planejanwnto adotado, os dois grupos no diferiam (~]JI 1."1' mos de deprmsil.o no incio do ensaio. Assim, uma evidncia solll'l~li efeito da timwptina (~obtida comparandll-se os dois grupos ao lilll dI' 42 dias. A Tabela G.14 apresenta os mcorm finais dos pacientes dos dlli:: grupos admitidos em B(~loI-Iorizonte.
Ii

Apresentamos a seguir alguns dos resultados obtidos neste estudo '111 que o teste t de amostras independnntes foi aplicado. As mdias das idadm dos grupos dn mulherc~s e homnns n,o apf'(~sentaram diferena estatisticamente significantn (jJ = O, :HJ). A !J;lic(~mia de jejum e a dn 2 horas aps a sobrecarga oral de glicose "ao foram diferentes entre homens e rnullwres (p = 0,08 e p = 0,40, f'( ~spectivamente). A diferen<:a entre sexos para frutosamina estatis1.ie:unente significant(~ (p = 0,0(2). Como a distribuio gaussiana, a raixa de normalidade obtida foi calculada corno mdia 2 desviosIla(lr,o, sendo portanto 2,35 a 3,63 rnTII,olI para homens e 2,18 a 3,22 IlIo'lnol/l para mulheres.
I

Tabela G.14: Escore final na escala MADRS de pacientes dos dois grupos admitidos em Belo Horizonte Grupo Pla,cebo Escores 26 10 21 7 4 10 17 29

G 37 10

33 15 8
3

21 2 17
7

29 26 14 13

33 13

29

Tianeptina

21

No grupo das gestantes, os valores de frutosamina tambm apre,S(~II1.aram distribuio gaussiana e a faixa de normalidade neste grupo r, li de 1,96 a 2,84 rnrn o1/1. Os achados principais indicam que devem ser considerados o sexo " a presena ou no de gravidez para se definir os limites normais dos \'alllf'(~sda frutosamina srica. I';xmnplo 6.9: Comparao da tianeptina com placebo 2
8 p

n1 n2

= 15 = 16

Xl

= 20,53

X2 = 11,37

81=11,09 82 = 7,26

Ii I

1\ tianeptina um frmaco antidepressivo do grupo dos triccli"II,S. Sna ao antidepressiva potencial foi demonstrada em estudos pr{' clnicos atravs de testes em animais. Rocha (1995) relata os re::1"Lados de um ensaio clnico aleatorizado, duplo-cego, realizado com I.jdivo de comparar a tianeptina com o placebo. Participam deste 'I I.':aillpacicntes de Belo Horizonte, Rio de Janeiro e Campinas. S11ei 111.mncnte,o ensaio consistiu ~m administrar a droga a dois
I"

14(11, (9)2.~ 15(7,26)2 = (9 31)2 15 + 16 - 2 '

20,53 - 11,37 9,31

Us

+ r1(,)

que comparado com o valor de /;'2!); O,D7G = 2,045 kva re.i(~i({iio da igualdade entre os dois grupos no nvel de 5%. () valor-p O, Ol04.

pressiio sist(lica, a pressiio diastlica, o ndice de obesidad(l ahdullli nal, fibrinog{~llio(~capacidade vital so poss've'is fatores de risc(l pll.l'II o AVC em honWIlS. A vm'ilicvJto linal da influncia destes faL()J'1 's 11: I ocorrncia de AVe foi feita. usando-s(~ anlises multivariadas. 6.5.2 Teste

No estudo de GoteIublll'go, citado no Ex(~m[JloG.:), aln do hbito (11 l fumar (escore) foram consideradas diversas variveis quantitativas (contnuas) con10 possveis fatores d(~ risco para AVe: press.u sistlica (mrnHg) e diastlica (-m/mil,!}), peso (klj), altura ('(11,), ndice dl~massa corporal definido corno peso/(aU:ura?(]{,!}/m'2), medida da cintura (em), medida do quadril (em.), ndice de obesidade abdomiIlal definido como cintura/quadril, nvc1 srico de colesterol (mg/d1), 1';1 icose no sangue (uuJ/d1), fibrinognio no plasma (,!}/1), nveis de Il<lmoglobina (g/d1) e de hematcrito (%), e capacidade vital (1). Na Tabela 6.15 reproduzimos do artigo original os valores mdios < Ias diversas variveis para os indivduos do estudo, divididos em dois grnpos: os que sofreram AVC e os que no sofreram AVe. Tabela 6.15: Valores mdios dos fatores estudados no incio do pesquisa e valor-p obtido atravs elo test(~ 1.de comparao de mdias Fator Fumo Presso sistlica Presso diastlica ndice massa corporal Medida do quadril ndice obesidade abdominal Colesterol Glicose Fi brinognio Hemoglobina Hematcrito Capacidade vital AVC Sim No 2,9 2,6 151,9 143,2 96,8 90,1 25,7 24,9 94,8 93,6 0,95 0,93 275 269 64,8 67,9 3,6 3,3 14;9 14,8 44,3 44,0 4,3 4,5

';Z

para comparao

de mdias

UIn pressuposto important(~ para aplicar o teste 1.da seo ,\.I I L( l rior que os dois grupos coruparados tenham a mesma variabilid'l.<l<l, o que nmu serupre acontece na prtica. No caso de amostras graUd(lS (nl e 'n'2 2: 30) dispomos de um testecm que no necessrio qual '2 '2 .' . . I quer suposio adicional sobre !TI e !T'2' ou seja, as vananCIas (llll ser iguais ou diferentes. Para fazermos inferncia sobre a difereIl<~ade mdias (~I'l - !1.'2) (, natural utilizarmos a informa(~o amostraL,contida em Xl - X'2, cllja varincia (~estimada por sI!'({,j + s~/TI,'2' A estatstica do teste para testar a hiptese de igualdade de mdias(Ro: fI'I = ~(2)
A'

P()(

J sr j-nl + syn2

(Xl - X'2)

Valor-p 0,16 0,004 0,0001 0,08 0,23 0,0004 0,40 0,60 0,01 0,40 0,46 0,03

que aproximadamente N(O,l), sob Ro, 181.0 , a hiptese lllila (, rejeitada se o valor absoluto da estatstica (6.22) for maior que ZI (\/~!l o percentil de ordem (1 - /2) da distribuio N(O, 1).

uma droga bastante utilizada para induzir arwsL('Hia geral. Trata-se de um poderoso anestsico de inalao, no inflallr: vel e no explosivo, com um odor relativamente agradvel. P()d(~~il'l administrado ao paciente com o mesmo equipamento usado para HIIiI oxigenao. Aps a inalao, a substncia chega aos pulmes (,01'11,111 do possvel a passagem para o estat10 anestsico mais rapidam(llll.(' dll que seria possvel com drogas administradas de forma intrav(~lI( lHa. Entretanto, os efeitos colaterais incluem a depresso do SiSI.('1I111 respiratrio e cardiovascular, sensibilizao a arritmias prOdlll',jllll:1 por adrenalina e eventualmente o desenvolvimento de leso Iwp:,l.iclI Alguns anestesistas acreditam que esses efeitos podem causal' CUIII plicaes em pacientes com problemas cardacos e sugerem () llHI' d/I

o halotano

lllorfina corno um agente ancstsico ncsscs pacientcs devido ao seu pequeno efeito na atividade cardaca. Conahan et aI. (1973) compararam esses dois agentes anestsicos Clll um grande nmero de pacientes submetidos a uma cirurgia de rotina para reparo ou substituio da vlvula cardaca. Para obter duas amostras comparveis, os pacientes foram alocados aleatoriaIlIcnte a cada tipo de anestesia. A fim de estudar o efeito desses dois tipos de anestesia, foram rcgistradas variveis hemodinmicas, como pI'l?sso sangnea antes (Ia induo da anestesia, aps a anestesia mas antes da inciso, e (~IIJ outros perodos importantes durante a operao. A questo que surge se o efeito do halotano e da morfina na presso sangnea o IIlesmo. Para comparar os dois grupos, necessitamos dos resultados apresentados na Tabel 6.16. Tabela 6.16: Mdia e desvio-padro da presso sangnea (TTlirnHg) s(:gundo o tipo de anestesia Informac:es , ., sobre a amostra Mdia Desvio- padro n Anestesia Halotano Morfina 66,9 73,2 12,2 14,4 61 61

Consideremos a seguintc pergunta: ser que o armazenan\(~IIL() da amostra do sangue influencia o valor da medida do colestcro\ (: do triglicrides? Se no h mudana, o annazenamento de amostras poderia ser usado em estudos tipo coorte, em que pacientes so aCOlllpanhados ao longo do tempo, () que geraria vrias facilidades para o pesquisador clnico. Neste caso, o problema de interesse uma comparao entre dois grupos de medidas: de triglicrides, por exemplo. -razovel supor, e existem evidncias empricas neste sentido, que a distribuio estatstica do nvel de triglicrides gaussiana. Se o possvel efeito do armazenamento se d apenas no aumento ou decrscimo na mdia da distribuio, no na sua variabilidade, ento as hipteses a sermu testadas so

Nas condies do problema, as hipteses so Ho: ~ll = P2 e 1/1: /1'1 # ~l2, isto , devemos testar a diferena entre as presses sangiineas mdias de indivduos anestesiados com halotano ou morfi
11 a.

Corno as amostras so grandes, podemos usar o teste Z, cujo valor da (:statstica do teste 66,9 - 73, 2 J(12, 2)2 /61 + (14,4)2 /61 -6 30 J5: 84

= -2,61

Adotando um nvel de significncia de 5%, o resultado estatistiCll.lltnlltcsignificativo, j que 1- 2, 61[ > 1,96. Alm disso, o valor-p O, ()(J!), que menor que o valor de a estipulado, indicando que os de)is allcstsicos no so equivalentes.

onde ~ll e Il2 so as mdias antes e depois do armazenamento. O erro do tipo I, neste caso, dizer que o armazenamento tmll efeito, quando, na realidade no tem, enquanto o do tipo n, qlH! no h efeito quando, de fato, os resultados de medies feitas (H 1.1 diferentes momentos so diferentes. A escolha de Ho implica qlW, lia ausncia de outras evidncias, consideraremos que o armazenanwlILo no tem efeito. Intuitivamente, o critrio de deciso, a ser utilizado para tosLar Ho, deve ser baseado nas diferenas entre os valores do triglicridcH nas duas ocasies das medidas. Se houver influncia do armaJ'-clIamento, ento essas diferenas devem ser diferentes de zero. O problema de escolha de um critrio de deciso reduz-se a CHCOlher urna forma de verificar se as diferenas so provenientes d<]1111111. distribuio com mdia zero. De uma maneira geral, considerando o par formado por um illdivrduo que recebe o tratamento e outro do grupo controle, os dados si",o 'I/. pares de observaes: (Xl1, X21), (X12, X22), ... , (Xln, X2n)' Para cada par tomamos a diferena das duas observaes, isto , dI = :I:J J _. :1:21 , d2 = x12 - x22, ... , dn = Xln - ;[;2'/1,'

d=

,\'''''fI,

0-1=,1 (,'/,
'li,

I'

l{,ealiZll-:-:e 11lIle:-:Llldo COIll O objdivo de avaliar a efetividad( ~di' uma dida cOlIlbinada corn um um progranla de exerccios f:-:ico:-: lia redur)io do nvc1 de colmterol. A Tabela G.17 mo:-:tra 0:-: nvei:-:de coln:-:Lerolele 12 particillall LI~:-: no incio e no final do programa,

Um critrio razo;vc1 () a di:-:U\ncia entre a mdia das cliferencas ((I) () zero. Como no problerna da :-:1~1;;:io anterior, esta diferer;r;a 111~vl~ :-:ermedida em termos de de:-:vio:-:-padro. Usando-se EstatsLica Matemtica po~e-:-:e rnostrar que, para TI, pare:-: de ob:-:erval;e:-:, I I (1< ~:-:viopadro de D {~ .Ift. Como o de:-:viopadro ( ri usualmente (I<~:-:conhecido, estima-:-:e e:-:teparilmdro por '"ri, o desvio-padro das di[(!l'Imas das dua:-:meclida:-:. Portanto,S'tmte c:on:-:i:-:te em rejeitar Ho se

Programa Final (:];2) Incio (:];1)


201 231 221 260 228 237 326 235 240 267 284 201 200 236 216 233 224 216 296 195 207 247 210 209

Diferena ri

:];1 -

:];2

Desvio ri - (I
-19,16 -25,16 -15,16 6,83 -16,16 0,83 9,83 19,83 12,83 -0,16 53,83 -28,16

Desvio ao quadralll) (ri -

d?

1 -5 +5 +27 +4 +21 +30 +40 00 +"" +20 +74 -8

T _(1-0_
\r~

ri
-

]J

..;n

8d

..;n

Sr}

1)11 s<a,{se a distncia entre a mdia d(~'-)diferenas e zero, medida 1'111 desvs-padro tem um valor "grand?!]. 1\ deciso de quo "grande" o valor de ~) deve ser exige o conheci1I11~IILo de sua distribuio. Aqui tambm~) tem distribuio t, agora I '11111 'li, 1 graus de liberdade, quando a distribuio da diferenca ~ I',all:-::-:iana. 1\ regra do teste ent~:~ejeitar Ho se
-

367,36 633,36 230,03 46,69 261,36 0,69 96,69 393,36 164,69 0,03 2898,03 793,36

1111111' 1"1111-.0. o percentil de ordem (1 - .9:) da distribuio ' , 2 2 ~ ~~I,IIII('I li, com n - 1 graus de liberdade.

t de

Quanto maior o valor d maior a evidncia de que o programa l'I~ duz o nvel de colesterol; quanto menor a variabilidade das diferelll;a:-: individuais maior a chance de se detectar um efeito mdio significa tivo, isto , uma reduo significativa do colesterol devido ar)io do programa e no ao acaso. Estes aspectos podem ser avaliados atmv(!:-: do teste t. Sejam fia, e fi~ respectivamente as mdias dos nveis de colc:-:t(~l'ol antes e depois do programa. Par-testar a hiptese de que o prograrua altera o nvel de colesterol (Ho: fia, = firi versus H1: lia -# fI'ri) :-:(~l'; aplicado o teste t (11 graus de liberdade).

Apenas dois participantes tiveranl o 11v(~1 de col(~stero] ill1I1leIltado aps o programa, rnas por 1)(~qllClLas quantida.d(~s (G e 8 m'.!J/dl). As mdias antc;s e dq)ois do prognuua S,\.orespectivamente 244,2G (~ 224,08, correspondent.c~ a uUla r(,dIHJio ln(~dia 20,12 'truJ/dl (c7 = 20,17). Alm disso, .'id 2:3,L} (: TI' :3,02 (p O,(12), isto , h evidncia de qUC\C,lIlmdia, o programa a1tc,ra o uvcl de ll(~sterol. No prximo captulo vaUlos quantificar a J'(~dw,;il.o que o I 19rama proporcionou.
)i'(

= ;,Sr:,7 =

C(

() teste dc~Mann- vVhitney (, usado para a comparao de dois grll pos independentes. Para sua constru<.;o, primeiramente, obtem<lS(IS postos a todas as observaries como se das fossem uma nica amostra. A estatstica do teste d(~

Testes no-paramtricos
Os testes apresentados uas sees 6.S e 6.0 foram derivados para :;il.llaes em que o efeito do tratamento descrito por varivel CClllLI IIIIl. com distri bui<.;ogaussiana. Estes testes so denominados pam/mtricos, pois suas estatsticas de teste usam as estimativas dos panlmetros da distribuio gaussiana. Existem testes paramtric:os para compara.o ele dois grupos deS(~lIvo]vidospara outras distribuies, por exemplo Poisson. Entretanto geralmente nci se encontram disponveis em textos elementares I~(~tIlsoftwares estatsticos, Nesta seo vamos apresentar dois testes no-paramtT'icos, des<~llvolvidos para cornparar grupos em situac;es em que a distribui.o (Ia varivel de interesse no conhecida ou tem comportamento no !',allssiano. Esses testes so construdos usando-se os postos das observaes. () posto de uma observa.o o nmero de ordem da observao, estalido as observaes ordenadas. Quando h empates, toma-se como 1)( Isto de cada observao a mdia dos postos que seriam atribudos :\,c; IliJscrvaes, caso os empates no existissem. ()s testes no-paramtricos so boas opes para situaes em I111< ~ocorrem violaes elos pressup.ostos bsicos necessrios para a apl icac;o de um teste paramtrico. Por exemplo, para testar a dife1'<'1 1 I.,: a de dois grupos quando a distribuio subjacente assimtrica ti ()Sdados foram coletados em uma escala ordinal. Vamos apresentar dois testes para variveis contnuas, sendo o prillj(~iro para amostra independentes e o segundo para amostras pll.l'<~adas. Os clculos necessrios so simples mas trabalhosos e por : i::, I m<:lllnendamos o uso de computador.
11

1\!IW

n j'I/'2

+ nJ(nJ+l) 2

- T

onde' '(rI c n2 so os tamanhos elas amostras elos dois grupos e 'I' (, 'I ttal dos postos do grupo menor. Para a tomada de deciso o valor da estatstica 1\!IW deve ser <:<llll parado com o percentil de uma distribuic;o especial (n.o apresellt,ada nesse texto). O teste pode ser baseado na estatstica T que; aparece em (fi. 2K), Para amostras grandes (pelo menos 10 em cada grupo), T tenl il.J ll'll . 1 1"] . ~. , l' np(np-I-nc: I I) Xlmac amente c lstn )UlaO gaussmna com mec Ia IJ,T = 2-" e desvio-padro
(JT

=J.nGrt'T,
(JT

onde

'np

nu

so os tamanJl<ls ,111
(I

amostra do grupo menor e maior, respectivamente. Neste cas, I, valor da estatstica Z = T-IJT deve ser comparado com o T)en:(~lll.il da distribuio gaussiana padro.
1:

Exemplo 6.13: Comparao da tianeptina com placebo tinuao)

(COII-

Para os dados do Exemplo 6.9, vamos comparar o grllpo '111<' recebeu tianeptina com o que recebeu placebo atravs do t<~sL(~ ,I,' Mann- Whitney. Os dados ordenados e os postos correspondellLI's 1 'H to apresentados na Tabela 6.18. O valor-p 0,0266 indicando que h diferena entre os dois 1',1'11 pos comparados. mais do dobro do que o valor-p obtido pelo I.I'HLI' t de Student (p = 0,0104). 2,bserveque o uso de um L(~sLI' 1I1111 paramtrico mais apropriado j que a escala usada para III<~dir dI' presso ordinal.

'I'a1>da 6.18: Postos atribudos ,\,osdados al-';I'()g,1,( los dos dois grupos (i>laC(~bo e tianeptina)
Placnllo
TiHIWllbllH

Escore
2

Posto
1,5

Escore
2
') .)

Posto
1,5 :3 IJ,5 4,5 7,5 9 10 12 12 14,5 16,5 16,5 19,5 19,5 21,5

:3. Calcular a sorna elospostos (S) di) todas as diferenas negativas (ou positivas), Para amostra p(~qllenas(at(~ 25 pares), o valor-p deve ser obtido atravs de uma tabela especial (no includa nesse texto). Para amostras grandes, a estatstica do teste (S) tem aproximadamente distribui(~o gaussiana com mdia lis = n'('I~+I) e desvio-padro
(TS =

4 4 7

n(n+Jlf,l'll+J).

~
9 10 10 13 14 14 17 17 21

..

Assim, o valor de Z

= S-Ps

us

deve ser compara-

do ao valor do percentil da distribuio gaussiana. Embora no haja nenhuma suposio sobre a forma da distribuio das observa,(~es, o teste mais poderoso para distribuies simtricas.

21 26 26 29 33
clcl
'J
f)

21,5 2') r: cl,LJ 23,5 25,5 27,5 27,5 29

Rocha (1995), alm da anlise sintetizada na seo anterior, verificou se houve diminuio do escore de depresso entre os pacientes de um dos grupos durante o desenvolvimento do estudo. A Tabela 6.19 mostra os escores dos pacientes do grupo tianeptina que foram admitidos em Belo Horizonte no primeiro (Xl) e no ltimo dia (X42)' Como O escore MADRS , na realidade, uma medida em escala ordinal, o uso de teste no-paramtrico mais apropriado. O uso do teste t, s se justifica como aproximao. Dois pacientes (nmeros 14 e 15) no completaram o estudo. Assim, no fornecem informaes suficientes para a comparao pretendida e, por isto, foram excludos da anlise. As diferenas em valor absoluto, Idl, e os respectivos postos esto mostrados na Tabela 6.20. O valor-p 0,0225 que maior que o obtido atravs do teste t (p = O,(013). H portanto indicao de alterao dos nveis ele depressg...para pacientes que fezeram uso de tianeptina.

39

() I,(~stede Wilc:oxon usado para comparar dois tratamentos '1llallclo os dados so obtidos atravs do esquema de pareamento.

Tal )(~la 6.19: Escores dos jmcieutes do ,1')'11pO tiaJl(~j)ti]l.a no I)r11ne1n) ( :\ I ) e ltimo dia (X42) N.'!. 2
<>
')

Xl

X42

d=

:1:42

:1:1

G G 7 i)

24 46 26 44 27 34 33 25

6 33 21 26 10 29
C) ') ,j,j

-li) -1:) -G -li) -17 -G


O +11

N.'!. xI D :)G 10 :m 11 ;)H 12 ;)K


1:\ lil

:1:42

d=

:1:42

~ :r:,

:n
27

:)7 IG 2 21 7

+2 -IG -:)(i -17


-2/1

II
L

29

IG :3/1 l(i ;)2

* *
2G

* *
-G

Tabela 6.20: Posto atribudo

ao valor absoluto ela diferena

Idl

Idl
O

Posto

N-'-'- do pacielli.e

[di
lG 17 17 li) li) 24 36

Posto

N-'-'- do paciellte

2 4 5 5 G 13

1 2
') ,j

7
D

i)
') ,j

4,5 4,5 6 7

G lG 2

i) 9,5 9,G 11,5 11,5 13 14

10 5 12 1 4 13 11

a ocorrC~I.H:ia eln surtos e as altenHi)(~s de mtigenicidade. A principalllwdida profiltica (~a utilizac~o de vacina tlivale'III.., contendo lnn ou lllais subtipos do vrus influenza A e B com rc:vi~;ae 1 alltigC~uica anual. No (~lltanto, as vacinas disponveis contra illlllle'll za WnJ vrias liulitvJm. Destaca-se a no obteno consisteut(! ele' nv(~is protetores de auticorpos na populac:o idosa aps dose nica ela vacina, restando lllna prol)oro da populac,.o imunizada sob risce I. EUl U1ua teutai.iva d(~produzir uma nova vacina com maior inlllll( 1 genicidad(~, G1w:k et aI. (1994) dmenvolvermn uma vacina viross()llli ca trivalente de infhwnza inselindo hemaglutinina purificada do VlllS na menlbrana dc~lipossomas (virossomas). Para verilicar a segunluc,a (~iIullIJ()gc~nicidade, conduziram li 111 ('s tudo em unIa casa dc~repouso para idosos em Cagliari, Itlia. ():; residente;s foram excludos na presen<.;a (1e evidncias de doena agi 1 da. ou crnica no momelO da vacinac,o, histria de infiuenza nos ltimos 12 meses, alergia a qualquer elos cornponentes da vacina (111 protenas de aves, uma reao grave pr(wia a essa vacina ou estar participando de outro (~stuelo. Cento e~vinte e seis residentes sc1ecionados rece~beram, aleatoria mente, Ulna das trs vacinas: vrus inteiros, sul lll1lidade viral e v irossmica. As rea(~es adversas foram diariaIlil'lIi (~l"egistradas e duas amostras ele sangue, coletadas, antros e 2-\ (li<lSaps a imunizao. A idade mdia do grupo estudHI() foi de 78 anos, sendo 7()1j{ dos participantes mulheres. Alm disso, 12% haviam lH:C,hid" <I \'acilla contra esse vrus no ano anterior. No formu ]"c' LIj ; \ ( I:1:-; IC 'ilc,c)eslocais ou sisternicas nos grupos. As caracterstici(:-; (I, 1:-; IIC'sgrupos estudados esto resumidas na Tabela 6.21. Tabela 6.21: Informao soilre idade dos P;Wil'IIII"'-'; e distribui8.o quanto ao sexo e vacinao contra infllll'll/<I III)Sltimos 24 meses
Vacina Vrus inteiros Virossmica Subunidade Total Idade x (faixa) NQ de idosos JVlul1w]"l's '1()l;d
')') _d

Exemplo comentado: Imunogenicidade de uma vaCIna


!\ illr('(:(~opor vrus infiuenza ocorre atravs da contaminao de 111< I i V dllo susceptvel por secrees respiratrias de indivduo infecI ;11 li I. A eloew,a respiratria febril aguda resultante pode se apresen1;(, ('( 11110 sndnllues clnicas diversas: resfriados comuns, faringite, I,; I' 1111 'oilronquite, pneumonias virais e at mesmo pneumonias bac1.. 'li; 111; I~; secundrias. Geralmente auto-limitada, responde por alta 111' 1111i( I:\de e mortalidade na populao idosa, especialmente em vir1.11< I,' de) Illior risco de complicaes pulmonares. Ressalta-se ainda

Homens

Vacillados

78 (64-8i)) 78 (63-102) 79 (G3-102) 78 (63-102)

9 22 /".7 3i)

41 24 8i)

32 63 31 126

1 10
LI

Li

A Tabela 6.22 mostra a resposta imuIJ(~,ls tl.; vacinas. Atravb; do t(~ste t pareado constatou-se elevacJio significativa (p < 0,(1) da 111(\dia geomtrica dos ttulos em relac;iio aos ttulos basais para as II'(!Scepas virais. uso da ln(~dia geomtrica justifica-se pc10 tipo ,1(' varivel (titulao); nest(~ caso, trabalha-se conl o logaritmo da lilll!<u;o e, ento, o logaritmo da mdia geOln(~trica (~igual ,l,m,dia ; 11' i IIntica na escala logartmica.

6.9

Consideraes prticas sobre testes de hipteses

Tabc1a 6.22: Mdia geomd,rica e faixa dos ttulos de Ac anti-Ha ;\1 iI,(~se aps vacina8.o com os trC~spreparados vacinais referentes ;LC; trs cepas: HINl Sillgapore (C(~pa 1), H3N2 Beijing (Ccpa 2) e I\jYamagata (Cepa ~~)

Reunimos IlCsta se(;ao alp.;umas consideracies eSSenCIalSpara o uso crtico dos t(~st(~S de liip()tnses na prtica. Como atualmente os clculos p,tra a ]'(~aJiy,a(;il.o d(~qualquer teste est8.o disponveis em programas de computador, vrias observa(ii(S desta seo so potencialmente lnais inlportmltes qll(~aquelas das sees anteriores, em que se explica basicarnente a mecil,nica de clculo das estatsticas de alguns testns de hiptes<~s.

Tipo de vacina V rllSinteiros


V iI'ossmica S IIImnidade

Cqm 1 lYls Pr
2,9 (O-~O ) 2,4 (0-30 ) 1,~ (0-40 ) 29,1 (0-320 ) 4L1,2 (O-MO) 14 (0-320)

Pr()

Cepa 2 Ps
130 (10-640) 142 (20-2560) 121 (10-5120)

Cepa 3 Pr Ps
3,4 (0-20) 2,4 (0-40) 2,9 (0-40) 16,3 (O-MO) 17,5 (0-320) 11,4 (0-160)

25,2 (0-1 GO) 20, fi (0-320) 2G,4 (0-160 )

final sobre a hiptese nula tomada omparando-se o valor-p com um valor pr-fixado, usualmente 0,05::\.9uando o vapor-p menor que estf:.1Kmto de corte, o resultado chamadoestatisticamerde significo.nte,e, alto:mente siqrl:~!ico:nt;e, quando ele menor que um ponto de corte ainda menc)r (digamos 0,01). INas outras situaes o teste dito niio s'lg'nificante. Por esta raz8.0 os "testes S8.0den~minados testes de siqn:if'r:cii'l7,cia."--.._. v _

, .!:- deciso

P'''''''''-

A eficcia vacinal foi avaliada atravs da propor8.0 de imunizados lill(! adquiriram nveis protetores de anticorpos. A Tabela 6.23 mostra ,):: valores-p obtidos atravs do teste t. A vacina virossmica levou pl'Opor8.0mais alta de pessoas com ttulos protetores de anticorpos ('()IILl'aduas de trs cepas virais quando comparada -outra vacina. 1''11''1 a cepa H3N2 no houve diferena provavelmente pela alta por('('IILagemde indivduos com nveis basais de anticorpos protetores.

Esses pontos de corte so arbitrrios e no se deve dar uma importncia exagerada a eles. inaceitvel que os resultados de dois estudos em que os valores-p sejam 0,045 e 0,055 sejam interpretados de forma diferente para cy = 0,05. Esses valores devem levar a concluses muito parecidas, niio a concluses diametralmente opostas. Esse raciocnio ficar mais claro no prximo captulo, quando estudarmos o conceito de intervalo de confiana.

Tipo de vacina Vrus inteiros Virossmica

HINl Singapore 0,022 0,007

BjYamagata 0,035 0,002

As hipteses alternativas, respectivamente para o teste de comparao de propores e de mdias so: H1: Pl I- P2 e H1: ~I'l I- ~L2' Podem ser desmembradas como: H1: Pl > P2 ou Pl < P2 eH1: ~Ll > ~L2 ou H1: ~Ll < ~L2' Estas hipteses assumem, portanto, que qualquer um dos dois grupos pode ter uma propor~ ou uma mdia maior elo que o outro. Por isto este tipo de hiptese denominada bilateml. ia valor-p bilateral a probabilidade de se obter em q'LUz.lg;uer diTeo~a diferena igualou mais extrema do que a observada.,

.--J

(1;xiste tambm a possibilidade d(~ SI) fOl'llluJar hip()teses alternaI.ivas (H1) unilaterais, como Illostra o (luadro aLmixo. Situao PI'OIH)1'<';( )es 11] : Ji] > JiL fIl:
Ji I

IV!()(lias
RI: [lI:
/I J

(1) (2)

> <

/I'L

<

JiL

/"1

/IL

Nestes casos, as conlpara(;(~s s~in ()stabd(~cidas em uma dctermiIlal Ia direo. Assim, por exeInplo :';),~) s(~comparar um procedimento 1II )VOcom um padril.o, estamos avaliando se a inova<;o deve ser reI:Omendada':(portanto, a escolha d(~hipteses unilaterais ou bilaterais influencia dcisivamente a interpreb),()io dos resultados da anlise es1.; \.Lstica. Para se testar hipteses unilaterais baseadas na clistribui(;o t de Sl.ndent ou na distribuiil.o gaussiana, utiliza-se apenas uma cauda da (Iistribuio. Por exemplo, fixando-se um nvel de significncia de 5%, () IH)rcentil utilizado para testes bas()ac1os na distri bui(;il.o gaussiana I,(j4 e no 1,96. Embora a diferena no seja grande, a interpretao I)()(le ser diferente para um nvel de significncia fixado. As duas op<;es de testes (unilateral ou bilateral) esto disponveis (!11l programas de computador. Em geral, o valor-p para teste bilateral I'!o dobro do valor-p correspondente hiptese unilateral. H circunstncias em que hiptese unilateral a melhor forma IlI! se formular a questil.o de interesse. Em estudos comparando uma ilIovao de um procedimento padro, a hiptese alternativa mais in1.()J'()ssante que a inova(;o superior, um apelo hiptese unilateral. 1';111 um estudo sobre a qualidade da gua, importante verificar se as contagens bacteriolgicas das amostras analisadas esto acima do I)allril.o considerado aceitvel. Obviamente, no h nenhuma preocul,a(J.o quando a gua estiver mais pura do que o padro estab_elecido, I) (lne justificaria a hiptese unilateral. Um teste unilateral tambm pode ser justificado quando se pode af i rmar que uma das direes contempladas pela hiptese bilateral I'olllpletamente inconcebvel, como a situao descrita por Luthra et aI. (1982). ' () argumento mais forte contra o uso de hipteses unilaterais Ifli(! por maior que seja a evidncia de que um tratamento seja supe1'11)1' ao outro, nunca se tem certeza absoluta do que realmente pode

acontecer. Embora exista uma boa razo para esperar (11 i(! li(IV: I~; 111'1) gas ou novos procedimentos sejam melhores que os do grtlJHI 1'llIiI,l'llil' (caso contrrio o estudo no estaria sendo realizado), ainda a:-;~;i 111 existe a possibilidade, llWSIllOque remota, de que seus resul I.ai IiISSI' jam piores. 'Na compara(Ju) de urna droga com o placebo, no SI! 1)1 li11' descartar a possibilidade de que a droga tenha um efeito deld,{)l'il I' portanto no deva ser recomendad. Na escolha entre hiptese bilateral e unilateral os seguintes aSpl!I' tos devem ser considerados:
I,

1. O tipo de hiptese adotado deve preceder a anlise dos d;1.( lo~;, isto , a escolha no deve ser inHuenciada pelo resultado d:1 anlostra. 2. O teste bilateral mais conservador do que o unilat()l'al. N:J maioria dos casos, testes unilaterais so vistos corno unia 11111 n~ir~ de se exagerar a fora dos c~chad.?..:'J'Qehouver (l11al<lIII'1' dUVIda, deve-se optar pelo teste bIlate~. 3. Segundo alguns autores, a distino entre testes unilal.(!l'ais bilaterais no de fundamental importncia na interpl'da<:1I.l1 dos resultados, desde que fique claro qual foi usado.
I'

4. Mesmo quando o teste unilateral pode ser justificado, plldl' :11' encontrar resistncia editorial para publicar tais achadlls,

Alguns estatsticos e editores de jornais acreditam que o vali li' 1i unilateral nunca deve ser usado. O primeiro argumento a 1lllil'()!'lIli dade de apresentao dos resultados, tal que um determinado vali lI' Ii tenha um mesmo significado em todos os artigos. Segundo, aCI'I!d il.all 1 que situaes que justificam o uso de testes unilaterais so (~xl.l'l'III:1 mente raras. Terceiro, em estudos sobre importantes quesU)(!S, ('11111<1 a regulamentao de uma droga, o valor-p apenas um fat()!' Ilsadl I na tomada de decises. O critrio de que o valor-p seja nWJ1ol'dll <[111' 0,05 em geral insuficiente para estabececer eficincia (; p()lo 1111'1111:1 o teste bilateral mais con;;;ervador. Aceitando estes argumentos e considera:qs\9 a padro 11 i/,,: 11,: ai I ,n existente na maioria dos peI:~~e\licosmdicos,_Ec:comeIH !ali II)S II li:II I rotineiro de,hipteses bilaterais.,

O.O.:l

p,artir d~ testes bilaten~,is niio se),p(!(le concluir que mn trataT,o () supen()r ao outro e SIILl que 1w dlierew,;a entre os tratallwnIi I,': ('.1li uparados. Urna llHtlWira apropriada para avaliar qual (l o mais 1'lil'il)IILe atr'~';s da quanLiJicae.;ii,o dos "efeitos" dos tratamentos, :1:;:;IIIILo tratado no prximo captulo. 1\ ()vidncia fornecida pelo valor-p ()mna evidflncUe1. probabilstica. 1\:,:; iIII em ~ ensaio clnico,;se o valor- p () "gralHIC:'( digamos maior qlll' O,20),.podemos dizer sili a evidfmcia fOl'llecida sugen) que os lJ'aLalllcnt~sso equivalent::::l Nil.o podemos (lxc:luir, entretanto, que I':, LJ'atamentos sejam diferentes, aperws ()stamos mais seguros que :;:111 ()quivalentes. " I'or outro lado,'.se o valor-p ()peqlwll(Mdigamos menor que 0,(01), \I'IIL;\()a igualdade dos dois tratanlelo~Ilil.o parece ser plausve. A "vidf)Llcia.sugere que um dos tratament()s superior. -. , \.-Conforme comentado na Seil.oG.2.4,o valor-p igual a 0,05 usado IJ()referncia para tornada de decisil.o em pesquisas mdic<~.s.1 Isto :;i!',llificaum resultado que pode ocorrer Inenos que urna vez em vinte q I1 alI(10 a hiptese nula verdadeira. Nesta formulao, quando se 1".il'iLa a hiptese nula, aceita-se a hiptese alternativa complementar. \ ~~I: 0"1 valor-p no excede o ponto ele corte, nil.o se rejeita a hiptese 111 11 a.! Entretanto, no se pode dizer que a hiptese nula verdadeira, Illas sornente que nil.oh evidncia suficiente para que ela seja rejeitaIa. I';sta uma distin<;o sutil.mas importante. (:oucluindo, no se eleve f1xar no critrio de p < 0,05, mas sim IIILI'J'pretarcorretamente o resultado do teste atravs do valor-p.
1111 '1
r-" I I 'I li ,.-\ I

r~

Concluses a partir de testes de hipteses

presso sangullwa foi esLatisticamente siguif1cante, mas sem qualquer im porUhICia clnica. For 011 tI'O lado, pode ocorrer que o teste n,o tenha sido est,atisLicmu()]lic)significante, mas os dados podem ter mostrado mua diferelH;a iUlportante na prtica. Esses efeitos podem estar ligados a,o tamanho ela amostra (Lemeshow et aI., 1990).

Nem sempre a diferew;a observada entre as respostas, atravs da aplica(;o do teste t ou tesLe qui-qua,drado, pode ser atribuda ao fator usado para dividir os pacientes nos dois grupos de comparao. Como visto no Captulo 2, eventuais diferenas podem ser atribudas a um outro fato'r que recebe neste caso, a denominao de fator de confuso. !Como qualquer realidade clnica complexa, a possibilidade de exi~tncia de fatores de confuso deVI)ser sempre consielerad~.i ~..P. De fato, qualquer resposta clnica, como sobrevida, remisso, recidiva ou desaparecimento dos sintomas, influenciada por vrios fatores. Para se fazer compara({es vlidas, na presena de fatores de confuso, foram desenvolvidos vrios mtodos estatsticos que recebem na literatura mdica o nome genrico de mtodos multivariados.

fi.O.4

Significncia estatstica e significncia clnica

I )(:lItro do contexto de teste de hipteses, a palavra sign~ficante sido muitas vezes usada de forma incorreta. Por essa razo no I' 11 'I:t" IIcndada em alguns peridicos mdicos. Pode-se usar correta1111'111.,) li conceito de significncia estatstica e na prtica interpret-lo til' r, >l'lllaindevida. Portanto, importante entender a diferena entre : I iJ'.11 i Ii c;\,llcia estatstica e significncia clnica. 11111 I'<)sultadoestatisticamente significante no implica necessaria1111'111.1' 1~1ll uma importncia clnica. Por exemplo, Gould et aI. (1985) 'II:ilalll mn estudo em que uma pequena diferena de 1 mmHg na
11'111

Em anlises que envolvem testes de hipteses, boa pntica apresentar os valores necessrios para que o valor-p possa ser recalculado. Por exemplo, em testes de comparao de mdias para amostras independentes, as mdias e os desvios-padro para cada grupo devem ser apresentados. Deve-se evitar a apresentao do valor-p em forma de intervalos (p > 0,05; 0,01 < P < 0,05). recomendado apresentar o valor-p exato obtido (por exemplo, p = 0,012), qU8 em geral a sada padro de programas de computador. Em geral duas ou trs casas decimais so suficientes.

6.9.7

Pressupostos dos testes


(

Corno mencionado nas sees em que os testes foram apresentados, cada um deles foi desenvolvido a partir de determinados pressupostos. Aps aescolha do teste a ser utilizado, as seguintes questes

I'ldnvantes podem ser levantadas: Os dados ,ulalisados satisfa~mn os 11I'(~SSllpOStoS? Se eles n80 forem cOluplc1.amente satisfeitos, quais S80 IIScOllseqncias? Elas S80 graves? I';xistem vrias formas para a verifica(;iio dos rlI'(~SSupostos: anlise ,I,'sni tiva dos dados, grficos (;speciicos e os chamados testes de 1Il11~1'l'llcia. Cada suposi(;iio avaliada de 111.na fonna eSIlccfica. Por I'XI'1llplo, no Captulo 5 discutimos formas dc~avaliar a suposio de cI' I' ~a varivel tem distribuio gaussiana,. I';m geral, a violao da suposi(:o alt()l'Clo nvel de significncia. 1',11'c~xemplo, algum pode estar pensando que est testando a um II VI d de significncia de 5 (li] e realmente o nvel sc~rmaior, digamos ,'":'X, , Outros efeitos tambm podem ocorrer, dependendo da situao " do tipo de teste. A seguir apresentamos alguns comentrios sobre os pressupostos dI' dois testes discutidos neste captulo: teste qui-quadrado e teste t.

() ,teste qui-quadradQ foi desenvolvido v:lidas as seguintes sur;sies:

para situaes em que so

I. A probabilidade de sucesso no varia de indivduo para indivduo dentro dos grupos de controle e tratamento. :2. O resultado que ocorre para um paciente de qualquer dos grupos no infiuencia de nenhuma maneira o resultado de outros indivduos. qllando a condio 1 no for vlida, necessrio usar uma outra :l11:liHC), por exemplo, combinao de tabelas 2 x 2 (Fleiss, 1981). qllando a segunda hiptese, de independncia, no verdadeira, Il: 111:liordificuldade na anlise. Mtodos adequados de anlise para c,:;1,:1 Hi Lnao s foram desenvolvidos muito recentemente. Esto agru111 1 ,1,IHuo tpico Anlise de Dados Dependentes.

so iguais. Com essas duas SUpOSIoes, a hiptese dc~i)..';llI\.ldltdn 1111 mdia :xl'isg(~ral do que a princpio parece, pois (~C~<lllivlIl('III.(I ,) hiptese de <l11c' os dois 1]',lt.anHmtos produzem o rnesmo d(!i j,(), '111 seja, no apc~llas qlW IJS 1]'ai amentos sejam em mdias COIUIIIII':V('is, Esse o tipo <1<: cOluparac;iio que mais interessa na prtica. Estudos mosb',tm que o teste t robusto com relao S11 POSil:1Il1 da distribuio, isto , o t(~ste {~apropriado mesmo para varivc~is <111<' sejam um pouco assirn{~tricas ou que efetivamente no tenhaul dis tribuio gaussiana (por exeruplo escalas). Entretanto, a suposil:llo de igualdade de varincia, dellominada hOTnocedasticidade, 11111 i))I portante aspecto a ser avaliado, pois sua violao pode resultar 1~1I1 concluses incorretas. Outros estudos demonstrara,m que se o tamanho das amostras' dos dois grupos igual (nI = n2) e as amostras so grandes, o nvel dl~si)', nificncia calculado segundo a suposio de que a distribuiu,() slrll,ill cente gaussiana e h igualdade de desvio-padro vlido, nWSlllo SI' essas suposies forern violadas. Entretanto, se TLl i- n2 e os dl~svilIH padro no so iguais, o nvel de significncia pode ser alterado P(lf' uma quantidade que depende de quantas vezes um desvio- padl'al I (, maior que o outro. A homocedasticidade pode ser avaliada por um teste de igualdad(' de varincia. A heteTOcedasticidade, varincias diferentes, podc~ Hc'l' corrigi da pelo uso de transformao da varivel; alternativan\(~IIt.c~ pode-se usar testes desenvolvidos para esta situao. Alm do aspecto tcnico apresentado sobre o desvio de hOIlIC) cedasticidade, importante estar atento ao significado das hip(Jt.(~H(~H no caso de heterocedasticidade. Nesse caso, o teste de compara6i,() dc! r. mdias pode no ter muito interesse na prtica.!,pois tratamentos <l1)C! tenham a mesma mdia podem ter efeitos completamente diferelJLc~s, e I(,ortanto no serem considerados equivalent~i;

( )s Hnguintes pressupostos so feitos para aplicar o teste t descrito 11:1 SI~IJ\.{) 6.5.1 ~a a comparao de mdias quando as amostras so 111,lc")(!1 f( lentes: .a varivel tem distribuio gli~assiana e as varincias

Nas sees 6.3.1 e 6.5.1, usamos as denominaes teste qlli-<l1I1l. drado e teste t. Essas so as formas populares como esses LC!HLns so conhecidos. Entretanto, existe uma pequena imprecis8.o III~HHII

III'111 llllillac;o pois na verdack existeuJ iuI'uJl(~ros t(~st(~S baseados nas di~il.ribui(;esqui-quadrado e t de St,IHkl1t.

Dificuldades prticas na formao de pares homogneos Na prtica podem existir dificuldades no conhecimento das caractersticas que devem ser controladas e mesmo conhecendo-as pode ser difcil formar pares homogneos, como por exemplo no caso em que o nmero de fatores muito grande. Em lImitas situac;es, embora desejvel, torna-se difcil ou mesmo impossvel a implementao do planejamento com amostras pareadas.

1':111 geral, o planejamento de mllostras par(~adas lJwlllora a preI I::;\11 lias estimativas das diferelH,;asentn~ as lll(~diasdos tratameutos. 1-:111.1'l'I.al1to, quando os indivduos j fmeul horuoglwoS ou quando ;1 Iwt{~J'()geneidadeno pud(~r ser atribuda a fatores identificveis, 'I Ilal'l~amento arbitrrio nem sempre coutribui para Ullla reducJio 11:1 variabilidade, ou seja, para a mclboria da preciso. Neste caso, II ,d;\.II<amentode amostras indepeudentes seria recomendado (ver :"',;a'l !J.G de Bhattacharyya & Johnson, 1!>77).

1' lemos distinguir trs tipos de pareamento: auto- parectmento, 1';II'I;\.I1lCnto natural e pareamento artificial. ( ), l/,uto-paTearnento corre quando:,~) indivduo serve como seu IJI"jlrill contr()l~).como na situao em cl..e\mindivduo recebe duas II1I',1 ',as admini~'adas em ocasies diferent~>JOutra situao a que ["i ;IJlresentada no Exernplo 6.12, em que o nvel de colesterol foi 1111" I i( I() antes e depois do programa. Finalmente, a comparac:o de '\'Ii:; l'll'gos no mesmo indivduo, como braos, pernas, olhos, narinas, ::t'I',IIIHlll alguma caracterstica estudada tambm constitui um autoI';li' 'alll<~nto. ( ) lJI/,Tearnentonat'lLraZ consiste em\t:9rmar pares to homogneos IIllillll.lIJlossvel, controlando os fatores que possam interferir na resI" d<:,s(~ndo que o pareamento aparece de forma natural. Por exemI,j I', ;'1 ~ 1I~xperimentos de laboratrio pode-se formar pares de cobaias :,1,1"1 'i,luadas da mesma ninhada; em investigaes clnicas, gmeos 1IIIII'ildillOSso muitos usados.' I~,I lJII,',.(;arne'Qtoar:ti,fi,c),L"~olhe-se indivduos com caractersticas :il'lllI'lll:llli,i~s,'i tais-c~mo, i~la~l~~ sexo, nvel scio-econmico, estado II,' :::11'1"( ~ 011, em geral, fatores que podem influenciar de maneira 11'1"I':IIILI~ a varivel resposta.
1)( ,.".,.J

Uma questo essencial em qualquer pesquisa sobre a amostra a ser coletada ou pesquisada. Alm da necessidade de se ter uma amostra com uma boa representatividade da populao! que pode ser obtida atravs de um planejamento adequado, ~ .quantidade de indivduos crucial para a validade das concluses! A chave de uma pesquisa portanto, corno e quanto arnostTaT. Um dos problemas que pode acompanhar a no deteco de diferena significativa em um estudo o tamanho de amostra insuficiente (Freiman et aI., 1978). Os principais esquemas amostrais que podem ser implementados so: amostragem aleatria simples, estratificada, por conglomerados e sistemtica ou combinaes entre eles. Os critrios usuais na determinac:o do tamanho da amostra so: preciso, erros associados a testes de hipteses, poder estatstico, custos, ou ainda a combinao de alguns destes critrios. Existem frmulas desenvolvidas para dimensionamento de amostras que consideram o esquema amostral e/ou o planejamento do estudo. Entretanto, algumas frmulas populares de tamanho de amostra nem sempre so apropriadas (Kupper & Hafner, 1989). Gail (1976), Kraemer & Thiemann (1987), Lemeshowet aI. (1990), Levi & Lemeshow (1991), Lwanga & Lemeshow (1991) e Silva (1998) so boas referncias para esses tpicos.

Hipteses mais gerais Neste captulo as hipteses testadas referem-se a igualdade de mdias e igualdade de propores dos tratamentos comparados. Em algumas situaes pode haver o interesse de testar hipteses mais

)',1

!l'aiH, jHto , que a diferena (~ntn~ aH In{~diaHou aH propon:eH de :lIll'I'HH(l dos tratamentos uma cm'ta quantidade. Por exemplo, pode1111 li, LI~Htar se a diferena entre aH m{)diaHda preHHiiosangnea antes I' dI'1)(lis de um exerccio fsico () 20 'lIIill/,I-Jy. Poderamos ainda testar :11'a 1>J'()fcrnciapara o partido poltico A eHbi 10 pontos pen:entuais IIl'i I 1 li\.do partido B. I'al'a estas situaes, testmnos as seguintes hiplteHeH de comparaI:all dl~ mdias: Ho: fI'l - 1','2 = 11'0 verSUH 11l: 11'1 1','2 i- 11.0 e as ::I"',llilil,()H hipteses de comparaiio de pn)pon:()()s: Ho: Pl - P2 = PO \,(,I':;IIH 1h: Pl - P2 i- Po Note qlH) para o teste de igualdade de III1'diaH1"0 = O e para o teste de igualdade de propon;es PO = 0, isto 1\ I':>L(~s testes so um caso particular do teste mais geral. H estatsticas para os testes de mdia, para amostras indepen111'lltl)H ou emparelhadas, e para o teste Z para comparao de pro11111'1,:1 )()Sso semelhantes quelas apresentadas nas sees anteriores; l'lltld,anto, no numerador da estatstica do teste, a diferena das eslilllativas dos parmetros comparada com o valor espeficicac10 na IIi I)('lLeHI~ nula. Por exemplo, no teste Z ele comparao de propores III'VI~IIIOS calcular

1. Observou-se nos anos 60 que a ocorrncia de abortos espontneos nas gestaes de mdicas anestesistas era mais elevada do que o nonna1, Para verificar se esta observao refletia, ou no uma conc1i<:ogeral, realizou-se em 1970 um estudo no Hospital da Universidade de Stanford, Califrnia. Foram encontrados os seguintes resultados: Especialidade Anestesista Outra 2~~ 52 14 6
37 58

Gestao normal Aborto espontneo Total

Total 75

20
95

(a) Escolha a hiptese nula e a alternativa nesta situao.

que so razoveis

(1)1 - 1)2) - PO
1)1(l-tJL)
'/1.]

lJ2 (1 -1)2)
T/'2

(b) Faa o teste adequado considerando uma margem de erro provvel inferior a 5%. Calcule o valor-p. Qual ,,a sua concluso? 2. Para os dados de glicose e triglicerdeos o valor-p para o teste de companu)io Comente. do Exemplo 6.8, calcule de mulheres e homens.

IIIIII(~ lio o valor especificado no problema (no exemplo da preferncia 1>' d (Lica PO = 0,10). IVlni:>de dois grupos I'::>t()captulo trata do easo de comparao de dois grupos, mas i",tj(I'~lltemente o objetivo de uma pesquisa a comparao de mais ,11' li, liHgrupos. No apropriado fazer-se comparaes duas a duas :11'111 IlIlalquer ajuste. Torna-se, portanto, necessria a extenso dos 1,1':Ii,I':-; Iql],<)Hentados. f\ ':'llnparao de mdias de mais de dois tratamentos feita IILIIIVI"H dI) anlise de varincia e comparaes mltiplas. Para a '"l1l1lal'll.I:;',ode mais de duas propores podemos utilizar o teste '11" I11 ladI'ado, com as devidas adaptaes. Altman (1991) uma I "il'lllllcia para esses dois tpicos.

3. Frick et a1,(1987) realizaram em Helsinque um ensaio clnico aleatorizado com o objetivo de verificar se o frmaco gemfibrozil, que reduz o nvel de colesterol, era eficiente para a preveno primria de doena coronariana em homens de meiaidade assintomticos com dislipidemia. Para isto, compararam o grupo que durante o ensaio tomou gemfibrozil (grupo 1), com o grupo que usou placebo (grupo 2). Entre as vrias anlises, verificaram o nvel de colesterol (mg/ dl) observando os seguintes resultados:
nl n2

= 1973

Xl

"

= 1958

X2

= 244,7 = 272,5

SI S2

= 33,7 = 31,4

,
Com base nos resultadol acima pode-le afirmar quc, ao nvel de significncia de 5%, o gcmfil)1'o~ilatua lobrc o nvel de colelt,(~l'01 ?
. I

Teste a hip()h~l('de' ;\ll(J('];\(:ao entre o nvel de catecolaminH no sanguc (~ a illcidllcia de doena coronariana, ao nvel d(~ significncia de 1(Xl.

~. Transcrevemos a seguir rClultaclol do artigo de Rothenberg et aI. (1987), onde so descritas aB caractersticas dos primeiros 5833 casos de AIDS em Nova York. () termo lobrevida zero Illadopara indicar que o paciente morreu no primeiro ms aps o diagnstico de AIDS. Nmero de pacientes Masculino Feminino 5281 552 Sobrevida Mediana (dias) 357

6'; Nove indivduos do lexo masculino, sadios, com idade mdia


\ de 21 ancm participaram, voluntariamente, de urna pesquisa cujo objetivo era verificar lCa alcalose respiratria, induzida por hiperventilao voluntria, aumenta a capacidade fsica avaliada pelo tempo de corrida de 800 metros. Neste estudo, os nove indivduos participaram da corrida de 800 metros em 2 momentos: um deles em condies normais (sem hiperventilao) e no outro aps a hiperventilao voluntria. Os dados obtidos (em minutos) esto apresentados a seguir: Indivduo 1 2 3 4 5 6 7 8 9 Hiperventilao Com Sem 155 151 150 152 174 172 158 150 155 152 148 150 142 144 164 169 143 144

Mdia (dias) 374 298

Zero

( %)
10,9 16,3

263

Sexo Masculino Feminino Total

Sobrevida zero Sirn No

Total

(b) Teste a hiptese de que a proporo de homens com sobrevida zero igual proporo de mulheres com sobrevida zero (use o: = 0,05). Calcule o valor-p.

rI. i n,ealizou-se um estudo tipo coorte para investigar a associao


(~ntre o nvel de catecolamina no sangue e a incidncia posterior (le doena coronariana. Para isto, 609 homens com idade entre !J() e 76 anos foram acompanhados no perodo de 1960 a 1989. () nvel de catecolamina foi determinado em 1960 e classificado <:ornoalto ou baixo. Os resultados so apresentados na tabela
al);xo:

Expresse em termos estatsticos as hipteses de interesse a serem testadas pelo pesquisador. Teste a hiptese estabelecida em (a), ao nvel de significncia de 5%. CalculB o valor-p e apres~nte suas concluses. 7. O artigo transcrito a seguir foi publicado, no primeiro semestre de 1990, pela Folha de So Paulo: ENZIMA INDICA PROPENSO RECIDIVA

Doena coronanana Presente Ausente Total

Nvel inicial de catecolamina Alto Baixo 27 44 95 443 122 487

Total 71 538 609

Boston, Massachusetts - Urna enzima denominada catepsina D pode indicar quais as pacientes com cncer de mama so mail suscetveis a recidivas, indica estudo da Universidade do TexaK De acordo com os pesquisadores, mulheres com altos nveil d(~

catepsina D parecem t(~r mais do dohro de chances de recidiva cinco anos aps a cirurgia, devendo por isso ser submetidas a tratamentos esp(~cficos. Uma das fUJl(~es da catepsina D {~decompor protenas ellcontradas nos alimentos. O trabalho acompanhou 199 mulheres cujo cncer no havia se estendido aos ndulos linfticos. Um teI'(~oapre~sentou altos nveis de catepsina D; dessas, GO% sofreram recidivas. Nas mulheres com baixas taxas da enzirna, o percentual caiu para 29%, equivalente ao da maioria das mulheres americanas que tiveram a doena diagnosticada em estgios iniciais. Os resultados do estudo indicam que pacientes precocemente diagnosticadas que tenham alto nvel da enzima devem ser submetidas quimioterapia ou terapia hormonal para reduzir os riscos de recidiva. Cerca de 140 mil americanas morrem anualmente nos Estados Unidos em conseqncia da doene~a. Metade dos casos diagnosticada em estgios iniciais. (a) Que forma de pesquisa mdica foi utilizada neste estudo? Justifique, identificando os grupos e a resposta de interesse.

(b) Qual {~a relevncia do fato de os pacie)1tes t(:I'(!111 sidos esco]] i< [os ,11 ('il1< )rimllente?
j

9. Cinqenta iUuosLl'ilS (le saliva sa1Jidamente positivas para l) I lal'i lo da tuberculos(~ foram colocadas em duas diferentes clIltil rm; (A e 13). O objetivo do experimento era a cornparae~iioci(:St('ci meios na detecIJi.o do bacilo. Os resultados est,o resumidos lia tabela abaixo:

=================---Meio A Meio 13
Detectou No detectou Detectou 20 2 No det~ 12 16
lI'

Existe evidncia de que os mtodos sejam diferentes? (lIse 0,05).

(b) Utilizando os dados fornecidos no artigo, faa o teste adequado para verificar se os resultados obtidos pelos pesquisadores indicam que a enzima catepsina D est associada recidiva nos casos de cncer de mama (use a = 0,05). Calcule o valor-p. K. Para determinar como uma dose experimental de anestesia afeta homens e mulheres, uma amostra de 15 homens e 17 mulheres foi selecionada aleatoriamente em uma clnica odontolgica e slms tempos de reao (em minutos), registrados. As seguintes mtatsticas sumarizam os dados: Estatstica Mdia Desvio- padro Homens 4,8 0,8 Mulheres 4,4 0,9

10. Numa pesquisa de opinio pblica 1000 homens e 1000 mullll:I'l':-; foram entrevistados sobre a posio acerca do a.borto. Entn: as mulheres 356 manifestaram-se contra a legaliz;;to do abortl I, enquanto que 515 homens tiveram a mesma posio. Exist(: diferena significativa entre os dois sexos quanto opinio sohl'l' a legalizao do aborto? (use a = 0,05). CalCllle o valor-p.
11. O Ca:nadian Nledical Association

Jemrnal publicou em novelllbro de 1972 os seguintes resultados de um etperimento qlW procurou investigar se o uso de vitamina C previne resfriados. Por um determinado perodo de tempo, 407 indivduos tomaram fortes doses de vitamina C e 411 receberam placebo. No grupo da vitamina, 105 participantes ficaram livres de) doenas do tipo respiratrio enquanto que no grupo dos pseudomedicados, apenas 76. O que os pesquisadoreS puderam concluir? (use a = 0,05). Calcule o valor-p.

(a) Usando a = 0,05, teste se existe diferena significativa entre os tempos de reao de homens e mulheres.

12. Para verificar se, na faixa etria de 7 a 10 anOS, crianas do sexo masculino tm desempenho em uma corrida de 50 metros diferente de crianas do sexo feminino, obteve-s6 uma amostra de 30 meninos e 30 meninas escolhidos aleatoria.mente entre os 804 alunos do Colgio Pitgoras Pampulha en} Belo Horizonte

que participaram da Mini-Olimpada de 1989. A partir dos dados referentes ao tempo gasto para completa,r o percurso foram calculadas as seguintes estatsticas: Estatstica Meninos 8,75 1,5G Meninas 9,08 1,G8

mdico iniciou-se aps o primeiro trimestre da gravidez ter-se completado.

x
s

Informa(;es Brancas Freqncia Idade Paridade Solteira Pr-natal tardio Negras Freqncia Idade \ Paridade Solteira Pr-natal tardio

Intervalo Intergensico < 6 meses :2:6 meses 286 2354 2 2,71,1 11(3,8) 11(3,8)
c;-~,

Valor-p

(a) Estabelea a hiptese a ser testada. (b) Teste-a ao nvel de significncia de 5%. (c) Existe algum fator de confuso possvel neste caso? (d) A escolha aleatria elosalunos resolve a dificuldade trazida por um eventual fator de confuso? A seguir apresentamos o resumo do artigo intitulado Prevalence af Low Birth WC'ight and Pr'CteTTn Deliver-y in Relation to the Interval Between PregnanC'ies o:monq White and Black Women, de autoria de Rawlings, J. S. et al., publicado no The New England Jo'urnal pf Med:ine em 12 de janeiro de 1995. A taxa de mortalidade infantil nos Estados Unidos mais alta entre os negros do que entre as outras raas. Isto pode ser devido a uma maior freqncia de crianas nascidas prematuramente ou com baixo peso entre os negros, fatores que, por sua vez, esto assocados a pequenos intervalos entre as gestaes. Assim, uma possvel explicao para a diferena de mortalidade infantil entre as raas seria o menor intervalo entre gestaes para as mulheres da raa negra. Para verificar essa hiptese, os autores fizeram um estudo retrospectivo envolvendo 1624 mulheres brancas e 298 negras, to(las com acesso a um servio de sade gratuito de alta qualidade. S foram includas mulheres que tiveram duas gestaes simples com o mesmo parceiro. Alguns resultados esto sintetizados na tabela a seguir. Par~ as variveis idade e paridade, apresentamos as mdias e os d(~svios-padro e para as variveis solteira e pr-natal tardio, as freqncias com as respectivas porcentagens entre parntes(~s. Por pr-natal tardio entende-se que o acompanhamento

1338 2~4,6 2,71, 45(3,4) 24(1,8)

<0,001 0,924 0,685 0,030

89 21,,34,5 ),.(1,1 i.9(10,1) 4(4,5)

209 ?QJ4,4 2,71,2 ~9(9,1) 5(2,4)

0,183 0,381 0,782 0,332

(a) Os dados evidenciam diferena entre mulheres negras e brancas quanto ao intervalo entre gestaes? Faa o teste que julgar apropriado, explicitando a hiptese, a estatstica do teste, o valor-p e a sua concluso. (b) O estado civil das mulheres negras influencia no intervalo entre gestaes? (c) Verifique se a idade mdia das mulheres no grupo < 6 meses estatisticamente diferente da idade mdia no grupo :2: 6 meses. Interprete os resultados.
L

Considerando as brancas.

n. Considerando as negras. 14. Considere as seguintes informaes adicionais do estudo descrito no Exemplo 6.11 sobre a comparao do efeito do halotano e

da morfina na pn~SS\() sallgllll(~a: dos 61 pacientes anestesiados com halotano S (1J,l(){J) morreram, assim como 10 dos 67 110 (14,9%) pacientes anestcsiados com morfina. (a) Compare os valows das estatsticas (6.9) e (6.10). (b) Ao nvel de significncia de 5% use o teste Z e o teste quiquadrado para avaliar em tennos de mortalidade se os dois anestsicos s.o equivalentes.
J.(. Dezenove crianas com diagnstico de AIDS foram separadas

(grupo controle ou grupo 1) com crianas desprivilegiadlll'l, dll camadas sociais mais baixas (grupo 2). As crianas do grlll li I controle vinham de 15 escolas particulares da cidade, mHJlIilIlf.() as do outro grupo, de orfanatos e casas de caridade ou d<~ ouf.ras reas da cidGvle, (mde cheiravam cola, roubavam ou vendialll frutas, chocolate,s e doces. Amostras de sangue das crianas foram colhidas e um dos asp(~ctos estudados foi a conc<mtra<:iiototal de protenas plasmticas e tambm nveis de albumina e globulina, responsveis, entn~ outras coisas, pela produo de presso osmtica a nvel de membrana capilar e pela imunidade natural e adquirida que o organismo possui, respectivamente. Os resultados obtidos, em giZ, esto sintetizados na tabela a seguir. Informaes Grupo 1 Mdia Desvio- padr o n Grupo 2 Mdia Desvio-padriio n Protena total 69,2 5,1 412 70,0 5,9 196 Albumina
\.

em dois grupos de acordo com a susceptibilidade droga. Considera-se susceptvel quando o vrus HIV <" inibido por concentrao de zidovudina (AZT) menor do que 0,1 Ilg I Z e resistente quando a inibiiio exige nvel acima de 10 I/giZ. A durao em meses da terapia com AZT relatada por Ogino (1993) mostrac.a a seguir. Susceptveis (n = 10) 9 7 Resistentes

Globulina 15,4 3,1 412 18,9 4,3 196

(n = 9) 12
14 5

32,4 4,0 412 30,3 4,0 196

12
18 10 10 10 13

14
15 17

13
9

13 13 12

(a) Verifique se existe diferena significativa na concentrao total de protenas entre os dois grupos. Escreva as hipteses de interesse e a concluso. (b) A partir unicamente do resultado obtido em (a), pode-se concluir a presena ou no de desnutrio nas crianas desprivilegiadas? (Sugesto: anlise do significado das protenas albumina e globulina). 17. Uma das questes mais controversas da Medicina contempornea diz respeito eutansia e suicdio assistido por mdicos em pacientes com doenas terminais. Alm do "direiro de morrer" , outros aspectos vem sendo questionados, desde a durabilidade
}

(a) Para cada grupo calcule a mdia e o desvio-padro do tempo de tratamento com AZT. (I Existe difierena significativa entre os dois grupos no que diz respeito ao tempo de terapia com AZT? Formule a hiptese de interesse e teste-a ao nvel de significncia de 5%. Calcule o valor-p e interprete-o.

1(;,

I) III(~studorealizado em Recife (Linhares et aI., 1986) comparou niall(:as entre 7 e 17 anos de classes scio-econmicas elevadas

do desejo pela mort(~ at{~fator(~s qlW () influenciem, especialmente aqueles remediv(~is con] intcrvelHJio rndica e social. ~_ xiste hoje urna preOCUpil,(:i',o d(~que o d(~i:1ej() pela morte, mer,mo entre doentes t(~rminais, pode s(~r um indicativo de d(~sordem psiquitrica potencialmellte~ tratvd. Chochinov et aI. (1995) entn~Vii:1tarmll 199 pacientes de dois hospitais em Winnipeg, Canad, com diagnstico primrio de cncer terminal, admitidos no perodo de coletcti)de dados. Uma das preocupaes era verificar a existncia de-lQlao eI.!tr~J2._ d~~.i.clf) illQrt rell:tl:clo por JllgllIls dele~c(l,dBpress.o. ..diag: .._ nosticacl.a~m alg11I10.0a.sQ:._ A tabela abaixo mostra os dados obtidos para essa varivel (diaglH)stico de depresso).

mulheres bebeu o etanol no suco de laranja no prillH~il'lldill de teste (~o suco de laranja puro no segundo. A Ol'd(I/l11'111 invertida para as seii:1mulheres remanescentes. Am()sl,l':l~ldi' leite para o estudo foram obtidas 30 minutos, 1, 2 (l :1 lima:: aps o consumo da bebida., de modo a interromper o utflli/lli) possvd a amanwnta(:8.o. Os bebs alimentaram-se livremente e o .total de leitejl~L. ..du. foi ei:1timado a partir de clculos sobre o peso da crialJ(,:a (~ a densidade do leite humano. .J a ,.Q.uraoda amamcntiu,:;'ul__... (tempo) foi obtida atravs de gravaes em vdeo. Esses dados encontram-i:1e expostos na tabela a seguir, ,jlllil.a mente com os resultados do teste t pareado (11 graus (k lil)(,1' dade) que compara o comportamento das crianas d(~ ;tcmdll com a bebida tomada por suas m.es.
Varivel Leite ingerido (111,1) Tempo (Trn) Bebida alcolica No Teste t Vali li: I1
< (),i)()
(),H,~

Desejo pela morte Presente Ausente Total

Depress.o Presente Ausente

10
14 24

7
168 175

Total 17

Sim

182
199

156,4 8,2 120,4 9,5 28,6 7,7 28,2 7,3

4,69 0,15

(a) Formule a hiptese de interesse e teste-a ao nvel de sig1::01 m'fi cancla c1e ;) /0.
A

(a) Para cada varivel, formule as hipteses que foralll tadas.

1,(':-1

(b) Calcule o valor-p. (c) Qual a relevncia do resultado para a discuss.o atual sobre eutansia? IH. O consumo de pequenas quantidades de lcool tem sido recomendado a mulheres que amamentam a fim de ajudar lactao. Entretanto, no h evidncias cientficas para tanto. As crianas so expostas ao lcQol do leite de suas mes, que representam uma pequena fra' do total ingerido, sendo mnimos os efeitos a longo pra,po. A ocorrncia de alterao nas caractersticas sensoriais do leite ou no comportamento dos lactentes foi objeto de estudo de Mennella & Beauchamp (1991). Dmante dois dias, com intervalo de uma semana, doze mulheres consumiram suco de laranja puro ou contendo etanol (0,3 g/kg <lemassa corporal) antes de amamentarem suas crianas e meiaIlora aps ter sido obtida uma amostra do leite. Metade das

(b) Existe associao entre a presena ou no de lc:()1 li 11:1 bebida da me e o total de leite ingerido pelo fillJo'! ,111:: tifique. (c) Interprete o valor-p para a varivel durao da alJl:l.Ill1'll tao.

19. A existncia de relao entre criatividade e certos disl/ll'llill,':


mentais sempre foi alvo de especulaes. Relatos mais aJ1Lig( lS .i:i indicam taxas mais altas de esquizofrenia, psiconeuroses (~,Illai:1 modernamente, distrbios afetivos, depresso e alcoolii:1ll1o. Estudos clnicos e cientficos ao longo dos anos no foralll ca pazes de resolver essas controvrsias. Diferenas na COIIC( ~i L\I ao e medida da criatividade, nos critrios de diagnstim psi quitrico, na mtodologia e interpretao fazem com qlW mlll paraes entre esses estudos seJam impraticveis.

Um dos trabalhos mais iUlportantcs para essa discusso foi publicado por Ludwig emU)!)2, no qual ele compara o comportamento criativo e psicopatologia entrc diversos grupos profissionais, a partir de pelo mcnos 1l111a foni;cbiogrfica bem documentada e bem estudada. Mais de 1000 personalidades eminc)fltes, j falecidas e que viveram pelo menos 1l1naparte de suas vidas no sculo XX foram divididas em dezc)IJovecategorias profissionais e observac)s comportamentais e julgamentos sobre eles, realizadas com base em evidncias cientficas. Um dos aspectos abordados no estudo envolveu a comparae;o entre dois grandes grupos, um com os integrantes da chamada "arte criativa" (arquitetos, pintores, msicos, poetas, escritores, entre outros) e outro com aqueles de outras profisses (por exemplo, banqueiros, atletas, filsofos e cientistas). (a) Sabendo que 38,7% dos membros do grupo de "arte criativa" (n = 555) e 16,4% dos membros de outras profisses (n = 450) experimentaram depresso antes dos 40 anos, avalie a exi~tncia de diferencia significativa entre esses grupos. (b) Outro objeto de estudo foi a existncia de diferenas na psicopatologia para integrantes do grupo artstico. A tabela a seguir mostra a incidncia de suicdio como causa de morte para poetas e escritores de fico.

Clnicils da UFl\/C (11 = Ll), representando um hospital 1(1 caliy,ado (!111 lUua rcgi,\.() barulhenta, e o Hospital da H:ti('i" ('li, = 22), considerado um hospital mais silencioso. Os IH,)' centuais de queixas elos pacientes quanto a fatores que pod('111 atrapalhar o sono obscrvados nos dois hospitais e os valoI'(,s-p do teste) exato de Fisher encontram-se na tabela abaixo.
Hospital o Baleia Clnicas 31,82 69,23 9,09 7,69 27,2 15,38 9,09 38,46 0,00 7,69 22,73 46,15 4,55 0,00 9,09 15,38 0,00 7,69

Barulho Acomod:1<Jioruim Temperatura Presena ou atelH;o a outra pessoa Umidade, mofo, cheiro, p Luz Silncio excessivo Desadaptao a nova situao Outros

Valor-p 0,04:J 1,000 0,G80 0,07G 0,371 O,2GH 1,000

O,GIK O,:J71

(a) J ustiiique o uso do teste exato de Fisher. (b) Comente os resultados mostrados na tabela.

Causa da morte Suicdio Outras Total

Poetas 10 43 53

Escritores de fico 7 173 180

Total 17 216 233

Formule a hiptese de interesse e teste-a ao nvel de significncia de 5%. Calcule o valor-p.


:~(). I'>m um estudo sobre o efeito de condies ambientais sobre a

(Jllalidade do sono de pacientes, Pimentel-Souza et aI. (1996) compararam dois hospitais de Belo Horizonte: o Hospital das

Captulo 7

Nesta sel)]O valnos apresentar os conceitos bsicos 1l1~I'I'S~,:l'il I:; para a cornprel:nsiio do captulo. Utilizaremos para isto o CI li 11.1' x 1.( I de uma anlisl~ dl~dados eln qlW existe apenas uma varivel n'sl)1181.:1 de interC8sl~,dl~scrita pela distribuil:o gaussiana.

Medida do Efeito de uma Interveno ou Exposio

Moura (1990) avaliou os nveis plasmticos de vitamina A 1'111 um grupo de 47 crimll:as diabticas com idade at 12 anos. li III d(' seus interesses era conhecer o nvel sangneo da vitamina 1\ 11l'~,I.I' grupo, composto de pacientes tpicos dos atendidos pelo setOl' dI! 1';1l drocrinologia Peditrica da Faculdade de Medicina da UFM ( :.

Nos estudos do tipo caso-controle, estamos interessados em ver ilic:l.r se o grupo de pacientes com a patologia de interesse foi mais (Ili I rnenos) exposto ao fator de risco em anlise. Ao verificarmos, :l.l.r:l.vs de testes de hipteses, a e:ristncla de efeito da exposio, d(~llloSuma resposta parcial a essa questo. Neste captulo vamos responder mesma pergunta medindo, enI.rdanto, o efeito da exposio. Essa abordagem , em muitos aspecI.IIS,mais completa e til do que a apresentada no captulo anterior. 1'1 Ir isto tornou-se a forma padro de anlise da associao entre fator IlI' risco e doena nas revistas cientficas da rea mdica. Sua utiliII:uk se estende, naturalmente, aos outros tipos de estudos clnicos, 1'111. n ~eles estudos de coorte e ensaios clnicos. ( :(nno fizemos no Captulo 6, vamos dividir a apresentao do 1.1'111:1. de acordo com o tipo da resposta de interesse (contnua ou (li('oL(nllica) e da forma de coleta de dados utilizada (grupos independl'III.I~S ou pareamento). No entanto, para tratar destes assuntos, 111'1 'I:iso conhecer alguns resultados gerais, que sero introduzidos nas :11'(:IIf~S 7.2 e 7.3.

Em termos estatsticos o objetivo elo estudo descrito no EXI'lllpllI 7.1 conhecer o nvel rndio, fi. , da distribuil:o do nvel sall!',ilflll'll de vitamina A em crianas diabticas, Neste caso, {L o ]JI/,ni:IIll'iI'1l de inteTesse. Em geral, para a anlise estatstica dos dados de um p1'<l1 )1('111:1 clnico preciso, primeiramente, identificar os parmetros dl~i111.1 '1'1 ':1 se, isto , aqueles cujo conhecimento viabiliza a soluo da <I"1'81.:UI colocada. Esta identificao exige de quem analisa os dados I~X IH 'ri ncia clnica relevante, intuio e conhecimentos estatsticos. A tomada de qualquer deciso deve ser baseada no valor dI I paril metro de interesse que, entretanto, no conhecido na pn.Lica. I';lliI atender a esta necessidade foram desenvolvidos mtodos agrllp:ulll:: na chamada Teoria da Estimao, uma grande e important(~ :l'l~a(1:1 Estatstica. A se aprende como, a partir de dados amostrais, podmllos 01)1.( 'I valores que se aproximam do verdadeiro valor do parml)tl'o. 'l'alll bm pode-se entender exatamente como estas aproximal;()()s d('VI'111 ser construdas e de que forma esto prximas do valor do par;'\,lIldrl I, Este captulo trata dos aspectos mais simples e sempn: t(~I)( ('1111111 referncia as necessidades dos estudos clnicos.
I()

razovel admitir que o nvel langiineo de vitamina A tem dilt.l'iI mi({o gaussiana. Com elta elpeci1ca(;iio, o problema do Exemplo 7. I l()reduz a encontrar mtimatival para Oldoil parmetros da dist.l'illlti(;o (fI e 0-).

A Teoria Estatstica tem vrias soluc;es para este problema. A 1I1 ail comum dada pc10 Tntodo da Tn:r:'na vc'{'()ssiTnha'na. Em 1.1 !l'lllOSintuitivos este mi:odo baseia-se no leguinte princpio: entre t.odas as amostras possveil, aquc1a observada a que tem maior Ill'()1 >abilidade.
Assumindo que os valores dos nveis da vitamina A so rnpresent.ados por X1,X2, ... ,X'n (n = 47), () reprelcntando fi, e &2 os cstiII tadores fornecidos pelo mtodo ela mxima verossimilhana, temos
IPU!

Com a construc;iio de intervalos de confiana agregamol ai) I!~i timador pontual informa(;iio sobre sua variabilidade. Isto (! Id 1.0 escolhendo-se um limite inferior e outro superior para a estiIl tal.i va. Descutimm: a seguir o sentido pnciso destes limites e a forma de) llla obten({i:io. Para construirmos o intervalo de confiana para {L, usareI tI( ll (I seguinte resultado da Teoria Estatstica, que justificado intllit.ivll. mente na prxima se(;o X -IL
-",-rv

:A
onde o sm b o Io
rv

t.n-1

"fi" ca ter eIS l' t 1'1' 'b ma.o, ' - " Sx slgm

Z;(Xi-'\')~! n-I (i t'/I

representa a distribuio t com.~ graus de liberdade, cuja 1.11.1 l(\11I. est disponvel no apndice A5. Ou s~ja, mesmo no se COIlIt()('(IIHlo {L, podemos calcular probabilidades envolvendo a estatstica :B'I)' , '1,=1

(X - X)2
I,

T--s~;
Vii

-IL

:,1 igllinte

Um grande nmero de autoi'es recomenda, estimador

entretanto,

para

(T2

que nos permite construir o inteT"ualo de confiana para I'" Para isto, atravs da tabela da distribui(;o tn-1 O!>t(!III(I," 11111 valor t* tal que

D'n (X i 2 = LJi=1 n-l

X-)2

I';xistem motivos tericos e prticos para esta indicao. Sem "X JlIicjtar as justificativas, cujo entendimento exige conhecimentos 11111' Iiltrapassam o nvel terico pretendido para este texto, vamos 1I.(1,1i,; .. ia. I';lt()l dois estimadores so chamados de pontuais, pois fornecem IIJlI'llalo valor da estimativa do parmetro. A questo da sua variahi I idadl) tratada pela construo do intervalo de confiana, assunto ,Ia Ill'()xima seo. Pr

* [ -t:S

X 5, - IL :St
Vii

*]

Pr [X-t*-,

-' :S{L:SX+t*-", vn

Sx

S\,
.JIi

(I'

Assim, um 'inteTvalo I()()(1 - (v)% dado por

COTldl,'IJ,(:a

para f"

COIU

uvel d{~couJian{,a clr:~ Tabela 7.1: Amostras de tamanho


:I:;3 :(;4

6 e suas mdias
:r5 11,7 12,9 10,9 12,6 12,1 11,1 10,9 13,5 11,2 12,6
x6

X -

t* 8,);

vn

X + 1;* ,E/I: ]

vn

Amostra 1 2

:rl 11,7 12,9 12,3 13,1 12,4 12,0 12,6 11,6 12,7 9,7

:r2 11,:3 12,5 13,5 11,4 14,0 12,0 12,7 12,3 12,8 13,4

Mdia 11,8 12,0 12,5 12,6 12,4 12,2 11,9 12,7 12,4 11,7

V()l'emos na proxlma

seo

<]11<)

)n () uma

estimativa

do desvio-

11,3 9,9 12,8 11,9 12,0 12,5 10,9 11,8 13,4 11,2

11,8 11,7 12,6 13,5 12,5 13,5 10,7 13,2 11,4 12,0

12,7 12,3 12,8 13,3 11,4 12,3 13,8 13,5 12,9 11,4

pa<ll'ao de X. Assim, o intervalo d{~conJiaw,a para fi, centrado na ,'sl,i I 11 ativa do efeito, e varia de uma quantidade 't* de:wios-padro Ilal'a baixo at o mesmo nmero de desvios-padro para cima. I'lxumplo 7.2: Nveis plasmticos lIio) de vitamina A (continu-

3
4

5 6 7 8 9 10

I'ara os dados do Exemplo 7.1, :Y:= 25,5 '1neg/dl e 8 = 8,5 meg/ dl. I'ara um nvel de confian{,a de 95(/r1, o percentil da distribuio com 46 )',I'aw..; de liberdade t,fJ7c, = 2,0129. Portanto, o intervalo de confiallC,a para a mdia do nvel plasmtico de vitamina A [23,00; 28, 00]. ( ~llIll95 % de confiana 'podemos afirmar que o nvel plasmtico de vi1,'l.Il1illaA em criam,as diabticas com idade at 12 anos varia entre ~~:\'/I/,{;g/dl e 28 meg/dl.

50

11,2

11,4

12,1

13,4

11,9

11,5

11,9

Na Figura 7.1 apresentamos o histograma da coluna de mdias, que tem mdia 12,072 e o desvio-padro 0,359.

() objetivo desta seo apresentar os resultados da Teoria Esl,aUsbca, usados na construo de intervalos de confiana. Esta seo alll'I)S{mta resultados tericos e pode ser omitida em uma primeira 1"jl,llra. , entretanto, fundamental para um entendimento mais pro1'1111111) da forma de construo dos intervalos de confiana. Sao trs os resultados a serem apresentados: a frmula do desvio1111.<11',10 da mdia, a distribuio da mdia amostral e sua distribuio li, 1111'1 llliladapelo desvio-padro. ( :ollsideremos que a varivel aleatria nvel da hemoglobina em IlIIJill()I'{)S jovens gozando de boa sade tenha distribuio gaussiana ,'llIll 11I{)dia12 e desvio-padro 1. Vamos tirar sucessivas amostras de 1IIIIIallllo G desta populao e para cada amostra, calcular sua mdia. 1'lira !l() ]'(;peties, obtivemos os resultados da Tabela 7.1.

Os dois primeiros resultados que devemos explicar referem-s{) 1l.I)S valores tericos da mdia e do desvio-padro d~populao de m{)<! ias, uma amostra da qual est apresentada na ltima coluna da 'T'aIHdIl 7.1.

'111

s(~ja, quej-; desvio-padl,'~,~ da lndia {~dado pelo desvio-padro poplllao diVIdido por.j0,i

da

Note o leitor que o desvio-padro da mdia, tambm chamado de padro, sempre menor que o desvio-padro da popula{:iio para n:~ 2. Intuitivamente este rmultado esperado j que a mdia de um cOlljunto de valores, de uma mesma popula{Jio, deve variar menos que 'JS prprios valores. Alnr disso, o desvio-padro da mdia diminue :\ Ilwdida que cresce o tamanho da amostra, mais precisamente 1It<~didaque cresce a raiz quadrada do tamanho da amostra. Neste exemplo deveramos obter ~ = 0,41. A diferena entre o valor terico de 0,41 e o valor observado de 0,359 advm do fato de ,'sl,annos usando uma amostra de tamanho 50. O segundo resultado, Teor-enw, CentTal do Limite, diz que a mdia L,~11l aproximadamente distribuio gaussiana centrada na mdia da populao e desvio-padro dado pela expresso (7.7), isto ,
("no

7.3

Medida do efeito: resposta contnua

() histograma da Figura 7.1 sugere a validade terica deste resultado. Repetindo o processo de gerao de mdias para 1.000 amostras, (>I JI,(!mosa Figura 7.2, cujo aspecto gaussiano mais claro. () terceiro resultado devido a W. Cosset que descobriu, no pri llcpio do sculo, que a razo

o objetivo desta seiio mostrar como o efeito pode ser estilllll.<lo a partir dos dados e como deve ser tratada a questo da variabili<lll.ll,' desta estimativa para os dois tipos de coleta de dados: anJ(lsl,rll.H emparelhadas e independentes. Consideremos uma situao em que os pacientes do estudo (!HI,IIII divididos em dois grupos e a resposta de interesse contnua. 11111 exemplo tpico um ensaio clnico para verificar se uma droga 1,('111 efeito hipotensor. Nesta circunstncia, o comportamento global ('111 cada grupo sintetizado pela mdia aritmtica dos valores da varifv(.1 resposta. O efeito da inter-veno definido como a difen~1i<:a <1":1 mdias das respostas dos pacientes nos dois grupos.

f f

1"111 distribuio que no depende de 1-" e 1T2, mas apenas do tamanho /11 alllostra. Produziu as primeiras tabelas para esta nova distribuio 111" rl!(:( ~beu o nome de t de St'Udent, pseudmino utilizado por Cosset I':lra plIl llicao do resultado.

A varivel resposta denotada por Xl e X2 , respectivalli<'III", para os dois grupos a serem comparados. Os dados so paJ'(~s <I,' observaes: (xn, X12), (X21, X22), ... , (Xnl, Xn2)' bastant{~ illl,11 i Li vo pensar que o efeito de interveno para cada par medido p,!Ias diferenas dI = Xn - X12, d2 = X2l - X22, ... , dn = Xnl - :I:n'2 ,~ '1111' a estimativa do efeito 1-"1 - f-L2 = /"d dada por

()I>tida esta estimativa, (~nal,lu';11 I)(Tgllutar-r:(~ r:oln'() a variabilillal!() associada a este valor. A rcsposta {~dad, pc10 '!J;CTVlr,/O dc jr!'lIjr:n:o., que neste car:o {~ Este intervalo nos d uma boa representao da variabilidade com que conseguimos medir o efeito hipotensor do timolol. Podemos afirmar com 95% de confiana que o timolol reduz a presso ocular por uma quantidade que varia de 0,4 mmHg a 4,8 mmHg. A no incluso do zero no intervalo indica, ao nvel de confiana de 95%, a existncia do efeito, mesmo resultado que obteramos atravs do uso do teste t para dados pareados, descrito no Captulo 6.

/,* / o percentil ele ordeul ] - 1\'/'2 ela (.lis. t.ribui()io t com l-c> 2 1'[ . 1 ' graus 1 de liberdade c -"ri () o desvio-padriio ( as ( 1 'ereue{as, lS',0 e~,

I;(d;-JY
n~l

II;Ulestudo realizado no Hospital Si"l,o Geraldo da UFMG, CronemI)(~I')', 81; Calixto (1991)estudaram a capacidade de reduo da presso i I ill'aocular das drogas timolol, bctaxolol e levobunolol. Para isto, IIII~elicaram 10 pacientes com as trs drogas e compararam os resultaIII Ir:com aqueles obtidor: quando os pacientes receberam um placebo. I\s Ilwdidas da presso intraocular, expressas em mmHg, obtida s li I,mas da manh com os pacientes usando timolol e placebo so ai 11'1)sclltadasna Tabela 7.2.

muito comum em ensaios clnicos a necessidade de realizar comparaes entre grupos independentes de pacientes. Chamando as observaes do primeiro grupo de Xll, ... , :rn1l, e as do segundo X12, ... , Xn22, a estimativa do efeito dada por

Corno no caso anterior, este valor apenas a estimativa do verdadeiro valor do efeito lil - /-"2' No Captulo 6 usamos o seguinte resultado demonstrado pela Teoria Estatstica:

I)Iacebo 'I'irnolol 1';Feito

22 18 -4

25 20 -5

23 20 -3

18 17 -1

24 16 -8

24 20 -4

17 20 3

23 20 -3

22 20 -2

23 24 1

1)1)1' exemplo, o efeito do timolol para O' primeiro paciente foi de I' a presso ocular em 4 mmHg. Para descrever o efeito global 11,,:: I() pacientes considerados, usamoscI, a mdia do efeito em cada 11111 clllr: 10 pares. Neste caso II = -2,6 m:mHg urna estimativa cl" dl,it,o hipotensor do timolol, ou seja, esses 10 pacientes fornecem I'Vil\I'I\l:iar: de que o timolol diminui a presso ocular em 2,6 mmHg. 1\ \{~lll disso, Sd = 3,098, = 0,98,t* = 2,262.Assim, o intervalo
11'1

IIII'.j

.fi;,

111'

l'llulialll;a com nvel de 95% para o efeito hipotensor

do timolol

Obtendo da tabela da distribuio t com nl + liberdade um nmero t* tal que Pr [-t* :::;tn1+n2-2 onde 1 - o: o nvel de confiana escolhido.

n2 -

2 graus de

:::; t*]

1 - 0:,

Exposto Um exemplo ilustra que os clculos neccssrios que so razoavel111(~lltc simples. Present(~ Auscnte Total
pPl
p(Jl

Fator No-exposto

qPo
q(J()

1)

Total PP1 + qPo p(Jl + qQo 1

Utilizando os dados obtidos no Exemplo 6.9 do Captulo 6, podeIIIOSobter uma estimativa do efeito da tianeptina ao fim de 42 dias
(I( ~
\lSO.

Grupo placebo Grupo tianeptina

TI'1

'17.2

15 = 16
=

:[;1 :[;2

= 20,53
= 11,37

sl=11,09 S2 = 7,26

Presente Ausente Total

Fator Exposto No-exposto 0,08 0,06 0,32 0,54 0,4 0,6

Total 0,14 0,86


1

(20,53 - 11,37) ,(2, 0452)(9, 31)1 ]~'i+ 116 = ID, 16 - 6,84; 9, 16 + 6,84] = [2,32 ; 16,00] Ou seja, a tianeptina tem claro efeito, ainda que medido com 1',I':uldcvariabilidade, neste ensaio clnico.

Em um estudo de coortes, as propores p e q = 1 - p indicam simplesmente o tamanho relativo das coortes do estudo. Entre os pacientes e:;;postos P1 a proporo dos que desenvolveram a doena e Po a propor({o anloga entre os pacientes no e:EpostoS. Os dados amostrais, em estudos tipo caso-controle e de coorte, so usualmente apresentados como na Tabela 7.5. Tabela coorte 7.5: Freqncias observadas em estudos caso-controle ou

varivel resposta pode ser dicotmica em qualquer tipo de esLII"Oclnico. No entanto, o tipo padro de resposta em estudos tipo (':I:I() controle e em muitos estudos de coorte. Tabela 7.3 apresenta, neste caso, as prop.Qres dos pacientes !spolldentes a cada possvel classificao. Para exemplificar, vaIliI):-;SIIJH)rque P1 = 0,20, Po = 0,10 e p = 0,4. Obtemos a disLlilllli({<l.o da Tabela 7.4.

('( )1'1'(

Presente Ausente Total

Fator Presente Ausente a b c d a+c b+d

Total a+b c+d N

No est,ydo de coorte {~lmstaut,e uatnral p{~llSar na razi'io de PI e de efeito da exposil}w ao fateil Esta raCo recebe (J l!ollW de risco r'C1ati'U(), ser denotada por RR e definida por
I

il, como~edida

de quem tomava aspirina regularmente i' [)!)% do l'isCII c!O",/ que niio o faCiarn.ou ainda, o risco de quem no toma a dmga (! 1,00 vezes maior do qlH~ o dos usurios.

o risco

risco relativo , ,natu:'almel1t(), estimado propores amostrais P1 e p().


fi
_1 ,

pela razo das duas

R'R ..

_1_'.
o-+r:

-RI

li Ii+d

\)

() leitor deve se lernbrar de que um ensaio clnico pode ser visto 1:111110 um estudo de coortes, em que os grupos foram criados atravs de alocao aleatria de pacientes aos grupos. Portanto, o risco relativo Il(l(l{~ ser calculado para ensaios clnicos.

rdativo, embora seja uma medida de efeito COUl 1I1IIiLaH qualidades, tem uma grande limitao: po p{)de SE)!: estimado I!111 ~--.-r'. ,estulo ..de caso-controle, forma mais freqente de estudo cOlll(araLI :;.-Isto porque, neste tipo de estudo, as incidncias observadas Si\1 I meras conseqncias do nmero escolhido de casos e control{!s I! Ilao caractersticas dos grupos em estudo. Por isto, buscaram-se nli\.Il<!irw-i alternativas para se definir o efeito da exposio de forma adl!(Jllada a todos os estudos epidemiolgicos. A soluo encontrada Foi II IIHI I de uma medida denominada mziio da8 chances. Define-se chance de se desenvolver a doena entre os (!X Ili IHL{ lil como f:[; e entre os no expostos como ~~. Portanto, a 'I'IL".rl.O d(/,,~ chances :
. > ,<, .. ,," ..... _. -... ' .....

o .,risco

Com o objetivo de testar se 325 mg de aspirina (65% de um compriluido usual que de 0,5 g), ingeridas em dias alternados, reduzem a 111I1I'Lalidade devida a doenas cardiovasculares, um ensaio clnico conLl'Illado, duplo-cego, envolveu um total de 22.071 mdicos americanos, 1'0111 idades entre 40 e 84 anos, que no tinham histria de infarto IIlI Illiocrdio, acidente vascular celebral (AVC) ou ataque isqumico Lr:lllsitrio, no usavam regularmente aspirina e nem apresentavam {'IJliI.ra-indicaes ao seu uso. Destes, 11.037 receberam aspirina ativa (' II.m4, placebo. O experimento teve incio em 1982 com os resultadll,L:liuais publicados pelo Steering Commitee of Physicians' Healthy (,"'OUI) (!m 1989. Durante o tempo de seguimento (mdia de 57 meses), 1{IIalllobservados 139 infartos no grupo que tomava aspirina e 239 no ",I'IIJ I placebo. Assim, P1 = = 0,013 e Po = = 0,022. "III'l.anto, uma estimativa do risco relativo :
I(

Este o parmetro estimado por

de interesse para anlise de tabelas ~ :x :2 I'

I'

a./(a+c)

1/) =

c/(a+c) b/(b+d) d/(b+d)

Por razes tericas a variao de 'V) mais facilmentl! calt:l 11111 111 na escala logartmica. Vale o seguinte resultado , 1 1 1 1

li67

li6~4

Var[ln

1/)] = - + - + - + a b
c

, RR

---ci2? O, ~

0,013

= 0,59

1
====? -,-

RR,

= O 013 = 1,69

0,022

Como ln ~ tem aproximadamente distribuio gaussiaua 1:1111.'11.1'111 mos intervalos de confiana para In'V) da mesma forma da SI!I:all1111 terior, isto ,

cli Id(~z* o percentil obtido de uma tabela da gaussiana padro tal clll<~ PT[-Z* < Z < z*] = 1 - Ct e Vo,'I'[lIl'J}] dada por 7.20. Considerando que as probabilidades associadas aos valores 0,01 e (), OS, correspondendo a um nvel de confianc;a ele 99% e 95%, tomados fJ'(lqentemente como referncia, temos z* igual a 2,33 e 1,9G. Se este intervalo contm o nmero zero (correspondendo ao valor I para a razo de chances) entiio a associc:tl,oentre a doena e o fator nl.o estatisticamente significativa. Para obter o intervalo de confiana para 4} basta exponenciar os liluites inferior e superior do intervalo (7.21), isto , [ 'l
i;

Conseqiientem(mte, o risco relativo, aproximado pda l'ay,/I,( I (11lH chanccs, pode ser estirnado diretamente de um estudo tiJlcI c'n:,( I controle, ainda qu<~ esta razo no fornea nenhuma informa(,:1< I s(1111'(' o valor absoluto das taxas de incidncia (Po e Pl) nos grupos ('XJlll:1 tos c no-expostos, Esta uma forte justificativa para o uso da l'aY,i!C das chanccs como medida de efeito quando a varivel resposta (~cii cotmica. Para se apreciar completamente a importncia deste resul tadc I, alguns outros fatos so necessrios. O leitor interessado cOllvidacic I a consultar Breslow e Day (1980), um livro clssico da rea. Em estudos pareados com resposta clicotmica possvd (~stjlllnl' a razo das chances. A forma mais simples de se fazer isto, entl'dalll.c I, via a combinao de tabelas 2 x 2 (Fleiss, 1981).
I

Dois motivos concorrem para adoo da razo das chances como a forma de se medir associao entre fator de risco e doena, como discutido a seguir. Usualmente as doenas so raras, isto , P1 e Po so pequenos (~portanto Ql = Qo .~ 1. Nesta situao, 4) = ~l = RR. Noutras (9 " . IlaIavras, \I2a,radoenas raras, a razao das chances e proxlma do nsco I'lli:l.tivoe pode portanto ser interpretada da mesma manir:\ O segundo motivo que .) pode ser estimado com dado-;"de qual(11 I(lrtipo de estudo. Esta segunda vantagem foi percebida e divulgada JlI)[Cornfield (1956), em um artigo fundamental para a epidemiologia IlIoderna. A seguir apresentamos uma justificativa intuitiva para este :sllltado. Considerando a Tabela 7.3 como proveniente de um estudo casoc'cli It1'ole, temos que
1'(

Para verificar se o fato de ter sido amamentado pela IlIac~(. 11111 fator de proteo para o cncer de mama, Freudenheim 01. aI. (I !l!),I) realizaram estudo do tipo caso-controle nos condados de El'i(: (' Nil" gara situados na parte oeste do estado de Nova York (EUA). As pacientes tomadas como controle foram escolhidas lia JlC I1 111 lao da regio, no havendo emparelhamento. Os dados lllll.icic 1:1 esto apresentados na Tabela 7.6.

Pl

= Pr[exposio I caso] = -P--P


1

pH

+ qPo

Casos Controles

Amamentao Sim No 353 175 449 153

Po

= PT[exposio I controle] = Q PQl Q


P l+q

O risco de desenvolver cncer de mama entre mulher<~salllalllc'lI tadas pela me, aproximado pela razo de chances, estillladll Jl11I (353)(153) , (175)(449) =0,69

Pl/ql po/qO

= PlqO = P1Qo
POql POQl

='ljJ

4)=

ou seja, nominalnwni;(), o risco do grupo anmuwntado apenas 69% do risco do grupo no amarnentado. Para obtermos um intervalo de confiana para '1/) temos que calcular:

Tabela 7.7: Freqncias e riscos relativos referentes a infarto do miocrdio (1M) e acidente vascular cerebral (AVC) nos grupos que receberam aspirina ou placebo Resultados finais 1M Fatal No fatal Total AVC Fatal No fatal Total Grupo Aspirina Placebo Risco relativo LC. para RR

(RR)
0,34 0,59 0,56

(95%)
0,15 - 0,75 0,47 - 0,74 0,45 - 0,70

, 1 Vel'/'[ln"/;] - , y - 353

+++175 449 153 -

O 02 ,

ou seja, a estimativa do desvio-padro de ln ,)) y',02 = 0,14. Um intervalo de 95% de confiam:a para ln'l/) portanto

10 129 139

26 213 239

9 110 119

1,51 1,20 1,22

0,54 - 4,28 0,91 - 1,59 0,92 - 1,60

intervalo para '1/) ento obtido tomando-se a exponencial dos limites inferior e superior deste intervalo, ou seja, [0,53 ; 0,90], indicando uma associao significativa entre ter sido amamentada e cncer de mama. Esse resultado deve ser interpretado com cuidado, uma vez que no foram considerados fatores importantes, como histria familiar e idade na primeira gestao. De fato, ao ajustar o modelo incorporando essas variveis, a associao deixou de ser significativa.

7.5

Exemplo comentado: Desnutrio hospitalar

Os resultados finais do ensaio clnico sobre a eficcia da aspirina lia preveno de doenas coronarianas, so dados pela Tabela 7.7. N(~sta tabela a estimativa do risco relativo e intervalo de confiana fo!'am obtidos por mtodos, no descritos aqui, que consideram o L(~IIJpo de acompanhamento de cada indivduo. Quem tomou aspirina teve uma reduo de 44% na chance de Ln!'infarto do miocrdio (fatal e no fatal) em relao ao grupo que IIHOj;omou. Este resultado estatisticamente significativo j que o iIIL(~I'Valo de confiana no contem o valor 1. Quanto ao AVC (fatal (' lIao fatal), quem tomou aspirina teve sua chance aumentada de :2~(X" mn relao ~os que no receberam a aspirina. Este valor no , ('11 L I'danto, estatisticamente significativo.

A desnutrio, um estado mrbido secundrio a uma deficincia ou excesso, relativo ou absoluto, de um ou mais nutrientes tem alta prevalncia em pacientes internados, especialmente cirrgicos. Pode relacionar-se doena de base (cncer, A1DS e doenas inflamatrias intestinais, dentre tantas outras), a componente iatrognico (jejum prolongado para realizao de propedutica, por exemplo) e tambm a alteraes metablicas induzidas no trauma operatrio. Pacientes cirrgicos desnutridos tm maior incidncia de complicaes e ndices superiores de mortalidade. Na avaliao do estado nutricional podem ser empregadas vrias abordagens. So utilizadas, por exemplo, avaliao subjetiva global (histria clnica completa), medidas de dados antropomtricos (peso, altura, ndice de massa corporal: 1MC = pesojaltura2 , medida do pregas cutneas), anlises bioqumicas (contagem total de linfcitos e albumina) e resposta a testes de sensibilidade cutnea. Correia (1997) estudou pacientes do Sistema nico do Sade COlll idade superior a 18 anos, internados em 25 hospitais da rndn PI'lhli<:lI.,

cOJlveniados, filantrpicos c llllivcrsitrios d(~ 12 cstados do Brasil e do Distrito Federal entrc maio (~uovClJlln'o dc 19()6. Neste estudo, que rccebcu a d(~llOmilla(Jio IllqU{~Iito Brasilciro dc N \I tric:o (IBRANUTIU), foralll lcIndos 4000 casos, 2072 clnicos c I!)2H cirrgicos. Dos paci<~nt<~s cin'lrgicos, :W4 referiam-se a cirurgias do aparelho digestivo (~hrnias da lmr(~( l(~abdominaL A Tabela 7.8 evidencia o (~stado nutricional de toda a amostra do (!sLudo, dos pacientes cirrgicos (~dos pacieltl.es sulmwtidos a cirurgias do aparelho digestivo (~hrnias da pared(~ abdominal. Tabela 7.8: Distribui(Jio do estado nutricional dc todos os pacientes do IBRANUTRI e dos pacicIJt(~s cirrgicos dcstacando-se os submdidos a cirurgias do aparelho dig(~stivo c hrnias da parede abdominal :AD+HPA) Tipo dc Cirurgia Geral CAD+ HP A 1233 (64,0%) 188 (45%) 1407 (35,2%) 498 (12,4%) 34 (0,8%) 4000 (100%) 543 (28,2%) . 140 (7,3%) 12 (0,6%) 1928 (100%) 135 (36%) 71 (19%)

Tabela 7.(): submdidos dominal, a intervalo de

Distrilmi<.;o para algumas caractersticas di! plldc'llll'H a cirurgias do apclrelho digestivo e hrnias da pal'l ,di' 1111 estimativa para a razo de chances (1/)) (! o 1'1 !~q -Li "" ()5% de confiam:a
li 'I

Nutrido Desnutrido moderado grave Scm diagnstico 'rotal

Caracterstica dos pacientes Idade > GO anos :s; 00 anos Cncer Sim No Infeco Sim No Internao 2: 8 dias < 8 dias

Pacientes Desnlltridos Nutridos 85 (64,41/(',) 121 (50%) 116 (85,5%) 90 (38,3%) 92 (61,7%) 114 (50,7%) 114 (69,9%) 92 (43,6%) 47 (35,6%) 121 (50%) 23 (16,6%) 145 (61,7%) 57 (31,1%) 111 (49,3%) 49 (30,1%) 119 (56,4%)

-J)

Te

I>al'al/' (%IX,)

1,81

1,14 - 2,S'I

8,13

4,70 .. ' liI,I'1

1,57

I ,O I

'. ~,I ri

2,73

I ,(,li

1':1 I

A Tabela 7.9 mostra a distribuic:o para algumas caractersticas 11I >spacientes submetidos a cirurgias do aparelho digestivo e hrnias lia parede abdominal, a estimativa para a razo de chances e o resI !ctivo intervalo de confiana. Estimou-se que pacientes portadores de neoplasias malignas tm 11111 risco de desnutrio cerca de 8 vezes maior do que os no portali I

II )['(~s.

Pacientes internados por um perodo superior a 7 dias (2: 8 dias) apn~sentaram uma chance de desnutrio 2,73 vezes maior do que aqlldcs internados h menos tempo.

De acordo com a conveno cientfica, um achado {~1!~,L:il:iIlill mente significante se o valor-p menor que um ponto d(~cOI'LI'(1',1'1111 mente 0,05). Por outro lado,fllm resultado clinicament(~ llll III.:lliI,' Ise o intervalo de confiana para o parmetro de intcl'!!ssl! dirl'lI' d" valor especificado na hiptese nula por uma quantidadc (:oll~;dl'I:ldll clinicamente relevanti] A Figura 7.3 ilustra os tipos diferentes de resultados lia ~;iLII:U:IIO em que a inexistncia de efeito corresponde ao valor ~(!1'Ilc' 1'111 '1111' W a quantidade considerada clinicament. e importanLI!. ITlllillldo o intervalo de confiana re.presentad ..~"~,, elo se.gmcnto.d(! nA"_ illl'llIi 'I zero, cu:.esultad--Uo.bignifi9clltEl.~e o efeito esti I nado (, i11 r,'Iilll 11 W, o efeito no considerado clinTcamente importall~
li

['3tathlicaJTI8nte no significant8 F'V3",velnlonle Impoltante Estatisticamente slglllflcelnte F'os~:)ivolnvjnt8 inlportante Estali "li carnente si gnifi ca nle Impolt81lte Estatisticamente f\I;]O ImpOltante Estatisticamente I'.lo Importante; no significante

a rmlao de /;a:J:O,,~ dn incidncia da doena. Neste ca:-:o, d ividl' ~~I'I I nmero dn dOI~ute:-: pc10 n1m(~rototal de unidades de tmllpo 1'111 li"l' foram acompanhal [0:-:. Alternativamente usam-se modelo:-: (~:-:l.aU~iI, il'I ,: i para o tempo de acolllpanhamento, ou sobrevivncia (1<1(~ildlalllll, 1995).

signlflcante

No h con:-:enso em como traduzir o termo odds-ratio. Pl'<J(~ri1111 ,:I o nome Taziio das cha'nccs qun criticado porque a palavra dlalll'l' est mais relacionada com probabilidade, conceito diferente daI 11 li011' captado pela palavra odds. Optamo:-: por criar um novo sentido parI! a palavra chance ao invs de criar um neologismo, corno d(J(~11I1 id,) por aqueles que usam termos corno r'(J,ziio de odds. n SIg-

1,'i)',lII'a7.3: Esquema Ililidl.Jlcia clnica

ilustrativo

da signihcncia

estatstica

7.(j.2

Equivalncia entre teste de hipteses e intervalo de confianq

i)o Centro

I';xiste equivalncia entre teste de hipteses bilaterais e intervalo ,li' confiana. (Pode-se entender que o intervalo de ~onfiana en~loba Il,c;valores plausveis do parmetro para um determmado coefiCIente, I111(' {~o complemento do nvel de significncia., Assim, se o intervalo d" I:()llfiana contem o valor especificado na hiptese nula, no se 1'1 '.i I'iI.a a hiptese. I '01' exemplo, baseados no intervalo de confiana para a razo di' I'!tarlces ('IjJ) do Exemplo 7.6, podemos testar as hipteses Ho: 1/' I versus H1: 4) # 1. Como o intervalo de 95% de confiana ."d,illl) , [O 90] , -no contem o valor 1, no se reJ'eita Ho ao nvel , 530 " di' :-:igllificncia de 5%.

de Acompanhamento Pr-Natal, para dnpI'lldl'III.I':i ;/ de drogas qumicas, da Escola de Medicina da Univ(~l':-:i<1:)( li' di' Northwestern - Chicago acompanhou a gravidez de 55 111111111'1'1':1 dependentes de cocana. Destas, apesar de todo o 1~:-:r()J\'1 I IIiI centro, apenas 19 conseguiram parar de usar a droga <1111':1111." o 1- trimestre. A tabela abaixo apresenta os resulta<1o:-: do:: pesos dos recm-nascidos do grupo 1, filhos de mes qlll~ II:-:al'alll cocana apenas no 1!2. trimestre de gravidez, e do grul)() ~, IiII1I li i de mes que usaram cocana durante toda a gravidny.. Informao Tamanho da amostra Mdia (g) Desvio-padro (g) Grupo 1 Grupo :2 36

19
3160 453

2829
70S

Na:-::-:ees anteriores, ao tratar do estudo de coorte, assumimos '1111'I.alll.o os pacientes do grupo exposto quanto os do grupo no "X Ili1:-:1.0 foram acompanhados durante o mesmo perodo de tempo. I:d,l1 ,', 11 mi:-:a exceo do que a regra e portanto, para se descrever " ri::cII rc1ativo em estudo de coortes usa-se muito freqentemente

(a) Faa o teste estatstico adequado para verificar a 11 ip{d,I'::I' de que os filhos de mes que usaram cocana dlll'alll.l' 1.11 da a gravidez trn peso ao nascer diferente do:-: fi1111 I:: di' mes que usaram cocana apenas no primeiro tl'illll"c;l.l'l'111' gravidez.

(I

Estime o efeito da cocana no P(~sOdos ]:eul-Imscidos (; construa o respectivo inj,(~rvatode cOIlfiaw;a. C0111erL!;c os resultados.

(a) Para as lllullwn~s C01nidade entre 40 e 50 anos verifiqn(~, usando o test(~,uleqwHto, s(~ter sido amamentada pela m(~ (~fator de proLe()'i.opara o cnc(~rde rnama. Use cy = 0,05. (b) Determine, C01]l a pn~cisil.opermitida pela tabela, o valor-p associado ao teste ft~ito mu (a). InLerprete este valor. (c) Para as mulheres com utais (k GO anos, calcule o efeito da mnaruentaJ;o com leite materno e o respectivo intervalo de 9G(l() de confialll;a. Interprete or; resultados. 4. Segundo Grady et aI. (1986), a probabilidade de uma mulher casada experimentar uma gravidez indesejada durante o primeiro ano de uso de um dos seguintes mtodos de contracepo estimada por: Mtodo de contracepo Nenhum Diafragma Preservativo DIU Plula Pro babilidade de gravidez 0,431 0,149 0,106 0,071 0,037

;~. 'I 'I'inta pacientes

com nwlauO]lm foram acompanhados at a Illmte pelo Centro de Ci(~llciasda Sad(~ d(~Oklahoma. O objetivo era comparar a imuIloterapia C. Parvum (md;odo IlOVO) (:OIU o BCG (mtodo padril.o) ql1alJto a sna capacidade de prolongar o tempo de sobn)Viv(~llcin, e o tempo de remissiio de inti ivduos com a doen(;a. Os telnpos de remisso (; de sobrevida (~Ill meses observados por Calvet(~ (lm';(j) estil.o sintetizados na. Labela abaixo. Tempo de remissil.o BCG C. Parvum 11 19 13,73 11,53 12,11 7,43 Tempo de sobrevivncia BCG C. Parvum 11 19 17,18 14,26 10,20 6,82

:r
8

(a) Escreva em notailo estatstica as hipteses relevantes. (b) Faa os respectivos testes de hiptese. (c) Determine, na preciso possvel da tabela do texto, a probabilidade de significncia. (d) Determine o efeito do mtodo novo. :1. Freudenheim et aI. (1994) publicaram um estudo sobre a in11 nncia da amament,v;il.o com leite materno no desenvolvimenh l, anos depois, de cncer de mama. () estudo foi feito no formaL()de caso-controle. Os casos forarn todos recm-diagnosticados (' os controles escolhidos na mesma faixa etria e residentes no 111(~Smo local dos casos. A tabela fornece alguns resultados para as pacientes que ainda no tinham entrado na menopausa. Casos Amamentao Sim No 40-50 >50 Controles Amamentao Sim No 124 94

Para cada mtodo listado, calcular o risco de gravidez para mulheres usando o mtodo comparado com o de mulheres no utilizando nenhum tipo de contracepo. Interprete e compare os resultados obtidos. 5. A deficincia de vitamina A, reconhecida por suas complicaes oculares, tem mostrado efeitos sistmicos que contribuem para aumento de mortalidade e morbidade. O sarampo continua sendo uma das doenas infecciosas mais graves em comunidades pobres, e para verificar se a suplementao de vitamina A reduz a morbidade dessa enfermidade, Coutsoudis et aI. (1991) conduziram um estudo na frica do Sul. Sessenta crianas de baixas condies scio-econmicas (idade entre 4 e 24 meses) com sarampo e complicaes (pneumonia e diarria grave), admitidas no King Edwoxd VIII H08Vita1 em

96 16

108 9

20

])urban foram aleatorianwntc (lividi(tas mn dois grupos. Ambos receberam terapia [mdrilo (antibi()ticos, antipirticos c rehidratao oral) e monitoramento pata as condi(~es apresenbulas. O grupo experimental recebeu vitamina A em dose recomendada pela ()rgani~(1(;i:;'o Mundial ele Sade, enquanto o controle recebeu placebo. Vitamina A e placebo foram aelmiuistrados pela meSlna pessoa na adrnisso e nos dias 2 e 8 (estudo duplo-cego). Nilo s(; conhecia o estado nutricional prvio (tas crianas, IIlas nenhuIlla deIllonstrou sinais de deficincia de vitamina A que exigisse cuidados. A tabela a seguir mostra alguns resultados para as seguintes variveis de interesse obtidas a partir do acompanhamento das crianas: XI- dunt(~o de pneumonia clnica (dias); X2 _durao da diarria (dias); X:3- ganho de peso aps 6 semanas (Kg) X4 _ ganho de peso aps 6 meses (Kg). Varivel Placebo 5,70 0,79 (1l=31) 4,50, 0,35 (1l=31) 0,90 0,14 (1l=24) 2,37 0,20 (n=16) Vitamina A 3,80 O,40 (n=29) 3,20 0,71 (n=29) 1,29 0,31 (n=24) 2,89 0,23 (1l=20) Valor-p 0,04

N!.!. elo Paciente 1 2


d
')

4 G 6 7 8 9 10 11 12 13 14 15 16 17 18

Pr8ssiiosangneH, repouso ex()rccio 190 17G 140 160 22G 140 190 148 232 lG4 170 140 200 170 190 158 185 175 140 170 166 154 174 150 144 132 214 178 154 122 150 128 218 160 172 125

N!.!. elo Presso sangnea Paciente; repouso exerccio 186 120 19 150 180 20 162 194 21 172 204 22 220 178 23 220 24 168 168 25 134 180 26 154 220 130 27 120 146 28 214 160 29 160 160 30 170 150 31 204 32 170 162 122 d0 220 180 34 140 190 35
') ')

XI
X2

X3 X4

(a) Calcule o valor-p para as demais variveis e verifique se existe diferena significativa entre os dois grupos. (b) Estime o efeito da vitamina A com seu respectivo intervalo de 95% de confiana. li. Trinta e cinco pacientes com doena arterial coronariana, de idade entre 35 e 75 anos, foram submetidos a teste ergomtrico (Miller et a1" 1990). Os estudos realizaram-se em bicicleta ergomtrica, com os exerccios continuando at angina ou fadiga que requeresse a suspenso da atividade. O tempo mdio de durao do exerccio foi 716 s, desvio-padro 437 s, variando (1e 240 a 1845 s. A tabela abaixo mostra a presso sangunea sistlica em mmHg dos indivduos em repouso e no pico do exerccio. Calcule o efeito do exerccio sobre a presso sistlica (tos participantes da pesquisa e o intervalo de confiana corresltlelente.
1)(

7. Um dos objetivos da pesquisa descrita no exerccio 19 do Captulo 4 era averiguar a associao de alguns fatores de risco para hemorragia ped-intraventricular (HPIV). A partir dos dados da tabela a seguir, estime o risco (odds mt'io) associado a peso ao nascer inferior a 1500 g e seu respectivo intervalo de confiana. HPIV Peso (g) 1500 1500-2000 15 24 49 32 64 56

<
Presente Ausente Total

Total 39 81 120

8. Baseado nos dados do Exemplo 6.12 do Captulo 6, estime a reduo no nvel de colesterol proporcionado pelo programa de exerccios fsicos. Contrua o intervalo de confiana'e interprete.

---

:r

Apndice A

1 2
')

1 0,3Gi-l

2 0,135

2,5 0,0i-l2

')

d,iJ

') r:

8 0,000 0,003 0,011 0,029 0,057 0,092 0,122 0,140 0,140 0,124 0,099

Tabelas

4 5 G 7

O,:3G8 0,271 0,205 0,1i-l4 0,271 0,257 O,OGJ 0,1 i-lO 0,214 0,015 0,090 0,134 0,003 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,03G 0,012 0,003 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,067 0,028 0,010 0,003 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 (1,000 0,000 0,000 0,000 0,000 0,000

0,050 O,14!J 0,224 0,224 O,lGi-l 0,101 0,050 0,022 0,008 0,003 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

o,mo

0,007 O,1OG 0,034 0,185 0,084 O,21G 0,14

10 O,l)()( ) 0,000 0,00:2 O,OOH 0,0 I !) O,o:IH O,O(i:1 O,O!lO O,1J :1 0,12:, 0,125 0,]1;/ 0,0% 0,07:1 0,052 0,035 0,013 0,022 0,01:3 0,007 O,O(}!I 0,002 0,001

O,1i-l9 0,175 0,175 0,132 0,077 0,039 0,017 0,007 0,002 0,001 0,000 0,000 0,000 0,000 0,000 O,OOlJ 0,000 0,000 0,000 0,000 0,000 0,146 0,104 0,065 0,036 0,018 0,008 0,003 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

8
9 10
Linha Coluna

1
1 2 :l ti
!

2 5245 5866 3016 5876 3748 5300 1480 5493 8490 7471 1914 2794 8528 4827 8725 3274 4679 1830

3 2410 7747 3052 8380 8135 4649 4225 9353 9043 2884 3103 6221 5328 2277 4141 4461 2700 6496

6 2375 6931 6860 3572 1781 6549 6691 3120 3741 5732 7273 4040 7935 7892 1833 5000 7035 4001

7 9430 8586 5981 7010 8599 7223

8 7560 1494 9052

9 9704 2947 6540 6023 6241 7176 9680 5634 7843 9370 3771 7905 5280 4700 4482 5006 3260 1600

6640 9199 7572 6003 5232 6122 4747 9195 2256 2803 1616 4290 2848 4030 2950 6707 1762 6170

(i

7
N

!)

10
I1 12 1:;
Irl

5920 0305 8516 2002 9135 7907 7513 5443 2.104 1983 6540 6961 4401 6765 9430 6236 1055 6528 4722 7652 5856 1470 8280 5200 2664 4510 50lH 3611 5435 1729 1027 1227 5879 5601 9674 6020

11 12 13 14 ]5 16 17 18 ]9 20 21 22

o,on
0,048 0,030 0,017 0,009 0,005 0,007 0,002 0,001 0,000 0,000 0,000

5784 2345 1633 C~?) 6770 2689 5482 1500 3608 3118 5662 8376 6008 9752 2646 8270 2606 3150 3305 8479 4539 9831 6564 8875 1132 1836 4448

Exemplo: Pr(X

= ]) = O, 149 para

=3

Ir,
Ili

17
I~

Tabela A3: Distribui8,o gaussiaua para valon~s negativos: Pr(X :; :1:)

\ Tabela A;~: Distribui(;8,o gaussiana para valores posit.ivos: p,. (X :; :1:) (continuao)

:r,

S(~gll11daC<\.Ha

d()cillUl.l

d(l

;1:

a;

Sq"Illl<ln cnsn decimal de x


'"~-

O -2,!) -2,13 -2,7 -2,


-2,S

1 00llS 002;' OO:;il 004::; OOGO OOi)O OllJ4 OJ:;G 0174 0222 02i)1 03::;1 O'];)G O:J:J7 O::;::; 07!J:l 0%] 113] 133::; 1::;G2 181'] 20!)O 2;)8D 270!) 3050 340!) 378;) 41l) 45G2 4D(;O

2 OO.!K 002il OO:!:1 004il OO;,!) 007K 0]02 01:;2 0170 02]7 027,] O:l']i/ (H27 ,0::;2(, Oi/:; 077,~ OU:;,] 1112 1314 15:;!) 17138 20GI 2:;58 2G7G 3015 3372 :J745 412!) '1522 '1!)20

:1 0017 002:1 00:12 004:, 00;'7 007:, 0000 0]20 O]GG 02]2 02(ji) O:;:; (J,I]i) O:Jl(; OG:W 07G'1 O!H8 lO!):; 12!)2 1:J15 17G2 20:;3 2:;27 2G4:; 2!)81 :;:;:;G 3707 40!)O '1,]8;) '1I:l80

,I OOl(i 002:1 00:11 0041 00;';' 007:! OOO 0]2;' OJ(i2 0207 02G2 O:;2!) 040') O;,O~ OG1i) 074'J O!)O1 107::; 1271 Ji!!)2 173G 2005 220G 211 2!)4G 3:WO 3GG'J 'lO:J2 '14'1:; '1I:l40

;, OOl(i 0022 OO:W O(j,(O 00;',] 0071 OO!),! 0122 OI;,K 0202 02:JG 0:;22 Oto'! O,J'):J OGOG 07:;::; 0813::; 1O::;G 1251 14!) 1711 1D77 22G 2578 2D12 :;2'l 3G32 4013 4'104 '11)01

(i 001;' 002] 0020 00:;0 00;'2 OOli'J OO!)] Oll!) 01;'4

7 00];' 0021 00213 OO:;i) 00;'] OOGi) OOWJ Oll(i 01;'0 0102 024,J 0307 03i)'] 047::; 0::;132 0708 08::;3 1020 1210 1'123 1GGO 1!)22 220G 2514 2843 ;)1!)2 3557 3!)3G 4325 4721

K 00],1 0020 0027 00:,7 00,11) OO(;(i OOK7 011:; 014G O]KK 02:10 0:;0] O:J7;, 04::; 0::;71 O!)'l 0838 100;) l1!)O 1,10 1 1:15 18!)4 2177 2413:; 2810 315 3520 :;13!)7 421)G 'J(j1)1

')

O 0,0 O,] ~, 0,2 O,:; 0,4 O,:J ',;'000 ;,:10i) ;'70:1 G170
(i[)[it!

2 ;'(1)0 ;,,]7i) ;'137] G2:J5 e;:zi) G'Ji);, 7:;2'1 7G42 7'):;D 1)212 i)'IG] I)Gi)(i I)i)i)i) DOGG !)222 \)3::;7 !J474 %7;) !)G::;G D72G D7i);) !Ji):;O !)i)i) ')8!J8 !J!)22 DD DD::i D')(j7 !)D7G !)!)82

:1 :J120 :J;,17 ::;!JlO G2!J:; GG(j,1 701'J 7:1::;7 7(;7:; 7%7 1)2:;1) i)/Ii) 5 1)70i) i)!)07 !)O1)2 D23(j !J:)70 D4i)'1 D51)2 D(;G'J !)732 D7i)i) Di):;4 !)871 !)')Ol !)!)25 !)D4:; D%7 D')(jl) DD77 !)',)i);)

,1 ;,IGO
SeiS?

:J :Jl!)!) :J5DG :J'Ji)7 G;)Gi) G7:; 70i)i) 7422 77:;4 i)02:; i)2 1)') i)::;:n 1)74D i)D44 !)11:J \)2G:J \)3!)4 !)::;O::; !)::;!)!) 'JG7i) !J744 D7!)i) Di)'12 !)i37i) !J!)OG !)!)2!) DD,J(j D!JGO !)!)70 !)!)7i) !)!)i)4

::;23D ::;3G G02G G40 772 7123 74::;,1 77G4 i)O:JI 1);)1::; ts!J54 i)770 1)'JG2 'H31 D27D !)40G %15 %(1) DGi)G

7 ::;27!) 5G7::; O4 G44:; Gi)Oi) 7157 74i) 77'J4 i)071) i)340 i)577 1)7DO i)Di)O \)147

!I
-,,_.,

OOI!) 002 003::; 0047 OO2 OOi)2 OlO7 0l3!) 0l7!) 022i) 02137 03::;!) O'14G O::;4i) Oi3 Oi)Oi) O!)(j8 11::;1 1:;57 1::;137 1i)41 2110 2420 274;) 30i3:J :;44G ;)821 ']207 402 :JOOO

'00] ,] 00]0 OIl2(i OO:JG OO!]i) OO!] OOi)'] OHO 014:; Oli):; 023:; 02!Ji1 03G7 04::;::; 0::;::;0 OG81 082:; O!)8::; 1170 1370 lGl.I 18G7 2148 2,1::;1 277-(; 3121 ;)4133 3i3:J!) 42'17 4G41

;'0,10 ,;"I:li) ;,K:12 G217 G:J'J] (i'):JO 72!)] 7Gll 7D1O I)ll) i)43i) i)GG:J I)i)GD D(Jil!) ')207 'J:H:J !)4G3 \)54 %4D D71') !)77i) !)i)2 Di)G4 (Ji)(JG 'J'J20 !)D'lO

:,:110 ;'71,1 (i1 0:1 G4i)O GI),I,1 7]!)() 7;'1.7 7i)2:1 i)IO(i i):W:, I);,!JO I)i) 1O i)!)!J7 \)J(i2 \):mli

[I; ~;I!
011'"
r ''f'

:J!)4i) :13] G700 70:J,1 7:;1)'J 7704 7'J% i)2'] i)50i) i)720 I)D2:J !)O!)'J D2:JI !):;i)2 !WJ:J %\)] 'JG71 !)73i) !)7!J3 !)1):;i) !)i)7::; D!JO'1 !)!)27 \)D4::; DD::;!) !)!)(jD !)D77 !J!)i),J

(,1,1 G:,I' Ii,~'(


'(~~~~, '(tI'!

,I:
I~\ -'

-2,4 -2,3 -2,2 -2,1 -2,0 -I,!) -1,13 -1,7 -I, -l,S -1,'1
-]

(i')I;, 72:J7 751)0 7i)i)] i)l::;!J 1)'113 I)G4:1 i)1)4'J 'JO:;2 !)J'J2 !)3:;2 \)4::;2

O,1i 0,7 0,1) O,D 1,0 1,1 1,2 1,3 1,'1 1,S 1, 1,7 1,1) I,!) 2,0 2,1 2,2 2,3 2,4
2,J

'/K!,

,~I:1 H:IH
l~lJ'.~

@)
031] O:;!)2 04i)S O::;!)4 0721 08!) 1038 1230 1'14G lG85 1!J4'J 223G 2:J4G 2877 322i) ;):J!)'1 3!)H 43G4 47GI

Ol'J7

,~H:I !)(II !) I '( !I:II 0,1,1 !I:>-I !II,:I !J'(O


~)' /' i

\)41i) D::;25 %I %!)3

!H2'J !)5:;;, %2;' !)(jf)!J !)7(il !)i)12 !)i);,1 !)i)S7 !)!JI:l !)!):,l,j DD;,I D!)(i:; \)'J7:! \)!JKO O!Ji)(i

,:;

-1,2 -1,1 -1,0 -O,!) 0,8 0,7 ,O,G O,;' 0,-1 O,:! 0,2 0,1 0,0

DGG4
%41 !)713 !)772 Di)21 !)i)Gl !)i)D3 !)!)l8 !)D38 DD:J:l D!)G5 D!)74 !)!)i)]

<:~) D7::;
!)803 \)84G !)8i)1 !)!)O!) !)!)31 DD'18 D!)GI DD71 !)!J7!) !)!)i)5 !)i)Oi) !)i)50 !)1)84 !)!)U !)!)32 DD4D DDG2 D!)72 !)!)7!) !)!)i)5

!),~1.
!H'!I

!)H!) !I!II !I!I:I !)!)f, !J!lIi !J!I'( !l!IH !I!I,.,

2,G 2,7 2,8 2,!)

U0SS
D!)(jG DD7::; !)!)i)2

1\ tahela apresenta a parte decimal de F-r[X :S xJ i';x"lllplo: Pr[X < -1,96] = 0,0250

A tabela
Exemplo:

apresenta

a parte 1,96)

decimal 0,9750

de F-r(X

:S :r)

Pr(X

<

Tabela A5: Distrilmiiio


:

/; de Student

: Pr(X:S;

-:1;)

+ Pr(X

2: x)

Pr(X

2:

;I;)

1,
(:1'11.110

Graus ele liberda,le 1 0,50 1,000 0,817 0,765 0,741 0,727 0,718 0,711 0,706 0,703 0,700 0,697 0,695 0,694 0,692 0,691 0,690 0,689 0,688. 0,688 0,687 0,683 0,681 0,679 0,677 0,40 1,376 1,IHJl 0,978 0,941 0,920 0,906 0,896 0,889 0,883 0,879 0,876 0,873 0,870 0,868 0,866 0,865 0,863 0,862 0,861 0,860 0,854 0,851 0,848 0,845

Pr(X :::.: -;r:) 0,20 ~1,O78 1,886 1,6:38 1,5:3:3 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,310 1,303 1,296 1,289

+ Pr(X

2: :1:) 0,02 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,897 2,821 2,764 2,718 2,681 2,650 2,625 2,603 2,584 2,567 2,552 2,540 2,528 2,457 Q,423 2,390 2,358 0,01 63,657 9,925 5,841 4,604 4,032 3,708 3,500 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,750 2,705 2,660 2,617

0,10 6,314 2,920 2,35:3 2,132 2,015 1,943 1,895 1,860 1,83J 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,697 1,684 1,671 1,658

0,05 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228

de 0,750 0,102 0,575 1,213 1,923 2,675 3,455 4,255 5,071 5,899 6,737 7,584 8,438 9,299 10,165 11,037 11,912 12,792 13,675 14,562 15,452 24,478 33,660 42,942 52,294 0,250 I ,J2~1 2,77:3 4,108 5,J85 G,G26 7,841 9,037 10,219 11,389 12,549 13,701 14,845 1,5,984 17,117 18,245 19,369 20,489 21,605 22,718 23,828 34,800 45,616 56,334 66,982 0,100 2,70(i 4,G05 G,251 7,779 9,2:W 10,645 12,0,17 13,362 14,684 15,987 17,275 18,54D 19,812 21,064 22,307 2J,542 24,769 25,989 27,204 28,412 40,256 51,805 63,167 74,397

--: :D) Pr(X ~


0,051 )) 0,025 0,010 6,6:35 9,210 11,345 13,277 15,086 16,812 18,475 20,090 21,666 23,209 24,725 26,217 27,688 29,141 30,578 32,000 33,409 34,805 36,191 37,566 50,892 ' 63,691 76,154 88,381 0,005 7,879 10,597 12,838 14,860 16,750 18,548 20,278 21,955 23,589 25,188 26,757 28,300 29,819 31,319 32,$JH 34,267 35,718 37,156 38,582 39,997 53,672 66,767 79,490 91,955

Ii I,,)rclade

2
:\ ,I ;) fi

:3,84 I 5,!J91 7,815 9,488

5,024\ 7,:378 D,:348

:3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 30 40 60 120

,
O

11,14:3 12,8JJ 14,449 16,01J 17,535 lD,023 20,483 21,920 23,337 24,736 26,119 27,488 28,845 30,191 31,526 32,852 34,170 46,979 59,342 71,420 83,298

12,59 2 14,06'7 15,5( )7 16,91 9 18,JI )7 19,67 5 21,02 6 22,36 '2

7 8
!l

10

'2~20D t_ ../
2,179 2,160 2,145 2,132 2,120 2,110 2,101 2,093 2,086 2,042 2,021 2,000 1,980

1I 12
I:l

11/
IG Ili

)5 2:3,68
24,99 6 26,29 6 27,58 7 28,86 9 30,14 3 31,41 O 43,77 3 55,75 9 67,50 5 79,08 2

17 11-: I!)

~m
:1II ,li) !,II lill

A tabela fornece probabilidades Pr(X

acumuladas nas duas caudas. 0,05; Pr(X2: 2,228)

Exemplo: para 10 graus de liberdade,

1':")lllplo: para 1 grau de liberdade, Pr(X 2: 3,841)

0,050

<

-2,228)

+ Pr(X > 2,228) =

0,025

265
c .~_",."

(c) CVA = 0,200; CVB = 0,225; CVr: =(),:WO. ()H l'I'HltI~," dos mostram maior homogeneidade na Turma A, (~lIqlli\.lIt.I) n 11111,1111' variabilidade encontrada na Turma C.

Apndice B

11 (")
(.L

Respostas dos exerccios

= lI) 71' s = 6 82', x~) = D,' (:V o, (i/l XI = 7,17; 8I = 3,67; XI = 7; CVr O,:) 1 (b) X = 8,94; 8 = 5,70; X = 7,5; CV cc O, (i/I
TI' ''(n,
" rI/, "", . III

12. O valor para albumina dessa pessoa SIIJ)('I'a :I~i 1111'1 Iill:l:: 1'111'1111 tradas em 95% dos indivduos. J o valor do COII'St.I'I'I d :0111'1'1'11 "1"'11"11 5% dos valores.
. 13. (b) Q1, i: e P90 esto nas segumtes c 1assl ~s: ;)1 I [,'{', e 69 f- 72. (c) Aproximadamente 53, correspondendo a I'~!II.
(ill I

(.; I

(is

-= 4

5. Considerando e s = 0,67.

o menor valor como 17 anos e o maior 21 anos:

14.

(a)
Frequlll:ia I'ldal.i.v/I simples 0,02 0,06 0,12 0,18 0,28 0,18
0,10

(i. (a) Haver aumento do valor da mdia correspondente ao nIIJ(~I'O adicionado. O valor do desvio-padro no sofrer alterao. (b) A mdia e o desvio-padro ficaro multiplicados pela cons-

7. (a) A mdia est abaixo de no mnimo um dos dados.

11I1'diana que se encontra sempre abaixo da metade dos dados. (b) A mdia uma medida representativa apenas para conjunto dI' dados simtricos. (c) A frase muito ambgua. Se entendermos mdia no sentido I':d.aUsLico, sempre haver alunos com nota abaixo da mdia, pela Ill't'llll'ia definio desse conceito. No entanto, a palavra mdia ulinda lia linguagem coloquial com sentido de padro (a mdia para alll'ov;u.. :;\O, por exemplo, 60). Nesse sentido, a frase expressa uma 1'11 'oCIIpa({o correta. ,"\. (a) X =i' 20,26; X = 21,00. (11) (21 = 16,5; Q3 = 23, O.

Taxa de colestel'Ol 112 f- 132 132 f- 152 152 f- 172 172 f- 192 192 f- 212 212 f- 232 232 f- 252 252 f- 272 272 f- 292 Total

Frequncia simples 1
') ...,

absoluta acumulada 1 4 10 19

iU:11I111I11Il11l
O ,O~ 0,1 lK O,',!,II O,: \,'" O, (i! i O,KI (l,!)1 O,!lK I ,011

6 9 14 9 5 2 1 50

33
42 47 49 50

0,04 0,02 1

(c) P90 ~ 244. 1''', (d) O grupo A (entre 10 (~19 anos) (~ 11I<I.1S 11011111",1'11 I'''' apresentar menor coeficiente de varia()io: C V;\ :-c 0,1 7, (' \ '/I li, 111 (e) H uma tendncia de aumento da I.axa dI! clIll~SI.I '1'1 d 1111'11 i/I com a idade.

Ju. o procedimento utili~ado foi inadequado porque qualquer val'ia<)io nos valores da amostra tremi altera<;es indesejveis ao valor da 11l{~dia. A forma mais apropriada de sntese dos dados, nesse caso, {~a 11l<~diana,pois seu clculo independe de valores extremos.
17. (a) (b) (c) 1.:1.Ii1,o, uma (d) :;r Ia obra. P13. 1850. Opus 87. At 1833 havia composto somente G% de sua obra, POI'perda de 94% d(~seu trabalho. Durante esses dois anos, Schumann comps 35,12% de

blema inverso. H urna diminuio da especificidadc (~allllll~1I1.1 I dll sensibilidade porque alguns testes negativos tOI'naranl-S<~ posi I.i VOH, 5. (a) Geralmente, ao se aumentar a pI'<walfmci;\', v(~l'ilica :,1' 1111 mento significativo do valor da predio positiva, <~llql1alll.oII vIIIII1 da predi(;o negativa sofI'<"pequena variao. 6. O valor de precli(;o positiva dado Pl)]' 11,/(1/. I I'l qlllllldl I a prevalncia populacional igual prevalfmcia di\, I.ai)(da, 1i 11'11' raramente ocorre na prtica. 7. Para p = 0,05: VPP = 0,139; VPN = O, 9H(i; J'/"" PFN = 0,014. Para p = 0,10: VPP = 0,254; VPN = O, mo; ,,/,'" PFN = 0,030. Parap=0,15: VPP=0,351; VPN= 0,9G!\; /,/,'"
(I, Hlil; (I, '(Ili; (1,liI!I,

18. (b) A expresso "erro em exames" inadequada para o caso. ( ) que houve, na verdade, foi detec(:o de variao para as medidas de 1'1 ,I(~sterol e triglicrides. Como no fornecido um padro para comI)ala(:o, no se pode demonstrar se a variaiio encontrada aceitvel 1111 se esto configurados realmente erros nos exames. 21. (c) 73,7% (d) 94,5% 22. (a) 39 meninas. (b) 21

PFN = 0,046. Conforme o esperado, a um aumento na preva.lf~llcill HI'J',III'III 111' o aumento no valor de V P P e a pouca alterao de V/),'. 8. (a) .'3 = 0,733; e = 0,972. (b) Definindo-se proporo de falso- positivo com() \/ "" I' proporo de falso-negativo como 1- VPN, obtem-se O,(i!)f) I' (1,(IlI!, respectivamente. (c) Se um mdico tem 75% de certeza sobre o dia/',lll'd.ilII, 11 V P P passa a ser 0,998, aumentando' a probabilidade em 2/1,K'Y.,.

I. (a)i. 0,0488 ii.0,4729 (b) i. 0,044~ ii. 0,0001 (d) 49 i'ndivduos.

iii. 0,0137 iii. 0,0024

IV.

0,0800 iv. 0,9048

9. (a) .'3 = 0,841; e = 0,982. (b) Probabilidade de teste positivo em indivduo sadill il',llai 0,302.

11

:\. (a)

= 0,953 ; e = 0,998. (1)) VPP = 0,0667.


.'3

'I. Alterando-se a faixa de normalidade de 75 a 85 para 75 a 120, 1I11',IIIIS dos indivduos, antes considerados doentes, passam a apresen1m I.I~SI.<~ negativo, significando diminuio de sensibilidade e aumento ,I,' I':-;1 )(~cificidade. Ao variar a faixa para 50 a 80, acontece um pro-

(c) VPP = 0,698; VPN = 0,992. (d) A recomendao dos pesquisadores precipitada. () 1.1':iI.l' apresenta valor baixo para VPP, mostrando que um test(~ posil.ivo :li'l corresponderia a cncer heptico em 70% dos casos. Assilll, alll.l':1 de encaminhar um paciente para uma clnica especialila< Ia, 11111.1'1111 exames deveriam ser realizados de modo a confirmar ess<~n~sli1l.wll
I,

10. (a) Considerando p = 0,05, um valor razovel para PII'VIlII'1I cia de diabetes na populao, V P P = 0,50.

(b) Espera-se que haja um aurnenf,o ~ignif:icativo no valor dc li 1'1), uma vez que o pacientl~ apre~enta um valor p maior do que lU IllIdl' correspondente ao da po[m1a(,iio em geral.
11.

(c) Vr]' = O,:.27;~; IIFN = O,!)77. (d) Sim. Como o VrN (~aHo, o h~~j(, I'm qlle~L\() (, til para cxcluir a docm,a; o baixo IIT' r, faz com qlW um re~ultado po~itivo no seja confivc1 para diagno~ticar a doena.
17. O clnico que u~a corno critrio de anormaldade conccntra(,e~ de glico~e maiore~ (10 que LI, faz com que o teste de todos o~ ~adio~ seja negativo mas leva ~\n~tOdctec(;o da doena em alguns paciente~. O outro clnico, cujo critrio (~o valor L2, observa teste positivo para todos os doentes, mas tambm, para alguns sadios. Desse modo, ao utilizar LI, h ganho em especificidade e perda de sensibildade quando comparado ao uso do valor L2 18. (a) 5 = 0,93; e = 0,88. (b) 5 = 0,422; e = 0,992. (c) Para o teste 1: VPP = 0,931; VPN teste 2: VPP = 0,989; VPN = 0,492. 19. (a) (b)
5 =

(a) 5 = 0,696; c = O,i)02. (b) VPP = 0,6Gi); VPN = 0,907. (c) Considerando p = 0,005: IIr?

0,0:31.

I2. (a) O VPP depende fundamentalmente da prevalncia da ,1,11 '1 11,: a de interesse na populalJio, da a incoerncia da afirmativa. t /111 LI,st~e que produza VPP baixo em deterrninada populal;iio pode 11111) faz-lo em outra. E mesmo naquela, dependendo do interesse, IllIdl'I':.ser utilzado satisfatoriamente (um VPP baixo no inHui no \ '/' N, que uma vez alto, ser de grande utilidade para descartar a 11I1:;si Ililidade de urna doen(,a). (b) Especificidade alta significa que grande nmero de pessoas Ilall doentes tero testes negativos. Para avaliar a probabildade de 11111 LllStenegativo corresponder a um estado de ausncia de doena, (, III ,cI~ssria a utilzao do liP N. I;\. A divulga.o do teste foi feita de maneira confusa. Mas 1IIIIiLo mais importante, que apenas os dados relevantes ao clculo da ::1 '11:;j l>ilidade do teste so apresentados. No existe qualquer meno :1. I'apil.cidade do teste n.o detectar pessoas sadias (especificidade), to i 1111)( lItante quanto a deteco do tumor de prstata em fase inicial. 11. A afirmativa sintetiza de forma correta os significados dos 1IIIIil:l's5, e (em que a condio prvia dos indivduos conhecida) " \/1) P, VPN (em que h necessidade de se conhecer a condi.o do IJlIl'il'llte a partir do resultado de um teste). lfi. s = 0,99; e = 0,99; VPP = O,GO; VPN = 0,99; p = 0,01. 1- VPP = O,GO; PFN = 1- VPN = 0,01. O teste no lllllli:vc! nesta populao, por apresentar pequeno valor de predi.o l"I:;jLivII.No caso, apenas GO% das pessas com teste positivo ter.o
//I'/'CCC
II
ll()(

P95

O,6G8; e = 17609.

0,612; p

0,319

20. Para ruptura do menisco medial: s condromalcia: s = 0,379; e = 1,00.

= 0,882; e = 0,773. Para

21. (a) s = 0,938; e = 1,00. (b) A prevalncia. na amostra 0,86, muito menor do que a encontrada na populao em geral. (c) p = 0,7; VPN = 0,87. 22. (a) A sensibildade e especificidade do teste conjunto so 0,63 e 0,97 independente da ordem. (b) Suponhamos que o teste seja usado em 11.000 pessoas. Quando o teste A (o de maior sensibildade) usado primeiro, 3900 pessoas devem receber ambos os testes. Quando o teste b (o de maior especificidade) usado primeiro, somente 1.700 pessoas devem receber ambos os testes. Ent.o economicamente vantajoso usar o teste B primeiro, j que o teste B custa 2,3 vezes (3900/1700) menos que o teste A.

~IIC~(L

1(;. (a) p = 0,167 (16,7%). (b) s = 0,94; e = O,GO.

(c)

o
6,3

18,5

2 27,0

3 26,3

4 19,3

5 11,3

()

5,5

2,3

15. 96,20% das pessoas apresentam fosfatase alcalina entre 15 e 69 '(nUlell. 16. Nem sempre a varivc1 de interesse tem distribuio gaussiana. Alm disso, a expressiio (x - 28, X + 28) pode no ser razovel para o problema em questo. Ela fora a existncia de limites superior e inferior, que em determinadas situaes perdem sentido. Outras vezes, essa expresso gera valores que no condizem com os limites de normalidade. 17. (a) Mdia e desvio-padro so 106,42 e 11,94. (b) 80% das crianas em questo tm presso sistlica acima de 94,40 mmHg. 18. (a) 0,16 (b) 0,62 (c) Aumento de sensibilidade e diminuio de especificidade. 19. (a) VPP 0,213.

r). (a) 31% dos candida,tos tf~mchancc de serem aprovados.


(b) O tempo mximo para merecer o certificado 57 minutos. li. (a) 489 estudantes. (b) 106 estudantes. 7. (a) Pelo mtodo de percentis: : :IIISS: [98,28; 147, 12]. [97,5;146,5]. Pelo mtodo de

9. (a) x = 243,92; :1; = 235,5; s = 43,04; P25 = 215,5; P75 = ~W~, 5. (b) No h indicao de que os dados foram gerados a partir de 1IIIIapopulao gaussiana, urna vez que os valores observados diferem (I()s ()sperados se eles seguissem essa distribuio (mdia = mediana I'" P25 = 257,7 e P75 = 273,2).

= 0,957; VPN = 0,787; PFP = 0,043; PFN =

11. (a) 496 pessoas.

(b) [36,45; 37,15]. 1:2. (a) Mtodo dos percentis:\ [19,5; 73,5]. Mtodo da curva de (:allss: [6,06; 63,54]. (b) O mtodo mais indicado nesse caso o mtodo dos per1'1'IILis, uma vez que o mtodo da curva de Gauss coloca o limite i I Ii'( 'l'ioI' sem significado para os dados obtidos.

20. (a) P15 = 22. (b) e = 0,85. (c) No se pode calcular a sensibilidade porque os testes foram realizados somente em idosos sem disfuno mental. (d) Ocorrer aumento da especificidade, j que um nmero maior de resultados negativos nos indivduos testados.

I;L (a) 0,52 (b) 52 homens.

1. (a) Ho: A proporo de abortos espontneos em mdicas anestesistas igual proporo em mdicas de outras especialidades. H1: A proporo de abortos espontneos em mdicas anestesistas diferente da proporo encontrada em mdicas de outras especialidades.

(b) X2 = 10,27; X;2 = ~,G9 (com corrcl)lo); valor p < 0,005. I<;xistediferena na propon)lo de abortos espoubl,ncos cntrc mdicas all(~stesistas e de outras CSI)(~cialidad(~s. 2. Em relao aos dados de glicos(\ valor-p ~ O; para triglicridcs, valor-p = 0,52. 3. Pode-se afirmar qlll~o gemfibro';il atua sobre o nvel de colesI.(~rol(Z = 26, 7G, valor-p ~ O).

10. X2

= 51,42 (valor-fi ~ O); X,/: = 50,77 (valor-p ~ O); . .%"

7,2G (valor-p ~ O). = G,34 (valor-p Z = 2, G7 (valor-p = O, (1). 12. (a) fIo: No existe diferen<.;ana perfonnance em corrida dI' 50 metros entre meninos e meninas. (b) t = 0,79; valor-p = 0,4:). (c) A diferena de idade entre os grupos, a prtica espml.iv:I por algumas crianas, alm de caractersticas individuais POdCll1:-:1 'I' fatores de confuso. (d) A escolha aleatria garante repre:-:entatividade da ali 10:-:1.1'11 , mas no a comparabilidade entre grupos, o que no elimina os fa1.III'('11 de confuso. 13. (a) fIo: Intervalo entre gestaes menor que 6 mescs 01'(11'1'1' com as mesmas propores em mulheres negras e brancas. X2 = 24,08 (valor-p~ O); Xz = 23,31 (valor-p~ O). I';~ilil.l' diferena na proporo de mulheres negras que tm intervalo l'lill'" gestaes menor que 6 meses em relao s mulheres branca:-:. (b) No existe influncia do estado civil de mulhel'l!:-:111 "',IlIiI no intervalo entre gestaes (valor-p= 0,78). (c) i. Para mulheres brancas: existe diferena na idadl' 1111,.1111 das mulheres no grupo < 6 meses e no grupo 2': 6 meses ('" 'i ,'i! I) ii. Para mulheres negras: a idade mdia igual para Ili: )',1111" ,:, de mulheres negras com intervalo de gestao < 6meses (! . li 111"il"11 (T = 1, 43; valor-p~ 0,16). 14. (a) Z = 0,294 (valor-p = 0,77); Z* = 0,292 (valm II (b) X2 = 0,087 (valor-p = 0,77); X,/: = 0,001;, = 0,97). 15. (a) Para o grupo de crianas susceptveis: x = 11, I;.'. Para o grupo de crianas em que h resitncia ao AZT: :T: s :\, I I'.', ,'i,
I),

11. X2

Masculino Feminino Total (b) = 0,(002).

Sobrevida ';ero Sim No Total 57G 4705 52~1 90 4G2 552 66G 5167 5833

X2

6. (a) Definindo ~"h como a mdia do tempo de corrida dos inIlivduos quando hiperventilados e J-"s' mdia sem hiperventilao, as Iti pteses a serem testadas so: fIo: ~"h = ~"s vs fIo: ~"h :f ~"s' (b) T = 0,42; valor-p = 0,69. No existe diferena na caIlacidade fsica (avaliada por corrida de 800 metros) de indivduos :-:1" nnetidos ou no alcalose respiratria, adquirida atravs de hipervcntilao. 7. (a) Estudo de coorte a i uHuncia dos altos nveis de Illama em pacientes submetidas ",l'llpOS, um com altas taxas de (b) X2 = 18,03 (valor-p estudo prospectivo visando verificar catepsina na recidiva de cncer de cirurgia. Acompanhamento de dois catepsina D e outro com baixas. ~ O); Xz = 16,75 (valor-p ~ O).

'i't')

(1':tI'I'

I'

= 3,3.
(b) T = 3,20; valor- p = 0,01.

~. (a) No existe diferena signifi.cativa entre os tempos de reao ,k llomens e mulheres (T = 1,32; valor-p = 0,20).

(a) Ho: No existe dih~n~ll(,a na cOllceutral,o plamntica dI~ protenas totais nos grn pos estndados. lII: Exist(~ (lifc:reu<,a na 1'1 li lCentrao dessas protenas lias crialH,as I~studadas. No existe difen~ll(,a siguilicativa IJOSdois grupos, cornjmrando:;1' o valor encontrado no tl~sLc~ COlUo respectivo padr8,o: Z = 1, G~~ (I'alol"-p = 0,10); T = 1,7'2 (valor-p =--= O, (9).
[(j.

(d) Diminuir o tclUPO de remisso 1~lll2,20 de sobrevivCmcia em '2,9'2 meses.


3.

111I'SI'S t' 1111'1111111

(a) X2 = 4,07; X,2 = 3,69.

( a) Ho: N8.o existl~ difen~UI,a na pn~seUl,a d(~ depresso nos I'YllpOS. Hl: Existe difermll.;a ua pr(~SI~llI,a de depresso nos pacicntcs 17.

(b) Valor-p ~ O, OS. (c) Estimativa do deito = ~ = 0,71; 1.<~. 11:11;\ I;' [li, :~:~, :~,',~(IJ Para lllulhl:res acima d(~ SO anos, o fator 1,('1" :--;ido:1111:11111'111.:111:1 11:t1l cxerce influC~llcia uo desenvolvimento de 6\,IICI'I'di' Illalll:l.
4. Estimativa do risco para os mtodlls: di;ll"r:iI',III:1 preservativo = 0,246; DIU = 0,165; plula O,O:-\(i,
c

t'sl.ll(lados. (b) X2
19. (a) X2

= :m,:~:~ (valor-p ~ O); X/ = :~:~,GG (valor-p ~ O).

= GO,29 (valor-p ~ O); X/ = 59,21 (valor-p ~ O). (b) Ho: No cxiste diferen(,a na ocorrncia de suicdio como 1';I.IISa de morte eIll podas e escritores de JiC<,;8.o. Hl: Existe diferena lia ocorrncia de suicdio nos grupos estudados. X2 = 13,58 (valor-p 0,(002); Xz = 11, 4G (valor-p = O, ()()07).

5. (a) Para X2 e X4, valor-p ~ O. (b) Xl = Durao da pneumonia (dias): 101'1' i1.11 I , !I, I ( , [1,57;2,23]; X2 = Durac:o da diarria (dias): dl'il.ll 1,:\, 1(' [1,02;1,58]; X3 = Ganho de peso aps 6 seIllallas (/11/) "1"1111 0,39; LC.= [0,25; O, 53]; X4 = Ganho de peso apc')s (j 111I':il':> I 11'/1 efeito= 0,52; LC.= [0,37; O, 57].
6. Atividade [29,93; 43,33].

fsica na presso arterial:

efeito = ;l(j,(j;\

111111//'1,

I (

(valor-p = 0,07). (b) Estimativa do efeito = 331 g; intervalo de confiana, LC. [-20,82; 682,82]. No existe diferena significativa no peso mdio III~n:cm-nascidos cujas mes usaram cocana apenas no l- trimestre t~daquelas que a utilizaram durante toda a gravidez.
2. (a) Considerando rndia no tempo de remisso ILB para imuIIId,erapia com BCG e /I.C para aquela com C. Parvum, e mdia no LI '111 po de sobrevida IL~3 e 11c para os dois tratamentos, tem-se que: Ilara tempo de remisso: Ho: IIB = ILc e H1 : /L13 "# ILc; para tempo dl~ sobrevivncia: Ho: /L~ = e H1: /-L~ "# /-IC (b) Tempo de remisso: T = 0,62. Tempo de sobrevivncia: I' 0,94. Niio h evidncia de diferena entre os mtodos BCG e C. parvum, 1'lJlllparados em relao aos tempos mdios de remisso e de sobreI'i1'1~llcia. (c) Tempo de remisso: valor-p ~ 0,10. Tempo de sobrevivnI'ia: valor-p ~ 0,35.

1. (a) T = 1,84

8.

Atividade

fsica no colesterol:

efeito

[15,93; 24,41].

p.c