Você está na página 1de 17

REVISO REVISOREVISOREVISOREVISOREVISO Conceitos bsicos de epidemiologia e estatstica para a leitura de ensaios clnicos controlados Basic concepts in epidemiology and

statistics for reading controlled clinical trials Evandro Silva Freire Coutinho,1 Geraldo Marcelo da Cunha1 V VVVVVerso original aceita em P erso original aceita em Perso original aceita em Perso original aceita em Perso orig inal aceita em Perso original aceita em Por ororororortugus tugustugustugustugustugus Resumo ResumoResumoResumoResumoResumo Os autores apresentam conceitos bsicos de epidemiologia e de estatstica necessrios para a compreenso adequada do desenho e dos resultados de ensaios clnicos controlados. No texto apresentam-se, atravs de exemplos, os conceitos de medidas de associao e de efeito, teste de significncia estatstica, p-valor, intervalo de confia na e poder do estudo, e discutem-se os erros mais comuns em suas interpretaes. Descritores DescritoresDescritoresDescritoresDescritoresDescritores: Ensaios clnicos controla dos; Eficcia; Estatstica; Testes de hiptese Abstract AbstractAbstractAbstractAbstractAbstract The authors present the basic concepts in epidemiology and statistics needed for understanding properly the design and results of controlled clinical trials. Through a set of examples, the concepts of measur es of association and effect, statistical significance tests, p-value, confidence interval and statistical power are presented and comm on their misinterpretations are discussed. Keywords: Keywords:Keywords:Keywords:Keywords:Keywords: Controlled clinical trial; Efficac y; Statistics; Hypothesis-testing Departamento de Epidemiologia e Mtodos Quantitativos em Sade; Escola Nacional de S ade Pblica e Fundao Oswaldo Cruz Correspondncia Evandro Silva Freire Coutinho Financiamento: CNPq nr. 471145/03-3 Rua Leopoldo Bulhes, 1480, 8 andar Conflito de interesses: Inexistente 21041-210 Rio de Janeiro, RJ, Brasil Manguinhos

Recebido: 12.08.2004 Aceito: 19.08.2004 E-mail: evandro@ensp.fiocruz.br Rev Bras Psiquiatr. 2005;27(2):146-51

147 Coutinho ESF & Cunha GM Introduo IntroduoIntroduoIntroduoIntroduoIntroduo Os ensaios clnicos constituem-se numa poderosa ferramenta para a avaliao de intervenes para a sade, sejam elas medicamentosas ou no. O primeiro ensaio clnico, nos moldes que hoje conhecemos, foi publicado no final da dcada de 40,1 quando o estatstico Sir Austin Bradford Hill alocou aleatoriamente pacientes com tuberculose pulmonar em dois grupos: os que receberiam estreptomicina e os que no receberiam o medicamento. Desta forma, ele pode avaliar, de maneira no-viesada, a eficcia deste medicamento. Em que pese a publicao crescente de ensaios clnicos controlados, alguns aspectos do desenho e da anlise ainda so mal compreendidos e interpretados de forma equivocada. O objetivo deste artigo apresentar alguns conceitos bsicos de epidemiologia e de estatstica presentes em grande parte desses estudos, assim como chamar a ateno para as peculiaridades e equvocos em sua interpretao. Para isso, abordaremos os seguintes tpicos: 1) Randomizao; 2) Medidas de efeito: razo e diferena; 3) Testes de significncia estatstica; 4) Intervalo de confiana; 5) Poder do estudo. Randomizao RandomizaoRandomizaoRandomizaoRandomizaoRandomizao No ensaio clnico ideal para se avaliar a eficcia de um tratamento, um grupo de pacientes deveria receber o placebo e ser acompanhado por um perodo de tempo para se medir a ocorrncia de certo evento (ex: bito, cura). Em seguida, o pesquisador faria o tempo recuar a um momento imediatamente anterior administrao do placebo e administraria, a esse mesmo grupo de pacientes, o tratamento que se quer avaliar. O desfecho nessa segunda situao seria contabilizado e comparado com aquele observado na primeira situao. Por se tratarem dos mesmos pacientes, num mesmo momento de suas vidas, qualquer diferena quanto ocorrncia do desfecho (ex: bito, cura) nas duas situaes poderia ser atribuda, sem qualquer dvida, interveno. Como este desenho imaginrio no vivel, os pesquisadores realizam uma randomizao com intuito de gerar grupos comparveis. Este procedimento consiste em alocar os indivduos aleatoriamente (ao acaso) nos grupos a serem comparados. Com isso, busca-se constituir grupos com caractersticas muito semelhantes (comparveis), com exceo das intervenes que se quer avaliar. Com a distribuio eqitativa de fatores de risco ou de prognstico, pode-se atribuir as diferenas

observadas entre os grupos s intervenes que esto sendo comparadas. Embora a randomizao no assegure a distribuio homognea dos fatores nos grupos comparados em todas as ocasies em que implementada, a probabilidade de que isso ocorra aumenta conforme cresce o nmero de participantes no estudo. O ocultamento do processo de randomizao importante para evitar manipulaes da alocao que podem comprometer a comparabilidade dos grupos. Num ensaio clnico bem conduzido, a deciso de incluir ou no um paciente no estudo deve anteceder a sua randomizao. Ainda que a randomizao constitua um aspecto central dos ensaios clnicos, no raro encontrarmos estudos nos quais esse procedimento implementado de forma inadequada. Estratgias de alocao por ordem de chegada, numerao corrida e dias da semana no devem ser usadas, pois facilitam a identificao da interveno a que ser submetido um paciente selecionado para o estudo. Com isso, o responsvel pela alocao pode manipular o processo (ainda que inconscientemente), comprometendo a comparabilidade dos grupos. Para tornar esse problema mais claro vamos imaginar que o pesquisador acredite que o novo tratamento superior ao tratamento convencional. Se ele sabe que um paciente mais grave ser alocado no grupo de tratamento convencional, ele pode no incluir esse indivduo no estudo, aguardando a chegada de um paciente menos grave. Com isso, os grupos tendem a perder a desejada comparabilidade, ocorrendo um predomnio de pacientes mais graves no grupo que receber o novo tratamento. O uso de uma seqncia aleatria de nmeros, obtida atravs de tabelas de nmeros aleatrios ou de algoritmos computacionais, facilita o encobrimento da seqncia de alocaes e da conseqente manipulao da alocao.* A Tabela 1 ajuda a entender esse fenmeno. No caso das estratgias apresentadas nas colunas 1 e 2, basta que o responsvel pela randomizao descubra o dia ao qual cada tratamento est ligado para que ele desvende toda a seqncia da randomizao e saiba em qual grupo ser alocado o prximo paciente. No caso da coluna 3, mesmo que o pesquisador saiba que nmeros mpares correspondem ao tratamento A e nmeros pares correspondem ao tratamento B, ele no tem como deduzir a seqncia das alocaes. Estudos que adotam os procedimentos descritos nas colunas 1 ou 2 costumam ser denominados quasi-experimentais , sendo mais vulnerveis a manipulaes. Medidas de efeito Medidas de efeitoMedidas de efeitoMedidas de efeitoMedidas de efeitoMedidas de e feito Considerando-se que o processo de randomizao se deu de modo adequado, que os pacientes receberam as intervenes de modo apropriado e que as variveis de interesse foram aferidas corretamente, a prxima etapa ser a anlise dos dados. Existem diferentes maneiras de se mensurar o desfecho de interesse em um ensaio clnico. Quando os participantes

so classificados em dois grupos, segundo a presena *NOT *NOT*NOT*NOT*NOT*NOTA: A:A:A:A: A: Existem diversas metodologias para implementar a randomizao de modo mais eficie nte, como o procedimento por blocos, estratificado, no fixo. Esses mtodos fogem ao escopo deste artigo e podem ser enco ntrados nos artigos de Pocock e Meinert et al. 2-3 Rev Bras Psiquiatr. 2005;27(2):146-51

Estatstica e ensaios clnicos controlados 148 ou no de certo acontecimento, diz-se que esta varivel dicotmica. Por exemplo, os participantes podem ser classificados como vivos ou mortos, curados e no curados, com ou sem efeito adverso, e assim por diante. Quando fazemos uso de uma varivel dicotmica para classificar o desfecho dos participantes do estudo, podemos usar diferentes medidas para comparar o resultado observado entre os grupos de interveno e de controle. Essas medidas so construdas atravs de razes ou de diferenas e trazem informaes distintas. 1. Risco relativo ou reduo relativa do risco (RR) - Eficcia 1. Risco relativo ou reduo relativa do risco (RR) - Eficcia1. Risco relativo ou red uo relativa do risco (RR) - Eficcia1. Risco relativo ou reduo relativa do risco (RR) - Eficcia1. Risco relativo ou reduo relativa do risco (RR) - Eficcia1. Risco relativ o ou reduo relativa do risco (RR) - Eficcia O risco a probabilidade de ocorrncia de certo desfecho. Varia entre 0 e 1 e pode ser transformado em percentual ao se multiplicar por 100. Os dados apresentados na Tabela 2 foram extrados de um ensaio clnico controlado4 em que se alocou aleatoriamente 838 pacientes esquizofrnicos hospitalizados, de ambos os sexos, em dois grupos: clorpromazina e placebo. Os pacientes foram acompanhados por 24 semanas. Os dados referentes na tabela permitem estimar os riscos de agravamento dos sintomas psicticos nos dois grupos de pacientes: No grupo tratado: R(t) = 37/416 = 0,089 ou 8,9%. No grupo controle: R(c) = 70/212 = 0,33 ou 33%.

Aps obtermos os riscos em cada grupo, uma maneira de compararmos as duas intervenes atravs do clculo de uma razo desses riscos, conhecida como risco relativo (RR). Desse modo, quando o risco nos dois grupos for o mesmo, o RR ser igual a 1. Se o risco no grupo de interveno for menor do que o risco no grupo controle, ento o RR ser menor que 1; caso contrrio, ele ser maior do que 1. No exemplo da Tabela 2, o RR : RR = R(t) / R(c) = 0,089 / 0,33 = 0,27. Portanto, o grupo de pacientes com esquizofrenia que fez uso de clorpromazina apresentou um risco cuja magnitude equivale a 27% do risco encontrado para os pacientes que fizeram uso de placebo; isto , a magnitude do risco no grupo que recebeu clorpromazina foi de aproximadamente da magnitude do risco no grupo placebo. Pode-se ainda calcular a reduo de risco relativo, tambm conhecida como eficcia, atravs da seguinte frmula: RRR ou Eficcia = (1-0,27) x 100 = 73%. A eficcia representa a reduo relativa do risco obtida com a

interveno. No exemplo da Tabela 2, conclui-se que o uso da clorpromazina reduziu em 73% o risco de piora de pacientes. No caso do tratamento provocar um aumento do risco de algum evento, teremos o excesso relativo de risco (ERR) cal culado como (RR-1) x na Tabela 2, o risco clorpromazina contra um risco relativo de risco foi de 150%. 100. No mesmo estudo apresentado de distonia foi de 5% nos usurios de 2% no grupo com placebo, levando a 2,5. Desse modo, o excesso relativo de

ERR = (2,5-1) x 100 = 150%. Em outras palavras, a clorpromazina elevou em 150% o risco de distonia em comparao com o grupo que recebeu placebo. preciso cautela ao se interpretar o RR, pois nem sempre um valor maior do que 1 indica algo ruim, indesejado. Tudo depende do modo como as variveis esto sendo mensuradas. Num estudo com pacientes agitados/agressivos, realizado em trs emergncias psiquitricas do Rio de Janeiro,5 comparouse o uso de midazolam IM (intramuscular) em relao combinao haloperidol + prometazina (H+P), tambm por via IM. Observou-se que 89% dos pacientes do primeiro grupo foram tranqilizados em at 20 minutos aps o uso da medicao, contra 67% do segundo grupo. Nesse caso, o RR foi 1,33, o que significa um aumento de 33% da probabilidade de estar tranqilo 20 minutos aps o uso intramuscular do midazolam, em comparao com a combinao H+P. 2. Reduo absoluta de risco (RAR) 2. Reduo absoluta de risco (RAR)2. Reduo absoluta de risco (RAR)2. Reduo absoluta de isco (RAR)2. Reduo absoluta de risco (RAR)2. Reduo absoluta de risco (RAR) A RAR representa a reduo, em termos absolutos, do risco no grupo que sofreu a interveno de interesse, em relao ao grupo controle. RAR = [R(c) R(t)] x 100

No caso do estudo da Tabela 2, a RAR foi de 24,1%. RAR = (0,33-0,089) x 100 = 24,1% Para entendermos melhor o conceito de RAR e a sua dife rena em relao reduo do risco relativo (RRR), observemos os dados fictcios apresentados na Tabela 3. No caso do desfecho reinternao, temos uma eficcia (RR) do tratamento de 50% e uma reduo absoluta de risco (RAR) de 5%; isto , o tratamento reduziu o nmero de reiternaes metade (de 10% para 5%), o que representou a eliminao de um total de 5% desses eventos. Quanto ao desfecho recada, a eficcia foi de 25% e a reduo absoluta de risco foi de 10%; em outras palavras, o tratamento reduziu o nmero de recadas em apenas (de 40% para 30%), mas isso representou

a eliminao de um total de 10% desses eventos. Portanto, ainda que a eficcia da interveno seja maior para o desfecho reinternao, o maior benefcio se d para o desfecho recada, onde houve uma reduo de 10% do total de casos contra 5% do total das reinternaes. Isso ocorreu porque a freqncia de recadas maior do que a freqncia de Rev Bras Psiquiatr. 2005;27(2):146-51

149 Coutinho ESF & Cunha GM reinternaes. A Figura 1 ajuda a entender essa concluso. Sendo a rea clara das barras aquela correspondente diminuio das reinternaes e recadas, observa-se uma reduo de maior volume no evento recada. As reinternaes foram reduzidas metade, mas isso representou um volume menor do que aquele alcanado para as recadas. Figura 1 Figura 1 reduo rao da

- Comparao da eficcia e da reduo absoluta de - Comparao da eficcia e da reduo absoluta deFigura 1 - Comparao da eficcia absoluta deFigura 1 - Comparao da eficcia e da reduo absoluta deFigura 1 - Co eficcia e da reduo absoluta deFigura 1 - Comparao da eficcia e da reduo ab

risco para dois desfechos (baseada nos dados da T risco para dois desfechos (baseada nos dados da Trisco para dois desfechos (base ada nos dados da Trisco para dois desfechos (baseada nos dados da Trisco para do is desfechos (baseada nos dados da Trisco para dois desfechos (baseada nos dados da Tabela 3) abela 3)abela 3)abela 3)abela 3)abela 3) 3. Nmero necessrio para tratar (NNT) 3. Nmero necessrio para tratar (NNT)3. Nmero necessrio para tratar (NNT)3. Nmero nece ssrio para tratar (NNT)3. Nmero necessrio para tratar (NNT)3. Nmero necessrio para tr atar (NNT) Um modo adicional de se medir o impacto de uma interveno que vem se tornando popular nos ltimos anos o nmero necessrio para tratar (NNT). Essa medida representa o nmero de pacientes que se precisa tratar para se prevenir um evento indesejado (ex: morte, recada). O NNT calculado como o inverso da RAR. No caso da Tabela 2, onde a RAR foi de 0,241 (ou 24,1%), o NNT ser 1/0,241 = 4. Portanto, previne-se um caso de piora dos sintomas psicticos em cada quatro pacientes com esquizofrenia que fazem uso de clorpromazina. Vimos no item anterior que a RAR influenciada pela freqncia do evento que se est avaliando. Pelo fato do NNT ser o inverso da RAR, ele tambm ser influenciado pela freqncia do evento. No caso dos dados da Tabela 3, temos um NNT de 10 para o evento recada contra um NNT de 20 para o evento reinternao. Em outras palavras, para evitar uma reinternao seria necessrio tratar o dobro de pacientes do que seria necessrio para impedir uma recada. importante fazer uma distino entre os efeitos benficos e os efeitos indesejados da interveno. No caso desses ltimos, o NNT denominado nmero necessrio para produzir um dano (NNH number needed to harm). 4. Diferena de mdias 4. Diferena de mdias4. Diferena de mdias4. Diferena de mdias4. Diferena de mdias4. ena de mdias Existem ensaios clnicos nos quais o desfecho medido atravs de escores de escalas como, por exemplo, a Brief Psychiatric Rating Scale (BPRS) ou a Abnormal Involuntary Movement Scale (AIMS). Essas escalas produzem escores para cada paciente, ao invs de resultados dicotmicos do tipo sim/

no . Esse tipo de varivel denominada contnua, sendo comum o clculo de sua mdia nos dois grupos que se deseja comparar. Para avaliar o tratamento de melhor resultado, costumase comparar as mdias dos dois grupos ao longo do estudo. Em outras ocasies calculam-se esses escores no incio e no final do tratamento, e compara-se a mudana desses escores em cada grupo. O estudo de Borison et al compararam, entre outros desfechos, os escores mdios do BPRS ao final de 8 semanas nos pacientes alocados para o grupo da Clorpromazina com os escores observados entre pacientes do grupo placebo. A mdia do grupo que recebeu clorpromazina foi 46,4, contra 50,5 no grupo placebo.6 Um dos problemas desse tipo de desfecho que, embora seja possvel afirmar que os pacientes que fizeram uso de clorpromazina tivessem uma pontuao mais baixa para os sintomas psiquitricos, difcil extrair um significado clnico dessa diferena. mais fcil entender uma reduo de 25% das recadas do que uma diferena de 4,1 pontos numa escala de sintomas psicticos.

Nvel de significncia - valor de p Nvel de significncia - valor de pNvel de significncia - valor de pNvel de significnci - valor de pNvel de significncia - valor de pNvel de significncia - valor de p At o momento apresentamos diferentes medidas para estimar o tamanho da diferena de um determinado evento (ex: reinternao, agravamento dos sintomas) em grupos expostos a diferentes intervenes (ex: clorpromazina vs placebo). No entanto, ao lermos os ensaios clnicos freqente nos deparamos com expresses do tipo a diferena entre os grupos foi estatisticamente significativa ou p < 0,05 . O que se deseja com essas expresses discutir o papel do acaso nos resultados obtidos em um ensaio clnico. Em outras palavras, ainda que um estudo estime uma eficcia de 30%, esta diferena entre os grupos pode ser casual. Em estatstica, uma das maneiras de abordar essa questo avaliando a evidncia contra o que se denomina hiptese nula, segundo a qual no existe diferena entre os efeitos das intervenes que se est comparando. A fora evidncia contra a hiptese nula avaliada atravs do valor de p, que representa a probabilidade de se observar uma diferena entre os grupos como a que foi encontrada no estudo, quando, na verdade, esta diferena no existe. O valor de p tambm chamado de nvel de significncia e, quanto menor ele for, maior a evidncia contra a hiptese nula. Por se tratar de uma probabilidade, o valor de P varia entre 0 e 1. Os dados de trs ensaios clnicos controlados comparando clorpromazina com placebo (Tabela 4) ajudam a entender essa questo. Todos os estudos foram conduzidos com pacientes hospitalizados, de ambos os sexos. Clark et al randomizaram 55 pacientes, os quais foram acompanhados por 12 semanas, 7 enquanto o estudo de Hall et al incluiu 175 pacientes, acompanhados por 66 dias.8 O estudo de Ban et alocou aleatoriamente 30 pacientes, sendo o perodo de seguimento de

12 semanas.9 A hiptese nula no caso desses estudos que a clorpormazina e o placebo no diferem quanto aos seus efeitos sobre a sintomatologia psictica. Os testes estatsticos apresentados na ltima linha da tabela mostram que, no caso do ensaio de Hall et al, o valor de p 0,01 (ou 1%).8 Portanto, Rev Bras Psiquiatr. 2005;27(2):146-51

Estatstica e ensaios clnicos controlados 150 a probabilidade de se observar uma eficcia de 21% em favor da clorpromazina, quando esta no difere do placebo, de apenas 1%. No caso do estudo de Ban et al, a probabilidade de se encontrar uma eficcia de 25% na ausncia de uma superioridade da clorpromazina em relao ao placebo de 63%.9 Desse modo, o estudo de Hall et al apresenta uma forte evidncia contra a hiptese nula (valor baixo de p),8 enquanto no caso do estudo de Ban et al a evidncia contra a hiptese nula fraca (valor alto de p).9 As razes para essas discrepncias sero discutidas adiante. Para efeito de tomada de deciso, muitos ensaios clnicos consideram a probabilidade menor do que 5% (p < 0,05) como o valor limite para considerar que um efeito observado no estudo real, no sendo decorrente do acaso. Isto , a hiptese nula ser rejeitada caso o valor de p seja inferior a 0,05. Em outras palavras, quando a probabilidade de concluirmos equivocadamente que uma interveno superior outra for menor que 5%. Esse erro denominado erro tipo I ou a. Embora esse limite de 5% para aceitar ou rejeitar a hiptese nula seja habitual em ensaios clnicos, no existe nenhuma obrigao de que o valor de p seja fixado nesse nvel. Dependendo dos riscos em se assumir uma concluso falsopositiva, esse valor pode ser reduzido.** Os resultados dos testes de significncia estatstica, atravs de seus valores de p, costumam ser interpretados equivocadamente como medidas da magnitude do efeito de uma interveno. Quem mede a magnitude do efeito de uma interveno a eficcia, a reduo absoluta de risco, o nmero necessrio para tratar. Os valores de p apenas informam a probabilidade de que uma associao, identificada no estudo, seja um achado falso-positivo decorrente do acaso. Em outras palavras, um valor de p igual a 0,10 ou 10% significa que existe uma probabilidade de 10% de se encontrar uma eficcia como a observada no ensaio clnico na ausncia de superioridade de uma das intervenes. Considerando-se um nvel de significncia de 5% e observando as estimativas de eficcia, vemos que o estudo de Clark et al foi aquele com maior eficcia (32%), embora no seja estatisticamente significativo (p = 0,11).7 Por outro lado, o estudo de Hall et al foi o nico a apresentar significncia estatstica (p = 0,01), embora seja o de menor eficcia (21%).8 Portanto, um nvel de significncia ou valor de p baixo (ex: p = 5% ou 1%) no quer dizer que exista uma forte associao (ex: grande eficcia), mas apenas que existe uma forte evidn cia de que o efeito observado no seja decorrente do acaso. Mas se o teste de significncia estatstica no avalia a magnitude da associao (eficcia, neste caso), por que ele s foi significativo no estudo de Hall et al, exatamente aquele com menor eficcia? Porque esses testes dependem no s da

magnitude da eficcia, mas tambm do tamanho da amostra. 8 Em outras palavras, o nosso grau de certeza de que um efeito observado no decorre do acaso aumenta quando temos um nmero maior de indivduos no estudo. No caso da Tabela 4, o estudo de Hall et al tem uma amostra cerca de 5 vezes maior que a do estudo de Clark et al e cerca de 8 vezes maior que no estudo de Ban et al.7-9 importante ainda ressaltar que o fato de um resultado no ser estatisticamente significativo no deve ser interpretado como evidncia de ausncia de efeito da interveno, mas sim de que as evidncias contra a hiptese nula so fracas. Na Tabela 5 apresentamos dados fictcios sobre o risco de efeitos adversos de dois medicamentos (A e B). Observa-se que a nica distino entre os estudos 1 e 2 o tamanho do grupo investigado, j que a reduo de efeitos adversos observada para o tratamento A a mesma em ambos os casos: 34%. Se arbitrarmos um nvel de significncia de 5%, valores de p acima desse nvel levaro aceitao da hiptese nula e valores de P abaixo desse nvel levaro sua rejeio. Nesse caso, o estudo 1 no permitiria concluir que a droga A apresenta um risco de efeitos adversos superior ao da droga B, pois o valor de P alto (0,52); isto , a probabilidade de que se trate de um achado ao acaso est acima do limite de 5% que arbitramos a priori. No entanto, no estudo 2, nossa concluso seria de que o tratamento A est mais sujeito ocorrncia de efeitos adversos dado que o valor de P baixo (0,04); isto , a probabilidade de que este achado decorra de uma casualidade menor do que o limite de 5% que estabelecemos a priori. Do mesmo modo que na Tabela 4, essa mudana na concluso deve-se a um aumento do tamanho amostral. **NOT **NOT**NOT**NOT**NOT**NOTA: A:A:A:A: A: Parece que esta opo pelo valor de 5% vem dos escritos do estatstico Sir R. A. Fi sher, que expressou sua preferncia por este ponto de corte. Rev Bras Psiquiatr. 2005;27(2):146-51

151 Coutinho ESF & Cunha GM Intervalo de confiana Intervalo de confianaIntervalo de confianaIntervalo de confianaIntervalo de confiana Intervalo de confiana A cada dois anos somos expostos aos resultados das pesquisas eleitorais sobre as preferncias dos eleitores. O percentual de votos de cada candidato apresentado sempre seguido da seguinte informao: a margem de erro da pesquisa de 2% ou de 3% . Isso significa que sempre que fazemos uma pesquisa, seja ela eleitoral ou um ensaio clnico, utilizando uma frao da populao, existe certo grau de incerteza sobre o real valor da estimativa que fazemos. O intervalo de confiana define os limites inferior e superior de um conjunto de valores que tem certa probabilidade de conter no seu interior o valor verdadeiro do efeito da interveno em estudo. Desse modo, o processo pelo qual um intervalo de confiana de 95% calculado tal que ele tem 95% de probabilidade de incluir o valor real da eficcia da interveno em estudo. Na Tabela 5 esto os dados fictcios de dois estudos (estudo 3 e estudo 4) comparando a proporo de pacientes com efeitos adversos observados ao longo do tratamento com dois neurolpticos (C e D). Ambos os estudos tiveram reduo no risco de efeitos adversos de 50% com o uso do medicamento C e um nvel de significncia estatstica menor que 0,001 ou 0,1%. Entretanto, o intervalo de confiana do estudo 4 mais estreito do que o intervalo do estudo 3. Por essa razo, dizemos que o estudo 4 mais preciso do que o estudo 3, pois a regio de incerteza quanto ao verdadeiro valor da RR menor. No caso do estudo 3, h uma probabilidade de 95% do intervalo entre 25% e 67% conter o valor verdadeiro da RRR, enquanto no caso do estudo 4 este intervalo varia apenas de 43% a 56%. No h obrigatoriedade de que o intervalo de confiana seja de 95%, podendo ser de 90%, 99% ou ainda outro valor diferente. O uso do intervalo de confiana permite no s conhecermos a preciso com que o estudo estima certo efeito, como tambm possibilita dizermos se o achado estatisticamente significativo para um dado nvel de significncia. Quando o intervalo de confiana contiver o valor nulo de efeito, o estudo ser inconclusivo (sem significncia estatstica). Como vimos anteriormente, entende-se por valor nulo de efeito o valor que expressa riscos iguais em ambos os grupos. No caso do RR, da eficcia e da RAR os valores nulos so um, zero e zero, respectivamente. Voltando aos estudos da Tabela 4, o ensaio clnico de Hall et al,8 cujo valor de p de 0,01 foi significativo, tem um intervalo de confiana de 95% para a RR que exclui o valor nulo um (0,65-0,95). J o ensaio clnico de Ban et9 al apresentou um valor de p no significativo de 0,63, o que se expressa num intervalo de confiana de 95% que inclui o valor nulo (0,41-1,36).

P PPPPPoder do estudo oder do estudooder do estudooder do estudooder do estudooder do estudo O poder de um ensaio clnico pode ser definido como a probabilidade do estudo identificar uma diferena entre os tratamentos (efeito), quando esta diferena real. O poder influenciado por quatro fatores: a natureza do teste estatstico, o nvel de significncia, o tamanho da amostra e a diferena esperada no efeito dos dois tratamentos. Na Tabela 4, o poder do estudo de Hall et al foi de 77%, enquanto o poder no ensaio de Ban et al9 foi de 16%. Como os estudos observaram eficcias bastante prximas, o que est levando a poderes to distintos a diferena no tamanho amostral.8 Levando em conta o conceito de poder, fica mais claro porque um estudo com resultado sem significncia estatstica no pode ser interpretado como evidncia de ausncia de efeito. Pode ser apenas um caso de falta de poder estatstico para evidenciar este efeito. Por esta razo, de extrema importncia para os ensaios clnicos que: 1) O tamanho amostral propicie um poder elevado. Estudos para detectar efeitos pequenos necessitam amostras maiores. 2) O estudo informe o poder, sobretudo quando seus no alcanam significncia estatstica. Se o poder baixo, nada se pode concluir. Se o poder for alto, considerar, com um pouco mais de segurana, que os tenham efeitos semelhantes. Concluses ConclusesConclusesConclusesConclusesConcluses 1) A magnitude de uma associao ou efeito de uma interveno dada pelo risco relativo, reduo de risco relativo (eficcia), diferena de riscos ou diferena de mdias e no pelo valor de p. 2) O fato de uma interveno num ensaio clnico apresentar maior eficcia (reduo relativa do risco) no significa que ela responsvel pela maior reduo de risco em termos absolutos. 3) O valor de p no indica se o efeito de uma interveno forte ou fraco. Ele apenas indica a probabilidade de se observar determinado um efeito quando este se deve ao acaso. 4) O valor de p influenciado, entre outros fatores, pelo tamanho da amostra. 5) Estudos com amostras maiores tendem a obter estimativas de efeito mais precisas (menor intervalo de confiana) e costumam apresentar maior poder (probabilidade de detectar um efeito quando este existe). resultados for pode-se tratamentos

Referncias RefernciasRefernciasRefernciasRefernciasReferncias 1. 1.1.1.1.1.Medical Research Council. Streptomycin treatment of pulmonary tuberculosis. A Medical Research Council Investigation. BMJ. 1948;2:769-82. 2. 2.2.2.2.2.Pocock SJ. Clinical trials: a practical approach. Chichester: John Wiley & Sons; 1983. 3. 3.3.3.3.3.Meinert CL. Clinical trials: design, conduct and analysis. New York: Oxford University Press; 1986. (Monographs in epidemiology and Biostatistics, 8). 4. 4.4.4.4.4.Prien RF, Cole JO. High dose chlorpromazine therapy in chronic schizophrenia. Report of National Institute of Mental Healthpsychopharmacology research branch collaborative study group. Arch Gen Psychiatry. 1968;18(4):482-95. 5. 5.5.5.5.5.TREC Collaborative Group. Rapid tranquillisation for agitated patients in emergency psychiatric rooms: a randomised trial of midazolam versus haloperidol plus promethazine. BMJ. 2003;327(7417):708-13. Comment in: Evid Based Ment Health. 2004;7(2):42. 6. 6.6.6.6.6.Borison RL, Diamond BI, Dren AT. Does sigma receptor antagonism predict clinical antipsychotic efficacy? Psychopharmacol Bull. 1991;27(2):103-6. 7. 7.7.7.7.7.Clark ML, Ramsey HR, Rahhal DK, Serafetinides EA, Wood FD, Costiloe JP. Chlorpromazine in chronic schizophrenia. The effect of age and hospitalization on behavioral dose-response relationships. Arch Gen Psychiatry. 1972;27(4):479-83. 8. 8.8.8.8.8.Hall RA, Dunlap DJ. A study of chlorpromazine: methodology and results with chronic semi-disturbed schizophrenics. J Nerv Ment Dis. 1955;122(4):301-14. 9. 9.9.9.9.9.Ban TA, Lehmann HE, Sterlin C, Climan M. Comprehesiven clinical studies with thiothixene. Dis Nerv Syst. 1975;36(9):473-7. Rev Bras Psiquiatr. 2005;27(2):146-51