Você está na página 1de 20

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:32 Page 61

LE ITuR A C RT IC A DE ART IGOS C IE NT FICOS

| 61

Captulo 4
Testes de Hipteses
Inferncia estatstica pode ser denida como um conjunto de procedimentos que nos permite
tirar concluses acerca de populaes, a partir do estudo de amostras coletadas desta populao.
No captulo 3 aprendemos a quanticar caractersticas de uma populao ou grupo de dados,
fazer estimativas e, principalmente, saber a preciso destas estimativas.
Os testes de hipteses, que fazem parte da inferncia estatstica, incluem um amplo conjunto
de procedimentos, mas no que diz respeito oncologia, o mais importante so os testes de
signicncia estatstica, por fornecer indicaes sobre a extenso da diferena entre os valores mdios
de 2 ou mais agrupamentos de dados e qual a probabilidade desta diferena ser devida ao acaso.
Trata-se de ferramenta amplamente usada em vrias reas do conhecimento humano nas
quais os dados envolvidos esto sujeitos variabilidade.
No contexto deste Manual, estamos interessados na comparao entre dois, ou mais, grupos,
como por exemplo, tratamentos, procedimentos diagnsticos, dietas, etc.
Este tema dever ser subdividido nos seguintes tpicos:
4.1) Hipteses a serem testadas
4.2) Critrio de deciso
4.3) Erros tipos I e II, nvel de signicncia e o poder do teste
4.4) Probabilidade de signicncia (valor p)
4.5) Hipteses unilaterais X bilaterais (one-sided e two-sided)
4.6) Critrios de escolha e exemplos

4.1. Hipteses a serem testadas


uma hiptese uma alegao a respeito de um determinado problema. Em termos
estatsticos, uma hiptese uma armao sobre um parmetro de uma populao, tais como
mdia, proporo, desvio-padro, coeciente de correlao, etc. uma vez denida a hiptese, esta
dever ser comprovada ou rejeitada. A ferramenta de comprovao denominada teste de hiptese.
Na comparao entre dados numricos, sujeitos a variabilidade, extrados de amostras de
uma mesma populao, uma diferena real entre eles pode no ser evidente primeira vista. A
armativa inversa, ou seja, de que a ausncia de diferena real pode no ser evidente primeira
vista, tambm verdadeira.
Por conveno, podemos formular os problemas atravs de 2 hipteses:
a.1) Hiptese nula
Quando temos um problema de comparao de dois tratamentos usual xar como hiptese
de interesse a inexistncia de diferena entre os dois tratamentos comparados. A hiptese a ser
testada chamada de hiptese nula (H0).
a.2) Hiptese Alternativa
A hiptese nula deve ser comparada com uma hiptese alternativa, denominada H1. Para

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:32 Page 62

62 |

L E IT u R A CR T IC A D E A RT IG OS C IE NT FICOS

cada situao existem muitas hipteses alternativas adequadas. Seguindo conveno, a hiptese
alternativa a inexistncia de igualdade entre os tratamentos.
Exemplo:
H0 : pc = pt versus H1: pc pt
Onde pc e pt so respectivamente as probabilidades de se observar a resposta de interesse
entre os controles e entre os pacientes do grupo tratamento.
importante notar que as hipteses denidas se referem comparao do parmetro
populacional dos pacientes controles com o parmetro populacional do grupo tratamento. No
entanto, para testar estas hipteses so empregados resultados baseados em amostras. Logo, os
resultados amostrais so generalizados, aps o teste de hiptese, para todo o universo estudado.
Existem situaes inerentes a alguns experimentos clnicos nos quais hipteses diferentes
podem ser utilizadas, como veremos no prximo captulo.

4.2. Critrio de deciso


Aps decidirmos as hipteses a serem testadas, teremos que construir um critrio baseado no
qual a hiptese H0 ser julgada. O critrio de deciso baseado na estatstica de teste. De uma
forma bem genrica e intuitiva podemos dizer que a estatstica do teste mede a discrepncia entre
o que foi observado na amostra e o que seria esperado se a hiptese nula fosse verdadeira.
Rejeitaremos a hiptese nula se o valor da estatstica de teste for grande, o que traduziria uma
discrepncia entre os dados. Na prtica para se decidir quo grande o valor da estatstica de
teste necessria a comparao entre o valor obtido e o valor estabelecido em uma distribuio
hipottica de dados. Pequenas diferenas podem ser devido ao acaso em funo da variabilidade
dos dados; quanto maior a diferena menor a probabilidade do acaso para sua explicao. Nesta
circunstncia uma relao de causa e efeito, ou de concomitncia, pode ser inferida.
Para que clculos estatsticos possam ser realizados, vrios critrios necessitam ser denidos
a priori, como veremos em seguida.

4.3 - Erros tipo I e II (nvel de significncia e poder do teste)


A deciso de rejeitar H0 quando de fato ela verdadeira chamada de erro tipo I. Para evitlo, escolhemos um critrio de deciso que torna este erro pouco provvel. Na literatura, a
probabilidade de cometer esse erro recebe o nome de nvel de signicncia do teste, sendo
representado pela letra grega a(alfa).
H um segundo tipo de erro, erro tipo II, que consiste em no rejeitar a hiptese nula sendo
que ela falsa. Isto implicaria na no liberao do novo tratamento, cujo efeito real no est sendo
percebido. representado por b(beta).
Convencionou-se que o erro mais srio seria o tipo I. O quadro 4.1 a seguir sintetiza os erros
possveis associados a cada deciso tomada em um teste de hipteses.

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:32 Page 63

LE ITuR A C RT IC A DE ART IGOS C IE NT FICOS

| 63

QUADRO 4.1 - Erros possveis associados a teste de hipteses


Concluso
do teste

Situao
H0 verdadeira

Real
H0 falsa

No rejeitar H0
Rejeitar H0

deciso correta
erro tipo I

erro tipo II
deciso correta

A capacidade de um teste identicar diferenas que realmente existem, ou seja, de rejeitar H0


quando realmente falsa, denominada poder do teste e denida como 1 - b.

4.4. Probabilidade de significncia (valor p)


Existem duas opes para expressar a concluso nal de um teste de hipteses. A primeira
consiste em comparar o valor da estatstica de teste com o ponto crtico a partir da distribuio
terica, especca para o teste, para um valor pr-xado do nvel de signicncia (por exemplo 5%
ou 1%), conforme descrito na gura 4.1.

FIGURA 4.1 - Concluso para um teste de hiptese. Na primeira curva, a estatstica de teste
se encontra fora da rea de rejeio, logo no rejeito Ho. Para a segunda curva, a estatstica
de teste se encontra dentro da rea de rejeio, logo rejeito H0.
Na segunda opo, a mais usada, o interesse quanticar a ocorrncia do que foi observado
ou de resultados mais extremos, sob a hiptese da igualdade dos grupos. Assim, essa opo, baseiase na probabilidade de ocorrncia de valores iguais ou superiores ao assumido pela estatstica de
teste, sob a hiptese de que H0 seja verdadeira, conforme mostrado na gura 4.2.

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:32 Page 64

64 |

L E IT u R A CR T IC A D E A RT IG OS C IE NT FICOS

FIGURA 4.2 - CConcluso para um teste de hiptese. Na primeira curva, o valor p maior do
que o nvel de significncia (alfa), logo no rejeito H0. Para a segunda curva, o valor p
menor do que o nvel de significncia(alfa), logo rejeito H0.
Este nmero chamado de probabilidade de signicncia ou valor p e freqentemente
indicado apenas por p. Como o valor p calculado supondo-se que H0 seja verdadeira, duas
conjecturas podem ser feitas quando se obtm um valor muito pequeno. um evento que
extremamente raro pode ter ocorrido ou a hiptese H0 no deve ser verdadeira, isto , a conjectura
inicial e conservadora no parece plausvel.
De um modo geral, na rea mdica, considera-se que valor p menor ou igual a 0,05 indica
que h evidncias para rejeitar H0, ou seja, h diferena signicativa entre os grupos.
Nas outras situaes a diferena encontrada no signicante, do ponto de vista estatstico.
Esses pontos de corte so arbitrrios e no se deve dar uma importncia exagerada a eles.
inaceitvel que os resultados de dois estudos em que os valores p sejam 0,045 e 0,055 sejam
interpretados de forma diferente para a= 0,05. Esses valores devem levar a concluses muito
parecidas e no diametralmente opostas (signicativo e no signicativo).

4.5 Hipteses bilaterais versus unilaterais


As hipteses alternativas, respectivamente para o teste de comparao de propores, de
mdias ou de medianas (no caso de testes no-paramtricos) so: H1: p1 p2 e H1: 1 2
Mas podem ser desmembradas como: H1: p1 > p2 ou H1: p1 < p2 e H1: 1 > 2 ou H1: 1 < 2.
Estas hipteses assumem, portanto, que qualquer um dos dois grupos pode ter uma
proporo ou mdia maior do que o outro. Por isto este tipo de hiptese denominada bilateral.
O valor p bilateral a probabilidade de se obter em qualquer direo uma diferena igual ou mais
extrema do que a observada.
Existe tambm a possibilidade de se formular hipteses alternativas unilaterais (H1), como a seguir:
Situao
(1)
(2)

Propores
H1: p1 > p2
H1: p1 < p2

Mdias
H1: 1 > 2
H1: 1 < 2

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:32 Page 65

LE ITuR A C RT IC A DE ART IGOS C IE NT FICOS

| 65

Nestes casos, as comparaes so estabelecidas em uma determinada direo. Assim, por


exemplo, ao se comparar um procedimento novo com o padro, estamos avaliando se a inovao
deve ser recomendada. Portanto, a escolha de hipteses unilaterais ou bilaterais inuencia
decisivamente a interpretao dos resultados da anlise estatstica.
As duas opes de testes (unilateral ou bilateral) esto disponveis em programas de
computador. Em geral, o valor p para teste bilateral o dobro do valor p correspondente hiptese
unilateral (gura 4.3).

FIGURA 4.3 - Opes de testes de hipteses (unilateral ou bilateral).


H circunstncias em que hiptese unilateral a melhor forma de se descrever a questo de
interesse. Em estudos comparando uma inovao de um procedimento padro, a hiptese
alternativa mais interessante que a inovao superior, um apelo hiptese unilateral.
um teste unilateral tambm pode ser justicado quando se pode armar que uma das direes
contempladas pela hiptese bilateral completamente inconcebvel.
O argumento mais forte contra o uso de hipteses unilaterais que, por maior que seja a
evidncia de que um tratamento seja superior ao outro, nunca se tem certeza absoluta do que
realmente pode acontecer. Embora existam razes para esperar que novas drogas, ou novos
procedimentos, sejam melhores que os do grupo controle (caso contrrio o estudo no estaria
sendo realizado), ainda assim existe a possibilidade, mesmo que remota, de que seus resultados
sejam piores. Na comparao de uma droga com o placebo, no se pode descartar a possibilidade
de que a droga tenha um efeito deletrio, e portanto, no deva ser recomendada.
Na escolha entre hiptese bilateral e unilateral os seguintes aspectos devem ser considerados:
1. O tipo de hiptese adotado deve preceder a anlise dos dados, isto , a escolha no deve
ser inuenciada pelo resultado da amostra.
2. O teste bilateral mais conservador que o unilateral. Na maioria dos casos, testes unilaterais
so vistos como uma maneira de se exagerar a fora dos achados. Se houver qualquer dvida, devese optar pelo teste bilateral.
3. Segundo alguns autores, a distino entre testes unilaterais e bilaterais no de fundamental importncia na interpretao dos resultados, desde que que claro qual foi usado.
4. Mesmo quando o teste unilateral pode ser justicado, pode-se encontrar resistncia editorial
para publicar tais achados.
5. Teste bilateral a forma padro, usada em peridicos mdicos.

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:32 Page 66

66 |

L E IT u R A CR T IC A D E A RT IG OS C IE NT FICOS

Alguns estatsticos e editores de jornais acreditam que o valor p unilateral nunca deva ser
usado. O primeiro argumento a uniformidade de apresentao dos resultados, tal que um
determinado valor p tenha um mesmo signicado em todos os artigos. Segundo, acreditam que
situaes que justicam o uso do testes unilaterais so extremamente raras. Terceiro, em estudos
sobre importantes questes, como a regulamentao de uma droga, o valor p apenas um fator
usado na tomada de decises. O critrio de que o valor p seja menor que 0,05, em geral
insuciente para estabelecer ecincia e pelo menos o teste bilateral mais conservador.
Aceitando estes argumentos e considerando a padronizao j existente na maioria dos
peridicos mdicos, recomendamos o uso rotineiro de hipteses bilaterais.

4.6 Critrios de escolha e exemplos


4.6.1 Critrios de escolha
Dentre os inmeros testes e tcnicas estatsticos que se apresentam no contexto de um
trabalho de pesquisa, natural certo grau de desorientao inicial quanto identicao daqueles
que so ou no aplicveis a cada situao. Para realizar as escolhas adequadas, importante
considerar alguns parmetros bsicos dos dados a serem analisados, tais como:
N de Amostras: O nmero de grupos distintos sendo analisados.
Relaes Entre Amostras: Refere-se a duas ou mais amostras consistirem ou no de mltiplas
medidas das mesmas entidades ou de entidades relacionadas (serem ou no pareadas ou
casadas).
Escala Numrica: A forma que os dados foram registrados (escala qualitativa, quantitativa
discreta e quantitativa contnua).
Distribuio: A densidade de probabilidade (distribuio de probabilidade) dos dados
(Normal ou No-Normal).
Dependncia Entre Variveis: O conhecimento de que uma varivel pode contribuir ou no
para o conhecimento de outras (respectivamente, serem associadas ou independentes entre si).
So estes os fatores que determinam quais os procedimentos grcos e analticos possveis
para cada combinao de nmero de amostras e tipos de dados.
A tabela 4.2 abaixo indica as tcnicas estatsticas que podem ser aplicadas para a comparao
entre os parmetros de dois ou mais grupos de dados.

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:32 Page 67

LE ITuR A C RT IC A DE ART IGOS C IE NT FICOS

| 67

Tabela 4.2 - Testes estatsticos utilizados na comparao entre parmetros de duas ou


mais amostras
Comparaes
Tipo de
N de
Relao
Amostras
Pareadas
2

Distribuio

Escala Numrica

Normal

Quant. Contnua
Quant. discreta
Quant. discreta,
Quant. contnua
Qualitativa
Dicotmica*
Quant. Contnua
Quant. discreta
Quant. discreta,
Quant. contnua
Qualitativa
Quant. Contnua
Quant. discreta
Quant. discreta,
Quant. contnua
Qualitativa
Quant. Contnua
Quant. discreta
Quant. discreta,
Quant. contnua
Qualitativa

Pareadas

No-Normal

Pareadas

No-Normal

No-Pareadas

Normal

No-Pareadas

No-Normal

2
3

No-Pareadas
Pareadas

No-Normal
Normal

Pareadas

No-Normal

3
3

Pareadas
No-Pareadas

No-Normal
Normal

No-Pareadas

No-Normal

No-Pareadas

No-Normal

Anlises
Aplicveis
Teste t de Student
Pareado
Sign-Test, Wilcoxon
Matched-Pairs Test
Teste de McNemar
Teste t de Student
Teste Mann-Whitney u
Teste de Qui-Quadrado
ANOVA c/ Medidas
Repetidas
Teste de Friedman
Teste Q de Cochran
ANOVA c/ Grupos
Independentes
Teste de Kruskal-Wallis
Teste de Qui-Quadrado

* Varivel com apenas dois valores ou duas categorias (varivel binria).

O quadro a seguir mostra as tcnicas analticas e procedimentos grcos aplicveis quando


se quer vericar a existncia e/ou caracterizar a relao entre duas ou mais variveis.

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:32 Page 68

68 |

L E IT u R A CR T IC A D E A RT IG OS C IE NT FICOS

Tabela 4.3 - Tcnicas analticas e procedimentos grficos usados na determinao da


relao entre duas ou mais variveis
Relao / Associao
N de
Escala Numrica das
Variveis
Variveis
2
Quantitativa
contnua

Distribuio
Normal

No-Normal

Quant. discreta e/ou


Quant. contnua
Qualitativa

Quantitativa
contnua

Normal ou
No-Normal

Qualitativa

No-Normal

Quantitativa
contnua

Normal e/ou
No-Normal

Qualitativa
dicotmica* (VarivelResposta) e
Qualitativa ou
Quantitativa
(variveis explicativas)

Normal e/ou
No-Normal

No-Normal

Anlises
Aplicveis
Correlao de
Pearson, Regresso
Linear Simples
Correlao de
Spearman
Odds Ratio, Teste de
Qui-Quadrado
Regresso Mltipla
(Linear
e No-linear)
Anlise
Discriminante
Regresso Linear
Mltipla, Regresso
No-Linear

Regresso Logstica

Grficos
Aplicveis
Diagrama de
Disperso (X,Y)
Diagrama de
Disperso (X,Y)
--Diagrama
Previso vs.
Observao
---

---

---

* Varivel com apenas dois valores ou duas categorias (varivel binria).

Os quadros acima apontam para as anlises de dados possveis nas diversas situaes de
pesquisa, porm, no indicam exatamente os procedimentos a serem adotados em cada situao.
Isso ocorre devido ao fato de que a deciso nal depende no apenas das restries matemticas,
mas tambm dos objetivos do estudo e da prpria natureza dos achados que vo sendo
produzidos. importante, contudo, ter em mente que as tabulaes apresentadas constituem um
mapa de referncia que deixa claro espao para aes, dentro do qual pode se manifestar a
liberdade do pensador analtico.
4.6.2 Exemplos
I - Testes paramtricos
Ilustraremos alguns testes estatsticos da tabela 4.3 acima omitindo no entanto, o clculo da
estatstica de teste, que fornecido pelos programas estatsticos usuais.
Varivel dicotmica: amostras independentes
Neste caso, a varivel de interesse a ocorrncia de um determinado evento, como o
desenvolvimento de uma doena, ou a presena de certo atributo, por exemplo, albinismo.
usaremos exemplo citado por Siqueira e Teixeira (2002), a propsito do tratamento de
pacientes aidticos com AZT ou placebo e cujos resultados so descritos na tabela 4.4.

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:32 Page 69

LE ITuR A C RT IC A DE ART IGOS C IE NT FICOS

| 69

O problema da comparao das probabilidades de ocorrncia do evento ou do atributo nos


dois grupos formulado atravs das hipteses
H0: p AZT vivo = p AZT morto = p Placebo vivo = p Placebo morto
H1: pelo menos 1 grupo diferente
Tabela 4.4 - Nmero de sobreviventes tratados com AZT ou placebo
Grupo
AZT
Placebo
Total

Vivo
144
121
265

Situao
Morto
1
16
17

Total
145
137
282

Fonte: Siqueira e Teixeira (2002)

Calculado o valor da estatstica do teste (teste do X2), preciso decidir se este ou no um valor
grande. Assim, para se tomar uma deciso sobre a igualdade ou no das duas propores, preciso
conhecer o comportamento, isto , a distribuio estatstica dos valores de X2 quando as propores
so iguais. Esta distribuio foi obtida e recebeu o nome de qui-quadrado com 1 grau de liberdade,
indicada por X21 e est sintetizada em tabelas de fcil utilizao. A gura 4.4 ilustra a distribuio
do X2 com 1 grau de liberdade.

FIGURA 4.4 - Distribuio qui-quadrado e o valor da estatstica de teste.


O valor da estatstica de teste foi de 13,14. Como este valor maior que 3,84, obtido da
distribuio de X21 para um nvel de signicncia de 0,05, rejeita-se a hiptese de igualdade entre
os grupos de tratamento e controle. Em outras palavras, decidimos com 95% de conana que h
evidncia do efeito do AZT. Para obtermos a probabilidade de signicncia devemos calcular a
probabilidade de encontrar valores maiores que 13,14, isto , P[X21 13,14], sendo verdadeira a
hiptese de igualdade das propores. Da tabela da distribuio do X21, vemos que este valor
aproximadamente 0,0001, ou seja, o valor p 0,0001.
Baseado neste estudo, possvel armar, com 95% de certeza, que o AZT tem efeito de
prolongar a vida de pacientes com AIDS, sendo esta a primeira evidncia necessria para a liberao
do medicamento.

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:33 Page 70

70 |

L E IT u R A CR T IC A D E A RT IG OS C IE NT FICOS

Apresentaremos, agora, um teste para a comparao entre 2 propores: o teste Z. Trata-se


de um teste aproximado que requer grandes amostras para a sua aplicao. um critrio exigir que
n1p1 e n2p2 excedam o valor 5.
Queremos testar a hiptese de equivalncia entre dois tratamentos:
H0: p1 = p2 versus H1: p1 p2
Com o objetivo de comparar a eccia de dois preventivos contra nusea, dividiu-se
aleatoriamente uma amostra de 400 marinheiros em dois grupos de 200. um grupo recebeu a
plula A e o outro a plula B, sendo que no 1 grupo 152 no enjoaram durante uma tempestade e
no outro grupo apenas 132. H indicaes de que a eccia das plulas A e B seja a mesma?
Sejam pA e pB as propores de marinheiros que no enjoam, respectivamente com as plulas
A e B. Temos nA = 200 e nB = 200,

O valor da estatstica de teste : 2,22

FIGURA 4.5 - Curva normal com o valor da estatstica de teste e o ponto crtico.
Fixando-se o nvel de signicncia em 5%, rejeita-se H0. O valor p encontrado para Z 0,026.
Portanto pode-se concluir, com conana de 95%, que as duas plulas no so igualmente efetivas.
H indicaes de que a plula A oferece maior proteo contra nuseas comparada plula B.
Varivel dicotmica: amostras pareadas
Foram avaliados 100 doentes com cefaleias frequentes. Os mesmos 100 doentes tomaram
durante um ms um determinado medicamento A e no ms seguinte o medicamento B. Pediu-se
aos pacientes que registrassem se durante cada ms tiveram ou no dores de cabea.

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:33 Page 71

LE ITuR A C RT IC A DE ART IGOS C IE NT FICOS

| 71

Tabela 4.5 - Pacientes com cefalias frequentes usandos dois tipos de medicamentos
Medicamento B
Sem cefalia
Com cefalia
Total

Medicamento A
Sem cefalia
Com cefalia
45
4
17
34
62
38

Total
49
51
100

Fonte: http://medicina.med.up.pt/im/im2004/teoricas/categoricas.ppt

O teste apropriado para esta situao o teste de McNemar.


As hipteses so:
H0: A percentagem de doentes com cefalias usando o medicamento A igual a percentagem
de doentes com cefaleias usando o medicamento B.
H1: A percentagem de doentes com cefalias usando o medicamento A diferente da
percentagem de doentes com cefaleias usando o medicamento B.
O valor da estatstica do teste de McNemar : 6,86, conforme ilustrado na gura 4.6.

FIGURA 4.6 - Estatstica de teste do teste de McNemar.


Este valor deve ser comparado com 3,84 para um nvel de signicncia de 5%. Ou seja, com
uma conana de 95% a percentagem de doentes com cefalias usando o medicamento A
diferente da percentagem de doentes com cefaleias usando o medicamento B.
Resposta Contnua: amostras independentes
Agora apresentaremos a metodologia para comparar dois grupos de pacientes (por exemplo,
doentes vs no doentes) em relao a uma resposta contnua, por exemplo presso sistlica. Testase ento, nesse caso, a igualdade das mdias das respostas de dois tratamentos.
Sejam 1 e 2 as mdias da varivel estudada para os dois grupos, respectivamente. As
hipteses a serem testadas so:

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:33 Page 72

72 |

L E IT u R A CR T IC A D E A RT IG OS C IE NT FICOS

H0: 1 = 2 versus H1 :1 2
Vamos apresentar agora, o teste mais conhecido (o teste t para duas amostras) e adequado
para situaes em que as respostas aos dois tratamentos so variveis quantitativas com
distribuio normal (gaussiana) para os dois grupos. Assim, as suposies para se usar este teste
so que as variveis estudadas tm distribuies gaussianas com o mesmo desvio padro. Para
isso, deve-se realizar o teste de normalidade (Kolmogorov-Smirnov) e o teste de duas varincias
(teste de Fisher).
um estudo relata os resultados de um ensaio clnico aleatorizado, duplo-cego, realizado com
o objetivo de comparar a tianeptina com o placebo. Participaram desse estudo pacientes de Belo
Horizonte, Campinas e Rio de Janeiro.
Sucintamente, o ensaio consistiu em administrar a droga a dois grupos de pacientes,
compostos de forma aleatria, e quanticar a depresso atravs da escala de MADRS, em que os
valores maiores indicam maior gravidade da doena. O escore foi obtido para cada paciente 7, 14,
21, 28 e 42 dias aps o incio do ensaio.
Pelo planejamento adotado, os dois grupos no diferiam em termos de depresso no incio
do ensaio. Assim, uma evidncia sobre o efeito da tianeptina obtida comparando-se os dois
grupos ao m de 42 dias.
A Tabela 4.6 apresenta os escores nais dos pacientes dos dois grupos admitidos em Belo
Horizonte.
Tabela 4.6 - Escore final na escala MADRS de pacientes dos dois grupos admitidos em Belo
Horizonte
Grupo
Placebo

Tianeptina

Escores
6 33 21 26 10 29 33 29
37 15 2 21 7 26 13
10 8 17 4 17 14 9 4
21 3 7 10 29 13 14 2

Fonte: Siqueira e Teixeira (2002)

Para se efetuar o teste t preciso usar as seguintes informaes:


n1 = 15 x1= 20,53 s1 = 11,09
n2 = 16 x2= 11,37 s2 = 7,26
A estatstica de teste encontrada foi igual a 2,74, que comparando com o valor de t29;0,975 =
2,045 leva rejeio da igualdade entre os dois grupos no nvel de 5% (gura 4.7). O valor p
encontrado foi 0,0104.
Para aplicarmos o teste t necessrio que os dois grupos comparados tenham a mesma
variabilidade, o que nem sempre ocorre na prtica. No caso de amostras grandes (n1 e n2 > 30)
dispomos de um teste em que no necessria qualquer suposio adicional sobre s21 e s22, ou
seja, as varincias podem ser iguais ou diferentes: o teste Z para comparao de mdias.

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:33 Page 73

LE ITuR A C RT IC A DE ART IGOS C IE NT FICOS

| 73

FIGURA 4.7 - Distribuio de t com grau de liberdade de 29 para nvel de significncia de


5,0%.
um estudo foi feito em um grande nmero de pacientes para comparar dois agentes
anestsicos, o halotano, de efeito poderoso, mas que pode causar complicaes em pacientes com
problemas cardacos e a morna, que tem pequeno efeito na atividade cardaca. Todos pacientes
foram submetidos a uma cirurgia de rotina para reparo ou substituio da vlvula cardaca. Para
obter duas amostras comparveis, eles foram alocados aleatoriamente a cada tipo de anestesia.
A m de estudar o efeito desses dois tipos de anestesia, foram registradas variveis
hemodinmicas, como presso sangunea antes da induo da anestesia, aps a anestesia, mas
antes da inciso, e em outros perodos importantes durante a operao. A questo que surge se
o efeito do halotano e da morna na presso sangunea o mesmo. A mdia e o desvio-padro dos
dois grupos encontram-se a seguir:
Tabela 4.7 - Mdia e desvio-padro da presso sangunea (mmHg) segundo o tipo de
anestesia
Informaes sobre a amostra
Mdia
Desvio-padro
n

Anestesia
Halotano
66,9
12,2
61

Morfina
73,2
14,4
61

Fonte: Siqueira e Teixeira (2002)

Nas condies do problema, as hipteses so:


H0: 1 = 2 e H1 :1 2
Isto , devemos testar a diferena entre as presses sanguneas mdias de indivduos
anestesiados com halotano ou morna.
Como as amostras so grandes, podemos usar o teste Z, cujo valor da estatstica do teste de
-2,61
Adotando um nvel de signicncia de 5%, o resultado estatisticamente signicativo, j que
|-2,61| > 1,96 (gura 4.8). Alm disso, o valor p = 0,009, que menor que o valor de estipulado,
indicando que os dois anestsicos no so equivalentes.

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:33 Page 74

74 |

L E IT u R A CR T IC A D E A RT IG OS C IE NT FICOS

FIGURA 4.8 - Teste da diferena entre as presses sanguneas mdias de indivduos


anestesiados com halotano ou morfina.
Varivel contnua ou discreta: amostras pareadas
Consideremos a seguinte pergunta: ser que o armazenamento da amostra do sangue
inuencia o valor da medida do colesterol e do triglicrides?
Neste caso, o problema de interesse uma comparao entre dois grupos de medidas: de
triglicrides, por exemplo. razovel supor, e existem evidncias empricas neste sentido, que a
distribuio estatstica do nvel de triglicrides normal (gaussiana). No entanto, aconselhvel
usar o teste de normalidade para o nvel de triglicrides. Se o possvel efeito do armazenamento
se d apenas no aumento ou decrscimo na mdia da distribuio, no na sua variabilidade, ento
as hipteses a serem testadas so:
H0: 1 = 2 e H1 :1 2
Onde 1 e 2 so as mdias antes e depois do armazenamento. A escolha de H0 implica que, na
ausncia de outras evidncias, consideremos que o armazenamento no tem efeito. Intuitivamente,
o critrio de deciso, a ser utilizado para testar H0, deve ser baseado nas diferenas entre os nveis
encontrados de triglicrides nas duas ocasies das medidas. Se houver inuncia do armazenamento, ento essas diferenas devem ser diferentes de zero.
O problema de escolha de um critrio de deciso reduz-se a escolher uma forma de vericar
se as diferenas so provenientes de uma distribuio com mdia zero.
um exemplo semelhante pode ser ilustrado pelo estudo cujo objetivo era avaliar a efetividade
de uma dieta combinada com um programa de exerccios fsicos na reduo do nvel srico de
colesterol.
A tabela abaixo mostra os nveis de colesterol de 12 participantes no incio e no nal do
programa.

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:33 Page 75

LE ITuR A C RT IC A DE ART IGOS C IE NT FICOS

| 75

Tabela 4.8 - Nveis de colesterol no incio e no final do programa


Incio (x1)
201
231
221
260
228
237
326
235
240
267
284
201

Programa
Final (x2)
200
236
216
233
224
216
296
195
207
247
210
209

Diferena
d = x1-x2
1
-5
5
27
4
21
30
40
33
20
74
-8

Desvio
d- d
-19,16
-25,16
-15,16
6,83
-16,16
0,83
9,83
19,83
12,83
-0,16
53,83
-28,16

Desvio ao quadrado
(d-d)2
367,36
633,36
230,03
46,69
261,36
0,69
96,69
393,36
164,69
0,03
2898,03
793,36

Fonte: Arango (2005).

Quanto maior o valor d (que representa a mdia das diferenas x1-x2) maior a evidncia de
que o programa reduz o nvel de colesterol; quanto menor a variabilidade das diferenas
individuais, maior a chance de se detectar um efeito mdio signicativo, isto , uma reduo
signicativa do colesterol devido ao do programa e no ao acaso. Estes aspectos podem ser
avaliados atravs do teste t.
Sejam a e d respectivamente as mdias dos nveis de colesterol antes e depois do programa.
Para testar a hiptese de que o programa altera o nvel de colesterol (H0: a = d x H1: a d) ser
aplicado o teste t (11 graus de liberdade).
Apenas dois participantes tiveram o nvel de colesterol aumentado aps o programa, mas
por pequenas quantidades (5 e 8 mg/dl). As mdias antes e depois do programa so respectivamente 244,25 e 224,08, correspondente a uma reduo mdia de 20,12 mg/dl (d = 20,17). A
estatstica de teste foi de 3,02 (p = 0,012), isto , h evidncia de que, em mdia, o programa altera
o nvel de colesterol (gura 4.9).

FIGURA 4.9 - Teste t para as mdias antes e depois do programa

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:33 Page 76

76 |

L E IT u R A CR T IC A D E A RT IG OS C IE NT FICOS

II - Testes No Paramtricos
Os testes estudados at agora envolviam problemas nos quais a distribuio da populao em
estudo era conhecida, ou pelo menos nunca colocada em causa, e as hipteses testadas apenas
envolviam parmetros populacionais.
No entanto, outros tipos de problemas podem ser colocados: se a distribuio de uma
populao desconhecida e se pretender testar a hiptese de uma distribuio particular para
aquela populao, que fazer?
Os testes denominados testes no paramtricos ou testes de distribuio livre constituem uma
alternativa para este e outros tipos de problemas.
O termo distribuio livre popularmente usado para indicar que os mtodos so aplicveis
independentemente da forma da distribuio.
Estes mtodos so, em geral, fceis de aplicar, pois podem ser usados quando as hipteses
exigidas por outras tcnicas no so satisfeitas.
Relembramos aqui que os testes paramtricos estudados at agora comportam uma
diversidade de suposies fortes a que o seu emprego deve subordinar-se: as observaes devem
ser extradas de populaes com distribuio normal, as variveis em estudo devem ser medidas
em escala intervalar ou de razo, de modo a que seja possvel utilizar operaes aritmticas sobre
os valores obtidos das amostras (adio, multiplicao, obteno de mdias, etc.).
Apesar de haver certas suposies bsicas associadas maioria das provas no paramtricas,
essas suposies so em menor nmero e mais fracas do que as associadas s provas paramtricas.
Servem para pequenas amostras e, alm disso, a maior parte das provas no paramtricas
aplica-se a dados medidos em escala ordinal e, alguns, a dados em escala nominal.
Dentre uma vasta gama de testes no paramtricos disponveis, foram selecionados, para
anlise neste captulo, apenas alguns testes de utilizao freqente ou que complementam, de
alguma forma, os testes paramtricos discutidos anteriormente.
Em resumo, nos exemplos mencionados anteriormente, os testes aplicados foram baseados
em distribuies de probabilidade, denominado testes paramtricos; contudo, abordaremos nos
prximos exemplos testes no paramtricos, ou seja, testes que no possuem distribuio de
probabilidade.
Resposta Contnua ou Discreta: duas amostras independentes
O teste de Mann-Whitney a verso no paramtrica do teste t. Sendo assim, o interesse
testar se as medianas so iguais ou diferentes entre si.
A tabela ao lado exibe a taxa de uria de pacientes renais e sua condio quanto presena
de insucincia renal aguda (IRA).
Neste tipo de situao, cruzamento de uma varivel quantitativa (uria) com uma varivel
dicotmica (IRA), vivel empregar o teste de Mann-Whitney.
usando um programa de estatstica adequado, temos que a estatstica de teste foi de -2,76.
Este valor corresponde a um valor p = 0,00289. Como o valor-p menor que o nvel de signicncia
de 5%, logo pode-se dizer que existe uma diferena, signicativa, entre a taxa de uria de
portadores ou no portadores de IRA.

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:33 Page 77

LE ITuR A C RT IC A DE ART IGOS C IE NT FICOS

| 77

Tabela 4.9 - Pacientes segundo a taxa de uria (mg/100ml) e a presena ou no de IRA


Paciente
01
02
03
04
05
06
07
08
09
10
11
12

Uria
92
120
68
70
77
63
26
33
38
25
21
15

IRA
Sim
Sim
Sim
Sim
Sim
Sim
No
Sim
No
No
No
No

Fonte: Arango (2005).

Resposta Contnua ou Discreta: trs ou mais amostras independentes


O teste de Kruskall Wallis utilizado quando no possvel aplicar a Anova, pois os dados
no seguem distribuio normal. Sendo assim, as hipteses so denidas pela mediana e no pela
mdia.
A tabela abaixo mostra o ndice de Massa Corporal (IMC) e o grau de estadiamento do cncer
colorretal em 18 pacientes submetidos a cirurgia. O objetivo vericar se o grau de estadiamento
desta doena se relaciona o IMC.
Tabela 4.10 - IMC de trs grupos de pacientes
Estadiamento I
22.41
27.99
19.57
19.56
19.15
22.21

Estadiamento II
22.26
28.24
18.37
22.10
7.33
22.21

Estadiamento III
20.83
22.31
18.22
20.88
18.73
21.27

Fonte: Dados Fictcios

usando um software adequado, temos que a estatstica de teste foi de 0,758. Este valor
corresponde a um valor-p = 0,685. Como o valor-p maior que o nvel de signicncia de 5%,
pode-se dizer que o estadiamento do cncer colorretal no se correlacionou com o ndice de Massa
Corporal.
Resposta Contnua ou Discreta: duas amostras pareadas
O teste de Wilcoxon utilizado quando no possvel aplicar o teste t pareado, pois os dados
no seguem distribuio normal, ou seja, a verso no paramtrica do teste t pareado. Sendo
assim, o interesse testar se as medianas so iguais ou diferentes entre si.
A tabela abaixo mostra o nvel mximo de concentrao (NMC) de 12 pacientes selecionados
aleatoriamente, antes e depois da ingesto de determinada droga. O objetivo deste estudo era
testar a eccia desta droga em relao capacidade de aprendizado.

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:33 Page 78

78 |

L E IT u R A CR T IC A D E A RT IG OS C IE NT FICOS

Tabela 4.11 - Nveis mximos de ateno/concentrao, em segundos, em uma amostra


de 12 indivduos, antes e depois da ingesto da droga de teste
Paciente
01
02
03
04
05
06
07
08
09
10
11
12

NMC Antes
9
16
12
28
5
33
17
13
18
12
26
14

NMC Depois
14
22
18
23
11
40
15
18
22
31
19
8

Fonte: Arango (2005).

usando um programa de estatstica adequado, temos que a estatstica de teste foi de 1,44.
Este valor corresponde a um valor-p = 0,074 para o teste unilateral. Como o valor-p maior que o
nvel de signicncia de 5%, pode-se dizer que o uso da nova droga no aumenta a capacidade de
aprendizado. Recomenda-se fazer o teste com um nmero maior de pacientes para se ter uma
melhor concluso sobre o efeito real da droga.
Resposta Contnua ou Discreta: trs ou mais amostras pareadas
O teste de Friedman uma generalizao do teste de Wilcoxon para situaes de mais de
duas opes na comparao de dados. Este teste utilizado quando no possvel aplicar o teste
Anova com medidas repetidas, pois os dados no seguem distribuio normal. Sendo assim, as
hipteses so denidas pela mediana e no pela mdia.
A tabela 4.12 mostra dados ctcios sobre 25 pacientes, com diagnstico de metstase em
coluna vertebral. Para cada paciente, foi aplicado o questionrio VAS (Escala Analgica Visual), em
uma escala de 0 a 10, para avaliao de dor no perodo pr-operatrio, ps-operatrio e um ano
aps a cirurgia. O objetivo avaliar a evoluo da dor em pacientes com leso metasttica em
coluna vertebral operados por abordagem posterior.
usando um software adequado, temos que a estatstica de teste foi de 7,96. Este valor
corresponde a um valor-p = 0,000 para o teste bilateral. Como o valor-p menor que o nvel de
signicncia de 5%, pode-se dizer que os valores de VAS diferem entre si quando comparados
estatisticamente os perodos pr-operatrio, ps-operatrio e um ano aps a cirurgia.
Observe que o teste de Friedman apenas conclui que pelo menos uma situao difere das
demais. Neste caso, necessrio realizar comparao de dois a dois grupos para identicar a
hierarquia desta diferena.

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:33 Page 79

LE ITuR A C RT IC A DE ART IGOS C IE NT FICOS

| 79

Tabela 4.12 - Escala Analgica Visual (VAS) para avaliao da dor no pr-operatrio, psoperatrio e um ano aps cirurgia, em uma amostra de 25 indivduos
Paciente
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

VAS pr-operatrio
5
6
9
7
8
7
9
6
3
7
8
8
9
10
8
4
10
10
10
8
8
7
8
10
7

VAS ps-operatrio
1
0
0
5
8
2
9
6
3
7
8
8
0
6
0
2
10
0
8
8
7
7
6
4
7

VAS um ano aps cirurgia


0
0
0
0
8
1
9
6
0
5
0
8
0
0
0
2
10
5
8
5
8
6
0
8
7

Fonte: Arango (2005).

A Tabela 4.13 mostra os resultados da comparao de dois a dois entre Escala Analgica Visual
(VAS) para avaliao da dor no pr-operatrio, ps-operatrio e um ano aps cirurgia.
Tabela 4.13 - Teste de comparao mltipla entre a Escala Analgica Visual (VAS) para
avaliao da dor no pr-operatrio, ps-operatrio e um ano aps cirurgia
Comparao Mltipla
de VAS
VAS pr-operatrio (1)
VAS ps-operatrio (2)
VAS pr-operatrio (1)
VAS um ano aps cirurgia (3)
VAS ps-operatrio (2)
VAS um ano aps cirurgia (3)

Mediana
8.00
6.00
8.00
5.00
6.00
5.00

Resultados
Valor p
0.000**

Concluso
1 > 2

0.000**

1 > 3

0.074

2 = 3

Nota: As probabilidades de signicncia (valor p) referem-se ao teste de Wilcoxon


Valor p em negrito indica diferena signicativa.
Os resultados signicativos foram identicados com asteriscos, de acordo com o nvel de signicncia das comparaes
mltiplas, a saber: valor p < 0.0167** .

Manual de LEITURA CRTICA_Layout 1 6/10/2011 17:33 Page 80

80 |

L E IT u R A CR T IC A D E A RT IG OS C IE NT FICOS

Em anlise comparativa da Escala Analgica Visual (VAS), vericou-se que a Escala Analgica
Visual no pr-operatrio maior do que os demais momentos, pois o valor p < 0,05. Enquanto que
a Escala visual no ps-operatrio e no ano aps a cirurgia so iguais, valor p > 0,05 (Tabela 4.13).
Para as comparaes mltiplas, o nvel de signicncia ca dividido por trs (a/3), por se tratar
de comparaes entre 3 grupos, ou seja, ser considerado signicativa aquela comparao cujo
valor p for inferior a 0,0167.
Para casos em que existam n comparaes o nvel de signicncia ca dividido por n (a/n).

Referncias
1. Siqueira AL. Teixeira FJS. Introduo a Estatstica Mdica. 2ed. Belo Horizonte: COOPMED, 2002.
2. Triola M.Introduo Estatstica. 10ed. Rio de Janeiro: LTC, 2008, p.722-801.
3. Arango HG. Bioestatstica: terica e computacional. 2ed.Rio de Janeiro. Guanabara Koogan, 2005.

Você também pode gostar