Você está na página 1de 4

Determinao do tamanho da amostra em pesquisas

Artigo de R
experimentais na rea de sade

Reviso
Gasto Rbio de S Weyne*

eviso
Resumo c) Em razo do tamanho da amostra que utilizei, os
No presente trabalho so apresentados e discutidos alguns mtodos resultados obtidos tm significncia estatstica? d) Com
para determinao do tamanho da amostra para atributos e para o tamanho da amostra utilizado, como devem ser
variveis, operando-se com dados pareados e no-pareados, correlacionados os dados disponveis? d) Com o tamanho
visando validade estatstica de trabalhos de pesquisa da amostra que utilizei, o meu trabalho pode ser aceito?
experimental na rea da sade. Os mtodos conduzem a valores O que tenho a corrigir para a aceitao?
mnimos do tamanho da amostra, calculados por equaes No resta dvida, portanto, de que o problema da
matemticas, que devem ser coerentemente majorados de acordo determinao do tamanho da amostra considerado de fun-
com as condies dos experimentos. So apresentados e damental relevncia, basicamente, porque a rea de sade
discutidos exemplos ilustrativos para melhor entendimento dos apresenta particularidades de tal especificidade que o
mtodos sugeridos. tratamento a ser dispensado coleta e anlise de dados
requer um procedimento especial. Isto se justifica porque
Unitermos a complexidade do ser humano incomparavelmente
Tamanho de amostra; estatstica. maior que as dificuldades que se apresentam, por exemplo,
na rea de cincias exatas, com mquinas e/ou com-
Abstract
putadores. Para caracterizar esta complexidade, veja-se
This paper introduces statistical methods for calculating the que o ser humano constitudo, aproximadamente, por
appropriate sample size for comparing two independent groups 30.000 genes e que, no crtex cerebral, existem cerca de
of subjects (parallel group design), or for comparing paired 9,2 x 109 clulas nervosas interconectadas2. Estes nmeros,
observations (paired or crossover group design). These methods extremamente elevados, levam a concluir sobre a marcante
includes categorical or qualitative data (attributes) and numerical complexidade do organismo humano. Por outro lado,
or quantitative data (variables). The main idea behind the sample verifica-se que, nos seres humanos, a tolerncia bioes-
size calculations is to improve the reliability and credibility of tatstica , numericamente, muito ampla. Duas pessoas
the findings from health field research, giving some guarantee
que tm, cada uma delas, por exemplo, ndices glicmicos
that the statistical aspects have been handled well or even validly.
de 85 e de 110 mg/dL (diferena de 25 mg/dL), so
Keywords indivduos considerados normais, o mesmo acontecendo
Sample size; statistics. com dois pacientes que, individualmente, apresentem
presses sistlicas de 100 mmHg e 120 mmHg (diferena
Introduo de 20 mmHg). Estes valores representam uma ampla
A determinao do tamanho da amostra em trabalho de tolerncia, aceita na rea de sade, que no admitida, a
pesquisa experimental na rea de sade, ou seja, a seleo ttulo de ilustrao, na rea de engenharia, cincia na qual,
do nmero de pacientes a serem utilizados nesta tarefa, por exemplo, uma pea somente poderia ser aceita se a
de significativa importncia, considerando-se que a diferena entre sua medida e a medida de um padro (valor
correo desta determinao d validade estatstica ao nominal) no excedesse a 1 micrmetro (10 -6 m). Esta
experimento e condio bsica primordial para a ampla tolerncia em cincias da sade concorre,
aceitao de trabalhos na comunidade cientfica. Em substancialmente, como se ver adiante, para que as
razo da experincia vivida pelo autor, as perguntas iniciais amostras nesta rea sejam muito pequenas em relao a
mais freqentes, feitas, s vezes, at aps a concluso da outras reas, como a de engenharia. Por esta razo, en-
coleta de dados, nesta rea, esto, geralmente, entre as quanto a ordem de grandeza para uma amostra na rea de
seguintes: a) O tamanho da amostra escolhido no meu sade poderia ser, por exemplo, de 30 pacientes (N = 30),
trabalho est correto? b) Quando eu iniciar o meu na rea de engenharia poderia ser aceita uma amostra
trabalho, qual o tamanho da amostra que deverei utilizar? de 1.000 peas (N = 1.000).

* Livre-Docente pela Escola Politcnica da USP e Professor Titular do Curso de Cincias Farmacuticas da Faculdade de Medicina do ABC.

Arq. Med. ABC v. 29 no 2 Jul/Dez 2004 87


Perguntas que antecedem os clculos do um tratamento. So caracterizados por se referirem a uma
tamanho da amostra mesma amostra, testada antes e depois de um certo
procedimento. Os dados no-pareados so simultneos e
No desenvolvimento de um trabalho de pesquisa na correspondem a dois grupos de pesquisa: o grupo de
rea da sade, particularmente na determinao do controle e o grupo experimental. Neste caso, o tamanho
tamanho da amostra a ser usada, necessrio se faz que da amostra, calculada matematicamente como ser
sejam formuladas e respondidas algumas perguntas mostrado, deve ser multiplicado por 2, admitindo-se que
bsicas, entre as quais citam-se as seguintes: o nmero de participantes dos dois grupos seja o mesmo,
1) A pesquisa vai lidar com uma varivel ou com um o que, em geral, pode ocorrer.
atributo? 3) Qual o intervalo de confiana na pesquisa?
Uma varivel pode assumir diferentes valores, oscilando A preciso das pesquisas na rea de sade admite,
em torno de um valor mdio (ou valor nominal), usualmente, um erro de 5%, o que equivale a dizer que o
limitando-se superior e inferiormente por uma tolerncia intervalo de confiana dos testes de 95%. Utilizando a
e sendo caracterizada por uma medida definida por um distribuio normal com estes dados, o nmero de des-
nmero. Logo, trata-se de um conceito quantitativo. Uma vios-padro 1,96. Observe-se que, quanto maior o inter-
varivel X, portanto, pode ser dada por X = valor nominal valo de confiana, maior o nmero de desvios-padro e
tolerncia. Como exemplo, admita-se que X um maior o tamanho da amostra, uma vez que o erro dever
ndice glicmico (expresso em mg/dL). Se X = 110 ser menor. A ttulo de exemplo, enquanto na rea de enge-
15, significa que Xmx = 125 mg/dL e Xmn = 95 mg/dL. nharia trabalha-se com intervalo de confiana de 99,74%
Como exemplos de variveis bioestatsticas, pode-se (trs desvios-padro e erro de 0,26%), na rea de sade
citar: 1) presso sistlica de 120 mmHg; 2) peso do indi- utiliza-se, como j se fez meno, um intervalo de con-
vduo igual a 78 kg; 3) ndice glicmico de 110 mg/dL; 4) fiana de 95% (1,96 desvio-padro e erro de 5%).
temperatura corporal de 36,5 o C; 5) altura da pessoa
igual a 1,75 m; 6) dimetro de vaso igual a 3,25 mm; 7) 4) A medida a ser realizada tem preciso e exatido?
umidade de 0,016 g de gua/g de ar seco; 8) presso A preciso e a exatido (ou acurcia) do teste so fatores
atmosfrica de 101,35 kPa; 9) nvel de colesterol total de significncia no clculo do tamanho da amostra. A pre-
de 190 mg/dL. ciso de uma medida caracterizada pela reprodutibili-
O atributo, tambm chamado de varivel categrica, dade, situao em que os testes resultam em medidas
uma qualidade dicotmica, que define um sim ou um sempre muito prximas umas das outras e depende do
no, sendo, portanto, um conceito qualitativo. Ao con- processo usado, como o caso de uma balana precisa, que
trrio da varivel, o atributo no assume diferentes acusa sempre a mesma medida, mesmo estando viciada
valores que oscilam em torno de um valor mdio. Citam- (descalibrada). A medida dita exata (ou com acurcia)
se, como exemplos de atributos, as seguintes questes que quando se aproxima satisfatoriamente do valor real dado
apresentam alternativas: 1) O paciente est ou no febril? por um padro, logo, uma medida exata ou acurada tem
2) Joo est ou no imunizado? 3) A lmpada acende ou um compromisso com a verdade.
no? Nestas situaes, no h meio termo ou tolerncia.
No seria razovel, portanto, dizer que um paciente esta- 5) O teste tem sensibilidade? um teste especfico?
ria 20% imunizado. No entanto, um atributo pode ser A sensibilidade de um teste a capacidade do teste para
quantificado por uma frao de sucesso (ou de insu- detectar uma doena quando ela est presente. Na triagem,
cesso). Exemplos: 1) uma vacina A, sendo considerada todos os doentes e alguns no- doentes podem ser
eficiente se imunizar 80% dos vacinados; 2) um lote B indicados. A especificidade de um teste mostra que, no
aceitvel de lmpadas quando contenha, no mximo, ocorrendo a doena, o teste sempre acusar a no
0,01% de unidades queimadas. Um atributo pode existncia da enfermidade. Em outras palavras, a
tambm ser quantificado com atribuio de pesos ou especificidade a capacidade do teste em indicar a
escores, dando-se pesos maiores, obviamente, para os ausncia de uma doena quando ela no est presente. Os
atributos de maior importncia no trabalho experi- no-doentes so, portanto, excludos de suspeita.
mental. Exemplo: na pesquisa de um paciente ten-
dncia de acidentes vasculares cerebrais, possivelmente Equaes bsicas e exemplos
poder-se-ia atribuir peso 3 a fatores hereditrios e peso
2 ao tipo de alimentao do paciente em determinadas Equao para variveis
circunstncias.
Sendo X um valor da varivel, X a mdia dos valores
2) Os dados so pareados ou no pareados? desta varivel, s o desvio-padro da amostra e N, o tamanho
Os dados pareados so dados sucessivos, como os resul- da amostra, tem-se, pela distribuio de Student, vlida
tantes da situao fsica de um paciente antes e depois de para pequenas amostras (N = 30):

88 Arq. Med. ABC v. 29 no 2 Jul/Dez 2004


t= X - X Xmx = p + Zp (1 - p)/N , o que d
s
N
Xmx p = Zp (1 - p)/N

Como o nmero de desvios-padro, t, na distribuio (X mx p)2 = Z 2p (1 - p)/N, o que resulta para N o valor:
de Student, depende dos graus de liberdade, que pres-
supem conhecido o tamanho da amostra, t substitudo
N=Z p (1 - p) ou N=Z p (1 - p)
2 2
pelo nmero de desvios-padro Z da distribuio normal.
Uma transformao algbrica simples d o tamanho da (Xmx - p) 2 d2
amostra N.
Verifica-se que deve ser maximizado o valor de p (1 - p) e
N=Z S2
2 2

d minimizado o valor da diferena d = Xmx - p, para ma-


ximizar o valor do tamanho da amostra N (situao mais
Veja-se que N inversamente proporcional a d2 (d = desfavorvel). Para dados no pareados (simultneos), o
diferena) e, no caso das amostras da rea de sade, como valor de N deve ser multiplicado por 2.
a diferena d muito grande (e d2, com mais forte razo), Exemplo ilustrativo: Uma vacina est sendo testada em
conforme se fez meno, resulta em valor pequeno para certa populao, admitindo-se que um valor considerado
N, ao contrrio das pesquisas em engenharia, em que a satisfatrio ser a obteno de uma frao de sucesso em
tolerncia, caracterizada tambm por d, muitssimo torno de 70%. Valores da literatura indicam que, em
menor, o que conduz a amostras de tamanho N muito condies razoveis, pode-se obter uma frao de sucesso
elevadas. da ordem de 90%. Qual dever ser o tamanho da amostra,
Exemplo ilustrativo: Verificou-se que a populao de um para um intervalo de confiana de 95%?
bairro de uma cidade litornea apresentou um elevado Soluo: Tm-se os seguintes valores:
valor da presso arterial sistlica, na faixa mdia de
160 mmHg. Deseja-se aplicar um medicamento expe- Z = 1,96 (da curva normal)
rimental, com o fim de abaixar o valor mdio da presso p = 0,705
arterial sistlica at a faixa de 120 mmHg. Como estimar
o tamanho da amostra para ensaio dos efeitos do medica- d = Xmx - p = 0,90 - 0,70 = 0,20. Substituindo estes
mento antes e depois de corretamente aplicado, com um valores, obtm-se:
intervalo de confiana de 95% (usual na rea de sade), N = 1,962 . 0,70 (1 - 0,70)/0,202 21 indivduos, no
para o teste ser significativo? mnimo.
Soluo: A tabela da cur va normal fornece, para Se forem usados dados no-pareados (simultneos), o
intervalo de confiana de 95%, o nmero de desvios- grupo experimental e o grupo de controle devero ter,
padro, indicando o valor Z = 1,96. A diferena ser d cada um deles, 21 pessoas, com um total de, no mnimo,
= 160 - 120 = 40 mmHg. Como no h como calcular 42 indivduos.
o desvio-padro s, deve-se arbitrar uma condio
logicamente mais desfavorvel, escolhendo-se, por Observaes sobre o tamanho da amostra (N)
exemplo, um desvio-padro s = 80 mmHg, valor que 1) Para a determinao do tamanho da amostra, as
dificilmente ocorrer na populao estudada. Neste caso, condies mais desfavorveis devem ser escolhidas, ou
ter-se-: seja: maior s, no caso de variveis, maior produto p (1-p),
no caso de atributos e menor d possvel, para que N seja
N = 1,962. 802/40 2 16 indivduos maximizado. 2) O valor de N calculado vale para dados
pareados (sucessivos, como no caso de pacientes antes e
Como se trata de dados pareados (sucessivos), o depois do tratamento). Se os dados forem no-pareados
tamanho da amostra de, no mnimo, 16 indivduos. Se (simultneos, para um grupo de controle e um grupo
o teste fosse conduzido com uso de um grupo de controle experimental), o valor de N deve ser multiplicado por 2. 3)
e um grupo experimental, cada um destes grupos deveria Em qualquer situao (varivel ou atributo), o valor de N,
ter 16 pessoas, ou seja, um total de 32 indivduos, no calculado matematicamente, um valor mnimo a ser
mnimo. utilizado na pesquisa e, na prtica, deve ser majorado,
usando-se um critrio razovel. Exemplo: se o clculo
Equao para atributos indicou um valor de N =13 pessoas, ser possvel
Para atributos, conforme estudos anteriores, conside- escolher 13, 15, 20 ou mais indivduos, desde que o
rando-se que p a frao de sucesso (ou de insucesso), Z aumento da amostra no implique perda significativa
o nmero de desvios-padro e Xmx , o valor mximo do de tempo gasto na pesquisa ou, ainda, que seja praticvel
atributo quantificado, a estatstica fornece: nas condies do experimento. 4) No trabalho de

Arq. Med. ABC v. 29 no 2 Jul/Dez 2004 89


pesquisa na rea de sade, recomendvel apresentar Programas especficos auxiliares de
sempre os detalhes que indiquem como foi calculado o microcomputador
tamanho da amostra. 5) Quando o tamanho N de Alguns programas de microcomputador so de extrema
pacientes, muito grande, deve ser escolhida uma importncia no clculo do tamanho da amostra e na
soluo entre as seguintes: a) aumentar a taxa ou o tempo determinao de outros parmetros de interesse da
de recrutamento; b) reduzir o nvel de rigor cientfico; bioestatstica. Entre estes programas, esto o Microsoft
c) abandonar a pesquisa. Esta ltima hiptese deve ser Excel, o EPIINFO, o SPSS (Statistical Package of Social
afastada a todo custo. Science), o Statsoft Statistica 5.0 e o Matlab 6.

Bibliografia

Altman, Douglas G. Practical statistics for medical research. Soares JF, Siqueira AL. Introduo estatstica mdica. Belo
London: Chapman & Hall: 1999. Horizonte: Cooperativa Editora e de Cultura Mdica: 2002.
Dawson B, Trapp KG. Bioestatstica bsica e clnica. Rio de Zar JH. Bioestatistical analysis. London: Prentice Hall: 1999.
Janeiro: Mc Graw Hill: 2001.
Cox DR. Planning of experiments. New York: Wiley: 1992.
Herrick CJ. Brains of rats and man. New York: Hafner Publishing
Co: 1993. Endereo para correspondncia
Jekel JF. Epidemiologia, bioestatstica e medicina preventiva. Porto Coordenao do Curso de Cincias Farmacuticas da FMABC
Alegre: Artmed: 1999. Av. Prncipe de Gales, 821 Vila Prncipe de Gales
Petrie A, Sabin C. Compndio de estatstica mdica. Lisboa: Santo Andr, SP CEP 09060-650
Instituto Piaget: 2000. Tel.: (11) 4993-5411

90 Arq. Med. ABC v. 29 no 2 Jul/Dez 2004

Você também pode gostar