Você está na página 1de 6

Amostragem

Tânia Z. Guillén de Torres


Monica Maria Ferreira Magnanini
Ronir Raggio Luiz

INTRODUÇÃO O primeiro passo em qualquer pesquisa estatística é


identificar os objetivos. Os mesmos nem sempre estão
Tal como em qualquer área da saúde, a realização claros e podem até mesmo alterar-se, ao longo do estu-
de pesquisas por amostragem surge da necessidade do, daqueles inicialmente sugeridos. Os objetivos devem
de fornecer informações que serão úteis para diversos ser formulados de maneira clara, pois eles servem de
fins, tais como investigação de relações de causa e base para as outras etapas da pesquisa.
efeito de doenças, planejamento e gestão de serviços,
melhoria da qualidade de atendimento, caracterização A seguir, recomenda-se especificar melhor o que se
de comportamentos de risco etc. Assim estas infor- deseja conhecer da população em estudo, formulando os
mações são constantemente solicitadas por políticos, objetivos específicos. Eles fornecerão uma ideia das ca-
serviços públicos, entidades não-governamentais, além racterísticas a serem observadas ou medidas. Nesta eta-
dos pesquisadores. pa é muito importante consultar também outras pessoas
envolvidas no projeto, assim como especialistas na área
Na operacionalização de qualquer estudo, geralmen-
de interesse, não somente para clarificar os objetivos, mas
te não é razoável se examinar todos os elementos da po-
também para verificar a existência de alguma outra in-
pulação de interesse. Razões típicas para isso seriam
formação relevante que seja necessária à pesquisa.
limitações de recursos humanos ou materiais, devido à
população ser infinita, porque o processo de observação Uma vez esclarecidos os objetivos, deve-se identifi-
é destrutivo, ou, ainda, por questões éticas. Nestes casos, car a variável ou as variáveis apropriadas para poder
observa-se somente uma pequena parte da população, atingi-los, assim como listar fatores que poderiam afe-
chamada de amostra. Embora se associe à noção de tar a variável resposta. Por exemplo, para estudar o tem-
amostra um subconjunto contável de elementos de uma po de sobrevida em pacientes com Aids, seria
população - tal como pacientes - uma gota de sangue recomendável também ter informação sobre a idade do
também constitui uma amostra. Vale salientar que muitos paciente, uso de medicamentos anti-retrovirais, adesão
acreditam que só pelo fato de se observar todos os ele- ao tratamento, doenças oportunistas etc. A obtenção da
mentos da população, as estimativas obtidas serão mais informação sobre a variável resposta e demais variá-
"precisas". Entretanto, geralmente os erros que ocorrem veis envolvidas no estudo pode-se dar através de fonte
na coleta e no manuseio de um grande número de dados primária (ex.: questionários, entrevistas) ou secundária
são maiores do que as imprecisões a que se está sujeito (ex.: anuário estatístico). Usando uma fonte primária, é
quando, no processo de inferência, generalizam-se as con- essencial garantir que os dados coletados sejam confiá-
clusões de uma amostra bem selecionada. veis, acurados e representativos.

CAPÍTULO 22 403
Igação, representando, portanto, os potenciais elemen- • é mais económica, e pode fornecer resultados mais
constituir a amostra (ou população de estudo). acurados e abrangentes o levantamento da infor-
Çim, amostra ou população de estudo seria o subgrupo mação de uma parte ou amostra, do que observar a
elementos da população-fonte sobre os quais se fazem população toda, o que por vezes é impossível;
observações e coletam-se os dados. Na definição da • a informação estará disponível em um prazo menor
população-fonte deve-se levar em conta além dos objeti- de tempo, já que o volume de dados a coletar é
vos da pesquisa, as características a serem observadas e menor. Em consequência, será menor também o
os recursos disponíveis. Os membros da população cuja tempo necessário para criticar e apurar as infor-
característica será medida são chamados de unidades ele- mações. Este fator toma-se crucial, por exemplo,
mentares ou elementos da população. nas pesquisas eleitorais que precisam fornecer es-
Por exemplo, se uma pesquisa tem como objetivo timativas rápidas num curtíssimo prazo de tempo;
estimar a prevalência de obesidade entre jovens de 13 a • uma amostra bem selecionada pode fornecer re-
18 anos na Cidade do Rio de Janeiro, a base populacional, sultados mais acurados, ao diminuir a possibilidade
portanto, seria constituída por todos os jovens nessa faixa de viés, incrementando a precisão dos resultados;
etária, residentes na Cidade do Rio de Janeiro. Imaginan-
do que jovens nessa faixa etária devam estar na escola, a • pode-se diminuir os erros nas respostas, pois, ao ob-
população de estudantes com essas idades cadastrados servar-se um número menor de elementos, é possí-
nas escolas (públicas e particulares) constituiria a popu- vel dar mais atenção aos casos individuais. Neste
lação-fonte do estudo. Havendo dificuldades operacio- sentido também é possível dedicar mais tempo e re-
nais, a população-fonte poderia ser reduzida a estudantes cursos para localizar e persuadir os não-responden-
da rede pública, mas, neste caso, talvez fosse mais con- tes, diminuindo assim o viés de não-resposta;
veniente a restrição da população-alvo apenas aos estu- • a operacionalização e o controle da qualidade do
dantes das escolas públicas. Cada jovem de 13 a 18 anos trabalho em cada uma das etapas tendem a ser mais
constituiria as unidades elementares. satisfatórios que nos censos (observação de toda a
Municípios também podem representar as unidades base populacional), principalmente quando a popu-
í':i
elementares, como é o caso, por exemplo, dos estudos lação é muito grande e dispersa como é, por exem- í'l
ecológicos. plo, o caso do Brasil;
Por uma questão de notação, o número total de uni- • quando se deseja estudar de forma detalhada cer-
dades elementares na população é comumente denota- tos subgrupos, pode-se desenhar uma amostra com
do por N e a cada unidade elementar será associado um maior representatividade, para que estes possam
número de l até N. As características da população ou ser mais bem caracterizados e incrementar a pre-
variáveis aleatórias serão denotadas com letras maiús- cisão dos resultados;
culas, por exemplo F, e o valor desta característica para • desenhos amostrais podem aumentar a precisão e
a i-ésima unidade elementar será F,. diminuir os vieses em estudos observacionais.
Um dos objetivos da pesquisa por amostragem é esti- Existem também situações nas quais não se justifica
mar certos valores como médias, proporções, totais, odds o esforço de selecionar uma amostra, como por exemplo:
etc., obtidos através de funções matemáticas, relaciona- • quando a população é muito pequena, não se justi-
dos com a distribuição de uma certa característica da po- ficaria todo o gasto em recursos e tempo necessá-
pulação em estudo. Estes valores populacionais são rios para selecionar uma amostra relativamente
chamados de parâmetros, e para uma dada população os grande a fim de gerar resultados precisos;
valores dos parâmetros são constantes. Por outro lado, as
funções matemáticas são chamadas de esíimadores ou • se a característica que se quer estudar é de fácil
estatísticas dos parâmetros populacionais. A média amos- observação, pode não compensar a realização de um
trai de uma certa variável, por exemplo, é um estimador da plano de amostragem, mesmo quando a população
média populacional (o parâmetro), e uma vez obtida a amos- não seja muito pequena. Pode acontecer também
tra e calculado seu valor, obtém-se uma estimativa. que a informação necessária já esteja disponível como
subproduto de alguma outra pesquisa;

VANTAGENS E DESVANTAGENS DA AMOSTRAGEM • quando é preciso estudar características ou conhe-


cer parâmetros que sejam fundamentais para o pla-
A seguir, são apresentadas algumas das razões para nejamento de um país ou para servir de referência
se preferir realizar uma pesquisa por amostragem: para a realização de outras pesquisas, justifica-se a

CAPÍTULO 22 405
particular, pode-se dizer que cada elemento da dessa tabela, devemos a princípio determinar o número
íação tem a mesma probabilidade JL de perten- de algarismos necessários para caracterizar N, esco-
' à amostra. lher uma direção a seguir (à direita -», à esquerda <-,
Na seleção de uma amostra aleatória simples é ne- para cimaT, ou para baixo^) e um ponto de partida (uma
cessário: linha e uma coluna, escolhidas de preferência de forma
aleatória através de um sorteio). A partir desse ponto,
• dispor de um rol ou relação completa dos elemen- começa-se a ler os números formados com aquela quan-
tos da população ou das unidades de amostragem; tidade de algarismos seguindo a direção predetermina-
• numerar ebnsecutivamente os elementos da popu- da. Por exemplo, se o tamanho da população for de
lação de l até N (tamanho da população); 1.576.898 elementos, precisaremos de sete dígitos para
• determinar n, o número de elementos a serem sele- caracterizar N. Na tabela ler-se-iam números de sete
cionados; algarismos. Entretanto, se N = 60, são necessários so-
mente dois dígitos para caracterizar N e ler-se-iam na
• selecionar cada um dos elementos da amostra por tabela, números de dois algarismos.
um mecanismo aleatório, que poderia ser um sorteio,
como o empregado para escolher as dezenas ga- Exemplo: Suponha que um pesquisador deseja esco-
nhadoras da loto. Nesse tipo de sorteio colocam-se lher uma amostra de tamanho n = 8 elementos de uma
todos os números misturados dentro de uma urna e população de 800 prontuários. Logo, precisa de três dígi-
os elementos são escolhidos um a um até completar tos para caracterizar 800. Se ele escolhesse como ponto
a amostra. A Figura 22.2 ilustra esse esquema de de partida a linha l e a coluna l, e como direção à direita
amostragem. Quando cada elemento da população (-»), usando a tabela de números aleatórios apresentada
não pode ser sorteado mais que uma vez, o sorteio é na Tabela 22.1, leria números de três dígitos nas linhas
dito sem reposição, e quando o elemento sorteado começando da esquerda para a direita, obtendo os se-
é colocado novamente na urna, antes de fazer uma guintes elementos: 184,025,660,618,483,372,392 na
nova extração, o sorteio é dito com reposição. Nes- linha l. Continuando a procura na linha 2 seguindo a mes-
se caso, o número de possíveis amostras seria N". A ma direção (—»), seria lido o elemento 645. Observe que
escolha também pode ser feita através de algorit- o valor 830 não foi considerado por ser maior que 800.
mos numéricos de geração de números aleatórios Nas amostragens sem reposição os números que sejam
implementados na maioria dos pacotes estatísticos. repetições daqueles lidos anteriormente, devem também
ser descartados. O passo seguinte é usar os números assim
Um procedimento equivalente para escolher uma escolhidos para identificar os elementos na lista de pron-
amostra aleatória simples é fazer uso da tabela de nú- tuários para compor a amostra.
meros aleatórios. A tabela é uma disposição retangular
de dígitos, compreendidos entre O e 9, sorteados um a A amostragem aleatória simples (AAS) é um pro-
cedimento de escolha da amostra que serve de base
um de forma aleatória e com reposição. Para fazer uso
para o desenvolvimento da teoria de amostragem, sen-
do também usada como referência para comparação
dos demais tipos de amostragem, como será visto mais
adiante na discussão sobre o efeito do desenho. Uma
desvantagem da AAS é que pode ser bastante cara e às
vezes impossível de ser realizada. Uma das razões se-
ria a necessidade de identificação de todos os elemen-
tos da população, e uma outra, a possibilidade de que os
elementos sorteados se localizem em áreas geográficas
muito dispersas.
Amostragem.Aleatória
.Simples

Amostragem Sistemática

Trata-se de uma variação da amostragem aleatória


Amostra simples. É geralmente usada quando a população está
População naturalmente ordenada, como, por exemplo: listas tele-
Fig. 22.2 - Escolha de elementos numa amosfragem aleatória fónicas, prontuários em um hospital, peças num proces-
simples. so contínuo de produção etc. Às vezes ela é preferida à

CAPÍTULO 22 407
Bstragem aleatória simples, por ser de mais fácil exe- • usar os números assim escolhidos para identificar
3 estando, portanto, menos sujeita a erros, forne- os elementos da lista selecionados para compor a
P£endo informação um tanto mais precisa e com um custo amostra.
menor. Essa última afirmação somente é válida nos ca- Exemplo: Se o número de elementos em uma popu-
sos em que não existe periodicidade ou ciclos nos ele- lação de pacientes de um hospital fosse 160 e o tama-
mentos da população. Caso contrário, o processo de nho da amostra desejado fosse de 40 pacientes, o
amostragem sistemática está sujeito a erros, gerando processo de seleção da amostra seria:
viés de seleção.
• calcular o passo ou intervalo de seleção: a = l60/40=4;
Para a seleção de uma amostra sistemática é ne-
• definir o ponto de partida na tabela de números alea-
cessário: tórios: linha 5, coluna 5, direção (4-) para escolher um
• dispor de um rol ou relação completa dos elemen- número aleatório de um algarismo entre l e 4, obten-
tos da população ou das unidades de amostragem; do r = 3, uma vez que os três primeiros algarismos da
« numerar os elementos da população de l até N (ta- tabela estão compreendidos fora do intervalo;
manho da população); • selecionar os números de ordem:
« conhecer n, o número de elementos a serem sele- 3, 3 + 4, 3 + 2 x 4 , 3 + 3 x 4 , 3 + 4 x 4 , . . . . ou seja,
cionados; 3 7/, 111, 15
~>, i~>, 19 23 ^27/ , 31
i^, -t*j, ~ji,....,
• definir o passo ou intervalo de seleção: a = N/n; • identificar os elementos da lista para compor a
• escolher um número aleatório r entre l e a, através amostra.
da tabela de números aleatórios; A Figura 22.3 ilustra o esquema de amostragem sis-
• selecionar os números de ordem dos demais ele- temática descrito.
mentos da amostra. Sendo r o primeiro, o segundo
número escolhido será: r + a, o terceiro será: r + 2a, Amostragem Estratificada
e assim por diante. Observe que os números sele-
cionados constituem uma progressão aritmética com Este tipo de amostragem requer um conhecimento
valor inicial r e período a; prévio da natureza da população, pois ela é dividida em

Elemento 1
Elemento 2
Elemento 3
Elemento 4
Elemento 5 Elemento 3
Elemento 6 Elemento 7
r+ a Elemento 7 Elemento 11
Elemento 8
Elemento 9
Elemento 10 Elemento n
r + 2a Elemento 11
Elemento 12
Amostra
Sistemática
Elemento n

População

22.3 - Esquema de uma amostragem sistemática.

22 CAPÍTULO 22 409
Pessa maneira, tem-se agora que realizar três amos- menores a estratos mais homogéneos ou nos quais seria
; aleatórias simples: mais caro e difícil realizar uma»amostragem.
escolher uma amostra de «; = 6 atendimentos de
um total de NI = 600 atendimentos ambulatoriais; Amostragem por Conglomerados
• escolher uma amostra de n2 = 2 atendimentos de
um total de N2 = 200 atendimentos de emergência; Uma amostra por conglomerados é uma amostra
aleatória simples na qual cada unidade de amostragem
• escolher uma amostra de n3 = 2 atendimentos de é um grupo ou conglomerado (cluster) de elementos.
um total de N3 = 200 atendimentos cirúrgicos. Por conglomerado entende-se um grupamento natural
Pode-se realizar as três amostragens independen- de elementos da população, os quais são bastante hete-
temente ou supor que os atendimentos estão numera- rogéneos internamente em relação à característica es-
dos de forma sequencial de 001 a l .000, de acordo com tudada, porém de comportamento similar entre os
o seguinte esquema: conglomerados. Cada conglomerado deveria se com-
portar como uma população em miniatura. Por exem-
1,2,3,4..., 600, 601,602,..., 800, 801,802,..., 1.000 plo, numa pesquisa envolvendo a classe médica, os
conselhos regionais serviriam como conglomerados.
Outros exemplos de conglomerado seriam os Estados,
Ambulatorial Emergência Cirúrgicas
Municípios, setores censitários.

Usando-se, por exemplo, uma tabela de números alea- A amostragem por conglomerado é útil quando a
tórios, escolhem-se os elementos da amostra, identifican- população é muito dispersa e é praticamente impossível
ter uma lista de todos os elementos da população. Os
do-os na categoria correspondente, até completar o número
resultados obtidos de uma amostragem por conglome-
de elementos necessários em cada estrato. Neste caso, o
rados tendem a ser menos precisos, diferentemente da
número 1.000 poderia ser representado pelo 000.
amostragem estratificada, que tende a produzir resulta-
dos mais precisos e representativos, quando ambos es-
Amostragem Estratificada Uniforme quemas são comparados com uma amostra aleatória
simples do mesmo tamanho. Contudo, seu custo finan-
A amostragem estratificada uniforme costuma ser ceiro tende a ser bem menor.
usada nas situações em que o maior interesse é a ob-
O primeiro passo para se utilizar este processo é
tenção de estimativas separadas para cada estrato, ou
especificar conglomerados apropriados. O número de
ainda, quando se deseja comparar os diversos estratos.
elementos em um conglomerado deve ser pequeno em
Nesse tipo de amostragem seleciona-se a mesma quan-
relação ao tamanho da população, e o número de con-
tidade de elementos em cada estrato. Por exemplo, uma
glomerados, razoavelmente grande.
pesquisa de domicílios em que o tamanho total da amos-
tra fosse de l .500 domicílios, e se a população estivesse Nesse tipo de amostragem seleciona-se uma amos-
dividida em três estratos segundo o nível de renda (bai- tra aleatória de conglomerados de elementos. Se todos
xa, média e alta), ter-se-iam que observar 500 domicíli- os elementos dos conglomerados selecionados nessa
os em cada um dos estratos. fase são observados, o processo é dito amostragem de
conglomerados em um estágio. Se uma nova seleção é
realizada, tomando amostras aleatórias de elementos nos
Amostragem Estratificada Proporcional de conglomerados escolhidos anteriormente, a amostragem
Alocação Otima é chamada de conglomerados em dois estágios. Veja a
ilustração nas Figuras 22.5a e 22.5b.
Neste tipo de amostragem, além de levar em conta
os tamanhos de cada estrato, precisa-se conhecer a Em pesquisas de grande escala, a amostragem cos-
variabilidade da característica a ser estudada em cada tuma ser realizada em mais de dois estágios. Por exem-
um dos estratos. Esse tipo de amostragem é mais difícil plo, para selecionar uma amostra de bancários do Estado
de ser realizado, pois requer o conhecimento prévio das de Rio de Janeiro, pode-se, no primeiro estágio, selecio-
variabilidades e dos custos. Porém, as estimativas dos nar municípios; no segundo estágio, selecionar agências
parâmetros são melhores. Esse esquema aloca tama- e finalmente, no terceiro estágio, selecionar os bancários.
nhos de amostra maiores a estratos maiores e mais he- Para uma abordagem mais completa, não somente
terogéneos (com maior variabilidade) e aloca amostras em relação aos planos de amostragem como ao cálculo

CAPÍTULO 22 411
fácil de implementar que as amostragens pro- de determinada experiência, pacientes de um médico
Toilísticas, ser de menor custo e por produzir resul- ou que frequentam determinado hospital, alunos de
idos em menor tempo. Nessa amostragem são uma sala de aula, respondentes a um questionário de
'formados diversos estratos, geralmente baseados em revista, televisão ou qualquer outro meio de comuni-
características da população como sexo, idade, clas- cação etc.
se social etc., e a escolha dos elementos a serem
entrevistados em cada estrato é feita pelo entrevista-
dor. A cota de elementos geralmente é proporcional Erros nas Pesquisas por Amostragem
ao tamanho do estrato. Com a finalidade de controlar Quando se avalia a qualidade de uma pesquisa por
ou diminuir o viés de seleção que poderia acontecer amostragem, é importante diferenciar duas possíveis fon-
se os entrevistadores tivessem liberdade total de es- tes de erro: o erro amostrai e o erro sistemático (não-
colher as pessoas a serem entrevistadas, são atribu- amostral).
ídas a eles cotas de diferentes tipos de pessoas. Por
O erro amostrai é a diferença entre o valor de uma
exemplo, a cota de um entrevistador poderia ser: dez
estatística (estimativa do parâmetro, calculada a partir
homens brancos acima de 45 anos e quinze de 45
das observações da amostra) e o verdadeiro valor do
anos ou menos; 12 homens não-brancos acima de 45
parâmetro (que seria calculado levando em conta to-
anos e oito de 45 anos ou menos etc.
dos os elementos da população). É poãsível estimar
Uma aparente vantagem nesse tipo de amostragem esse tipo de erro somente nos casos em que a amos-
é que sempre será possível atingir o tamanho de amos- tragem é aleatória, e supondo que as n observações
tra pré-especifícado, contornando os problemas de os da amostra foram obtidas sem erros, o que geralmente
elementos selecionados não serem encontrados e os de não acontece na prática. Por essa razão, o planeja-
recusa para responder o questionário, pois sempre se mento e a execução da pesquisa devem ser conduzi-
pode entrevistar uma outra pessoa com as mesmas ca- dos de modo a evitar ou reduzir ao máximo os erros
racterísticas. O problema nessa abordagem está na cre- nos dados da amostra, que são chamados de erros não-
dibilidade dos resultados, já que não seria possível avaliar amostrais. Infelizmente, não existe um método simples
os vieses de selecão e de não-resposta e nem a preci- e direto para estimar esse tipo de erro.
são das estimativas.
A seguir, apresentam-se algumas situações onde cos-
tumam aparecer erros não-amostrais numa pesquisa:
Amostragem por Julgamento • Quando ao estudar uma certa população, por limi-
Neste segundo tipo de amostragem não-probabilís- tações de recursos ou falta de informação disponí-
tica, os elementos são escolhidos por um perito na ma- vel sobre a população, seleciona-se uma amostra
téria. Não é aplicado nenhum tipo de sorteio na selecão de uma lista incompleta de elementos. Nesse caso,
dos elementos, senão o critério pessoal do estudioso. recomenda-se limitar a abrangência da pesquisa à
Os elementos selecionados são aqueles julgados como população que foi efetivamente estudada;
típicos ou representativos da população que se deseja • Em pesquisas realizadas onde a população em es-
estudar. A desvantagem nesse tipo de pesquisa é que os tudo é a humana, é comum não se conseguir in-
resultados não necessariamente são válidos para toda a formação de alguns dos elementos selecionados,
população, e o viés dos estimadores tende a crescer pois nem todos se dispõem a responder um ques-
com o tamanho de amostra. tionário ou a serem entrevistados. Isso pode levar
a sérias distorções nos resultados, principalmente
se a conduta é substituir indivíduos que se recu-
Amostragem de Conveniência
sam a responder, ou que não são encontrados no
Caracteriza-se por não existir a preocupação com momento da pesquisa. Esse problema pode ser
o desenho de um plano particular de amostragem. O contornado retornando várias vezes a esses indi-
objetivo não seria generalizar conclusões, pelo poten- víduos. Pode acontecer também que o tema de
cial viés de selecão, senão descrever as característi- pesquisa seja difícil de abordar e que os respon-
cas principais do grupo de estudo. Por exemplo, os dentes se sintam constrangidos diante do entre-
elementos da amostra, dependendo do objetivo do es- vistador. Uma possível solução seria usar
tudo, poderiam ser pessoas voluntárias em participar questionários auto-explicativos respondidos pelos

CAPÍTULO 22 413