Escolar Documentos
Profissional Documentos
Cultura Documentos
AMOSTRA E PROCEDIMENTOS DE
AMOSTRAGENS
Cátia Candida de Almeida
-1-
Olá!
Você está na unidade Amostra e procedimentos de amostragens. Conheça aqui, inicialmente, os números e
amostragem, com destaque para as formas de amostragens aleatórias, sendo empregadas nas pesquisas
científicas e pesquisas em geral, que usam o rigor metodológico no momento da seleção de indivíduos da
população de irão compor uma amostra. A distribuição de frequência ou contagem é necessária para o
Bons estudos!
1 Introdução
Neste tópico, trataremos da importância de medidas de precisão, amostra, procedimentos de amostragem e, por
fim, distribuição de frequência dos dados. Porém, antes de iniciarmos, é preciso iniciar uma discussão sobre ou
números ou medidas no aspecto do seu rigor e precisão, mostrando o quanto uma medida pode envolver erros,
Quando se deseja realizar uma pesquisa, é necessário o planejamento amostral, sendo decidido antes da fase do
trabalho estatístico de coleta de dados, especialmente se a opção for em trabalhar com amostra aleatória, que
Na fase da apresentação dos dados, na forma de tabela ou gráfico, exige-se uma organização dos dados em forma
de distribuição de frequência ou contagem dos dados. Estes tópicos tratam de elementos metodológicos que
-2-
2 Medidas de precisão e rigor
A precisão de uma medida está relacionada com o erro, que passar a ser insignificante ou reduzido. Uma medida
é chamada de rigorosa quando a avaliação é realizada com extremo cuidado, procurando manter controlados os
erros que podem ocorrem com a medida. As áreas da ciência que utilizam estudos experimentais dependem
Quando se realiza os cálculos estatísticos de frequências ou de medidas, o valor resultante pode ser próximo ou
distante da grande maioria dos dados e sua representação numérica nem sempre é parecida como, por exemplo,
o cálculo da medida estatística da média aritmética de uma série de números inteiros, que pode resultar em um
Exemplo: O conjunto de números (18 25 31 41 26 38 19), que resulta na média aritmética de 28,285714...
Os números do conjunto de dados são números inteiros e o resultado do cálculo da média aritmética é um
número decimal e infinito. Por questões práticas. é muito comum representar o número “28,285714...” em
apenas 28, resultando em arredondamento do algarismo em unidades, ou 28,3, em décimos, ou 28, 29,
arredondamentos em centésimos.
Todos esses resultados de arredondamento estão corretos, mas alguns são mais precisos que os outros. Tudo
depende do grau de precisão e rigor exigido no estudo. Ainda, há de considerar que, em estatística, os resultados
aplicação. O arredondamento dos números, então, se baseia no princípio de que o máximo erro pode ocorrer
em um dado resultado.
Assim, as principais regras de arredondamento de acordo com a resolução 886/66 do IBGE. De acordo com os
autores FREUND, SIMON (2000) e MARTINS, DONAIRE (1990), têm-se as seguintes regras:
O algarismo na posição p+1 é igual a 5 e, após a posição p+1, pelo menos um algarismo é diferente de
-3-
1 decimal: 20,1501 = 20,2
O algarismo na posição p+1 e este é igual a 5 e este é o último algarismo ou se, após a posição p+1, todos
os algarismos forem iguais a zero, a posição p aumenta de uma unidade somente se for um número
ímpar.
Essas são as regras de arredondamento numérico mais comum e aplicável em qualquer contexto. No entanto,
existem regras de arredondamento mais específicas e que exigem um pouco mais manipulação matemática.
3 Amostra
Um dos principais objetivos da maioria dos estudos, análises e pesquisas estatísticas é fazer generalizações
seguras, com base nas amostras sobre a população da qual se extraiu uma amostra para o estudo ou
experimento. A expressão “segura” se refere às amostras e quando e sob quais condições elas permitem
generalizações.
Vejamos um exemplo: se desejarmos estimar a média de gastos de uma pessoa, temos como uma amostra das
despesas realizadas por um determinado período de tempo. Entretanto, alguns fatores como classe social,
profissão etc. são variáveis que devem ser consideradas. Assim, não é uma tarefa muito fácil delinear uma
amostra. A maior parte dos métodos de escolha de amostra se baseiam em amostras aleatórias, sendo originadas
por meio de um sorteio. As amostras aleatórias permitem generalizações ou validações das populações. Assim, o
O planejamento amostral é muito importante em uma pesquisa, principalmente se o desejo for trabalhar com
A amostra aleatória é obtida por meio do procedimento de seleção de amostragem aleatória. Existem muitas
maneiras de extrair uma amostra de uma população, exigindo um planejamento amostral, que deve ter um plano
amostral ou delineamento amostral, definido com o objetivo de obter uma amostra de uma determinada
população. O plano amostral, então, deve conter uma descrição do tipo de amostragem, visto que, amostragem
é um procedimento de seleção dos indivíduos da população que irão compor a amostra de estudo.
-4-
4 Amostragem
A seguir, veremos os tipos de amostragem, detalhando uma a uma para melhor compreendimento.
-5-
4.1 Amostragem aleatória simples
população e amostra.
• População finita
Consiste um número finito ou limitado de elementos na população como, por exemplo, o número total de
indivíduos submetidos a um teste de aptidão ou o número total de medicamentos fabricados por uma
indústria farmacêutica.
• População infinita
Consiste em um número infinito ou ilimitado de elementos na população como, por exemplo, quando
lançamos um dado um número infinito de vezes e não há limite para o fim dos lançamentos ou quando
Adquirida), onde entende-se que não é possível saber o número exato de pessoas com a condição.
Vale lembra da regra de matemática de combinação de n objetos tomados em r, ou seja, recorremos a ideia do
Fique de olho
Na fórmula da combinação simples se utiliza C_(n,p)=n!. Na combinação, então, a ordem dos
elementos no agrupamento não interfere nas combinações. Logo, se um conjunto de elementos
A é formado por n elementos tomados p a p, então, qualquer subconjunto de A formado por p
elementos é expresso por combinação.
-6-
Assim, tem-se um exemplo aplicado no caso de amostragem aleatória:
Quantas amostras diferentes de tamanho n podem ser extraídas de uma população finita de tamanho N,
se n= 2 e N= 12?
Tem-se que:
n= 2: tamanho da amostra
Tem-se:
Portanto, 66 combinações de amostras diferentes que são possíveis de retirar de forma aleatória.
Seguindo o exemplo, os autores FREUND e SIMON (2000) afirmam que uma população finita de tamanho N é
aleatória, se for escolhida de forma que cada uma das amostras possíveis tem a mesma chance ou
probabilidade de de ser escolhida, sendo denominada amostra aleatória. Em outras palavras, expressa na
forma do exemplo:
Substituindo:
Então:
Portanto, 10 combinações de amostras possíveis de tamanho n=3, partindo de uma população de 5 elementos.
As combinações são:
Cada uma dessas amostras tem a chance ou probabilidade de ser escolhida de , ou seja, de , denominando
amostra aleatória.
Nos casos práticos a população finita geralmente é muito grande, e as combinações obtidas também são
Suponha uma população de 1.000 indivíduos em que desejamos saber as possíveis combinações obtidas.
-7-
Considerando o tamanho amostral n=50, o número de combinações possíveis de amostra torna-se
suficientemente grande. Sendo assim, é possível obter um cálculo, mas com auxílio de calculadora ou planilha de
não será calcular todas as combinações possíveis, partindo de um tamanho populacional N tomados em tamanho
amostral n e, sim, obter uma amostra aleatória a partir de um procedimento de amostragem aleatória.
O procedimento, então, consiste em enumerar os indivíduos a população (1, 2,....N), começando de 1 até o
tamanho da populacional. Em seguida, realiza-se um sorteio, podendo utilizar a tabela de números aleatórios ou
Neste caso, o procedimento de amostragem pode ser realizado com ou sem reposição (FREUND, SIMON, 2000),
como seguem:
Quando os indivíduos selecionados irão fazer parte da amostra e decorrem da seleção. Desta forma, realiza-se o
sorteio e seleciona-se um número associado a um indivíduo. Em seguida, considera-se esse mesmo indivíduo
Quando um indivíduo é selecionado e não poderá fazer parte novamente do sorteio. Realiza-se, então, o sorteio e
seleciona-se um número associado a um indivíduo. Em seguida, este indivíduo não pode ser selecionado mais de
uma vez, ou seja, ele apenas irá compor à amostra uma única vez.
Como um exemplo, suponha a extração de uma amostra de n=12 da população de 247 drogarias, com
Neste caso, usa-se o procedimento de amostragem aleatória sem reposição, recorrendo a um aplicativo ou
programa para gerar números aleatórios. Os números secionados correspondem a numeração da drogaria na
Deste modo, os casos sorteados que compõem a amostra de 12 elementos são: 159, 98, 63, 68, 208, 85, 34, 71,
241,129, 48 e 05. Assim, as drogarias associadas a estes números constituem a amostra aleatória do estudo.
Esse tipo de amostragem exige a numeração de todos os N elementos da população, de maneira que seja
No caso de amostragem aleatória com reposição, usando o mesmo exemplo, a população de drogaria é
numerada de 1 até 247 e realiza-se um sorteio aleatório por meio de aplicativo ou software, sendo os seguintes
-8-
números selecionados: 240, 50, 48, 11, 120, 120, 27, 66, 120, 22, 13, 02. As drogarias associadas a estes números,
então, constituem a amostra aleatória do estudo, mas, neste caso, nota-se que o número “120” foi selecionado
três vezes.
Nas populações infinitas não se tem o valor exato do total da população e, em alguns casos, tem-se um valor
estimado da população. A seguir, veremos as técnicas de amostragem aleatória, tais como: amostragem
(FREUND, SIMON, 2000), notando que a amostragem por quotas não tem fundamentação em inferência
-9-
4.2 Amostragem estratificada
A amostragem estratificada é uma amostragem aleatória que usa uma estratificação. O procedimento trata de
seguida, extrair uma amostra de cada estrato. Os indivíduos que compões cada estrato são selecionados por
A estratificação tem o objetivo de formar estratos, de modo que a estratificação tenha relação com a pesquisa,
para que assegure a homogeneidade (uniformidade) da amostra. A alocação dos indivíduos na amostra pode
ser por alocação proporcional e isto significa que os tamanhos das amostras em cada estrato são proporcionais
Freund e Simon (2000) resumem que em uma população de tamanho N em k estratos, de tamanho N1, N2,...,Nk,
retira-se uma amostra de tamanho n1 do primeiro estrato, uma amostra de tamanho n2 do segundo e assim por
Em que:
i = 1,2,...,k.
: tamanho da amostra.
alocação proporcional, o tamanho da amostra a ser extraída de cada estrato deve ser:
Tem-se:
A alocação foi proporcional, de acordo com as quantidades, sendo, respectivamente 30, 18 e 12 casos.
Existem outras formas de alocação que consideram alocação proporcional, mas que levam em conta a
variabilidade da amostra dentro dos estratos, chamada de alocação ótima. Ressalta-se que a estratificação não é
Exemplo: uma pesquisa realizada no sistema educacional de um estado tem o objetivo de conhecer a
atitude dos alunos em relação a saúde bucal. A amostragem pode ser estratificada em relação as
- 10 -
Complementando, na amostragem estratificada, o custo da extração de amostras aleatórias dos estratos
Existem casos em que amostragem sistemática é a mais prática de extrair uma amostra e consiste em selecionar
cada k ordem um indivíduo. Essa amostragem inicialmente introduz um elemento aleatório na unidade de
partida. Vejamos no exemplo: partindo de uma listagem de nome, a cada 12º selecionam os casos para
compor a amostra.
Em alguns casos, a amostragem sistemática representa uma maneira melhor de amostragem, em comparação à
amostragem aleatória, sendo que as amostras se dispersam de forma uniforme sobre a população. Entretanto, os
elementos de uma população devem ser dispostos em forma sequencial ao longo de um período.
Vale atentar para o fato de que, na amostragem sistemática, pode ser possível encontrar a presença de
periodicidades ocultas que disfarçam os erros de amostragem no final dos resultados. Por exemplo: a inspeção
realizada em uma linha de produção de medicamentos, a cada 40ª lote produzido por determinada
máquina. Os resultados seriam enganosos em virtude de uma falha regular no equipamento. Neste caso, a
De modo geral, esse tipo de amostragem é relevante no planejamento amostral, quando se tem uma listagem de
- 11 -
4.4 Amostragem por conglomerados
Esse tipo de amostragem é chamado de amostragem por conglomerado, quando a população total é subdividida
em várias partes pequenas e algumas dessas subdivisões ou conglomerado são selecionadas aleatoriamente,
Um exemplo para uma situação de amostragem por conglomerado: a prefeitura de uma cidade deseja
pesquisar os casos existentes de uma determinada doença, mas para realizar um procedimento de
Deste modo, divide-se a área total do município em diversas áreas menores e, em seguida, em bairros e, depois,
em quarteirões, consistindo em uma amostra aleatória de casas. Consequentemente, aplica-se o questionário nas
amostragem por área. Exemplo: no caso de uma empresa, que deseja realizar uma pesquisa sobre a
qualidade de vida de seus funcionários, pode-se obter uma amostra realizando uma amostragem por
aleatória.
Alguns estudiosos alegam que as estimativas dos resultados obtidos nesse tipo de amostragem não são muito
confiáveis quanto a amostragem aleatória simples, mas o custo unitário do procedimento é mais vantajoso
Na prática, dependendo da situação de estudo, aplicam-se vários métodos de amostragem como, por exemplo:
quando o governo quer estudar a atitude dos professores da escola básica em relação aos programas de
educação. Inicialmente, pode-se estratificar as regiões do país por estados ou subdivisões geográficas.
Para extrair uma amostra de cada estrato, pode-se aplicar amostragem por conglomerado, subdividindo
cada estrato em várias partes geográficas menores, como distritos escolares ou divisão de ensino, e, em
nas escolas.
- 12 -
4.5 Amostragem por quotas
A amostragem por quotas é um processo conveniente e mais barato, e às vezes necessário, mas não apresenta
exigência de aleatoriedade, tendem a selecionar exatamente os indivíduos necessários para compor as quotas da
pesquisa.
As amostras obtidas por esse procedimento são amostras de julgamento e as inferências baseadas nessas
amostras não são baseadas na teoria formal da estatística. Mesmo assim, muitos institutos de pesquisas atestam
e usam esse método de amostragem por ser mais rápido e de custo menor.
5 Distribuição de dados
Nos anos mais recentes, os dados estatísticos cresceram de forma muito rápida e apareceram as dificuldades em
manter as atualizações e condensações, sendo um deles o problema de condensar as grandes massas de dados de
maneira a tornar mais simples a sua utilização. O advento do computador, então, permitiu fazer atualizações
O método mais comum de resumir dados consiste em apresentar na forma de tabelas de gráficos.
A organização e apresentação dos dados é a primeira etapa é o entendimento do problema. Considere a situação:
o tempo gasto para uma medicação começar a fazer efeito foi medido em alguns pacientes. Daí surge um
questionamento: “como fazer para torna os dados resultantes mais simples e aplicáveis?”.
Fique de olho
Em algumas circunstâncias, o necessário é saber o valor máximo e mínimo, calcular medidas
estatísticas (média, desvio padrão etc.), e, antes de qualquer cálculo, é necessário organizar e
condensar os dados na forma de distribuição e frequência.
- 13 -
5.2 Distribuição de frequência ou contagem
Para ter uma boa visualização de um grande conjunto de dados, é preciso agrupar os dados em um determinado
número de classe, intervalos ou categorias. Suponha a seguinte situação: uma pesquisa das bases de um
hospital com propósito de acompanhar o plano de saúde de empresas que utilizam serviços do hospital.
#PraCegoVer: na imagem, vemos uma tabela de distribuição de frequência de empresas, com duas colunas,
Os dados podem ser agrupados em distribuição numérica ou quantitativa, como no caso da tabela 1. Caso os
qualitativa.
Este tipo de distribuição é ilustrado na tabela 2, que mostra as principais reclamações dos pacientes do hospital.
- 14 -
Tabela 2 - Distribuição de frequência de reclamação.
Fonte: Elaborado pelo autor, 2020
#PraCegoVer: na imagem, vemos uma tabela de distribuição de frequência de reclamação, com duas colunas,
A distribuição de frequência apresenta os dados em um formato compacto, contribuindo para uma boa
visualização global, e contêm informações adequadas em muitos casos, mas usualmente não se pode determinar
A construção de uma tabela ou gráfico de distribuição de frequência consiste nas seguintes etapas:
No caso de distribuições de frequências numéricas, consiste em decidir quantas classes a utilizar e de qual valor
se inicia e finaliza. Existem várias regras para dividir as classes, mas geralmente, na prática, as escolhas são
arbitrárias.
Em muitas situações, raramente utiliza-se menos de seis ou mais quinze classes. O número exato vai depender
- 15 -
Precisa ser incluído o valor menor e o valor menor e nenhum valor pode estar no intervalo entre classes
sucessivas, ou seja, as classes não devem se sobrepor umas das outras e não podem ter valores comuns. Além
Classes do tipo “menos do que” ou “menos”, “mais do que” e “ou mais” são chamadas de classes abertas, usadas
para reduzir o número de classes quando alguns valores são muito menores ou muito maiores do que os
restantes.
De modo geral, recomenda-se evitar as classes abertas, pois impossibilita o cálculo de determinados valores
como média e totais. Exemplo: construa uma distribuição de frequência da quantidade de cirurgias
realizadas em um hospital no período de trinta dias, sendo as frequências: 12, 8, 11, 13, 10, 10, 7, 8, 9, 9,
A construção de uma tabela ou gráfico de distribuição de frequência nesse caso seguem as etapas:
• 1ª etapa
Escolha das classes (intervalos ou categorias). A ideia inicial é identificar o valor mínimo e o valor
máximo. Assim, valor mínimo é 5 e o máximo 17. Esses valores são chamados de limites de classes.
Recomenda-se que não ultrapasse mais de 15 classes. Existem vários métodos de divisão de classes, mas
essas regras não devem ser mais relevantes do que o bom senso do pesquisador (aqui discute-se apenas
as formas de apresentar a distribuição de frequência). No exemplo visto, pode-se dividir o intervalo dos
• 2ª etapa
Enquadramento dos dados nessas classes. Nesta etapa, verifica-se se os números dispostos em cada uma
das classes não podem sobrepor uma ou outra classe. Nesse caso, os números não estão sobrepostos nas
• 3ª etapa
A contagem dos números de elementos em cada classe é realizada e a apresentação é dada da seguinte
forma:
- 16 -
Tabela 3 - Distribuição de frequência de quantidade de cirurgias.
Fonte: Elaborado pelo autor, 2020
#PraCegoVer: na imagem vemos uma tabela de frequência da quantidade de cirurgias, onde temos duas
Observa-se que as classes foram subdividas em cinco classes e em cada classe foi realizada a contagem da
quantidade de vezes que aparece os números no intervalo das classes. Para as distribuições categóricas, não
precisa se preocupar com os detalhes numéricos e os limites de classes. Por outro lado, é necessário ter cuidado
com as ambiguidades no momento de criar as categorias, a maneira de criar e classificar as categorias. Exemplo:
construa uma distribuição de frequência das modalidades esportivas, sendo modalidades: basquete,
corrida, natação, vôlei, futebol, natação, judô, corrida, natação, futebol, vôlei, futebol, futebol, corrida,
A construção de uma tabela ou gráfico de distribuição de frequência nesse caso seguem as etapas:
1ª etapa
Escolha das classes (intervalos ou categorias). Como as modalidades esportivas são categorias, não tem
2ª etapa
Enquadramento dos dados nessas classes. Nessa etapa é importante verificar se as categorias dispostas em cada
classe não irão sobrepor uma ou outra classe. Nesse caso, cada classe é uma modalidade esportiva.
3ª etapa
Contagem da quantidade de vezes em que aparece cada modalidade esportiva, conforme a tabela abaixo:
- 17 -
Tabela 4 - Distribuição de frequência de quantidade de modalidades de esporte.
Fonte: Elaborado pelo autor, 2020
esporte, com duas colunas, sendo uma de modalidade esportiva e outra de quantidade.
As classes da distribuição de frequência também podem ser construídas considerando as escalas de medidas. As
escalas de medidas baseiam-se nos tipos de variáveis que compreendem as classes das distribuições.
Deste modo, quatro escalas de medidas podem ser utilizadas: escala nominal, escala ordinal, escala intervalar
e escala razão. Todas essas escalas dependem da classificação do tipo de variáveis, sendo variáveis qualitativas
• Escala nominal
Em uma escala nominal uma medida ou variável pode ser igual ou diferente das outras, sendo utilizada
para categorizar os indivíduos de uma amostra ou população. Exemplo: a variável sexo dos indivíduos
pode ser categorizada em: “masculino” e “feminino” ou respectivamente as categorias “1” e “2”.
• Escala ordinal
É uma escala de ordenação, ou seja, uma medida ou variável é maior ou menor do que a outra. Exemplo:
a classe econômica pode ser ordenada em: “baixa”, “média” e “alta”. Elas podem ser
- 18 -
• Escala intervalar
É uma escala que assume um valor numérico dentro de um intervalo. Para esta escala, pode-se realizar
• Escala razão
Quando se tem duas medidas, em escalas de duas iguais, uma maior e a outra menor e duas diferentes,
uma é quantas vezes a outra. Essa escala é específica para uma transformação e manipulações de
é isso Aí!
Nesta unidade, você teve a oportunidade de:
• adquirir uma noção de arredondamento de número ou medida;
• reconhecer importância da amostra e o planejamento amostral antes de dar início a uma pesquisa;
• apresentar as principais técnicas de amostragens: amostragem aleatória simples, estratificada,
sistemática, conglomerado. Além da amostragem por quotas;
• conhecer as medidas de precisão e rigor;
• construir a distribuição de frequência ou contagem dos dados.
Referências
BUSSAB O. W., MORETTIN A. P. Estatística básica. 5 ed. São Paulo: Editora Saraiva, 2002.
FREUND E. J., SIMON A. G. Estatística Aplicada a Economia, Administração e Contabilidade. 9 ed. Porto
- 19 -