Você está na página 1de 16

5.

Teoria elementar de amostragem ~ Mulenga

5 TEORIA ELEMENTAR DE AMOSTRAGEM


5.1 INTRODUÇÃO
De um modo geral, não têm sido fácil obter informações de todos os elementos que formam uma
população que se deseja estudar sempre que o tamanho desta for demasiadamente grande, porque
os custos são muito elevados ou por motivos de vária ordem. Estas e outras razões obrigam
muitas vezes a trabalhar com uma parte dos elementos que compõem a população (amostra)
Universo ou população – é o conjunto de todos elementos que apresentam uma determinada
característica em comum a qual é objecto de estudo.
Amostra – é todo o conjunto não vazio e com menor número de elementos em relação a
população onde esta foi extraída. Quanto ao tamanho da amostra, são possíveis duas situações: se
n < 30 , diz -se que a amostra é pequena, caso contrário a amostra é grande n  30 .
Unidade estatística – é cada elemento da população por estudar. È precisamente este elemento
que é objecto de análise onde são procurados todos os detalhes das variáveis ou do fenómeno a
estudar.
Se todos os elementos de uma população fossem idênticos, não haveria necessidade de
seleccionar uma amostra, bastaria estudar somente um deles para conhecer as características de
toda a população.
Amostragem – é o processo de extracção de amostras ou de seleccionar da população os
elementos que devem pertencer a amostra.

Figura 5.1. Processo de Amostragem


Existem principalmente três tipos de problemas que interessam ao investigador resolver quando
o estudo é feito usando uma ou mais amostras.
1. O primeiro problema, consiste em estimar os parâmetros da população a partir do
conhecimento das estatísticas de uma amostra.
- São consideradas estatísticas ou medidas amostrais, todas as características descritivas
como a média ( x ), desvio padrão (s), coeficiente de correlação (r), proporção (p), etc.,
calculadas a partir de uma amostra.

78
5. Teoria elementar de amostragem ~ Mulenga

- São considerados parâmetros populacionais os valores característicos de uma população: a


média (µ), desvio padrão (  ), coeficiente de correlação (  ), proporção (P), etc.

2. O segundo problema, consiste em determinar se uma amostra de uma estatística conhecida


provém de uma população da qual os parâmetros também são conhecidos. Neste problema a
resolução consiste em comparar os parâmetros populacionais com as respectivas estatísticas.

3. O terceiro de último problema, consiste em procurar saber a partir de duas ou mais


estatísticas, se as amostras correspondentes provêem de uma mesma população.

A teoria de amostragem hoje em dia é utilizada em quase todas áreas de investigação desde o
tratamento dos fenómenos demográficos, dados na agricultura, na indústria e comércio,
medicina, psicologia até na educação e pesquisas de opinião realizadas pelos meios de
comunicações, etc.

Porque usamos amostras?


Usamos amostra:
1. Porque existem populações infinitas;
2. Quando a população é tão grande que, para fins práticos, podemos considerar infinita;
3. Por economia, pois a amostra é menos dispendiosa e é fácil de controlar por ter menor
número de unidades estatísticas;
4. Porque o tempo é escasso, e a informação pode variar se transcorrer muito tempo entre o
primeiro e o último elemento a ser inquirido;
5. Porque, por vezes, os elementos da amostra podem ser destruídos durante o processo de
amostragem ou podem provocar danos materiais durante as experiencias.

Etapas de realização de um inquérito por amostragem


1. Definição com clareza dos objectivos do inquérito;
2. Definição de população a ser estudada e da unidade estatística;
3. Definir as bases teóricas e práticas da sondagem (variáveis, tamanho, etc.);
4. Elaborar o questionário com instruções de notação (simulação da validação dos dados);
5. Escolha do período de referência para a recolha das informações;
6. Escolha do método de amostragem conveniente;
7. Selecção da amostra no campo;
8. Organização, processamento, controle dos dados, análise e interpretação dos resultados;
9. Realização das inferências e divulgação dos resultados.
A validade das conclusões tiradas de uma amostra sobre uma população, depende do facto da
amostra ter sido bem escolhida e ter um tamanho representativo da população. Portanto, para que
a informação obtida numa amostra seja verdadeiramente válida é necessário que a
correspondente amostra seja representativa. Para isso, deve-se ter maior cuidado no
dimensionamento da amostra bem como no método usado para a selecção dos elementos que
devem pertencer a amostra.

79
5. Teoria elementar de amostragem ~ Mulenga

Ainda em relação a representatividade de uma amostra, são considerados dois princípios básicos:

n
1. Quando maior for a fracção de amostragem f  , maior será a probabilidade de obter uma
N
amostra representativa.
2. Se a população tem mais 10000 unidades estatísticas e a fracção de amostragem é de pelo
menos 0.1 (ou 10%), a amostra tem uma probabilidade aceitável de ser representativa.

5.2 MÉTODOS DE AMOSTRAGEM


Entre vários métodos ou procedimentos usados nas investigações, podem-se classificar dois tipos
principais de métodos de selecção de elementos para a composição da amostra: métodos
probabilísticos e métodos não probabilísticos.

5.2.1 Métodos Probabilísticos


Os métodos probabilísticos ou aleatórios são aqueles em que cada unidade estatística tem uma
certa probabilidade conhecida de pertencer na amostra, e esta probabilidade é diferente de zero.
A amostragem aleatória é a base da inferência estatística, pois, este método garante
cientificamente e aplicação das técnicas estatísticas de inferências.

a) Amostragem aleatória simples

Este é o processo mais elementar e frequentemente utilizado. Aqui, a probabilidade de cada


elemento pertencer na amostra é a mesma para todos. Assim, se N for o tamanho da população, a
probabilidade de cada elemento pertencer na amostra seleccionada sem reposição será
1
p(Ui)  . É a probabilidade de inclusão de cada unidade estatística na amostra.
N
Para cumprir a aleatoriedade é necessário possuir uma lista completa dos elementos que formam
parte da população, isto é, numerada de 1 até N. Em seguida realizar o sorteio utilizado a tabela
dos números aleatórios, que consiste numa sequência de dígitos 0 a 9, distribuídos
aleatoriamente.
Exemplo 5.1. Dada uma população de 1000 elementos (N = 1000), para seleccionarmos uma
amostra de 20 elementos (n = 20), procedemos o seguinte.

Resolução:
1) Numerar os elementos, assim 000, 001, 002,…999.
2) Seleccionar 20 números aleatórios da tabela de números aleatórios escolhendo um ponto de
partida casualmente. Para o nosso exemplo, os 20 números aleatórios foram extraídos do
primeiro rectângulo do livro Fonseca, J.S. e G.A. Martins (1996), só para três algarismos.

039 014 937 168 989 732 395 724 824 255
385 955 328 597 099 180 816 187 533 442

80
5. Teoria elementar de amostragem ~ Mulenga

3) Os elementos da lista cujos números coincidem com esta série, serão seleccionadas para
formar a amostra.
Como já podes observar, este processo embora ofereça uma segurança, ele precisa de um
domínio no uso das tabelas de números aleatórios. Um procedimento de uso corrente baseia-se
no sorteio de papelinhos que são baralhados num recipiente, o uso da roleta de lotaria, roleta
giratória com números fixos, etc.
Quer num, quer no outro caso, se o elemento seleccionado não for devolvido à população antes
de escolher o próximo elemento, a amostragem é sem reposição, caso contrário o elemento é
devolvido a população neste caso a amostragem é com reposição.

b) Amostragem aleatória sistemática


Esta é uma variante da amostragem aleatória simples. Sua aplicação requer que a população seja
ordenada segundo um determinado critério de tal modo que, cada elemento seja identificado pela
posição. O processo de extracção dos elementos consiste em escolher ao acaso o primeiro
elemento e os restantes são obtidos sistematicamente mediante uma progressão aritmética de
razão k. O procedimento consiste em:

1. Determinar k  Int  N  , é o inteiro mais próximo.


 n

2. Sortear um número x entre 1 a k; os elementos da amostra serão os correspondentes aos


números: x, x+k; x + 2k; x + 3k,…., etc.
Ou sorteia-se um dígito terminal e em seguida todos os números que terminam por este digito
serão inclusos na amostra até completar o tamanho da amostra, caso não, escolhe-se uma outra
terminação para completar a amostra.
Exemplo 5.2. Num determinado prédio da cidade de Maputo, existem 46 famílias. Um
investigador sobre a situação social das famílias escolheu aquele prédio para inquirir 15 famílias.
Usando um processo de amostragem sistemática, determine os números das flats que deverão ser
inquiridas.
Resolução:
N  46; n  15  k  Int (46 / 15)  3 é a razão de progressão e os números a sortear são 1, 2, 3.
Seja 2 o número escolhido.

x1  2 ;
x2  2  1* 3  5
x3  2  2 * 3  8
x4  2  3 * 3  11
…………………..
x15  2  14 * 3  44

As flats que devem pertencer a amostra deverão ter os números:


ni = {2; 5; 8; 11; 17; 20; 23; 26; 29; 32; 35; 38; 41; 44}

81
5. Teoria elementar de amostragem ~ Mulenga

c) Amostragem aleatória estratificada

É prático e vantajoso, usar a amostragem aleatória simples sempre que a amostra a seleccionar
não for grande. Se a população for muito grande, por exemplo mais de 10000 unidades, 10%
desta população é uma amostra de 1000 unidades, portanto, ainda é muito grande.
O problema neste caso é, como diminuir o tamanho da amostra de modo que ela mantenha a sua
representatividade? A solução deste problema, consiste em dividir a população em estratos e
depois seleccionar uma amostra aleatória em cada um dos estratos. A este tipo de amostragem
chama-se amostragem estratificada.
A amostragem estratificada, caracteriza-se por dividir a população em grupos homogéneos
denominado estratos, em que cada unidade estatística pertença a um e só estrato. Em seguida
seleccionar os elementos dentro de cada estrato mediante um processo aleatório simples e
finalmente somar os elementos seleccionados de modo que seja igual ao tamanho da amostra
pretendida. As variáveis de estratificação mais comuns são encontradas nas modalidades como:
classe social, idade, sexo, profissão e qualquer outro atributo relevante dentro da população.
Existem dois tipos de amostragem estrafegada: amostragem estratificada proporcional e
amostragem estratificada de fracção óptima. A primeira situação, consiste em seleccionar no
estrato uma quantidade de unidades proporcional ao tamanho do estrato na população. Na
segunda, para além da proporção exigida na primeira situação, nesta amostragem os elementos
extraídos devem guardar a proporcionalidade em relação a minimização da variabilidade de cada
estrato. Deve - se salientar que para o nosso caso, consideraremos apenas amostragem
estratificada proporcional.

Exemplo 5.3. Um estudo deve ser feito, para se apurar o aproveitamento anual escolar numa
determinada capital provincial. Para isso, a Direcção Provincial de Educação, tem uma
população de 7000 alunos distribuídos por 4 níveis de ensino: 3000 são do ensino primário, 2000
do ensino secundário,1500 ensino médio e 500 são do ensino superior.
A direcção dos estudos estatísticos da Direcção Provincial de Educação estimou que a amostra
deve ter no mínimo 700 alunos para se considerar representativa.
a) Determine a taxa ou fracção de amostragem.
b) Determine, usando amostragem estratificada proporcional, o número de alunos que deverão
ser extraídos em cada estrato de ensino.

Resolução:
n 700
a) N = 7000; n = 700; f    0.10 (ou 10%)
N 7000
b) Os elementos a seleccionar em cada estrato mediante um processo aleatório simples serão
calculados mediante o produto: ni  f * Ni com N1 + N2+N3+N4 = 7000 unidades

Ensino primário N1 = 3000 alunos Então n1 = 0.10*3000 = 300


Ensino secundário N2 = 2000 alunos Então n2 = 0.10*2000 = 200
Ensino médio N3 = 1500 alunos Então n3 = 0.10*1500 = 150
Ensino superior N4 = 50 alunos Então n4 = 0.10*50 = 50

82
5. Teoria elementar de amostragem ~ Mulenga

A soma de 300  200  150  50  700 unidades na amostra

d) Amostragem por conglomerados ou clusters


A amostragem por conglomerados é uma variação da amostragem estratificada. Esta amostragem
é conveniente quando a população não permite ou torna extremamente difícil que se
identifiquem os seus elementos ou porque está geograficamente dispersa ou por outra razão
qualquer, entretanto pode-se identificar alguns subgrupos da população e estudar as
características destes grupos para depois inferir na população.
A amostragem por conglomerados consiste em dividir a população em subgrupos que se excluem
um a outro, exaustivos de acordo com as variáveis que caracterizam o universo e com
aproximadamente o mesmo número de elementos, sorteia-se alguns conglomerados e em seguida
estuda-se todos os elementos dos conglomerados ou clusters.
Este método é vantajoso quando é difícil construir uma base de sondagem, isto é, a operação de
preparação da listagem de todos os elementos da população seria muito demorada e teria um
custo elevado, digamos proibitivo. Como alternativa, basta Elaborar a lista dos conglomerados e
seleccionar a amostra nestes, para obter a característica de toda a população.

e) Amostragem multi-etapas
Amostragem multi-etapa, é uma extensão do conceito de amostragem por conglomerados. Esta
amostragem é utilizada quando o tamanho dos conglomerados é muito grande que torna não
prático estudar todos os elementos que pertencem ao conglomerado, e ao mesmo tempo os
elementos nos conglomerados são homogéneos de tal forma que pode-se estudar alguns
elementos para conhecer toda a característica do conglomerado.
O procedimento da amostragem em duas ou mais etapas consiste em seleccionar no primeiro
estágio uma amostra aleatória simples de conglomerados e no segundo estágio, seleccionar uma
amostra aleatória simples de unidades estatísticas em cada conglomerado. O conjunto de todos os
elementos obtidos nos conglomerados constitui a amostra. Este processo pode multiplicar-se por
mais de duas etapas.

f) Amostragem multi-fásica
Não deverão se confundidos estes dois processos de amostragem: multi-etapas e multi-fásica. No
primeiro processo as unidades amostrais variam de uma etapa para outra, enquanto na
amostragem multi-fásica define-se sempre a mesma unidade amostral para todas as fases de
extracção de amostra. Na primeira fase, recolhe-se dado sobre determinadas características dos
inquiridos. Estas informações servem de base para definir uma segunda amostra que responderá
a um questionário com um nível de profundidade mais elevado.

5.2.2 Métodos não probabilísticos ou Dirigidos

Estes métodos de amostragem são aqueles em que a escolha dos elementos para pertencer a
amostra não depende de alguma probabilidade. Usando este tipo de métodos não é correcto
generalizar os resultados das investigações para a população, entretanto podem ajudar ao

83
5. Teoria elementar de amostragem ~ Mulenga

investigador formular boas hipóteses em relação ao problema a ser investigado, pois, as amostras
não probabilísticas ou empíricas não garantem a representatividade da população.

a) Amostragem Acidental

A amostra acidental é um subconjunto da população formado por elementos que são possíveis de
obter até completar o número de elementos necessários para a amostra, porém sem nenhuma
segurança de que os elementos constituem uma amostra exaustiva de todos subconjuntos
possíveis do universo. Em outras literaturas, esta amostragem é chamada de convencional ou por
acessibilidade. Geralmente é utilizada nas investigações de opinião pública onde os entrevistados
são escolhidos acidentalmente poe exemplo os pacientes atendidos em um hospital, etc.

b) Amostragem Intencional

Esta técnica, consiste em usar um determinado critério, e escolher intencionalmente um grupo de


elementos que irão compor a amostra. Os elementos dos grupos da população, devem apresentar
uma característica típica, dai se chamar também de amostragem típica. O investigador selecciona
os grupos da população que deseja saber as suas características típicas. Por exemplo, numa
investigação sobre os efeitos de um determinado produto cosmético, o investigador dirige-se aos
salões de beleza e entrevista as pessoas que ali se encontram.

c) Amostragem Snowball

Este processo de amostragem é praticamente aconselhado quando se pretende estimar


características relativamente raras na população total. O método consiste em identificar os
primeiros ou poucos elementos que possuem a característica investigada e inquerir a estes. Na
segunda fase, escolher outros entrevistados a partir da informação obtida dos primeiros e assim
por diante até obter a informação necessária para o estudo.

d) Amostragem Sequencial

Outro tipo de amostragem dirigida que pode ser considerada relativamente semelhante ao
método multi – fásico é o da amostragem sequencial. A diferença é que neste processo de
amostragem, a realização da fase seguinte só é decidida depois de analisados os resultados da
fase anterior.

e) Amostragem por quotas

Este é um dos métodos de amostragem mais utilizado. Ele oferece um maior rigor do que muitos
outros métodos não probabilísticos já considerados, por apresentar uma ideia intuitiva da
representatividade dos grupos na amostra. É usual nas campanhas eleitorais, nos estudos de
mercado, etc.

Uma investigação por este método abrange três fases:

84
5. Teoria elementar de amostragem ~ Mulenga

1) Classificar a população em termos de propriedades ou modalidades que se parecem


relevantes para a característica a estudar;
2) Determinar as proporções N1, N2, N3…,NK que constituem as partições da população N,
segundo as características que a população apresenta.
n * Ni
3) Calcular as quotas (ni) a seleccionar no grupo Ni para pertencer a amostra ni 
N

As vantagens deste tipo de amostragem são: não necessita uma base amostral mais rigorosa; é
fácil de aplicar; tem baixo custo e assegura uma representatividade dos elementos de cada grupo
populacional. Entretanto tem certa desvantagem por necessitar uma informação exacta em cada
passo e a selecção da amostra em cada grupo não é aleatória.

Exemplo 5.4. Seja uma população com N = 1000 unidades, divididas em três grupos com N1 =
200; N2 = 300 e N3 = 500. Pretende-se extrair desta população uma amostra de tamanho 350.
Encontre as quotas ou percentagem que devem ser tiradas em cada grupo.

Resolução:

Para facilitar a compreensão vamos apresentar numa tabela os resultados. Repare que nesta
tabela a proporção dos elementos no subgrupo populacional é igual a proporção nos grupos cuja
soma formará o número das unidades na amostra: ni  n * p(i)

Na População de tamanho N Na amostra de tamanho n


Ni Ni Pi Pi ni ni
N1 200 20% 20% 70 n1
N2 300 30% 30% 105 n2
N3 500 50% 50% 175 n3
soma 1000 100% 100% 350 soma

5.3 DETERMINAÇÃO DO TAMANHO DE UMA AMOSTRA

Na organização do esquema de uma sondagem a ser utilizado durante a investigação, há que


considerar o problema da determinação do tamanho da amostra que será necessário seleccionar
da população. Para que uma amostra apresente com fidelidade as características do universo, isto
é, tenha uma representatividade, não basta ser uma parte dele. É necessário que a amostra tenha
um número suficiente de casos escolhidos aleatoriamente. Portando, o tamanho da amostra deve
ser calculado mediante determinadas proporções estabelecidas estatisticamente, não só para
recolher a informação necessária como também para garantir a possibilidade de fazer inferência
dos resultados e minimizar o tempo de recolha de dados, o custo, etc.

85
5. Teoria elementar de amostragem ~ Mulenga

5.3.1 Factores que determinam o tamanho de uma amostra

Os factores que determinam a extensão de uma amostra são: o tamanho do universo que pode ser
finito ou infinito; o nível de confiança estabelecido; o erro de estimação permitido pelos órgãos
de controlo de qualidade da informação e proporção da característica investigada no universo.

1) Tamanho do universo

O tamanho de uma amostra depende do tamanho da população, que pode ser finito ou infinito.
Consideram-se universos finitos os que não ultrapassam as 100.000 unidades estatísticas
( N  100.000) , e universos infinitos são os que ultrapassam ( N  100.000) . Esta distinção é
importante para a determinação do tamanho, pois, usam-se fórmulas diferentes, porque no
segundo caso sempre se recebe uma amostra grande.
2) Nível de confiança estabelecido

De acordo com as estatísticas realizadas e da teoria das probabilidades, a distribuição de


qualquer informação obtida por uma amostra extraída de uma população normalmente
distribuída, se ajusta á lei normal, apresentando valores centrais mais elevados e valores
extremos mais reduzidos. Assim, o nível de confiança é a área da curva normal que se pretende
abranger, por exemplo, se desejarmos fazer inferências com 95% de segurança, abrange-se 95%
da área total da curva normal. Lembre que Z  N (0,1)

Nível de confiança (  ) Coeficiente de confiança ( Zcr )


68.27% 1  1* 
95.00% 1.96  1.96 * 
95.45% 2  2 *
98.98% 2.57  2.57 * 
99.73% 3  3 *

Figura 5.2. Distribuição Normal Padrão e a regra de três sigmas


Normalmente nas investigações sociais, trabalha-se com 95%, significando que existe uma
probabilidade de 95% em cada 100% de que qualquer resultado obtido da amostra seja válido
para o universo. Quando se deseja maior precisão trabalha-se com 99.7%.

86
5. Teoria elementar de amostragem ~ Mulenga

3) Erro de estimação

Os resultados obtidos a partir de uma amostra não são rigorosamente exactos em relação a
população que pretendem representar. Os erros cometidos na obtenção das estatísticas amostrais
devem ser considerados quando se pretende generalizar estes resultados.
Existem dois tipos de erros numa estimativa baseada na teoria de amostragem: erro de vieses e
erros de amostragem. Os erros de vieses ou de observação são aqueles relacionados com o estudo
da amostra (preparação inadequada da investigação, dificuldade dos conceitos, ma interpretação
da informação, mau registo dos dados, etc.), podendo-se minimizar, se a operação for bem
planificada. Os erros de amostragem ou aleatórios são ligados com a maneira como se obtêm a
amostra e as possíveis relações entre as estatísticas e os parâmetros populacionais.
Para efeitos de utilização, o erro de estimação é a máxima diferença que o investigador adite
entre a medida populacional (parâmetro) e a medida obtida da amostra (estatísticas) mesmo não
conhecendo estas medidas.  |    | . Para efeitos de simplicidade use –se geralmente as
diferenças entre as médias.

 |   x |

Geralmente nas investigações sociais não se aceita um erro maior que 6%. Considerando que o
tamanho da amostra depende do erro, este deve ser decidido antes. Quando se deseja maior
exactidão deve-se diminuir o erro e consequentemente maior é o tamanho da amostra, nas
investigações do dia-a-dia trabalha-se com um erro entre 3%    5%.

4) Proporção da característica investigada

Trata-se de ter uma estimativa da proporção (p) prévia da percentagem com que se verifica o
fenómeno que se precisa investigar na população. Na realidade é muito difícil realizar tal
estimativa, portanto, se pensar que a proporção da característica investigada no universo é 50%,
este é o caso mais desfavorável para a estimativa, pois, é aquele em que a amostra deve ser
maior. Logicamente, se a proporção fosse de 10% para um tamanho definido, a amostra teria um
menor número de casos favoráveis.
Se p > 50% - situação favorável para o estimador (pode-se ter uma amostra pequena);
Se p = 50% - situação não favorável para o estimador (a amostra deve ser grande)
Se p < 50% - situação muito desfavorável para o estimador (a amostra necessariamente deve
incluir o maior número possível de unidades do universo).

5.3.2 Cálculo do tamanho de uma amostra


Existem diversos procedimentos que são utilizados para do cálculo do tamanho de uma amostra,
nesta secção destacam-se algumas situações ao nosso nível de abordagem da teoria de
amostragem.
Situação 1. Se a variável escolhida na população for intervalar e a população considerada for
infinita, o tamanho da amostra pode ser determinada pela fórmula.

87
5. Teoria elementar de amostragem ~ Mulenga

 z * 
2

n  (5.1)
  
Onde:
z = valor critico, obtido a partir de um nível de confiança;
 = desvio padrão da população;
ε = erro de estimação

Exemplo 5.5 suponha que a variável escolhida no estudo seja o peso de certa pessoa e que a
população é infinita. Pelas especificações do produto, o desvio padrão é de 10Kg. Admitindo -se
um nível de confiança de 95.44% e um erro de estimação amostral de 1.5 kg calcule o tamanho
da amostra
Resolução:
0.9544
Dados: N é infinito; ε = 1.5; σ = 10; 2*Ф(z) = 0.9544  Ф(z) = = 0.4772 consultando
2
esta probabilidade na tabela de valores de função de distribuição normal padrão tem - se que
z = 2.
z * 2 2 *10 2
n( ) = ( ) = 177.77 ≈ 178
 1.5

Situação 2. Se a variável escolhida for intervalar e a população finita, o tamanho da amostra será
calculado por:

z 2 * 2 * N
n (5.2)
 2 ( N  1)  z 2 *  2

Exemplo 5.6. Suponha ainda que no exemplo anterior, a população seja finita de 600 pessoas.
Calcule o tamanho da amostra.
z 2 * 2 * N 2 2 *10 2 * 600
n 2 = = 137.31 ≈ 137
 ( N  1)  z 2 *  2 1.5 2 (600  1)  2 2 *10 2

Situação 3. Se a variável escolhida for nominal ou ordinal, e a população considerada infinita, o


tamanho da amostra poderá ser calculado pela fórmula:

z2 * p * q
n (5.3)
2

Onde:
p = proporção da característica investigada na população, e pode ser expresso em percentagem
ou decimais.
q = 1-p, proporção da característica não investigada na população

88
5. Teoria elementar de amostragem ~ Mulenga

Exemplo 5.7 Um investigador pretende saber as atitudes dos estudantes universitários em


relação a suas experiências pré - matrimoniais, a proporção dos estudantes que apresentam um
lar satisfeito é de 50%. A investigação deve ser realizada a um nível de confiança de 99.7% e a
um erro de 4%, qual deve ser o tamanho da amostra representativa se o número dos estudantes é
mais que 100.000 unidades estatísticas.

Resolução:
Dados: N é infinito; p = q = 50%; ε = 4%, γ = 0.997  z = 2.96
z 2 * p * q 2.96 2 * 50 * 50
n   1369
2 42

Situação 4. Se a variável escolhida for nominal ou ordinal e a população finita, o tamanho da


amostra será calculado por:

z2 * p * q * N
n 2 (5.4)
 * (n  1)  z 2 * p * q

Exemplo 5.8 Suponha que na investigação das atitudes dos estudantes universitários em relação
a suas experiências pré-matrimoniais, os estudantes não passam de 50.000, além disso o
investigador quer trabalhar apenas com um nível de confiança de 95% e um erro de estimação de
4%. Qual deve ser o tamanho mínimo da amostra para que seja representativa. Considere 50% a
proporção dos estudantes com a característica investigada.

Resolução:
Dados: N = 50000; p = q = 50%; ε = 4%
γ = 95% então 2Ф(z) = 0.95  Ф(z) = 0.4750  z = 1.96

z2 * p *q * N 1.96 2 * 50 * 50 * 50000
n=   593.1
 2 * ( N  1)  z 2 * p * q 4 2 * (50000  1)  1.96 2 * 50 * 50

Resposta: o tamanho mínimo da amostra deve ser de 593 estudantes (para alguns autores 1.96 é
arredondado para 2).

Exemplo 5.9 Um investigador realiza um estudo sobre o comportamento político dos eleitores de
uma determinada província. De acordo com as informações em seu poder o comportamento varia
muito de uma categoria profissional para outra. Portanto, ele está interessado em conhecer o
comportamento desses grupos. Sabendo que a província tem 10.000 eleitores, ao nível de
confiança correspondente a 95.44% e um erro de estimação de 4%, determinar o tamanho da
amostra geral e os tamanhos das amostras nos estratos. De acordo com a informação disponível
os eleitores distribuem-se nas seguintes categorias: técnicos profissionais 1.000, empregados
administrativos 2.000, operários 3.000 e trabalhadores não qualificados 4.000

89
5. Teoria elementar de amostragem ~ Mulenga

Resolução:
a) Tamanho de amostra
N = 10.000; ε = 4% como não foi referida a proporção da característica investigada vamos usar
p = q = 0.5 (50%); γ = 0.9544  z = 2.0

z2 * p *q * N 2 2* * 50 * 50 *10000
n   588.3
 2 * ( N  1)  z 2 * p * q 4 2 * (10000  1)  2 2 * 50 * 50

O tamanho da amostra deve ser 588 eleitores.

b) Determinação dos tamanhos nos extractos.

f = n/N = 588/10000 = 0.0588 é a taxa de amostragem

 Técnicos profissionais n1 = 0.0588 * 1000 = 058.8 ≈ 059


 Empregados administrativos n2 = 0.0588 * 2000 =117.6 ≈118
 Operários n3 = 0.0588 * 3000 = 176.4 ≈ 176
 Trabalhadores não qualificados n4 = 0.0588 * 4000 = 235.2 ≈ 235

5 .4 DISTRIBUIÇÕES AMOSTRAIS

Um dos problemas da inferência estatística é de tirar conclusões de uma população a partir dos
resultados observados na amostra. Logo, cabe ao observador da amostra usar relações mais
adequadas entre os parâmetros populacionais e as estatísticas amostrais. Estimador é qualquer
variável aleatória função dos elementos amostrais. O valor numérico de um estimador é
denominado uma estimativa.
Consideremos todas amostras de tamanho n que podem ser extraídas de uma determinada
população. Se para cada uma destas amostras for calculado o valor do estimador. Tem - se uma
distribuição amostral desse estimador. Como o estimador é uma variável aleatória, então pode -
se encontrar a sua média, variância, desvio padrão, etc.

5.4.1 Distribuição amostral das médias

Se for extraída uma amostra de tamanho n, a média da amostra será x . Se forem extraídas k
amostras do tamanho n, e para cada amostra for calculada a estimativa da média amostral, forma-
se uma população das médias amostrais e a distribuição correspondente chama-se distribuição
amostral das médias

X  { x1 , x 2 , x 3 , ..., x k }

Teorema 1. A média da distribuição amostral das médias, denotada por µ(x) é igual a média
populacional µ, isto é;

E ( x)   ( x)   (5.5)

90
5. Teoria elementar de amostragem ~ Mulenga

Teorema 2. Se a população é infinita ou se a amostragem é com reposição, então a variância da


distribuição amostral das médias é dada por:

2 
 2 ( x)  ou  ( x)  (5.6)
n n

Teorema 3. Se a população é finita, ou se amostragem é sem reposição, então a variância da


distribuição amostral das médias é dada por:
2 N n  N n
 ( x) 
2
*( ) ou  ( x)  *
n N 1 n N 1
(6.7)

Exemplo 5.10. Considere uma população constituída pelas séries das unidades estatísticas:
X ={2; 3; 5; 7; 8}
a) Determine as estimativas dos parâmetros pontuais: a média, a variância e o desvio padrão.
b) Considere todas amostras possíveis de tamanho 2 que podem ser extraídas com reposição e
apresente a distribuição amostral das médias amostrais.
c) Calcule a média e desvio padrão da distribuição amostral das médias.
d) A partir das relações entre as estatísticas e os parâmetros populacionais calcule a média e o
desvio padrão da distribuição amostral.
e) Usando uma amostragem aleatória sem reposição, apresente a distribuição amostral das
médias

Resolução:
a) X = {2, 3, 5, 7, 8} então N = 5.

   ( xi   )
2
xi 25 26
b)  5;  2
   5.2;   2.28
N 5 N 5

Como N = 5, para uma amostra com reposição, cada elemento combina com ele e com qualquer
outro. Então temos 5*5 = 25 amostras. As 25 amostras e as respectivas médias amostrais estão
apresentadas abaixo

25 Amostras de tamanho 2 25 Médias das amostras


2;2 3;2 5;2 7;2 8;2 2.0 2.5 3.5 4.5 5.0
2;3 3;3 5;3 7;3 8;3 2.5 3.0 4.0 5.0 5.5
2;5 3;5 5;5 7;5 8;5 3.5 4.0 5.0 6.0 6.5
2;7 3;7 5;7 7;7 8;7 4.5 5.0 6.0 7.0 7.5
2;8 3;8 5;8 7;8 8;8 5.0 5.5 6.5 7.5 8.0

c)  ( x) 
x i

125
 5;  2 ( x) 
 (x i   ( x)) 2

65
 2.6;  ( x)   2 ( x)  2.6  1.61
N 25 N 25

91
5. Teoria elementar de amostragem ~ Mulenga

 2.28
d) E(x) = µ(x) = µ = 5.0; σ(x) =   1.61
n 2

e) Para amostragem sem reposição as amostras se diferem por, pelo menos, um elemento, então
C(5;2) = 10 amostras.

As 10 amostras de tamanho 2 10 medias das amostras


2;3 2.5
2;5 3;5 3.5 4.0
2;7 3;7 5;7 4.5 5.0 6.0
2;8 3;8 5;8 7;8 5.0 5.5 6.5 7.5

5.4.2 Distribuição amostral das proporções

Se p é a proporção de ocorrência com sucesso de um evento e q = 1-p, seu insucesso, e uma


amostra de tamanho n é extraída de N, a amostra fornecerá uma proporção p = n/N de eventos
ocorridos com sucesso. Para k amostras de tamanho n receber-se-á uma distribuição amostral das
proporções µp, desvio padrão, σp que são dadas pelas fórmulas:
n p(1  p)
a) Amostra com reposição:  p  p  ;  p  (5.8)
N n

n p(1  p) N n
b) Amostra sem reposição:  p  p  ; p  * (5.9)
N n N 1

Exemplo 5.11. Numa prévia campanha eleitoral mostrou-se que um certo candidato tinha 46%
dos votantes. Perante esta situação qual é a probabilidade de que numa sessão eleitoral
constituída por 200 pessoas seleccionadas ao acaso entre a população votante, ele tenha a
maioria dos votos.

Resolução
n pq 0.46 * 0.54
 p   0.46;  p    0.0352
N n 200

A maioria dos votos terá a partir dos 101 eleitores entre os 200. Considerando uma variável
continua, vamos usar 100.5, isto é, a proporção de sucesso p = 100.5/200 = 0.5025.
Transformando para escores reduzidos, temos:
p   p 0.5025  0.46
z   1.21
p 0.0352
P(z >1.21) = 0.5 –P(0 ≤ z ≤ 1.21) = 0.5 – Ф(1.21) = 0.1131

92
5. Teoria elementar de amostragem ~ Mulenga

5.4.3 Distribuição amostra das variâncias

Seja  2 a variância populacional e s2 (variância amostral), o estimador da variância populacional.


Se se desejar saber qual é a distribuição da variância amostral, pode – se usar a relação:
2 * 4
E (s 2 )   2 e var(s2) = (5.10)
n 1

Onde s2 tem distribuição do qui – quadrado com (n-1) graus de liberdade ou seja:

(n  1 * s 2 )
 x 2 n1 (5.11)
2

Graficamente a relação entre a variância amostral e a variância populacional é dada pela


distribuição de qui-quadrado.

5.4.4 Distribuição amostral das médias quando a variância populacional não é


conhecida

Como – se pode deduzir, para uma população normal, a amostra extraída dela, deverá ser
normal, consequentemente a sua distribuição amostral também o será, isto é:
2
Se X ≈ N(µ;σ2) então x ≈ N(µ; )
n
Ou seja, a distribuição normal padronizada é dada por :

x
z (5.12)

n

Como não se conhece o valor da variância (σ2), portanto o valor do desvio padrão populacional
(σ), é substituído pela variável aleatória s (desvio padrão amostral), e procuramos a distribuição
da estatística t. Neste caso, pode – se mostrar que t em uma distribuição de Student com n-1
graus de liberdade, assim:
x
t n1  (5.13)
s
n

93

Você também pode gostar