Escolar Documentos
Profissional Documentos
Cultura Documentos
78
5. Teoria elementar de amostragem ~ Mulenga
A teoria de amostragem hoje em dia é utilizada em quase todas áreas de investigação desde o
tratamento dos fenómenos demográficos, dados na agricultura, na indústria e comércio,
medicina, psicologia até na educação e pesquisas de opinião realizadas pelos meios de
comunicações, etc.
79
5. Teoria elementar de amostragem ~ Mulenga
Ainda em relação a representatividade de uma amostra, são considerados dois princípios básicos:
n
1. Quando maior for a fracção de amostragem f , maior será a probabilidade de obter uma
N
amostra representativa.
2. Se a população tem mais 10000 unidades estatísticas e a fracção de amostragem é de pelo
menos 0.1 (ou 10%), a amostra tem uma probabilidade aceitável de ser representativa.
Resolução:
1) Numerar os elementos, assim 000, 001, 002,…999.
2) Seleccionar 20 números aleatórios da tabela de números aleatórios escolhendo um ponto de
partida casualmente. Para o nosso exemplo, os 20 números aleatórios foram extraídos do
primeiro rectângulo do livro Fonseca, J.S. e G.A. Martins (1996), só para três algarismos.
039 014 937 168 989 732 395 724 824 255
385 955 328 597 099 180 816 187 533 442
80
5. Teoria elementar de amostragem ~ Mulenga
3) Os elementos da lista cujos números coincidem com esta série, serão seleccionadas para
formar a amostra.
Como já podes observar, este processo embora ofereça uma segurança, ele precisa de um
domínio no uso das tabelas de números aleatórios. Um procedimento de uso corrente baseia-se
no sorteio de papelinhos que são baralhados num recipiente, o uso da roleta de lotaria, roleta
giratória com números fixos, etc.
Quer num, quer no outro caso, se o elemento seleccionado não for devolvido à população antes
de escolher o próximo elemento, a amostragem é sem reposição, caso contrário o elemento é
devolvido a população neste caso a amostragem é com reposição.
x1 2 ;
x2 2 1* 3 5
x3 2 2 * 3 8
x4 2 3 * 3 11
…………………..
x15 2 14 * 3 44
81
5. Teoria elementar de amostragem ~ Mulenga
É prático e vantajoso, usar a amostragem aleatória simples sempre que a amostra a seleccionar
não for grande. Se a população for muito grande, por exemplo mais de 10000 unidades, 10%
desta população é uma amostra de 1000 unidades, portanto, ainda é muito grande.
O problema neste caso é, como diminuir o tamanho da amostra de modo que ela mantenha a sua
representatividade? A solução deste problema, consiste em dividir a população em estratos e
depois seleccionar uma amostra aleatória em cada um dos estratos. A este tipo de amostragem
chama-se amostragem estratificada.
A amostragem estratificada, caracteriza-se por dividir a população em grupos homogéneos
denominado estratos, em que cada unidade estatística pertença a um e só estrato. Em seguida
seleccionar os elementos dentro de cada estrato mediante um processo aleatório simples e
finalmente somar os elementos seleccionados de modo que seja igual ao tamanho da amostra
pretendida. As variáveis de estratificação mais comuns são encontradas nas modalidades como:
classe social, idade, sexo, profissão e qualquer outro atributo relevante dentro da população.
Existem dois tipos de amostragem estrafegada: amostragem estratificada proporcional e
amostragem estratificada de fracção óptima. A primeira situação, consiste em seleccionar no
estrato uma quantidade de unidades proporcional ao tamanho do estrato na população. Na
segunda, para além da proporção exigida na primeira situação, nesta amostragem os elementos
extraídos devem guardar a proporcionalidade em relação a minimização da variabilidade de cada
estrato. Deve - se salientar que para o nosso caso, consideraremos apenas amostragem
estratificada proporcional.
Exemplo 5.3. Um estudo deve ser feito, para se apurar o aproveitamento anual escolar numa
determinada capital provincial. Para isso, a Direcção Provincial de Educação, tem uma
população de 7000 alunos distribuídos por 4 níveis de ensino: 3000 são do ensino primário, 2000
do ensino secundário,1500 ensino médio e 500 são do ensino superior.
A direcção dos estudos estatísticos da Direcção Provincial de Educação estimou que a amostra
deve ter no mínimo 700 alunos para se considerar representativa.
a) Determine a taxa ou fracção de amostragem.
b) Determine, usando amostragem estratificada proporcional, o número de alunos que deverão
ser extraídos em cada estrato de ensino.
Resolução:
n 700
a) N = 7000; n = 700; f 0.10 (ou 10%)
N 7000
b) Os elementos a seleccionar em cada estrato mediante um processo aleatório simples serão
calculados mediante o produto: ni f * Ni com N1 + N2+N3+N4 = 7000 unidades
82
5. Teoria elementar de amostragem ~ Mulenga
e) Amostragem multi-etapas
Amostragem multi-etapa, é uma extensão do conceito de amostragem por conglomerados. Esta
amostragem é utilizada quando o tamanho dos conglomerados é muito grande que torna não
prático estudar todos os elementos que pertencem ao conglomerado, e ao mesmo tempo os
elementos nos conglomerados são homogéneos de tal forma que pode-se estudar alguns
elementos para conhecer toda a característica do conglomerado.
O procedimento da amostragem em duas ou mais etapas consiste em seleccionar no primeiro
estágio uma amostra aleatória simples de conglomerados e no segundo estágio, seleccionar uma
amostra aleatória simples de unidades estatísticas em cada conglomerado. O conjunto de todos os
elementos obtidos nos conglomerados constitui a amostra. Este processo pode multiplicar-se por
mais de duas etapas.
f) Amostragem multi-fásica
Não deverão se confundidos estes dois processos de amostragem: multi-etapas e multi-fásica. No
primeiro processo as unidades amostrais variam de uma etapa para outra, enquanto na
amostragem multi-fásica define-se sempre a mesma unidade amostral para todas as fases de
extracção de amostra. Na primeira fase, recolhe-se dado sobre determinadas características dos
inquiridos. Estas informações servem de base para definir uma segunda amostra que responderá
a um questionário com um nível de profundidade mais elevado.
Estes métodos de amostragem são aqueles em que a escolha dos elementos para pertencer a
amostra não depende de alguma probabilidade. Usando este tipo de métodos não é correcto
generalizar os resultados das investigações para a população, entretanto podem ajudar ao
83
5. Teoria elementar de amostragem ~ Mulenga
investigador formular boas hipóteses em relação ao problema a ser investigado, pois, as amostras
não probabilísticas ou empíricas não garantem a representatividade da população.
a) Amostragem Acidental
A amostra acidental é um subconjunto da população formado por elementos que são possíveis de
obter até completar o número de elementos necessários para a amostra, porém sem nenhuma
segurança de que os elementos constituem uma amostra exaustiva de todos subconjuntos
possíveis do universo. Em outras literaturas, esta amostragem é chamada de convencional ou por
acessibilidade. Geralmente é utilizada nas investigações de opinião pública onde os entrevistados
são escolhidos acidentalmente poe exemplo os pacientes atendidos em um hospital, etc.
b) Amostragem Intencional
c) Amostragem Snowball
d) Amostragem Sequencial
Outro tipo de amostragem dirigida que pode ser considerada relativamente semelhante ao
método multi – fásico é o da amostragem sequencial. A diferença é que neste processo de
amostragem, a realização da fase seguinte só é decidida depois de analisados os resultados da
fase anterior.
Este é um dos métodos de amostragem mais utilizado. Ele oferece um maior rigor do que muitos
outros métodos não probabilísticos já considerados, por apresentar uma ideia intuitiva da
representatividade dos grupos na amostra. É usual nas campanhas eleitorais, nos estudos de
mercado, etc.
84
5. Teoria elementar de amostragem ~ Mulenga
As vantagens deste tipo de amostragem são: não necessita uma base amostral mais rigorosa; é
fácil de aplicar; tem baixo custo e assegura uma representatividade dos elementos de cada grupo
populacional. Entretanto tem certa desvantagem por necessitar uma informação exacta em cada
passo e a selecção da amostra em cada grupo não é aleatória.
Exemplo 5.4. Seja uma população com N = 1000 unidades, divididas em três grupos com N1 =
200; N2 = 300 e N3 = 500. Pretende-se extrair desta população uma amostra de tamanho 350.
Encontre as quotas ou percentagem que devem ser tiradas em cada grupo.
Resolução:
Para facilitar a compreensão vamos apresentar numa tabela os resultados. Repare que nesta
tabela a proporção dos elementos no subgrupo populacional é igual a proporção nos grupos cuja
soma formará o número das unidades na amostra: ni n * p(i)
85
5. Teoria elementar de amostragem ~ Mulenga
Os factores que determinam a extensão de uma amostra são: o tamanho do universo que pode ser
finito ou infinito; o nível de confiança estabelecido; o erro de estimação permitido pelos órgãos
de controlo de qualidade da informação e proporção da característica investigada no universo.
1) Tamanho do universo
O tamanho de uma amostra depende do tamanho da população, que pode ser finito ou infinito.
Consideram-se universos finitos os que não ultrapassam as 100.000 unidades estatísticas
( N 100.000) , e universos infinitos são os que ultrapassam ( N 100.000) . Esta distinção é
importante para a determinação do tamanho, pois, usam-se fórmulas diferentes, porque no
segundo caso sempre se recebe uma amostra grande.
2) Nível de confiança estabelecido
86
5. Teoria elementar de amostragem ~ Mulenga
3) Erro de estimação
Os resultados obtidos a partir de uma amostra não são rigorosamente exactos em relação a
população que pretendem representar. Os erros cometidos na obtenção das estatísticas amostrais
devem ser considerados quando se pretende generalizar estes resultados.
Existem dois tipos de erros numa estimativa baseada na teoria de amostragem: erro de vieses e
erros de amostragem. Os erros de vieses ou de observação são aqueles relacionados com o estudo
da amostra (preparação inadequada da investigação, dificuldade dos conceitos, ma interpretação
da informação, mau registo dos dados, etc.), podendo-se minimizar, se a operação for bem
planificada. Os erros de amostragem ou aleatórios são ligados com a maneira como se obtêm a
amostra e as possíveis relações entre as estatísticas e os parâmetros populacionais.
Para efeitos de utilização, o erro de estimação é a máxima diferença que o investigador adite
entre a medida populacional (parâmetro) e a medida obtida da amostra (estatísticas) mesmo não
conhecendo estas medidas. | | . Para efeitos de simplicidade use –se geralmente as
diferenças entre as médias.
| x |
Geralmente nas investigações sociais não se aceita um erro maior que 6%. Considerando que o
tamanho da amostra depende do erro, este deve ser decidido antes. Quando se deseja maior
exactidão deve-se diminuir o erro e consequentemente maior é o tamanho da amostra, nas
investigações do dia-a-dia trabalha-se com um erro entre 3% 5%.
Trata-se de ter uma estimativa da proporção (p) prévia da percentagem com que se verifica o
fenómeno que se precisa investigar na população. Na realidade é muito difícil realizar tal
estimativa, portanto, se pensar que a proporção da característica investigada no universo é 50%,
este é o caso mais desfavorável para a estimativa, pois, é aquele em que a amostra deve ser
maior. Logicamente, se a proporção fosse de 10% para um tamanho definido, a amostra teria um
menor número de casos favoráveis.
Se p > 50% - situação favorável para o estimador (pode-se ter uma amostra pequena);
Se p = 50% - situação não favorável para o estimador (a amostra deve ser grande)
Se p < 50% - situação muito desfavorável para o estimador (a amostra necessariamente deve
incluir o maior número possível de unidades do universo).
87
5. Teoria elementar de amostragem ~ Mulenga
z *
2
n (5.1)
Onde:
z = valor critico, obtido a partir de um nível de confiança;
= desvio padrão da população;
ε = erro de estimação
Exemplo 5.5 suponha que a variável escolhida no estudo seja o peso de certa pessoa e que a
população é infinita. Pelas especificações do produto, o desvio padrão é de 10Kg. Admitindo -se
um nível de confiança de 95.44% e um erro de estimação amostral de 1.5 kg calcule o tamanho
da amostra
Resolução:
0.9544
Dados: N é infinito; ε = 1.5; σ = 10; 2*Ф(z) = 0.9544 Ф(z) = = 0.4772 consultando
2
esta probabilidade na tabela de valores de função de distribuição normal padrão tem - se que
z = 2.
z * 2 2 *10 2
n( ) = ( ) = 177.77 ≈ 178
1.5
Situação 2. Se a variável escolhida for intervalar e a população finita, o tamanho da amostra será
calculado por:
z 2 * 2 * N
n (5.2)
2 ( N 1) z 2 * 2
Exemplo 5.6. Suponha ainda que no exemplo anterior, a população seja finita de 600 pessoas.
Calcule o tamanho da amostra.
z 2 * 2 * N 2 2 *10 2 * 600
n 2 = = 137.31 ≈ 137
( N 1) z 2 * 2 1.5 2 (600 1) 2 2 *10 2
z2 * p * q
n (5.3)
2
Onde:
p = proporção da característica investigada na população, e pode ser expresso em percentagem
ou decimais.
q = 1-p, proporção da característica não investigada na população
88
5. Teoria elementar de amostragem ~ Mulenga
Resolução:
Dados: N é infinito; p = q = 50%; ε = 4%, γ = 0.997 z = 2.96
z 2 * p * q 2.96 2 * 50 * 50
n 1369
2 42
z2 * p * q * N
n 2 (5.4)
* (n 1) z 2 * p * q
Exemplo 5.8 Suponha que na investigação das atitudes dos estudantes universitários em relação
a suas experiências pré-matrimoniais, os estudantes não passam de 50.000, além disso o
investigador quer trabalhar apenas com um nível de confiança de 95% e um erro de estimação de
4%. Qual deve ser o tamanho mínimo da amostra para que seja representativa. Considere 50% a
proporção dos estudantes com a característica investigada.
Resolução:
Dados: N = 50000; p = q = 50%; ε = 4%
γ = 95% então 2Ф(z) = 0.95 Ф(z) = 0.4750 z = 1.96
z2 * p *q * N 1.96 2 * 50 * 50 * 50000
n= 593.1
2 * ( N 1) z 2 * p * q 4 2 * (50000 1) 1.96 2 * 50 * 50
Resposta: o tamanho mínimo da amostra deve ser de 593 estudantes (para alguns autores 1.96 é
arredondado para 2).
Exemplo 5.9 Um investigador realiza um estudo sobre o comportamento político dos eleitores de
uma determinada província. De acordo com as informações em seu poder o comportamento varia
muito de uma categoria profissional para outra. Portanto, ele está interessado em conhecer o
comportamento desses grupos. Sabendo que a província tem 10.000 eleitores, ao nível de
confiança correspondente a 95.44% e um erro de estimação de 4%, determinar o tamanho da
amostra geral e os tamanhos das amostras nos estratos. De acordo com a informação disponível
os eleitores distribuem-se nas seguintes categorias: técnicos profissionais 1.000, empregados
administrativos 2.000, operários 3.000 e trabalhadores não qualificados 4.000
89
5. Teoria elementar de amostragem ~ Mulenga
Resolução:
a) Tamanho de amostra
N = 10.000; ε = 4% como não foi referida a proporção da característica investigada vamos usar
p = q = 0.5 (50%); γ = 0.9544 z = 2.0
z2 * p *q * N 2 2* * 50 * 50 *10000
n 588.3
2 * ( N 1) z 2 * p * q 4 2 * (10000 1) 2 2 * 50 * 50
5 .4 DISTRIBUIÇÕES AMOSTRAIS
Um dos problemas da inferência estatística é de tirar conclusões de uma população a partir dos
resultados observados na amostra. Logo, cabe ao observador da amostra usar relações mais
adequadas entre os parâmetros populacionais e as estatísticas amostrais. Estimador é qualquer
variável aleatória função dos elementos amostrais. O valor numérico de um estimador é
denominado uma estimativa.
Consideremos todas amostras de tamanho n que podem ser extraídas de uma determinada
população. Se para cada uma destas amostras for calculado o valor do estimador. Tem - se uma
distribuição amostral desse estimador. Como o estimador é uma variável aleatória, então pode -
se encontrar a sua média, variância, desvio padrão, etc.
Se for extraída uma amostra de tamanho n, a média da amostra será x . Se forem extraídas k
amostras do tamanho n, e para cada amostra for calculada a estimativa da média amostral, forma-
se uma população das médias amostrais e a distribuição correspondente chama-se distribuição
amostral das médias
X { x1 , x 2 , x 3 , ..., x k }
Teorema 1. A média da distribuição amostral das médias, denotada por µ(x) é igual a média
populacional µ, isto é;
E ( x) ( x) (5.5)
90
5. Teoria elementar de amostragem ~ Mulenga
2
2 ( x) ou ( x) (5.6)
n n
Exemplo 5.10. Considere uma população constituída pelas séries das unidades estatísticas:
X ={2; 3; 5; 7; 8}
a) Determine as estimativas dos parâmetros pontuais: a média, a variância e o desvio padrão.
b) Considere todas amostras possíveis de tamanho 2 que podem ser extraídas com reposição e
apresente a distribuição amostral das médias amostrais.
c) Calcule a média e desvio padrão da distribuição amostral das médias.
d) A partir das relações entre as estatísticas e os parâmetros populacionais calcule a média e o
desvio padrão da distribuição amostral.
e) Usando uma amostragem aleatória sem reposição, apresente a distribuição amostral das
médias
Resolução:
a) X = {2, 3, 5, 7, 8} então N = 5.
( xi )
2
xi 25 26
b) 5; 2
5.2; 2.28
N 5 N 5
Como N = 5, para uma amostra com reposição, cada elemento combina com ele e com qualquer
outro. Então temos 5*5 = 25 amostras. As 25 amostras e as respectivas médias amostrais estão
apresentadas abaixo
c) ( x)
x i
125
5; 2 ( x)
(x i ( x)) 2
65
2.6; ( x) 2 ( x) 2.6 1.61
N 25 N 25
91
5. Teoria elementar de amostragem ~ Mulenga
2.28
d) E(x) = µ(x) = µ = 5.0; σ(x) = 1.61
n 2
e) Para amostragem sem reposição as amostras se diferem por, pelo menos, um elemento, então
C(5;2) = 10 amostras.
n p(1 p) N n
b) Amostra sem reposição: p p ; p * (5.9)
N n N 1
Exemplo 5.11. Numa prévia campanha eleitoral mostrou-se que um certo candidato tinha 46%
dos votantes. Perante esta situação qual é a probabilidade de que numa sessão eleitoral
constituída por 200 pessoas seleccionadas ao acaso entre a população votante, ele tenha a
maioria dos votos.
Resolução
n pq 0.46 * 0.54
p 0.46; p 0.0352
N n 200
A maioria dos votos terá a partir dos 101 eleitores entre os 200. Considerando uma variável
continua, vamos usar 100.5, isto é, a proporção de sucesso p = 100.5/200 = 0.5025.
Transformando para escores reduzidos, temos:
p p 0.5025 0.46
z 1.21
p 0.0352
P(z >1.21) = 0.5 –P(0 ≤ z ≤ 1.21) = 0.5 – Ф(1.21) = 0.1131
92
5. Teoria elementar de amostragem ~ Mulenga
Onde s2 tem distribuição do qui – quadrado com (n-1) graus de liberdade ou seja:
(n 1 * s 2 )
x 2 n1 (5.11)
2
Como – se pode deduzir, para uma população normal, a amostra extraída dela, deverá ser
normal, consequentemente a sua distribuição amostral também o será, isto é:
2
Se X ≈ N(µ;σ2) então x ≈ N(µ; )
n
Ou seja, a distribuição normal padronizada é dada por :
x
z (5.12)
n
Como não se conhece o valor da variância (σ2), portanto o valor do desvio padrão populacional
(σ), é substituído pela variável aleatória s (desvio padrão amostral), e procuramos a distribuição
da estatística t. Neste caso, pode – se mostrar que t em uma distribuição de Student com n-1
graus de liberdade, assim:
x
t n1 (5.13)
s
n
93