Escolar Documentos
Profissional Documentos
Cultura Documentos
Ao desenvolver um projecto o “total de observações nas quais se está interessado, seja seu nº
finito ou infinito, constitui o que se chama de população”(Walpole e Myers, 1996,p.203). A
amostra é uma pequena parte da população estudada e deve caracterizar-se por ser
representativa da população. De acordo com Briones (1995) uma amostra é representativa
quando reproduz as distribuições e os valores das diferentes características da população…, com
margens de erro calculáveis (p.83).
1. População e amostra
O 1º passo para realizar um estudo na empresa, seja para o controlo interno, uma análise do
mercado, satisfação do cliente ou análise dos fornecedores, é o planeamento dos aspectos
básicos da amostra estatística. Entre esses aspectos básicos, encontram-se a população alvo do
estudo, a amostra selecionada e os parâmetros a estudar, entre outros elementos.
Entretanto, não é comum o modo de escolher estes poucos indivíduos; uma amostra bem
selecionada permitirá a obtenção de boas conclusões sobre a população total, sendo a principal
finalidade pela qual se realiza as amostragens e a análise estatística.
Se o pesquisador exclui certos grupos, áreas, etc., de sua pesquisa, há-de fazê-lo deliberada e
explicitamente, deixando sempre claro qual é a cobertura de seu estudo, isto é, qual é a
população que cobre efectivamente e, portanto, a qual correspondem as conclusões
derivadas da pesquisa.
Uma pesquisa pode ser considerada completa se, virtualmente, todas as unidades da
população estudada são consideradas na pesquisa, ou seja, se a relação contém a população
de interesse, ou se a população efectiva coincide com a população de interesse. Será
considerada se em qualquer outro caso, ou seja, se faltarem indivíduos. Porém, a falta de
indivíduos da população na relação não deve impedir a elaboração de conclusões sobre a
população de interesse inicialmente proposta.
1
Em algumas ocasiões as populações a estudar são tão grandes que ou estão tão dispersas que
uma cobertura completa é descartada por motivos financeiros, de tempo ou de potencial humano
(por exemplo, nos experimentos de auditoria).
O objectivo de todo o estudo será chegar a conclusões sobre como a população age à
determinadas características de interesse. As características mensuradas no estudo são as
variáveis. Um parâmetro é uma descrição numérica da população de interesse em relação a
uma determinada característica.
Um censo consiste na enumeração completa dos indivíduos que formam a população submetida
ao estudo, detalhados e reconhecidos por suas características. Na maioria das ocasiões, a
população efectiva é constituída por um nº tão grande de elementos que é praticamente
impossível ter acesso a todos e estudá-los. Nestes casos, seleciona-se uma amostra (uma parte
da população). A principal qualidade que pode apresentar uma amostra é a de ser
representativa.
Os resultados de uma pesquisa amostral estarão sempre sujeitos a certo grau de incerteza, posto
que somente parte da população foi mensurada e podem existir erros de mensuração.
O erro amostral e, em consequência, parte da incerteza, pode ser reduzido tomando-se amostras
maiores, tanto de tempo quanto financeiros, os quais nem sempre podem ser cobertos. Uma vez
determinado o erro permissível, calcular-se-á o tamanho necessário da amostra para ultrapassá-
lo. Por outro lado, quanto mais informações se tiver inicialmente sobre uma população, mais
fácil será organizar uma amostragem que proporcione boas aproximações dos parâmetros de
interesse.
Para uma população ser heterogénea, seus indivíduos devem ser muito semelhantes entre si em
relação à variável que está sendo mensurada. Portanto, qualquer das mensurações tomadas será
muito próxima do verdadeiro valor do parâmetro. Neste caso, será mais fácil obter boa
estimativa se nos encontrarmos diante de uma população heterogénea.
Quanto mais heterogénea uma população, maior deverá ser a amostra, para que se possa
garantir a sua representatividade.
Quanto menor o erro, maior será o tamanho da amostra. Um tamanho excessivo e desnecessário
da amostra, provoca perda de tempo e mais custos. Quando o tamanho da amostra é muito
grande, para diminuí-lo devemos aumentar o erro ou reduzir o grau de confiança.
2
1.5. Propriedades de um estimador
1.5.1.Variabilidade na amostragem
Visto que o caso intervém no facto de se conseguir uma amostra realmente representativa da
população e, portanto, uma boa estimativa do parâmetro de interesse. Mesmo sendo eficiente o
método de amostragem, isto é, sendo garantida a aleatoriedade, alguém pode conseguir, por
acaso, uma amostra ruim, o que resulta em uma estimativa ruim.
1.5.2. Viés
Dizemos que o valor esperado de um estimador coincide com o valor do parâmetro que se
estima, então o estimador é não enviesado.
O erro padrão serve para mensurar a regularidade das estimativas que podem ser obtidas, isto é,
a dispersão em torno de sua média. A variabilidade de um estimador pode ser mensurada em
termos de variâncias e de desvio típico ou erro padrão.
Outro critério útil para concluir a qualidade de um estimador e que unifica os dois critérios de
viés e variância é baseado no erro quadrático médio de um estimador, definido como a soma de
seu viés ao quadrado e de sua variância.
EQM= ¿ X −X ∨¿2 ¿
¿¿
ER=¿ X −X ∨
X
3
σ S
Erro padrão= ou →sem o desvio padrão populacional
√n √n
2. Métodos de amostragens
Os métodos de amostragem são métodos que se podem seguir para selecionar uma amostra de
uma população. Em 1º lugar uma mostra deve conter propriedades representativas da população.
Em 2º lugar a descrição dessas propriedades deve ser realizada de forma mais precisa possível.
Em último lugar, o método de amostragem escolhido deve minimizar o consumo de recursos:
uma amostra pequena economiza tempo e dinheiro.
Esta fórmula apenas é usada nos casos em que não existe o desvio padrão e a
confiança.
N
n 0=
( 1+ N∗E 2)
2.1.1. Exercícios
De acordo com os dados coletados no relatório de Empresas Activas, de acordo com o sector
económico, em 1º de janeiro (INE, 2017), um total de 3.282.346 empresas estavam Activas na
Espanha, das quais 198.805 pertencem ao sector da indústria, 402.923 pertencem ao sector da
construção, 753.503 pertencem ao sector do comércio e 1.927.115 pertencem aos demais
serviços.
Foi estabelecido que o erro máximo permitido na estimativa dos valores da população é de 1%
para um nível de confiança de 95%. Portanto, é necessário analisar uma amostra de 9.576
empresas.
Resolução:
Cálculo da amostra para cada estrato
N∗n0
n=
N + n0
1 1
1 n 0= =
n 0= 2 →
e
( 0,01 )2
( )
1 2 = 10.000
100
4
b) Em uma universidade com 2000 alunos, deseja-se estimar a percentagem de alunos
favoráveis a certo programa de estudo. Qual deve ser o tamanho de uma amostra aleatória
simples que garanta com um alto nível de confiança, um erro amostral não superior a 5%?
Dados:
Obs.: quando o problema não traz o N, ou se o N for 20 vezes maior que n 0 , então o n 0 , será o
n.
c) Para estudar a preferência do eleitorado a uma semana da eleição presidencial, qual deve ser
o tamanho de uma amostra aleatória simples de eleitores para garantir com 95% de
probabilidade, um erro amostral não superior a 2%?
( )(
2
1
)
2
n 0= 2 = 100 = 2.500 Pessoas
2
100
Quanto menor o erro amostral ( diferença entre o resultado amostral e populacional ) maior o
tamanho da amostra, implicando em maior precisão nas estimativas populacionais e
consequentemente maior custo para execução da pesquisa. A fixação do erro amostral depende
essencialmente de três factores:
Se a variável escolhida for quantitativa contínua (que assume qualquer valor – peso, idade,
altura tempo ou hora), podemos determinar o tamanho da amostra, usando as fórmulas
seguintes:
Z 2∗σ 2
População infinita: n= 2 ;
E
2 2
Z ∗σ ∗N
População finita: n= 2 2 2.
E ( N −1 ) +Z ∗σ
Se a variável escolhida for quantitativa discreta (que não assume qualquer valor, ou seja,
quantificação exacta), podemos determinar o tamanho da amostra, usando a fórmula a seguir:
5
2
Z ∗p∗q
População infinita: n=
E2
2
Z ∗p∗q∗N
População finita: n= 2 2
E ( N −1 ) +Z ∗ p∗q
σ 2= Variância da população. Caso seja desconhecido e não existam estudos semelhantes pode
ser estimado a partir de uma amostra piloto em torno de 50 elementos, que geralmente é
utilizada para testar o instrumento de pesquisa, bem como avaliar o comportamento da variável
pesquisada.
Exercícios:
1. Determinar o tamanho de uma amostra com precisão de 95%, para pesquisar a incidência de
listeriose em uma população de 40.000 pessoas, considerando uma prevalência de anos
anteriores igual a 30%. Usar erro amostral de 3%.
1-α=0.95
α= 0.05
Z =Z 1−0.025→ Z
0.975= 1.960
0.05
1−
2
2 2
Z ∗p∗q∗N 1.96 ∗0.30∗0.70∗40.000
n= 2 2 = n= 2 2 →n= 877 pessoas.
E ( N −1 ) +Z ∗p∗q 0.03 ( 40.000−1 ) +1.96 ∗0.30∗0.70
2. Determinada variável apresentou, em relação ao seu peso médio, desvio padrão de 12kg.
Admitindo um nível de confiança de 95.5% (1-α) e o erro amostral de 1,2 kg, determine o
tamanho da amostra para estudar essa população.
Z 2∗σ 2 22∗122
n= = = 400 Peças
E2 1,22
a) De quanto deve ser o tamanho da amostra para uma população de 1.300 peças?
6
2 2 2 2
Z ∗σ ∗N 2 ∗12 ∗1.300
n= 2 2 2 → n= 2 2 2 → n= 306 peças
E ( N −1 ) +Z ∗σ 12 ( 1.300−1 )+2 ∗12
( )
2
Z
n 0= *σ 2
E
Exemplo. Sabe-se que a quantidade de chumbo em certo tipo de solo acusa um desvio padrão
de 10 ppm. Qual o tamanho da amostra necessário para estimar a média de chumbo no solo com
um erro padrão de 0.5 ppm e um nível de confiança de 95%.
1-α=0.95
α= 0.05
Z=Z =Z 1−0.025→ Z
0.975= 1.960
0.05
1−
2
( )
2
n o= 1.96 *102= 1.537
0.5
Exemplo 2. Considere uma característica,com σ 2=36. Calcule o tamanho da amostra, para que
com 95% de probabilidade (confiança), a média amostral não difira da média populacional por
mais de:
σ= 6 erro 2= 2
1-α=0.95
α= 0.05
7
Z =Z 1−0.025→ Z
0.975= 1.960
0.05
1−
2
( ) ( )
2 2
n 0= Z *6→n 0= 1,960 *6 2= 554
E 0.5
Exemplo 3. Calcule o tamanho da amostra, para que a diferença da média amostral para a
média populacional seja inferior ou igual a 2 unidades, com um nível de confiança de 90% e
99%?
( )
2
Z
n 0= *σ 2→
E
→ n 0= 1.761 Eleitores
Exemplo 2. Um gestor gostaria de estimar o percentual de famílias que estão envolvidas. Qual o
tamanho da amostra a ser utilizada, considerando um erro máximo de 2,8% com 90% de
confiança. Considere que a pesquisa seja feita em uma cidade com 3.300 famílias.
1-α=0.90
α= 0.1
Z =Z 1−0.05→ Z
0.95= 1.645
0.1
1−
2
8
Depois disso, temos de corrigir, porque o tamanho da população é conhecido.
n0∗N 863∗3.300
n= = = 864,26= 864
n0 + N−1 863+3.299
Exemplo 3. Uma amostra de piloto de 100 consumidores revelou que 35% considerou o preço
como factor principal na escolha de um produto. Qual deve ser o tamanho da amostra para
determinar um intervalo de confiança de 95%, com um erro máximo de 3% para a verdadeira
proporção de consumidores que consideram o preço como factor principal na escolha do
produto?
1-α=0.95
α= 0.05
Z =Z 1−0.025→ Z
0.975= 1.960
0.05
1−
2
2 2
Z ∗P(1−p) 1,96 ∗0.35(1−0.35) 0.873964
n 0= = = = 971,07= 971
E
2
0.03
2
0.0009
Obs. No caso do desvio populacional desconhecido deve se fazer uma amostragem piloto, ou
usar a fórmula AT=4σ. E se for de tamanho amostral menor que 30, deve se usar:
( )
2
t
n o= * S2
E
Exemplo: toda a distribuição normal tem 95% de seus elementos. Com 95% de confiança temos
o valor de z= 1.96 arredondando passa para 2. O que quer dizer que temos 2 a direita e 2 a
esquerda, perfazendo um total de 4 desvios padrões. Logo,
AT V . max−V . min
AT=4σ→σ= = , Suponha-se que pretendemos estimar a estatura
4 4
média dos seguintes dados máximo e mínimo: 195, 150
195−150
Então, σ== = 11,25. Com este valor já é possível calcular n para estimar a
4
média.
Um método aleatório de selecção é aquele que proporciona a cada uma das N unidade da
população de interesse uma probabilidade calculável e diferente de zero de ser selecionada.
9
Apesar de existirem vários métodos aleatórios de amostragem, aqui serão abordados somente os
mais simples que, além disso, são os mais populares e utilizados. São úteis na obtenção de
amostras aleatórias.
Nas AAS, cada possível amostra n de unidades de uma população de tamanho N tem a mesma
probabilidade de ser selecionada e esta probabilidade é igual a:
P=¿¿ = 1
¿¿
A AAS é o método de amostragem adequado quando a população não é excessivamente
grande e está bem misturada, isto é, não há grupos de população com características distintas
entre si.
Tomar cinco nºs aleatórios do conjunto {01,02,03….,40} e os estudantes associados aos nºs
selecionados formarão a amostra. Pode-se formar a referida amostra, a partir da Tabela de nºs
aleatórios.
18 28 42 39 49 41 45
32 12 27 22 16 45 48
38 34 7 24 11 33 37
32 4 32 34 6 20 17
38 41 24 49 32 41 5
30 9 43 19 46 44 26
………………
………………
10
Na AAS caso haja nºs repetidos, estes só podem integrar para a amostra, uma única vez.
R/ Uma das formas para além de utilizar a tabela de nºs aleatórios, é meter os nomes das
pessoas e colocar num recipiente. Seguidamente, pedir a uma pessoa para que retire dos 80
apenas 30 papéis. Este é o método legítimo, para além da tabela e do Excel.
Um método geral para selecionar uma AAS de n elementos de uma população de tamanho N,
utilizando uma lista de nºs aleatórios é o seguinte:
Exemplo 3. Em uma vizinhança composta por 23 indivíduos deve se recolher uma lista dos
nomes dos 23 indivíduos, classificando cada um deles em ordem, do 0 ao 22 (N-1= 23-1). Neste
caso, não há necessidade de se dispor desse dado, basta identificar o membro da família em
questão dentro de uma residência. → foi resolvido no ecxel.
AAS
( ) ( )
Média 1
n
n σ2 n S2
X= ∑ Xi
n i=1
1−
N n
1−
N n
( )
N−n P ( 1−P )
( N−n ^
P ( 1− ^
) P)
Proporção 1
n
P= ∑ Xi
^
n i=1 N−1 n N−1 n
N
1
2
S= ∑
n−1 i
2
( Xi−X ) → Variância amostral
Exercício. Deseja-se estimar a estatura média de um grupo de 4 amigos utilizando uma AAS de
tamanho n=2. Suas estaturas (variável observada) são: 155, 165, 170 e 190 cm. Utilizando uma
AAS e a tabela de nºs aleatórios, obtêm-se como amostra os indivíduos {1,3} com respostas
{155,170}. Resolva.
11
n 2
1 1 1
X= ∑
n i=1
Xi = ∑
2 i=1
Xi = ( 155+170 )=162,5cm.
2
Este método é útil, da mesma forma que o AAS, quando a população está bem misturada. É
aconselhável quando a população é tão grande, que seria tedioso controlar as escolhas para
que não existam repetições. Para obter uma AACS de n elementos de uma população de
tamanho N, basta seguir as pautas da AAS, permitindo que o mesmo individuo possa ser
repetido na mesma amostra.
AACS
Média 1
n
σ
2
S
2
X= ∑ Xi
n i=1 n n
Proporção 1
n
P ( 1−P ) ^ ( 1− ^
P P)
P= ∑ Xi
^
n i=1 n n
Total N* X 2
N ∗σ
2 2
N ∗S
2
n n
Em que:
N
1
2
σ =
N
∑ ( X i=X ) 2
i=1
1. A AAS é mais preferível que a AACS, pois proporciona estimadores mais precisos, ou seja,
com menor erro de amostragem para o mesmo tamanho;
2. Se a fração amostral f=n/N é pequena, a diferença entre a AAS e a AACS será pequena. Isso
ocorre quando o tamanho da população é muito grande (comparado com o da amostra).
Uma amostragem linear sistemática de salto k é uma amostra na qual se escolhe o 1º individuo
da população de maneira aleatória e, a partir dele, são escolhidos os n-1 restantes de forma
sistemática, ou seja, dando saltos de k em k.
12
Especialmente útil quando se tem grandes listas da população a amostrar, podendo ser
censos, padrões, etc. especialmente, o processo de seleção é o seguinte:
A amostragem sistemática não apresenta fórmulas próprias e adota as leis da AAS, já que
assume que, se alista está bem misturada, o resultado da amostragem seria o mesmo que o de
uma AAS.
A variável observada é X=2”se provou ou não a bebida”, codificada com X=1 se a provou e
X=o se não a provou. As respostas da população dos 24 amigos, junto com suas
correspondentes etiquetas são:
1 2 3 4 5 6 7 8 9 10 11 12
Sim Sim não não sim sim sim não não não não sim
13 14 15 16 17 18 19 20 21 22 23 24
sim sim sim não não não não sim sim não sim sim
Em 1º lugar, deve se calcular o valor de k=N/n = 24/7= 3,42. O nº inteiro desta quantia é 3.
O próprio exercício enuncia que, depois de realizar uma AAS, o individuo escolhido entre os 3
1ºs foi o nº 2. Assim, serão selecionados todos aqueles indivíduos desde o 2 e somando k= 3:
122
K= =12.2
10
13
Como não temos o 1º elemento escolhido faz-se um sorteio de 1 a k→ 1…. 12. Suponhamos
que seja 5, logo:
5,17,29,41,53,65,77,89,101,113.
Por outro lado, para efectuar este tipo de amostra, não é preciso saber o tamanho N da
população, somente especificar o facto k, e forma que, de cada k indivíduos que existam, um
seja escolhido (ou seja, um é escolhido, e, depois, será escolhido o que voltar a fazer k
indivíduos).
Este tipo de amostra obtém bons resultados quando os indivíduos estão ordenados no limite
segundo a resposta de decrescente ou crescente, dado que ao recorrer aos saltos na lista,
obteremos indivíduos de todos os tipos, isto é, uma amostra representativa.
Com este tipo de amostragem pode se aumentar a previsão de nossa estimação AAS dividindo a
população em grupos mais homogéneos entre si, com o objectivo de construir a amostra total a
partir de subamostras obtidas com AAS em cada um destes grupos ou estratos.
Tem-se uma população estratificada nos casos em que contamos com uma população dividida
em grupos internamente homogéneos e externamente heterogéneos; ou seja, entre eles existe a
menor quantidade possível de factores em comum, mas nos elementos de um mesmo estrato têm
características muito semelhantes ou iguais.
O procedimento geral para a extração de uma amostra de tamanho n utilizando uma amostra
aleatória estratificada com AAS é o seguinte:
1. A população é dividida em L grupos, sendo que cada um deles deve ser o mais homogéneo
possível internamente, e os grupos devem ser o mais distintos (heterogéneos) possível entre si
no que se refere à características de interesse.
2. De cada grupo i, se extrai uma amostra, utilizando AAS de tamanho ni, onde a soma de todas
as subamostras ni=n.
L
3i=∑ ni=n
i=1
Com este tipo de amostra, podemos extrair conclusões estrato a estrato e de maneira global.
AAE
14
( )
Média 1
L
N i−ni
X=
N
∑ N i∗Xi L
Ni
∗Si
2
i=1 1
2∑
¿2
N i=1 ni
( )
L
1 N i−n
P= ∑ ¿ Pi
^ ^ ∗^ ^i )
Pi ( 1− P
i
Proporção N i=1 1
L Ni
2∑
¿2
N i=1 ni−1
( )
Total L L
N i −ni Si 2
∑ N i Xi ∑ ¿2 Ni ni
i=1 i=1
- Fixação óptima: o tamanho da amostra em cada estrato, ni , se fixa em função dos requisitos
que impomos sobre a precisão da estimação, a homogeneidade de cada estrato e as limitações
sobre os custos. A precisão óptima é conseguida se:
ni σ i
α
N i √C i
Exemplo
15
Masculin 144 50*0.4= 20
o
Total 360 50
A amostra de cada estrato deve ser proporcional à percentagem da população. Por exemplo:
216
Razão= = 0.6, significa dizer que o sexo feminino representa 60% da população. Se se
360
escolher uma amostra de 50 pessoas das 360, as mulheres também devem representar 60% da
colecta de dados e os homens 40%, conforme vê-se na coluna da amostra populacional.
Exemplo. Deseja-se saber o peso médio de um grupo de amigos compostos por 7 meninos e 13
meninas. Posto que o sexo é um determinante claro do peso deve-se considerá-lo como factor de
estratificação e, portanto, o grupo de meninos e meninas como os dois estratos existentes.
Deseja-se estimar utilizando amostra aleatória combinada com AAS e diversos tipos de fixação
para um tamanho amostral total igual a n=8.
1. Fixação dada→ sem justificação alguma, o pesquisador decide escolher dois meninos e seis
meninas.
Total 20 20
7
Razão (meninos) = = 0.35
20
13
Razão (meninas) = = 0.65
20
Arredondando, pode se dizer que foram escolhidos 3 meninos e 5 meninas.
√ √
2
nmenino =Nmenino* σ menino =7*
44
cmenina cmenino
√ √
2
nmenina = Nmenina* σ menina = 13*
41
cmenina 2∗cmenino
16
Por outro lado, uma vez que se conhece o tamanho total da amostra, pode se dizer que:
8= n = nmenino+nmenina = 7*
√ 44
cmenino
∗¿ 13*
√ 41
2∗cmenino
Isolando a igualdade, descobre-se que o custo da obtenção da amostra de um menino é de
177.88 e o da obtenção da amostra de uma menina é de 355,765 u.m.
Os dois melhores processo para a seleção dos elementos da amostra são os nºs aleatórios e a
seleção sistemática.
Uma vez descritos diversos métodos de amostragem aleatória, devem se considerar três
questões especialmente relevantes em qualquer desenho amostral: a determinação do tamanho
amostral com base na margem de erro que se está disposto a tolerar e no nível de garantia com o
qual se pretende concluir questões relativas às deficiências na relação amostral e como resolvê-
las.
Uma vez fixadas certas margens de erro, escolhido o método de amostragem aleatória e o
estimador a utilizar pode-se sempre calcular o tamanho necessário da amostra para manter as
margens estipuladas.
Denomina-se d o máximo erro que se está disposto a tolerar na estimação (erro de estimação), e
de 1−∞ o nível de garantias que se deseja conseguir para nossa estimação, isto é, o nível de
confiança com o qual se pretende trabalhar. Se o tamanho da amostra n é grande, se tem uma
distribuição na amostra aproximadamente normal; tem esse caso:
S.E. (T) E d
17
Exemplo. Suponhamos que P representa a proporção de estudantes de uma universidade que
usam habitualmente um meio de transporte público para se locomover até a instituição.
Suponhamos também que o tamanho total da população é N= 5000. Queremos estimar P usando
a AAS e a população amostral P como estimador. Vamos determinar o tamanho necessário da
amostra para estimar P sob duas suposições:
1- α= 1-0.955= 0.045
2 2
∗N ∗5000
0.02∗P∗( 1−P ) = 0.02∗P∗( 1−P )
n❑ =
N−1 4999
¿
S.E. (T)≤d → 1∗ ( NN −n
−1 ) P ( 1−P )
n
≤ 0.03
1 N 1 5000
n= * = *
0.03∗P∗( 1−P ) N −1 0.03∗P∗( 1−P ) 4999
Podemos observar que as equações a resolver dependem do parâmetro P desconhecido, o que
impede a determinação de n. Existem várias alternativas para resolver esta situação:
Se dispomos de alguma informação sobre uma possível faixa de valores para P, por
exemplo um intervalo de confiança obtido em algum estudo prévio (ou piloto), basta
esse situar-se no pior dos casos desta faixa, ou seja, utilizar aquele valor de P desta
faixa em que a função P (1-P) alcança seu máximo.
Se não dispomos de nenhuma informação sobre P, tomamos o valor P=0.5 para
determinar o tamanho amostral “prudente” em cada um dos casos propostos:
2
∗5000
1. n= 0.02∗0.5∗0.5 = 400
4999
18
1
∗5000
2. n= 0.03∗0.5∗0.5 = 133
4999
Devemos ratificar que, neste caso, a condição imposta sobre o erro de estimação é mais severa
do que a imposta sobre o erro de amostra, já que exige um tamanho amostral maior.
Quando se dispõe de algum estudo prévio (piloto), pode se estimar a variabilidade desta
amostra piloto, assim como estimar o valor médio da população.
Se não existe um estudo prévio, mas a faixa da variação da variável em questão é
conhecida (faixa= máximo – mínimo) basta utilizar como aproximação da variância
populacional um quarto desta faixa, isto é, faixa/4.
- Uma amostra maior do que o necessário. Proporcionará resultados mais precisos. Evitam-se,
desta forma, perdas de precisão tomando amostras maiores.
- A decisão sobre o tamanho amostral a utilizar dependerá frequentemente também dos custos
associados. Recomenda-se então utilizar a maior amostra possível com os meios ou orçamentos
disponíveis e descartar questões nas quais sejam necessárias amostras muito maiores para obter
resultados úteis.
As relações amostrais são as listas, índices mapas ou outras listagens de população a partir das
quais é selecionada a amostra a empregar em uma pesquisa.
Denominam-se elementos perdidos aqueles que deveriam estar incluídos na relação amostral
por pertencerem à população de interesse, mas que não estão seja porque a relação é
inadequada, seja porque está incompleta e faltam alguns indivíduos. Em consequência, alguns
elementos da população nunca poderão ser selecionados e as amostras não serão representativas.
Cobrir a população que não está nesta relação amostral, utilizando uma relação
suplementar;
Buscar conexões entre os indivíduos que faltam na relação e aqueles que estão nesta;
um “contacto” na relação pode facilitar o acesso aos indivíduos inacessíveis.
19
Denominam-se elementos duplicados aqueles que aparecem mais de uma vez na relação
amostral, estes têm maior probabilidade de sere selecionados na amostra daqueles que não
estão.
2.4. A não-resposta
Os indivíduos que não são localizados quando o estudo é realizado e aqueles que se negam
participar da pesquisa são os que ocasionam a não-resposta. A não-resposta é um problema do
qual nenhum pesquisador não pode escapar; ele nunca terá controle absoluto sobre todos os
elementos da pesquisa.
Suponhamos uma pesquisa na qual se pretende estimar a média dos indivíduos da população de
interesse, de tamanho N. contudo, devido à não resposta, obtêm-se somente dados de uma
subpopulação que se denomina E1 (de tamanho N1) e é formada pelos indivíduos que sempre
contestam. Há outra subpopulação de indivíduos que não respondem e ocasionam os problemas
de não-resposta; estes denominam-se E2, de tamanho N2.
O viés provocado pela não-resposta será a diferença entre a média que obteríamos se toda a
amostra fosse contestada ( X ) e a que obtivemos através dos que realmente responderam ( X 1):
3. Questionário
Classificação
20
entrevistador deve ater-se às perguntas como estão escritas. É ideal para enquetes
multitudinárias.
b) Não-estruturado: geralmente contém perguntas exclusivamente gerais, não
formalizadas. O entrevistador tem mais liberdade na formulação de perguntas
específicas para obter a informação que considera necessária. As perguntas são feitas na
ordem que o entrevistador considera apropriada para a sessão e o indivíduo. Este tipo de
questionário é utilizado, por exemplo, em entrevistas e dinâmicas de grupo. O
entrevistador deve ter grande habilidade e experiência.
c) Semiestruturado: trata-se de um guia com as principais perguntas e uma ordem (mais
ou menos rigorosa) de formulação. Haverá perguntas que darão liberdade ao
entrevistado para que responda com suas próprias palavras (perguntas abertas).
Perguntas sobre os factos: são as perguntas com uma única resposta correcta,
independente da opinião do entrevistado. São úteis para obter informações sobre os
possíveis grupos de resposta na análise.
Exemplo:
Perguntas sobre opiniões: são as perguntas nas quais o indivíduo manifesta a sua opinião
acerca de um tema. A veracidade da resposta dependerá da sinceridade do entrevistado sobre
seus pensamentos.
Os objectivos que podem ser buscados com ela são os de conhecer a proporção de pessoas que
opinam de uma determinada maneira ou quantificar a intensidade da opinião sobre o tema em
questão.
Exemplo:
Exemplo:
21
Perguntas de conhecimento ou informação: costumam a ser utilizadas para pesquisar o nível
de conhecimento ou informação das pessoas entrevistadas. Quando é solicitada a opinião de um
entrevistado sobre algo, ocasionalmente é feita primeiro uma pergunta deste tipo, para saber se
o indivíduo conhece o tema sobre o qual vai opinar; do contrário, não tem sentido solicitar sua
opinião.
Exemplo:
Perguntas abertas: o entrevistado pode escrever a resposta com suas próprias palavras.
Também são utilizadas quando a relação de respostas possíveis é muito ampla ou desconhecida.
Exemplo:
Perguntas fechadas: são perguntas cujas respostas são proporcionadas no questionário. Quando
as respostas são duas (por exemplo, Sim/Não), as perguntas fechadas denominam-se
dicotómicas; quando as opções de resposta são mais do que duas, se chamam perguntas
polinómicas. Quando a pergunta é de única escolha, somente uma resposta é possível. Quando
a pergunta é de múltipla escolha, o entrevistado pode dar várias respostas para a mesma
pergunta.
Perguntas de item aberto: são as perguntas que incluem uma opção aberta.
Exemplo:
Expontâneas: quando se pretende captar a primeira ideia que vem à cabeça do entrevistado
quando faz a pergunta a ele.
Exemplo:
Exemplo:
22
Dentre as seguintes marcas de bebidas sem gás, qual é mais popular?
a)X b) Y c)Z
Exemplo:
Exemplo:
Exemplo:
Em que uma enquete sobre o alcoolismo, para saber se o entrevistado tem o hábito de consumir
álcool:
Perguntas de filtro: são perguntas que antecedem outras, para eliminar os indivíduos que não
as afectam.
Exemplo:
23
1. (Filtro) você já viu o filme de “Toy Story ll”? Sim/Não (se a resposta for Não, pule para a
pergunta 3).
Sim/Não
Exemplo:
Em uma enquete sobre os problemas que surgem entre os membros de uma vizinhança:
(Controle) qual foi o problema enfrentado mais recentemente por sua vizinhança?
Se o entrevistado responde positivamente a 1ª pergunta, mas não se lembra qual foi o último
problema em sua vizinhança, teremos um problema de incoerência na resposta. Possivelmente o
individuo mentiu na 1ª resposta.
Perguntas bateria: recebem este nome todas as perguntas que compartilham uma estrutura:
trata-se de um conjunto de perguntas sobre a mesma questão, sendo que estas se
complementam, enfocando diversos aspectos. Costumam partir de aspectos mais gerais em
direcção aos mais específicos.
Exemplo:
A carroceria ou o motor.
O nº de portas ou de assentos.
O princípio básico é se fazer entender da forma mais simples. A seguir, apresentam-se algumas
normas que podem ser úteis na formulação das perguntas de um questionário.
24
Perguntas simples e curtas: deve se utilizar as palavras mais simples possíveis. É preferível
evitar uma única pergunta complexa e longa, substituindo-a por uma serie de perguntas simples
e curtas. Uma linguagem informal costuma a ser mais aceite pelas pessoas, sempre sem incorrer
em vulgarismos.
Exemplo:
Exemplo:
Uma resposta afirmativa tem um significado claro: o entrevistado gosta de viajar de trem e de
ônibus. No entanto, uma resposta negativa não pode ser interpretada: não sabemos se o
entrevistado não gosta de viajar de trem, mas sim de ônibus ou vice-versa, ou em nenhum dos
dois. O correcto seria dividir a pergunta em duas:
Responder “sim” significa “nunca escutei nenhuma de suas canções”, mas o individuo poderia
entender que “Não” significa “não, nunca escutei”. Seria mais correcto perguntar:
Evitar expressões vagas: deve se evitar perguntas com expressões vagas como: geralmente,
muitos, com frequência, do tipo, parecido, em conjunto, coisa, muito, pouco, etc. também as
perguntas “porquê”? Se for feita uma pergunta sobre um comportamento periódico, isto é, uma
frequência, deve se especificar em que termos ela deve ser entendida (semanas, meses, etc.).
Exemplo:
Esta pergunta pode gerar respostas difíceis de codificar mais tarde, já que cada entrevistado
expressará a frequência como quiser. Seria mais correcto perguntar:
Evitar perguntas dirigidas: as perguntas não devem ser formuladas supondo uma determinada
resposta do entrevistado; devem sempre ser feitas de forma neutra.
25
Exemplo:
A pergunta: você não está de acordo com a greve justamente reivindicativa dos
transportes? Sim/Não.
Faça ao entrevistado uma pergunta afirmativa, mais razoável. Seria mais correcto perguntar:
Não pressupor informação. As perguntas não devem ser formuladas pressupondo algo sobre a
resposta: nem que se conheça o tema, nem que se tenha uma opinião formada sobre o que está
sendo perguntado. Pode se utilizar alguma pergunta filtro para averiguar se o indivíduo está em
condições de responder, e exclui-lo quando não estiver.
Exemplo:
A pergunta: qual programa eleitoral lhe parece mais razoável em matéria de urbanismo
entre os apresentados pelos diferentes partidos políticos?
Você sabe o que propõem para o urbanismo os diferentes partidos políticos? Sim/Não.
Evitar as perguntas hipotéticas: as pessoas não costumam agir como dizem que o fariam em
uma situação duvidosa.
Evitar perguntas que envolvam a memória ou que requeiram cálculos: deve se considerar que,
quanto maior for o esforço requerido da memória, menor será a precisão da resposta e, portanto,
menor será sua confiabilidade. Requerer o esforço mental através de cálculos pode fazer com
que o entrevistado, por comodidade, invente a resposta.
Exemplo:
Pode ser um tanto complicado recordar a resposta para: quando você comprou sua
geladeira?
A. Há menos de 3 anos;
B. Há mais de 3 anos.
26
Evitar perguntas fechadas de conhecimento: ninguém gosta de reconhecer sua ignorância, ao
passo que, no caso do entrevistado desconhecer uma resposta e se puder escolher entre várias
alternativas, possivelmente responderá com alguma delas. A resposta obtida desta forma seria
incorrecta. A solução é deixar abertas as perguntas de conhecimento.
Geralmente é complicado obter resposta em perguntas desse tipo, pois sua formulação se
transforma em uma questão muito importante. A seguir, apresentamos soluções ou mecanismos
para algumas delas:
1. Perguntar em terceira pessoa sobre o ponto de vista dos outros, para que os
entrevistados se sintam livres na hora de criticar condutas alheias.
Exemplo:
Exemplo:
Seria interessante que a informação sexual que as crianças recebem na escola fosse…
Exemplo:
5. Método de resposta aleatória. É útil quando a pergunta delicada pode ser formulada de
modo que a resposta seja Sim ou Não.
27
êxito no experimento (por exemplo, cara) deve responder à primeira pergunta; se não obteve
êxito (coroa), deve responder à segunda pergunta.
π= π1p+ π2 (1-p)
Em que π1é a proporção de pessoas que responderam “Sim” à pergunta delicada (a primeira),
π2 é a proporção de pessoas que responderam “Sim” à pergunta irrelevante (a segunda) e p é a
probabilidade de que o experimento tenha obtido êxito.
π −π 2 ( 1− p )
π1=
p
Exemplo. Queremos conhecer a proporção de executivos de uma grande empresa que
consomem habitualmente cocaína. Para isso, escolhemos AAS de 50 executivos da empresa, e
fazemos duas perguntas à eles, escritas no mesmo cartão que lhes mostramos:
1. Você consome cocaína pelo menos uma vez por semana? Sim/Não.
Pedimos a eles que lancem uma moeda ao ar e que nos contem o resultado. Dizemos a eles que,
se saiu cara o que nos outros consideramos êxito, (devem responder à pergunta 1), e se não saiu
cara, (devem responder à pergunta 2).
Através dos dados da empresa, sabemos que, dos 50 executivos entrevistados, 28 são casados,
onde π2= 28/50= 0.56.
Por outro lado, sabemos que a probabilidade de que, ao se lançar uma moeda ao ar, saia cara, é
de p= 0.5
0.7−0.56∗(1−0.5 )
π1= = 0.84
0.5
Pode se concluir que a estimação de executivos da empresa estudada que consome
habitualmente cocaína é de 0.84= 84%.
28
Perguntar com as perguntas que, de uma maneira logica, mova-se de tópico em tópico,
dando indicações ao respondente sobre a relação entre as perguntas. Quando se faz um
corte no tema sobre o qual se pergunta, convém explicar o porquê deste corte e a
relevância do conjunto seguinte de perguntas.
Agrupe as perguntas em temas afins.
Para manter o fio argumental e a motivação na entrevista, tome cuidado com a
apresentação de cada uma das perguntas ou bloco de perguntas.
As perguntas que fornecem informação não devem preceder as perguntas sobre
conhecimentos, uma vez que condicionariam a resposta. Deve se evitar que as
perguntas já enunciadas influenciem as respostas das seguintes.
Deve se seguir do geral para o específico, seguindo o fio argumental que deve ser claro
e cobrir todos os tópicos a tratar.
Devem se manter um espaço entre as perguntas de controle.
Das perguntas substanciais, que são o corpo do questionário, devemos deixar para o
final aquela que são mais difíceis, delicadas ou pesadas. As listas longas ou itens
cansam o entrevistado e, portanto, deve-se evitá-las.
As perguntas de classificação costumam ser colocadas ao final do questionário para não
consumir tempo da entrevista. Também são adequadas no início do questionário quando
se realiza uma amostra por contingente de pessoas a identificar com determinadas
características, logo no início da entrevista.
Antes de se despedir e de coletar todas as respostas, o entrevistador deve agradecer ao
entrevistado por sua colaboração na investigação.
29