Você está na página 1de 5

53

UNIVERSIDADE FEDERAL DO RIO GRANDE - FURG


Departamento de Matemática
01112 – Probabilidade e Estatística Aplicada a Engenharia – Eng. da Computação – Profa Muriel B. de Oliveira

Unidade 11: TEORIA DA AMOSTRAGEM

11.1. INTRODUÇÃO
A amostragem e em particular os processos de amostragem aplicam-se em variadas áreas do
conhecimento e constituem, muitas vezes, a única forma de obter informações sobre uma determinada realidade
que importa conhecer.
A teoria da amostragem é assim um dos instrumentos que possibilita esse conhecimento científico da
realidade, onde outros processos ou métodos alternativos, por razões diversas, não se mostram adequados ou até
mesmo possíveis.
A teoria da amostragem estuda as relações existentes entre uma população e as amostras extraídas dessa
população. É útil para avaliação de grandezas desconhecidas da população (como a média, a variância, etc), ou
para determinar se as diferenças observadas entre duas amostras são devidas ao acaso ou se são verdadeiramente
significativas (Teste de Hipóteses).
Amostragem é o processo de determinação de uma amostra a ser pesquisada.
Enquanto que um senso envolve um exame a todos os elementos de um dado grupo, a amostragem
envolve um estudo de apenas uma parte dos elementos. A amostragem consiste em selecionar parte de uma
população e observá-la com vista a estimar uma ou mais características para a totalidade da população.
Por exemplo: "Para se saber se o bolo de chocolate está bom, basta comer uma fatia."
Alguns exemplos da utilização da amostragem são:
- Pesquisas de opinião pública;
- Inspeção de mercado utilizada com o intuito de descobrir as preferências das pessoas em relação a
certos produtos;
- Para estimar a prevalência de uma doença rara, a amostra pode ser constituída por algumas instituições
médicas, cada uma das quais tem registro dos pacientes.
O censo apresenta dificuldades que tornam a amostragem um pouco mais atraente. Entre as dificuldades
que o senso apresenta, podem ser apresentadas as seguintes:
(i) A população pode ser infinita, neste caso o senso seria impossível;
(ii) A amostra pode ser atualizada mais facilmente que o censo;
(iii) O custo do senso pode torná-lo inviável;
(iv) Fatores de tempo e custo podem apontar pela preferência entre uma amostra e um censo.
Porém há ocasiões em que o levantamento do censo pode ser vantajoso:
(i) Quando a população é pequena e o custo entre o censo e a amostra forem praticamente iguais;
(ii) Se o tamanho da amostra necessária tiver que ser muito grande em relação à população examinada;
(iii) Nas ocasiões em que se exige precisão completa;
(iv) Nas ocasiões em que já existe informação completa.

11.2. PLANEJAMENTO DE AMOSTRAS


O planejamento da coleta da amostra define o tipo de amostragem a ser utilizado. Os tipos de
planejamentos amostrais mais utilizados são: Amostragem sistemática, Amostragem proporcional estratificada,
Amostragem por conglomerado e Amostragem aleatória simples.

11.2.1. AMOSTRAGEM SISTEMÁTICA


Quando os elementos da população já estão ordenados, não há necessidade de construirmos um sistema
de referência, para selecionarmos a amostra. São exemplos os prontuários médicos de um hospital, os prédios de
uma rua, uma linha de produção, os nomes em uma telefônica, etc. Nestes casos a seleção dos elementos que
constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem
denominamos de sistemática.
54
UNIVERSIDADE FEDERAL DO RIO GRANDE - FURG
Departamento de Matemática
01112 – Probabilidade e Estatística Aplicada a Engenharia – Eng. da Computação – Profa Muriel B. de Oliveira

11.2.2. AMOSTRAGEM PROPORCIONAL ESTRATIFICADA


Muitas vezes a população se divide em subpopulações denominados estratos.
Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento
heterogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. É isso que
fazemos quando empregamos a amostragem proporcional estratificada, que, além de considerar a existência dos
estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos.

11.2.3. AMOSTRAGEM POR CONGLOMERADOS


Neste tipo de amostragem a população total é subdividida em várias partes relativamente pequenas
(normalmente homogêneas), e algumas dessas subdivisões, ou conglomerados, são selecionadas ao acaso, para
integrarem a amostra global.
Exemplo: Suponhamos que o reitor de uma universidade deseja saber o que os membros dos centros
acadêmicos acham de um novo regulamento. Ele pode obter uma amostra por conglomerado entrevistando
alguns ou todos os membros de alguns centros acadêmicos escolhidos ao acaso.

11.2.4. AMOSTRAGEM ALEATÓRIA SIMPLES


É um tipo de amostragem que utiliza uma técnica probabilística. A característica principal é que todos
os elementos da população têm igual probabilidade de pertencer à amostra.
Na prática a amostragem aleatória simples pode ser realizada numerando-se a população de 1 a N e
sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa seqüência, os quais
corresponderão aos elementos pertencentes à amostra.

11.3. AMOSTRAS COM E SEM REPOSIÇÃO


Se cada elemento da população pode ser escolhido mais de uma vez para participar de uma mesma
amostra temos a chamada amostra com reposição. Se cada elemento da população puder ser escolhido apenas
uma única vez para participar de uma mesma amostra, temos a chamada amostra sem reposição.
Na prática, demonstra-se que o uso de amostras sem reposição acarreta em menores erros do que com
amostras com reposição.

11.4. DISTRIBUIÇÕES AMOSTRAIS


Considerem-se todas as amostras possíveis de tamanho n que podem ser retiradas de uma população de
tamanho N (com ou sem reposição). Para cada amostra pode-se calcular uma grandeza estatística, como a média,
o desvio padrão etc., que varia de amostra para amostra. Com os valores obtidos para determinada grandeza,
podemos construir uma distribuição de probabilidades, que será denominada de distribuição amostral.
A tabela abaixo mostra as notações mais utilizadas pra algumas medidas:

População Amostra
Medidas
(Parâmetros) (Estatística)
Tamanho N n
Média Aritmética x
Variância ² s²
Desvio Padrão s
Proporção P p

11.5. DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS


Se os valores da média e do desvio padrão de uma população, de tamanho N, forem respectivamente e
, e desta população são retiradas todas as possíveis amostras de tamanho n, sendo n ≤ N, temos os valores da
média e do desvio padrão da distribuição amostral das médias para:
I- Amostragem com reposição (população infinita):

x x
n
55
UNIVERSIDADE FEDERAL DO RIO GRANDE - FURG
Departamento de Matemática
01112 – Probabilidade e Estatística Aplicada a Engenharia – Eng. da Computação – Profa Muriel B. de Oliveira

x x
Variável aleatória padronizada de x : z
x

II- Amostragem sem reposição (população finita):

N n
x x
n N 1

* N n : representa o fator de correção para população finita.


N 1

x
Variável aleatória padronizada de x :
x
z
x *
Obs:
- O fator de correção para população finita pode ser omitido sempre que n < 0,05 N ;
- Se o desvio padrão da população for desconhecido, o erro padrão da média pode ser estimado usando-
se o desvio padrão da amostra como um estimador do desvio padrão da população:
s
sx , desde que n ≥ 30.
? n

11.6. DISTRIBUIÇÃO AMOSTRAL DAS PROPORÇÕES

x
P: proporção da amostra P
n
Admita uma população infinita distribuída binomialmente, onde p é a probabilidade de sucesso da
população e q é a probabilidade de fracasso da população e p+q=1.
Consideremos todas as possíveis amostras de tamanho n retiradas de uma população de tamanho N,
com reposição. Se para cada amostra calcularmos a probabilidade de sucesso da amostra P x , obtemos desta
n
maneira a distribuição amostral das proporções:

p.q P P
P P P
z
n P

Se a população for finita, ou se amostragem for tomada sem reposição, os valores acima ficarão:

p.q N n P P
P P P
z
n N 1 P *

 Erro Padrão
O desvio padrão da distribuição amostral de uma grandeza estatística é freqüentemente denominado de
seu erro padrão.

Então temos que: x é chamado de erro padrão da média, e P é chamado de erro padrão da
proporção.

 Teorema do Limite Central


Quanto maior o tamanho da amostra, a distribuição de amostragem da média mais se aproxima da forma
da distribuição normal, qualquer que seja a forma da distribuição da população. Na prática, a distribuição
amostral da média pode ser considerada como normal sempre que n 30.
A distribuição amostral das proporções pode ser considerada como normal para grandes valores (n 30).
Neste caso, deve-se usar uma correção de continuidade para podermos utilizar a tabela da curva normal.
56
UNIVERSIDADE FEDERAL DO RIO GRANDE - FURG
Departamento de Matemática
01112 – Probabilidade e Estatística Aplicada a Engenharia – Eng. da Computação – Profa Muriel B. de Oliveira

CC: correção de continuidade = CC 1 0,5


2n n

11.7. DISTRIBUIÇÃO AMOSTRAL DAS DIFERENÇAS DAS MÉDIAS OU DAS PROPORÇÕES


Considere duas populações onde são retiradas amostras de tamanho n1 e n2 cujas médias são x1 e x 2 ,
respectivamente. Sendo as médias e os desvios padrões das populações σ1,µ1 e σ2,µ2, respectivamente.

Na distribuição amostral das diferenças entre as médias, temos:

2 * 2 * ( x1 x2 ) x1 x2
x1 x 2 1 2 x 1 x2
2
x1
2
x2
1 2 z *
n1 n2 x1 x2

Na distribuição amostral das diferenças entre as proporções, temos:

p1 .q1
*
p 2 .q 2
* ( P1 P2 ) P1 P2
P1 P2 p1 p2 P 1 P2
2
P1
2
P2 z *
n1 n2 P1 P2

Exemplo:
Considere a seguinte população x={2, 3, 4, 5}.
Se nós considerarmos todas as amostras de tamanho n=2 que podemos obter com reposição teremos:
A1 = (2,2) A5 = (3,2) A9 = (4,2) A13 = (5,2)
A2 = (2,3) A6 = (3,3) A10 = (4,3) A14 = (5,3)
A3 = (2,4) A7 = (3,4) A11 = (4,4) A15 = (5,4)
A4 = (2,5) A8 = (3,5) A12 = (4,5) A16 = (5,5)

Cada uma destas amostras possui um valor médio:


x1 2 x 5 2,5 x9 3 x 13 3,5
x2 2,5 x6 3 x 10 3,5 x 14 4
x3 3 x7 3,5 x 11 4 x 15 4,5
x4 3,5 x8 4 x 12 4,5 x 16 5
Podemos calcular a média, a variância e o desvio-padrão para a população, assim:
N=4
2 3 4 5 14
3,5
4 4

2 (2 3,5) 2 (3 3,5) 2 (4 3,5) 2 (5 3,5) 2 5


1,25
4 4

1,25 1,12
Agora, calculamos a média, a variância e o desvio-padrão para a distribuição amostral das médias,
então: n=2
2 2,5 3 3,5 2,5 3 3,5 4 3 3,5 4 4,5 3,5 4 4,5 5
3,5
x
42
2
2 1,25
0,625
x n 2
1,12
x
0,79
n 2
Note que:
A média das médias é igual a média populacional : x ;
57
UNIVERSIDADE FEDERAL DO RIO GRANDE - FURG
Departamento de Matemática
01112 – Probabilidade e Estatística Aplicada a Engenharia – Eng. da Computação – Profa Muriel B. de Oliveira

A variância das médias amostrais mantém com a variância populacional a seguinte relação:
x
n
Exercícios:
1) Sabendo que certa população é constituída dos valores 4, 5, 6, 9; após o cálculo de todas as amostras
possíveis de tamanho 2, com reposição, apresente o seguinte:
a) Determinação da média e do desvio padrão da população; (R: 6 e 1,87)
b) Determinação da média e do desvio padrão da distribuição amostral das médias. (R: 6 e 1,32)

2) A média das notas obtidas na disciplina de Estatística num determinado curso de graduação tem sido
igual a 7,7 e a variância igual a 1,96. Caso sejam extraídas várias amostras de 49 alunos cada uma, do total de
586 que estão matriculados na disciplina, determine o desvio padrão da distribuição amostral das médias,
levando-se em conta que a amostra foi efetuada:
a) com reposição; (R: 0,2)
b) sem reposição. (R: 0, 1916)

3) Numa prova de matemática e física, constante de 80 questões, referente a um vestibular simulado


realizado em Porto Alegre, observou-se que a média de acertos foi de 24,12 com desvio padrão de 9,78. Dos
22102 vestibulandos que participaram da prova, retirou-se aleatoriamente uma amostra de 200 concorrentes.
Determinar:
a) a probabilidade de que a média dessa amostra se localize entre 25 e 26; (R: 0,0987)
b) a probabilidade de que a média dessa amostra apresente um valor inferior a 22. (R: 0,0011)

4) Verificou-se que 2% das ferramentas produzidas por uma certa máquina são defeituosas. Qual é a
probabilidade de que numa remessa de 400 dessas ferramentas, revelarem-se;
a) 3% ou mais defeituosas; (R: 0,1056)
b) 2% ou menos defeituosas. (R: 0,5714)

5) Considerando duas populações: I- adultos do sexo masculino; II- adultos do sexo feminino. Supondo
que a proporção de pessoas com dificuldades na área de matemática nessas duas populações seja de 30% e 20%,
respectivamente. Qual a probabilidade de que numa dada amostra de 100 adultos de I e 120 adultos de II,
resultem num valor (P1-P2)<0,18? (R: 0,9147)

6) Um pesquisador toma uma amostra aleatória de 10% de 300 itens e encontra a média dos itens igual a
148,5 com um desvio padrão de 35,75. Com base nesta informação, qual o valor estimado do erro padrão da
média? (R: 6,2024)

7) As notas de 40 alunos de uma classe experimental apresentaram µ = 7 e σ = 0,8. Observando-se que


foi extraída, aleatoriamente, uma amostra de 5 alunos dessa população, determinar a probabilidade de que o total
dessas notas da amostra esteja compreendido entre 32 e 36. (R: 0,6840)

8) O QI médio dos estudantes de uma escola A é igual a 100 e o desvio padrão igual a 15, enquanto que
numa escola B a média é igual a 90 e o desvio padrão é igual a 10. Se forem extraídas 120 amostras aleatórias de
cada escola, qual será a probabilidade dos alunos da escola A terem QI médio maior do que os alunos da escola
B de 12 ou mais? (R: 0,1131)

9) A loja “A” possui 200 funcionários, sabendo-se que o salário mensal e o desvio padrão
correspondem, respectivamente a R$ 2500,00 e a R$ 375,00, e efetuando-se um levantamento de 25 amostras ao
acaso, determinar:
a) a probabilidade de que sua média fique situada entre R$ 2400,00 e R$ 2650,00; (R: 0,9056)
b) a probabilidade de que sua média apresente um valor inferior a R$ 2300,00. (R: 0,0023)

10) Deve ser efetuada a eleição para presidente do Diretório Acadêmico de uma Universidade,
observando-se existirem dois concorrentes: A1 e A2. Em um teste piloto, ao acaso, notou-se que 40% das
manifestações foram favoráveis ao A1. Selecionando-se, aleatoriamente uma amostra de 1200 alunos,
determinara a probabilidade do candidato A1 conseguir a maioria dos votos nessa amostra. (R: 0,0162)

11) Em uma fábrica trabalham cerca de 550 funcionários. Sabe-se que a probabilidade do número de
funcionários homens e mulheres é a mesma, determinar para essa população a probabilidade de:
a) o número de homens estar compreendido entre 45% e 55%; (R: 0,9832)
b) existirem menos de 242 mulheres; (R: 0,0021)
c) existirem mais de 264 homens; (R: 0,8159)

Você também pode gostar