Escolar Documentos
Profissional Documentos
Cultura Documentos
O que é amostragem
Se a população em estudo for muito pequena, todos os indivíduos devem ser utilizados para a medição
das características que se deseja conhecer sobre a mesma, nesse caso têm-se os valores dos
parâmetros. Agora, se a população em estudo for grande, na maioria das vezes faz-se necessário retirar
uma amostra representativa através das técnicas de amostragem.
Esquemas amostrais
Por esquema amostral entende-se a dupla: sorteio e métodos de estimação dos parâmetros,
geralmente médias e totais, e de modo que se possam obter suas variâncias.
Neste tipo de amostra considera-se que cada componente da população estudada tem a mesma
chance de ser escolhido para compor a amostra e a técnica que garante esta igual probabilidade é
a seleção aleatória de indivíduos, por exemplo, através de sorteio.
O sorteio dos elementos da amostra é feito geralmente de uma lista com todos os elementos da
população, e pode-se usar a tabela de números aleatórios.
Exemplo de amostra aleatória simples
Onde:
P - é o estimador da proporção de elementos da população que possuem determinada característica de
interesse;
d - representa a precisão ou distância de P, em ambas as direções, do verdadeiro valor populacional P;
z 1-/2 – designa o percentil da distribuição gaussiana a que corresponde o nível de confiança 1-;
N – é a quantidade de elementos da população.
Exemplo: Em um município existem 2000 domicílios. Para avaliar a proporção de domicílios que
têm rede de esgoto deseja-se selecionar uma amostra com precisão de 3% e um nível de
significância de 5%. Sabendo-se que a proporção de domicílios nesta região com rede de esgoto é
de 35%, qual a amostra para este tipo de estudo? n = 654
Onde:
2 - é a variância da população que possuem determinada característica de interesse;
d - representa a precisão ou distância de X, em ambas as direções, do verdadeiro valor
populacional ;
z 1-/2 – designa o percentil da distribuição gausiana a que corresponde o nível de confiança 1-.
2. Amostragem Aleatória Estratificada
A amostragem estratificada faz com que ao se ponderar as estimativas vindas de cada estrato em uma
estimativa global, a variabilidade final seja menor do que se fosse usada a amostragem aleatória
simples.
O dimensionamento das subamostras, ou alocação dos elementos, pode ser de maneira balanceada
(mesmo número de elementos em cada estrato) ou proporcional (número de elementos no estrato é
proporcional à sua contribuição no total populacional).
onde:
Exemplo: Um estudo para avaliar proporção de domicílios com piso adequado foi realizado em
zonas rurais de três municípios da Bahia. No município A existem 350 domicílios, no B existem 500
domicílios e no município C existem 1000 domicílios. A proporção de domicílios com piso adequado
nestas regiões é de 10%, 15% e 20% respectivamente. Calcule uma amostra com precisão de 3% e
nível de confiança de 5%.
Municípios Nh wh Ph Nh Ph (1 - Ph) N2h Ph (1 - Ph)/ wh
1. Introdução
Na inferência estatística a incerteza está sempre presente. No entanto, se o experimento foi feito
de acordo com certos princípios, essa incerteza pode ser medida.
Uma função da estatística é fornecer um conjunto de técnicas para fazer inferências e medir o
grau de incerteza destas inferências.
População: é o conjunto de elementos que têm pelo menos uma característica comum observável.
Amostra: é um subconjunto de elementos extraídos de uma população.
Estimador Parâmetro
Média
X
Variância s2 2
Proporções p̂ P
2.3. Erros amostrais e não amostrais
O uso de um levantamento amostral introduz um tipo de erro, que pode se resumido na diferença
entre o valor de certa característica na amostra e o parâmetro de interesse na população. Esta
diferença pode ocorrer apenas devido à particular amostra selecionada, ou então devido a fatores
externos ao plano amostral. Quando o erro é devido à amostra selecionada é chamado de erro
amostral e quando é devido a fatores independentes do plano amostral (erros de medida,
digitação etc) é chamado de erro não amostral.
Considera-se um erro amostral aquele desvio que aparece porque o pesquisador não levantou a
população toda. Cada amostra possível de um plano acarreta um desvio.
2.4. Distribuições Amostrais
Diferentes amostras extraídas da população irão originar valores distintos para a estatística
considerada. Por este motivo, dizemos que as estatísticas são variáveis aleatórias, já que seu valor
não pode ser predito com certeza antes da amostra ter sido extraída.
A distribuição amostral das médias , de amostras casuais simples de tamanho n, extraída de uma
população que tem média e desvio padrão , tem as seguintes características:
E( X ) =
V( X ) = 2/n
Caso a população tenha distribuição Normal com média e desvio padrão , a distribuição amostral
das médias é Normal com média e desvio padrão / .
A distribuição amostral das médias , de amostras casuais simples de tamanho n extraída de uma
população não Normal, com média e desvio padrão , é aproximadamente normal com média e
desvio padrão / , quando n é suficientemente grande. Este resultado é uma aplicação de um
importante teorema de probabilidade, chamado Teorema Central do Limite. Para a utilização deste
resultado, é usual considerar que o tamanho n da amostra é suficientemente grande quando n é
superior a 30.
2. Distribuição Amostral da Proporção
O objetivo da estimação pontual é encontrar um valor numérico único que esteja bastante próximo do
verdadeiro valor do parâmetro. Este procedimento não permite julgar a magnitude do erro que podemos
estar cometendo.
ESTIMADORES PONTUAIS DOS PRINCIPAIS PARÂMETROS POPULACIONAIS
Parâmetro
Estimador
Média () 1 n
X = Xi
n i =1
Variância (2)
s2 =
1 n
(Xi − X )2
n − 1 i =1
Desvio padrão
s=
1 n
(Xi − X )2
n − 1 i =1
Proporção (p) X
p̂ = onde
n
X = número de elementos da amostra que possuem a
característica
n = tamanho da amostra
2.6. Estimação Intervalar
Procura determinar um intervalo que abranja o valor do parâmetro populacional, com certa margem de
segurança. Este procedimento permite julgar a magnitude do erro que podemos estar cometendo
quando afirmamos que o intervalo encontrado abrange o verdadeiro valor do parâmetro.
Suponha que o parâmetro de interesse é , desejamos obter um intervalo com limite inferior I e limite
superior S tal que
A precisão com que se conhece depende da amplitude deste intervalo dada por S – I. Quanto
menor esta amplitude melhor determinado estará o parâmetro.
Na prática trabalhamos em geral com apenas uma amostra e obtemos um único intervalo. Temos,
portanto, 95% de confiança que este intervalo seja um dos que cobrem o verdadeiro valor do
parâmetro.
População Normal
Esta situação é um tanto quanto rara na prática, pois, embora a hipótese de normalidade seja
razoável em muitos casos, dificilmente se conhece a variância de uma população quando sua
média é desconhecida. Algumas vezes o conhecimento de pode provir de dados históricos
sobre a população de interesse ou de resultados obtidos em estudos similares ao que está sendo
realizado.
Neste caso, precisamos usar o desvio padrão amostral (S) para estimar , e o intervalo de
confiança ficará alterado pois, em lugar dos limites da Normal Padrão (za/2), utilizaremos os limites de
uma outra distribuição chamada de distribuição de Student com n-1 graus de liberdade.
A distribuição de Student é contínua e simétrica com média igual a zero. Sua aparência é bastante
parecida com a distribuição Normal Padrão. A qualificação “com n-1 graus de liberdade” é
necessária, porque para cada valor diferente do tamanho da amostra n existe uma distribuição de
Student específica. O número de graus de liberdade (gl) é o parâmetro da distribuição de Student.
Notação:
Assim como a distribuição Normal padrão a distribuição de Student também é tabelada. As
tabelas fornecem valores de para vários graus de liberdade. Neste caso o Intervalo de
Confiança para a média é dado por
Se n é suficientemente grande (em geral, n > 30), mesmo sem conhecermos a distribuição da
população, os limites do Intervalo de Confiança para a média () poderão ser calculados com base na
distribuição Normal padrão. Da mesma forma podemos utilizar o desvio padrão amostral s no lugar de
(desvio-padrão populacional). Neste caso o Intervalo de Confiança para a média é dado por:
2.6.2. Intervalo de Confiança para uma Proporção Populacional
Em muitas situações pode ser de interesse construir um intervalo de confiança para a proporção
de elementos da população que possuem alguma característica de interesse (p).
Exemplo: Uma amostra de 250 reservatórios apresentou 55 com qualidade de água imprópria
para abastecimento público. Encontre um intervalo com 99% de confiança para a proporção
de reservatório com qualidade inadequada da água.
Resp: [0,15; 0,29]
REFERÊNCIAS BIBLIOGRÁFICAS
• MORETTIN, Pedro Alberto; BUSSAB, Wilton de Oliveira. Estatística básica. 9ª. ed.