Você está na página 1de 5

Amostragem Como podemos determinar quantas pessoas em uma populao apresentam certa caracterstica?

Por exemplo, quantos eleitores apiam um candidato presidncia? Ou ento, da populao de determinado estado, quantas pessoas so crianas, quantas vivem em centros urbanos, quantas esto desempregadas? Uma forma de responder a essas questes consiste em entrevistar todas as pessoas. Mas este um processo demorado e caro. Outro processo possvel consiste ento em consultar um grupo de pessoas, que constituem um amostra. Se a amostra representa de fato toda a populao, podemos utilizar as caractersticas dos seus elementos para estimar as caractersticas de toda populao. Distinguiremos dois tipos de amostragem: a probabilstica e a no-probabilstica. A amostragem ser probabilstica se todos os elementos da populao tiverem probabilidade conhecida, e diferente de zero, de pertencer amostra. Caso contrrio, a amostragem ser no probabilstica. Segundo essa definio, a amostragem probabilstica implica um sorteio com regras bem determinadas, cuja realizao s ser possvel se a populao for finita e totalmente acessvel. Exemplo: Numa empresa deseja-se escolher 3 diretores entre seus chefes executivos. A escolha aleatria e no depende do prestgio, da capacidade, dos anos de servio, etc. Temos uma amostragem probabilstica. As tcnicas da estatstica pressupem que as amostras utilizadas sejam probabilsticas, o que muitas vezes no se pode conseguir. No entanto o bom senso ir indicar quando o processo de amostragem, embora no sendo probabilstico, pode ser, para efeitos prticos, considerado como tal. Isso amplia consideravelmente as possibilidades de utilizao do mtodo estatstico em geral. A utilizao de uma amostragem probabilstica a melhor recomendao que se deve fazer no sentido de se garantir a representatividade da amostra, pois o acaso ser o nico responsvel por eventuais discrepncias entre populao e amostra, o que levado em considerao pelos mtodos de anlise da Estatstica Indutiva. Apresentamos a seguir algumas tcnicas de amostragem probabilstica. Amostragem por conglomerado A populao dividida em diferentes conglomerados (grupos), extraindo-se uma amostra apenas dos conglomerados selecionados, e no de toda a populao. O ideal seria que cada conglomerado representasse tanto quanto possvel o total da populao. Na prtica, selecionam-se os conglomerados geograficamente. Escolhem-se aleatoriamente algumas regies, em seguida algumas sub-regies e finalmente, alguns lares. Esse processo possibilita ao pesquisador entrevistar apenas poucas pessoas. Amostragem Estratificada Se a populao pode ser dividida em subgrupos que consistem, todos eles, em indivduos bastante semelhantes entre si, pode-se obter uma amostra aleatria de pessoas em cada grupo. Esse processo pode gerar amostras bastante precisas, mas s vivel quando a populao pode ser dividida em grupos homogneos.

Amostragem Aleatria Simples A amostragem aleatria simples a maneira mais fcil para selecionarmos uma amostra probabilstica de um populao. Comecemos introduzindo o conceito de AAS de uma populao finita, para a qual temos uma listagem de todas as unidades elementares. Podemos obter uma amostra nessas condies, escrevendo cada elemento num carto, misturando-os numa urna e sorteando tantos cartes quantos desejarmos na amostra. Esse procedimento torna-se invivel quando a populao muito grande. Nesse caso, usa-se um processo alternativo, no qual os elementos so numerados e em seguida sorteados por meio de uma tabela de nmeros aleatrios. Utilizando-se um procedimento aleatrio, sorteia-se um elemento da populao, sendo que todos os elementos tm a mesma probabilidade de ser selecionados. Repete-se o procedimento at que sejam sorteadas as unidades da amostra. Podemos ter uma AAS com reposio, se for permitido que uma unidade possa ser sorteada mais de uma vez, e sem reposio, se a unidade sorteada for removida da populao. Do ponto de vista da quantidade de informao contida na amostra, amostrar sem reposio mais adequado. Contudo, a amostragem com reposio conduz a um tratamento terico mais simples, pois ela implica que tenhamos independncia entre as unidades selecionadas. Essa independncia facilita o desenvolvimento das propriedades dos estimadores que sero considerados. Se a populao for infinita ento as retiradas com e sem reposio sero equivalentes, isto , se a populao for infinita (ou ento muito grande), o fato de se recolocar o elemento retirado de volta na populao no vai afetar em nada a probabilidade de extrao do elemento seguinte. Se, no entanto, a populao for finita (e pequena) ser necessrio fazer uma distino entre os dois procedimentos, pois na extrao com reposio as diversas retiradas sero independentes, mas no processo sem reposio haver dependncia entre as retiradas, isto , o fato de no recolocar o elemento retirado afeta a probabilidade do elemento seguinte ser retirado. A amostragem sem reposio mais eficiente que a amostragem com reposio e reduz a variabilidade uma vez que no possvel retirar elementos extremos mais do que uma vez. Amostragem Sistemtica Quando os elementos da populao se apresentam ordenados e a retirada dos elementos da amostra feita periodicamente, temos uma amostragem sistemtica. Assim, por exemplo, em uma linha de produo, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produo diria. Amostras no-probabilsticas so tambm, muitas vezes, empregados em trabalhos estatsticos, por simplicidade ou por impossibilidade de se obterem amostras probabilsticas, como seria desejvel. No entanto processos no-probabilsticos de amostragem tm tambm sua importncia. Sua utilizao, entretanto, deve ser feita com cuidado. Apresentamos a seguir algumas tcnicas de amostragem no-probabilstica. Inacessibilidade a toda populao Esta situao ocorre com muita freqncia na prtica. Por exemplo, seja a populao que nos interessa constituda de todas as peas produzidas por certa mquina. Ora, mesmo estando a mquina em funcionamento normal, existe uma parte da populao que formada pelas peas que ainda vo ser produzidas. Ou ento se nos interessar a populao de todos os portadores de febre tifide, estaremos diante de um caso semelhante. Deve-se notar que, em geral, estudos

realizados com base nos elementos da populao amostrada tero, na verdade, seu interesse de aplicao voltado para os elementos restantes da populao. Este caso de amostragem no-probabilstica pode ocorrer tambm quando, embora se tenha a possibilidade de atingir toda a populao, retiramos a amostra de uma parte que seja prontamente acessvel. Assim, se fssemos recolher uma amostra de um monte de minrio, poderamos por simplificao retirar a amostra de uma camada prxima da superfcie do monte, pois o acesso as pores interiores seria problemtico. Amostragem a esmo a amostragem em que o amostrador, para simplificar o processo, procura ser aleatrio sem, no entanto, realizar propriamente o sorteio usando algum dispositivo aleatrio confivel. Por exemplo, se desejarmos retirar uma amostra de 100 parafusos de uma caixa contendo 10.000, evidentemente no faremos uma AAS, pois seria muito trabalhosa, mas retiramos simplesmente a esmo. Os resultados da amostragem a esmo so, em geral, equivalentes aos da amostragem probabilstica se a populao homognea e se no existe a possibilidade de o amostrador ser inconscientemente influenciado por alguma caracterstica dos elementos da populao. Amostragens intencionais Enquadram-se aqui os diversos casos em que o amostrador deliberadamente escolhe certos elementos para pertencer amostra, por julgar tais elementos bem representativos. O perigo desse tipo de amostragem grande, pois o amostrador pode facilmente se enganar em seu pr-julgamento. Amostragem por voluntrios Ocorre, por exemplo, no caso da aplicao experimental de uma nova droga em pacientes, quando a tica obriga que haja concordncia dos escolhidos.

Distribuies Amostrais O conceito de distribuio de probabilidade de uma varivel aleatria ser agora utilizado para caracterizar a distribuio dos diversos valores de uma varivel em uma populao. Ao retirar uma amostra aleatria de uma populao estaremos considerando cada valor da amostra como um valor de uma varivel aleatria cuja distribuio de probabilidade a mesma da populao no instante da retirada desse elemento para a amostra. Em conseqncia do fato de os valores da amostra serem aleatrios, decorre que qualquer quantidade calculada em funo dos elementos da amostra tambm ser uma varivel aleatria. Parmetros so valores tericos correspondentes a populao. Estatsticas so funes dos valores amostrais. As estatsticas, sendo variveis aleatrias, tero alguma distribuio de probabilidade, com uma mdia, varincia, etc. A distribuio de probabilidade de uma estatstica chama-se comumente distribuio amostral ou distribuio por amostragem.

Estimao A inferncia estatstica tem por objetivo fazer generalizaes sobre uma populao, com base nos dados de amostra. Um dos itens bsicos nesse processo a estimao de parmetros. A estimao pode ser por ponto ou por intervalo. Estimativa por Ponto: a estimativa de um parmetro populacional por um nico valor. Estimativa por Intervalo: consiste em um intervalo em torno da estimativa por ponto de tal forma que ele possua probabilidade conhecida (nvel de confiana (1- )) de conter o verdadeiro valor do parmetro. Este intervalo conhecido por intervalo de confiana (IC). Intervalo de confiana para a mdia de uma populao Os intervalos de confiana para a mdia so tipicamente construdos com o estimador X no centro do intervalo. 1- Quando conhecido: Quando o uso da distribuio normal est garantido, o intervalo de confiana para a mdia determinado por: IC = ( x - z

; x +z

) ou

IC = ( x - z

N n ; N 1

x +z

N n ) N 1

no caso de populao finita de tamanho N e amostragem sem reposio.

Os intervalos de confiana mais freqentemente utilizados so os de 90%, 95% e 99%. z (1- ) 1,65 1,96 2,58 0,90 0,95 0,99

2- Quando desconhecido Quando o desvio padro da populao no conhecido, usa-se o desvio padro da amostra como estimativa, substituindo-se por s nas equaes para intervalo de confiana. (Distribuio da populao normal) A disbruio t de Student utilizada quando o desvio padro da populao desconhecido. A forma da distribuio t muito semelhante com a normal, sendo a

principal diferena entre as duas distribuies que a distribuio t apresenta maior rea nas caudas. Para calcularmos t, necessitamos conhecer o nvel de confiana desejado e o nmero de graus de liberdade (gl=n-1). O intervalo de confiana para a mdia determinado por: IC = ( x - t
s ; n

x +t

s ) ou n

IC = ( x - t

s n

N n ; N 1

x +t

s n

N n ) N 1

no caso de populao finita de tamanho N e amostragem sem reposio.

Intervalo de confiana para a proporo de uma populao A distribuio amostral da proporo aproximadamente normal para n > 30, pode-se ento usar a distribuio normal para estabelecer o intervalo de confiana:

IC=( p - z

p (1 p ) ;p+z n p(1 p ) n

p (1 p ) ) n

ou
N n ) N 1

IC=( p - z

N n ;p+z N 1

p(1 p ) n

no caso de populao finita de tamanho N e amostragem sem reposio.

Você também pode gostar