Você está na página 1de 8

PONTIFICIA UNIVERSIDADE CATLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMTICA - DEPARTAMENTO DE ESTATSTICA ESTATSTICA APLICADA ADMINISTRAO I PROF VALTER

R ALBUQUERQUE

AMOSTRAGEM E ESTIMAO

TEORIA DA AMOSTRAGEM A teoria da amostragem um estudo das relaes existentes entre uma populao e as amostras dela extradas. de grande valor em muitas conjeturas. Podemos, por exemplo, avaliar grandezas desconhecidas da populao ( como sua mdia, sua varincia, etc.), freqentemente denominadas de parmetros, atravs das correspondentes grandezas amostrais, denominadas de estatsticas amostrais. MEDIDAS Tamanho Total Mdia Aritmtica Varincia Absoluta Desvio Padro Proporo POPULAO N T AMOSTRA n t
x

s s p

MEDIDAS ESTATSTICAS DA AMOSTRA


Medida Dados no agrupados Dados agrupados

Proporo Total

p=

f n

p=

f n

t = X

t = fX

Mdia Aritmtica

X =

x
n
2

X =

f
n

Varincia Absoluta

S2 =

( x X )
n 1

S2 =
2

f (x X )
n 1

Varincia Absoluta (Frmula abreviada) Desvio Padro

S2 =

nX

n 1
S = S2

S2 =

x2 nX n 1

S = S2

PLANEJAMENTO DE AMOSTRAS O planejamento da coleta da amostra define o tipo de amostragem a ser utilizado. Os tipos de planejamentos amostrais mais utilizados so: Amostragem sistemtica, Amostragem proporcional estratificada, Amostragem por conglomerado e Amostragem aleatria simples. AMOSTRAGEM SISTEMTICA Quando os elementos da populao j esto ordenados, no h necessidade de construirmos um sistema de referncia, para selecionarmos a amostra. So exemplos os pronturios mdicos de um hospital, os prdios de uma rua, , uma linha de produo, os nomes em uma telefnica, etc. Nestes casos a seleo dos elementos que constituiro a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos de sistemtica. Consideremos uma populao, com elementos ordenados, de tamanho N e dela tiramos uma amostra de tamanho n, atravs de uma amostragem sistemtica, da seguinte maneira: - Definimos FS como fator de sistematizao, dado por FS = N/n. - Sorteamos um nmero entre 1 e FS. Esse nmero simbolizado por m, que ser o primeiro elemento da amostra. - O segundo elemento da amostra o de nmero FS + m. - O terceiro elemento da amostra o de nmero 2FS + m. - O k-simo elemento da amostra o nmero ( k 1 ) FS + m Exemplo: Uma rua contm 1000 prdios, dos quais desejamos obter uma amostra sistemtica formada por 100 deles. FS = 1000/100 = 10 m ser um nmero entre 1 e 10. Vamos supor que m=7. Ento temos: 1 elemento da amostra = (1 1) 10 + 7 = 7 >>> 7 elemento da populao. 100 elemento da amostra = (100 1) 10 + 7 = 997 >>> 997 elemento da populao. AMOSTRAGEM PROPORCIONAL ESTRATIFICADA Muitas vezes a populao se divide em subpopulaes >> estratos. Como provvel que a varivel em estudo apresente, de estrato em estrato, um comportamento heterogneo, convm que o sorteio dos elementos da amostra leve em considerao tais estratos. isso que fazemos quando empregamos a amostragem proporcional estratificada, que, alm de considerar a existncia dos estratos, obtm os elementos da amostra proporcional ao nmero de elementos dos mesmos., Exemplo; Dada a populao de 50.000 operrios da industria automobilstica, selecionar uma amostra proporcional estratificada de 5% de operrios para estimar seu salrio mdio. Usando a varivel critrio cargo para estratificar essa populao, e considerando amostras de 5% de cada estrato obtido, chegamos ao seguinte quadro:
CARGO Chefes de seo Operrios especializados Operrios no especializados TOTAL POPULAO 5.000 15.000 30.000 50.000 5% 5(5.000)/100 = 250 5(15.000)/100 = 750 5(30.000)/100 = 1.500 5(50.000)/100 = 2.500 AMOSTRA 250 750 1.500 2.500

AMOSTRAGEM POR CONGLOMERADOS Neste tipo de amostragem a populao total subdividida em vrias partes relativamente pequenas (normalmente homogneas) , e algumas dessas subdivises, ou conglomerados, so selecionadas ao acaso, para integrarem a amostra global. Exemplo: Suponhamos que o reitor de uma universidade deseja saber o que os membros dos centros acadmicos acham de um novo regulamento. Ele pode obter uma amostra por conglomerado entrevistando alguns ou todos os membros de alguns centros acadmicos escolhidos ao acaso. AMOSTRAGEM ALEATRIA SIMPLES um tipo de amostragem que utiliza uma tcnica probabilistica. tambm chamada de amostragem casual ou randmica. A caracteristica principal que todos os elementos da populao tm igual probabilidade de pertencer amostra. Na prtica a amostragem aleatria simples pode ser realizada numerando-se a populao de 1 a N e sorteando-se, a seguir, por meio de um dispositivo aleatrio qualquer, k nmeros dessa seqncia, os quais correspondero aos elementos pertencentes amostra. Exemplo: Vamos obter uma amostra representativa, de 10 % dos valores, para obtermos a estatura mdia de noventa alunos de uma escola: - Numeramos os alunos de 01 a 90 - Escrevemos os nmeros, de 01 a 90, em pedaos iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaos de papel e retiramos, um a um, nove nmeros que formaro a amostra. Quando o nmero de elementos grande, esse tipo de sorteio torna-se trabalhoso. A fim de facilit-lo, foi elaborada uma tabela chamada Tabela de nmeros aleatrios, constituda de modo que os dez algarismos (0 a 9) so distribudos ao acaso nas linhas e colunas. AMOSTRAS COM E SEM REPOSIO Se cada elemento da populao pode ser escolhido mais de uma vez para participar de uma mesma amostra temos a chamada amostra com reposio. Se cada elemento da populao puder ser escolhido apenas uma nica vez para participar de uma mesma amostra, temos a chamada amostra sem reposio. Na prtica, demonstra-se que o uso de amostras sem reposio acarreta em menores erros do que com amostras com reposio. A determinao do nmero de amostras sem reposio diferentes e possveis (K), de tamanho n numa populao de tamanho N, pode ser calculado por:
K =n N

O valor de K, para amostras com reposio, dado por


k = Nn

DISTRIBUIES AMOSTRAIS Considerem-se todas as amostras possveis de tamanho n que podem ser retiradas de uma populao de tamanho N (com ou sem reposio). Para cada amostra pode-se calcular uma grandeza estatstica, como a mdia, o desvio padro etc., que varia de amostra para amostra. Com os valores obtidos para determinada grandeza, podemos construir uma distribuio de probabilidades, que ser denominada de distribuio amostral. Para cada distribuio amostral possvel calcular a sua expectncia, o seu desvio padro, etc. DISTRIBUIO AMOSTRAL DAS MDIAS Se os valores da mdia e do desvio padro de uma populao, de tamanho N, forem respectivamente e , e desta populao so retiradas todas as possveis amostras de tamanho n, sem reposio, os valores da expectncia e do desvio padro da distribuio amostral das mdias correspondente sero:
E ( x) =
_

N n N 1

Se a populao for infinita, ou se amostragem for tomada com reposio, os valores acima ficaro:
E ( x) =
_

DISTRIBUIO AMOSTRAL DAS PROPORES Se o valor da proporo de ocorrncia de em evento em uma populao, de tamanho N, for , e desta populao so retiradas todas as possveis amostras de tamanho n, sem reposio, os valores da expectncia e do desvio padro da distribuio amostral das propores correspondente sero:
E ( p) =

(1 )
n

N n N 1

Se a populao for infinita, ou se amostragem for tomada com reposio, os valores acima ficaro:
E ( p) =

(1 )
n

ERRO PADRO O desvio padro da distribuio amostral de uma grandeza estatstica freqentemente denominado de seu erro padro.

Ento temos que:

padro da proporo. TEOREMA DO LIMITE CENTRAL Quanto maior o tamanho da amostra, a distribuio de amostragem da mdia mais se aproxima da forma da distribuio normal, qualquer que seja a forma da distribuio da populao. Na prtica, a distribuio de amostragem da mdia pode se considerada como normal sempre que n 30. ESTIMAO Inicialmente precisamos de alguns conceitos importantes: Parmetros: so as medidas estatsticas calculadas para a populao, como por exemplo: mdia aritmtica ( ), desvio padro ( ), varincia absoluta ( ), proporo ( ), etc . Estatsticas amostrais: so as medidas estatsticas calculadas para a amostra, como por exemplo: mdia aritmtica ( x ),desvio padro (s), varincia absoluta (s), proporo (p), etc . Estimao: o processo que consiste em utilizar dados amostrais para obter valores de parmetros populacionais desconhecidos. Estimador: toda a estatstica amostral que tem um correspondente parmetro na populao. Por exemplo: x um estimador de ; s um estimador de ; e assim por diante. Estimador no tendencioso: Se um parmetro, e seu estimador , dizemos que um estimador no tendencioso de se E( ) = . Estimativa: o valor numrico do estimador. ESTIMATIVAS As estatsticas amostrais so usadas como estimadores de parmetros populacionais. As estimativas obtidas podem ser pontuaia ou intervalares: Estimativa pontual: O parmetro estimado unicamente pelo valor do estimador. Estimativa intervalar: O parmetro estimado atravs de um intervalo de valores, onde o estmador o seu valor central. ALGUNS ESTIMADORES NO TENDENCIOSOS IMPORTANTES
Estimador de total da populao (T) Estimador do erro padro da mdia (populao infinita) Estimador do erro padro da mdia (populao finita) Estimador do erro padro da proporo (populao infinita) Estimador do erro padro da proporo (populao finita)

chamado de erro padro da mdia, e

chamado de erro

T = Nx

s n

p(1 p) p(1 p) N n Nn = = n p n N 1 n N1 p

INTERVALO DE CONFIANA PARA ESTIMAR A MDIA POPULACIONAL COM A UTILIZAO DA DISTRIBUIO NORMAL DE PROBABILIDADES A estimativa por ponto para a mdia populacional dada atravs da mdia da amostra. Um intervalo de estimao para a mdia populacional construdo, a partir do valor de x , levando-se em conta ainda um erro de estimativa que considera a probabilidade de que este intervalo inclua o valor real de , e a variabilidade dos dados. Definimos como Nvel de confiana (1 - ) a probabilidade de que o intervalo construdo contenha o verdadeiro valor da mdia populacional que est sendo estimada. A Distribuio normal pode ser utilizada, nesse caso, sempre que tivermos uma das seguintes situaes: 1 - se n 30, conforme o Teorema do Limite Central. 2 - se n < 30, sendo a populao estudada normalmente distribuda e o desvio padro populacional conhecido. Definimos Zc como coeficiente de confiana, que o valor obtido atravs da distribuio normal com o nvel de confiana especificado. A tabela seguinte apresenta os valores mais usados do nvel de confiana e seu respectivo coeficiente de confiana:
Nvel de confiana (1 - ) 0,90 0,95 0,99

Zc
1,65 1,96 2,58

Ento o intervalo de estimao, ou confiana, para a mdia populacional, utilizando-se a distribuio normal, ser calculado por:

[ x x ]

desconhecido

se for conhecido

[x x ]

se for

Sendo x o erro de estimao da mdia e x o estimador no tendencioso do erro de estimao da mdia, calculados pelas frmulas seguintes:

x = Zc x

x = Zc x

INTERVALO DE CONFIANA PARA ESTIMAR O TOTAL POPULACIONAL Aps obtido o intervalo de estimao para a media populacional, basta multiplicarmos seus dois valores por N, que obteremos o intervalo do total populacional, pois a estimativa pontual do total populacional e feita por T = N x INTERVALO DE CONFIANA PARA ESTIMAR A PROPORCAO POPULACIONAL O intervalo de estimao, ou de confiana, para estimar a proporo populacional ( ) determinado de maneira similar ao da mdia, ou seja a partir do valor da proporo amostral (p), acrescentado ou diminudo de um erro de estimativa. Ento p o erro de estimao da proporo e p o estimador no tendencioso do erro de estimao da proporo. Utilizaremos a distribuio normal para construir este intervalo sempre que n 30. Ento o intervalo ser determinado por:

[p P]

sendo :

p = Zc p

INTERVALO DE CONFIANA PARA ESTIMAR UTILIZANDO-SE A DISTRIBUIO t DE STUDENT

MDIA

POPULACIONAL

Quando o desvio padro da populao ( ) no for conhecido, e o tamanho da amostra for inferior a 30 (n < 30), sendo a populao estudada normalmente distribuda, a distribuio normal no apropriada para determinao de intervalos de confiana para a mdia. Nesse caso usamos a distribuio de Student (t) para determinao desse intervalo. A distribuio de Student tem a forma semelhante a da distribuio Normal, e a principal diferena que a distribuio t tem maior rea nas caudas.. Ento, para um dado nvel de confiana, o valor de t ser um pouco maior que o correspondente valor de z. A determinao do valor de t na tabela depende no nvel de confiana e do n do grau de liberdade. O nmero do grau de liberdade , geralmente representado por gl, definido como o nmero de observaes independentes da amostra menos o nmero dos parmetros populacionais que devem ser estimados por meio das observaes amostrais. Ento nesse caso usamos: gl = n - 1 O intervalo para a mdia , com a distribuio t, ser dado por:

[x x ]

x = tc x

Sendo:

DETERMINAO DO TAMANHO DA AMOSTRA Na estimao da mdia populacional, podemos determinar o tamanho mnimo necessrio da amostra considerando-se um erro de estimao, e um nvel de confiana desejados, e conhecendo ou estimando um valor para , atravs das seguintes frmulas:
n=
2 zc 2 2 x

Se a populao for infinita.

n=

NZ c2 2 2 x ( N 1) + Z c2 2

Se a populao for finita.

Na estimao da proporo populacional, determinamos o valor mnimo para n considerando um erro de estimao e um nvel de confiana desejados, e supondo um valor para , atravs das seguintes frmulas:
n= Z c2 (1 ) 2 p

Se a populao for infinita.

n=

NZ c2 (1 ) 2 ( N 1) + Z c2 (1 ) p

Se a populao for finita

OBSERVAES IMPORTANTES: (1) Ao determinarmos o tamanho da amostra, atravs dessas frmulas, qualquer resultado fracionrio sempre arredondado para o nmero inteiro imediatamente superior, pois essas frmulas nos do o tamanho mnimo necessrio. (2) Qualquer resultado obtido por essas frmulas que seja menor do que 30 deve ser aumentado para 30, pois as mesmas so baseadas no uso da distribuio Normal. Isso s no ser feito se a populao estudada for normalmente distribuda e o conhecido.

Você também pode gostar