Você está na página 1de 20

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

SUMRIO
AMOSTRAGEM 1. CONCEITOS BSICOS 2. DISTRIBUIO AMOSTRAL DOS ESTIMADORES 2.1. Distribuio amostral da mdia 2.1.1. Amostragem com reposio 2.1.2. Amostragem sem reposio 2.2. Distribuio amostral da proporo 2.2.1. Amostragem COM reposio 2.2.2. Amostragem SEM reposio 2.3. Distribuio amostral da varincia 2.3.1. Amostragem COM reposio 2.3.2. Amostragem SEM reposio 3. EXERCCIOS 4. RESPOSTAS DOS EXERCCIOS 5. REFERNCIAS 3 3 7 7 7 8 10 10 11 12 12 13 15 18 20

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

AMOSTRAGEM
1. CONCEITOS BSICOS
Estatstica Indutiva. Muitas vezes, apesar dos recursos computacionais e da boa vontade no possvel estudar todo um conjunto de dados de interesse. Neste caso estuda-se uma parte do conjunto. O principal motivo para se trabalhar com uma parte do conjunto ao invs do conjunto inteiro o custo. O conjunto de todos os elementos que se deseja estudar denominado de populao. Note-se que o termo populao usado num sentido amplo e no significa, em geral, conjunto de pessoas. Pode-se definir uma populao como sendo:

Uma coleo de todos os possveis elementos, objetos ou medidas de interesse.


Assim, so exemplos de populaes: O conjunto das rendas de todos os habitantes de Porto Alegre; O conjunto de todas as notas dos alunos de Estatstica; O conjunto das alturas de todos os alunos da Universidade; etc. Um levantamento efetuado sobre toda uma populao denominado de levantamento censitrio ou Censo. Fazer levantamentos, estudos, pesquisas, sobre toda uma populao (censo) , em geral, muito difcil. Isto se deve vrios fatores. O principal o custo. Um censo custa muito caro e demanda um tempo considervel para ser realizado. Assim, normalmente, se trabalha com partes da populao denominadas de amostras. Uma amostra pode ser caracterizada como:

Uma poro ou parte de uma populao de interesse.


Utilizar amostras para se ter conhecimento sobre populaes realizado intensamente na Agricultura, Poltica, Negcios, Marketing, Governo, etc., como se pode ver pelos seguintes exemplos: Antes da eleio diversos rgos de pesquisa e imprensa ouvem um conjunto selecionado de eleitores para ter uma idia do desempenho dos vrios candidatos nas futuras eleies. Uma empresa metal-mecnica toma uma amostra do produto fabricado em intervalos de tempo especificados para verificar se o processo est sob controle e evitar a fabricao de itens defeituosos. O IBGE faz levantamentos peridicos sobre emprego, desemprego, inflao, etc. Redes de rdio e TV se utilizam constantemente dos ndices de popularidade dos programas para fixar valores da propaganda ou ento modificar ou eliminar programas com audincia insatisfatria. Bilogos marcam pssaros, peixes, etc. para tentar prever e estudar seus hbitos. O processo de escolha de uma amostra da populao denominado de amostragem. Riscos da amostragem. O processo de amostragem envolve riscos, pois toma-se decises sobre toda a populao com base em apenas uma parte dela. A teoria da probabilidade pode ser utilizaProf. Lor Viali, Dr. viali@mat.ufrgs.br http://www.mat.ufrgs.br/~viali/ 3

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

da para fornecer uma idia do risco envolvido, ou seja, do erro cometido ao utilizar uma amostra ao invs de toda a populao, desde que, claro, a amostra seja selecionada atravs de critrios probabilsticos, isto , ao acaso. Baseado nos conceitos anteriores pode-se definir Estatstica Indutiva ou Inferencial como sendo: A coleo de mtodos e tcnicas utilizados para se estudar uma populao baseados em amostras probabilsticas desta mesma populao.

Uma amostra dita probabilstica se todos os elementos da populao tiverem probabilidade conhecida e no zero de pertencer a amostra.
Dentre as vrias maneiras de se selecionar uma amostra probabilstica ou aleatria de uma populao a mais simples atribuir a todos os elementos da populao a mesma probabilidade de pertencer a amostra. Uma amostra que satisfaa tal critrio denominada de amostra aleatria simples (aas). Uma aas pode ser extrada de uma populao de acordo com os critrios: (a) com reposio e (b) sem reposio. Se a populao for infinita ento as retiradas com e sem reposio sero equivalentes, isto , se a populao for infinita (ou ento muito grande), o fato de se recolocar o elemento retirado de volta na populao. no vai afetar em nada a probabilidade de extrao do elemento seguinte. Se, no entanto, a populao for finita (e pequena) ser necessrio fazer uma distino entre os dois procedimentos, pois na extrao com reposio as diversas retiradas sero independentes, mas no processo sem reposio haver dependncia entre as retiradas, isto , o fato de no recolocar o elemento retirado afeta a probabilidade do elemento seguinte ser retirado. A amostragem sem reposio mais eficiente que a amostragem com reposio e reduz a variabilidade uma vez que no possvel retirar elementos extremos mais do que uma vez. Assim se N representa o tamanho da populao e n < N o tamanho da amostra, ento o nmero de amostras possveis de acordo com os critrios com e sem reposio ser:

(a) Com reposio


k = nmero de amostras = Nn

(b) Sem reposio


k = nmero de amostras = =
n N
N! n!(N n)!

Exemplo: Considere a populao P = { 1, 3, 5, 6 }. Ento o nmero de amostras possveis de tamanhos n = 2 e n = 3, de acordo com os critrios com e sem reposio ser:

(a) Sem reposio


(1) n = 2 Como N = 4 e n = 2, ento o nmero de amostras possveis ser: = =
n 2 N 4
4! = 2!( 4 2)!

6
4

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

Estas amostras sero: (1, 3) (1, 5) (1, 6) (3, 5) (3, 6) (5, 6) (2) n = 3 Como N = 4 e n = 3, ento o nmero de amostras possveis ser: = =
n 3 N 4
4! = 3 !( 4 3 )!

Estas amostras sero: (1, 3, 5) (1, 3, 6)

(1, 5, 6) (3, 5, 6).

(b) Com reposio


(1) n = 2 Como N = 4 e n = 2, ento o nmero de amostras possveis ser Nn = 42 = 16. Estas amostras sero: (1, 1) (1, 3) (1, 5) (1, 6) (3, 3) (3, 5) (3, 6) (5, 5) (5, 6) (6, 6) (3, 1) (5, 1) (6, 1) ( 5, 3) (6, 3) (6, 5) Como pode ser observado neste caso as amostras (a, b) e (b, a) so consideradas diferentes, isto , na amostragem com reposio as amostras so ordenadas. (2) n = 3 Como N = 4 e n = 3, ento o nmero de amostras possveis ser Nn = 43 = 64 Algumas destas amostras so: (1, 1, 1) (1, 1, 3), (1, 3, 1), (3, 1, 1) (1, 3, 5) (1, 5, 3) ( 5, 3, 1) (5, 1, 3) (1, 3, 6) (3, 3, 3), (5, 5, 5) (5, 5, 6) (1, 5, 6) (3, 5, 6) , etc.

Estimador, estimativas e parmetros Uma caracterstica da populao denominada parmetro.


Um parmetro uma constante, isto , um nmero que representa uma caracterstica nica da populao. Assim se P uma populao, os principais parmetros seriam: (i) A mdia de P, anotada por P
2 (ii) A varincia de P, anotada por P

(iii) O desvio padro de P, anotado por P (iv) A proporo de elementos de P que apresentam determinada caracterstica, anotada por: , entre outros.

Exemplo:
Para a populao P = { 1, 3, 5, 6 } os parmetros acima seriam: (i) P = (1 + 3 + 5 + 6) / 4 = 15 / 4 = 3,75
2 (ii) P = (1 + 9 + 25 + 36) / 4 - 3,752 = 71/4 - 3,752 = 17,75 - 14,0625 = 3,6875 = 3,69.

(iv) P = 1,9203 = 1,92 (v) = 1 / 4 = 25%, onde o numerador representa o nmero de elementos pares na populao
5

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

Estimador Um estimador uma caracterstica da amostra.


Como a amostra aleatria um estimador uma varivel aleatria. Assim tudo o que foi visto em probabilidade sobre variveis aleatrias, aplica-se aos estimadores. A distribuio de probabilidade de um estimador denominada de distribuio amostral. Os principais estimadores so: (I) A mdia da amostra, X que um estimador da mdia da populao: (ii) A varincia amostral, S2 que um estimador da varincia populacional: 2 (iii) A proporo amostral, P, que um estimador amostral da proporo populacional .

Estimativa Uma estimativa um valor particular de um estimador


Assim x = 2 uma estimativa. O estimador a expresso (frmula) enquanto que a estimativa o valor particular que ele assume (nmero).

Clculo dos principais estimadores.


Se (X1, X2, ..., Xn) uma amostra aleatria de tamanho n extrada de uma populao, ento: (a) X = Xi / n uma estimativa da mdia populacional quando a amostra no est agrupada e X = f i Xi / n uma estimativa da mdia da amostra quando a amostra est agrupada em uma distribuio de freqncias (por ponto ou por valores). (b) S =
2

( Xi X) 2
n1
2

Xi2 n X2
n1

uma estimativa da varincia populacional quando a

amostra no est agrupada e S =


2

f i( Xi X)
n1

2 f i Xi n X 2

amostra est agrupada em uma distribuio de freqncias. Note-se que agora a varincia calculada com n - 1 no denominador. Isto se deve ao fato de que a varincia for calculada com n no denominador, a mdia de sua distribuio amostral no ser igual a varincia populacional o que caracterizaria um estimador tendencioso. Embora a varincia seja calculada com n - 1 no denominador com o objetivo de que as estimativas variem em torno do parmetro, isto no ir ocorrer se a amostragem for sem reposio de populao finita. Neste caso necessrio utilizar, ainda, uma correo para a varincia que consiste em multiplic-la pelo valor (N - 1) / N. Evidentemente esta correo s ser necessria se a populao for pequena, caso contrrio o quociente acima ser aproximadamente igual a um e a correo no precisar ser feita. Assim se a populao for finita (e pequena) e a amostragem for realizada sem reposio a varincia dever ser calculada por:
$ 2 = N 1 S2 S
N

n1

uma estimativa da varincia populacional quando a

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

(c) P = f / n, onde f = freqncia de elementos na amostra com determinada caracterstica uma estimativa da proporo populacional .

2. DISTRIBUIES AMOSTRAIS DOS PRINCIPAIS ESTIMADORES 2.1. D ISTRIBUIO


AMOSTRAL DA MDIA

2.1.1. Amostragem com reposio


Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 extradas com reposio. Para cada amostra vai-se calcular a mdia. Ter-se- assim um conjunto de 16 valores que sero dispostos em uma tabela, com as respectivas probabilidades, e que constituir ento a distribuio amostral da mdia da amostra. As possveis amostras com as respectivas mdias so: Amostras Amostras x (1, 1) 1 (5, 6) 5,5 (1, 3) 2 (6, 6) 6 (1, 5) 3 (3, 1) 2 (1, 6) 3,5 (5, 1) 3 (3, 3) 3 (6, 1) 3,5 (3, 5) 4 ( 5, 3) 4 (3, 6) 4,5 (6, 3) 4,5 (5, 5) 5 (6, 5) 5,5

Colocando estes resultados em uma tabela (distribuio amostral da mdia) vem:


x 1,0 2,0 3,0 3,5 4,0 4,5 5,0 5,5 6,0

f( x ) = P( X = x ) 1/16 2/16 3/16 2/16 2/16 2/16 1/16 2/16 1/16 1

x f( x ) 1/16 4/16 9/16 7/16 8/16 9/16 5/16 11/16 6/16 60/16

x2 f( x )

1,0/16 8,0/16 27,0/16 24,5/16 32,0/16 40,5/16 25,0/16 60,5/16 36,0/16 254,5/16

Pela tabela pode-se verificar que: E( X ) = x f( x ) = 60/16 = 3,75 = , isto a expectncia (mdia) de todas as mdias amostrais, extradas com reposio da populao P, igual a mdia populacional (parmetro populacional mdia). V( X ) = x2 f( x ) - X = 254,5/16 - 3,752 = 1,84375 = 2/ 2 = 3,6875/2, isto , a varincia entre as mdias amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional. O valor X = 1,36 denominado erro padro da mdia. Ele mede a variabilidade entre as mdias amostrais e d uma idia do erro que se comete ao se substituir a mdia da populao pela mdia da amostra. De fato, verificando a tabela acima, pode-se ver que se por exemplo, fosse selecionada a amostra (1, 1) seramos levados a crer que a mdia da populao seria um, quando de fato ela vale 3,75, cometendo assim um erro de 2,75 unidades. Felizmente este erro (o maior possvel neste caso) s vai oProf. Lor Viali, Dr. viali@mat.ufrgs.br http://www.mat.ufrgs.br/~viali/ 7

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

correr com uma probabilidade de 1/16 = 6,25%. Se por exemplo, fosse selecionada a amostra (1, 6) a mdia amostral seria 3,5 e o erro cometido (neste caso) seria de 0,25 unidades. Este erro bem menor que o anterior ocorre com uma probabilidade de 2/16 = 12,5%. O que o desvio padro da distribuio amostral da mdia faz determinar o erro mdio, sendo por isso denominado, ento, de erro padro da amostragem.

2.1.2. Amostragem sem reposio


Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 extradas sem reposio. As possveis amostras com as respectivas mdias so: Amostras
x

(1, 3) 2

(1, 5) 3

(1, 6) 3,5

(3, 5) 4

(3, 6) 4,5

(5, 6) 5,5

Colocando estes resultados em uma tabela (distribuio amostral da mdia) vem:


x 2,0 3,0 3,5 4,0 4,5 5,5

f( x ) = P( X = x ) 1/6 1/6 1/6 1/6 1/6 1/6 1

x f( x ) 2,0 / 6 3,0 / 6 3,5 / 6 4,0 / 6 4,5 / 6 5,5 / 6 22,5 / 6

2 x f( x )

04,00 / 6 09,00 / 6 12,25 / 6 16,00 / 6 20,25 / 6 30,25 / 6 91,75 / 6

Da tabela segue: E( X ) = x f( x ) = 22,5/6 = 3,75 = , isto a expectncia (mdia) de todas as mdias amostrais, extradas sem reposio da populao P, tambm igual a mdia populacional (parmetro populacional mdia).
2 2 N n V( X ) = x2 f( x ) - X = 91,75/6 - 3,752 = 1,2292 = . = 1,84375. (2/3), isto , a varin2 N1 cia entre as mdias amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional multiplicada pelo fator de correo de populao finita. Este fator, pode ser considerado como o fator de eficincia da amostragem sem reposio sobre a amostragem com reposio, que neste caso (N = 4 e n =2) vale 2/3. Como na amostragem sem reposio no possvel retirar o mesmo elemento duas vezes, as mdias no podem assumir valores to extremos, como por exemplo, o valor um ou seis que assumiram na amostragem com reposio. Isto faz com que a erro padro na amostragem sem reposio seja menor do que na amostragem com reposio.

O fator de reduo da varincia na amostragem sem reposio : (N - n) / (N -1) Pode-se perceber facilmente que quanto maior for a diferena entre o tamanho da populao e o tamanho da amostra mais prximo de um ser este fator. Ento, como regra prtica, pode-se admitir como necessria a correo para a varincia das mdias amostrais sempre que o tamanho da amostra exceder a 5% do tamanho da populao. Caso isto no ocorra no necessrio fazer-se a distino entre os dois procedimentos (com e sem reposio).

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

Evidentemente as consideraes acima valem para populaes pequenas. Se a populao bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para representar a distribuio das mdias amostrais. Neste caso necessrio procurar por modelos probabilsticos que descrevam a distribuio da mdia amostral. Neste caso, tambm, como declarado acima a distino entre amostragem com e sem reposio no ser necessrio, pois o fator de correo ser aproximadamente um e no necessitar ser utilizado. Os modelos probabilsticos so conhecidos a partir dos dois seguintes resultados: (a) Se (X1, X2, ..., Xn) uma amostra aleatria de uma populao com distribuio normal de mdia e desvio padro , ento a mdia da amostra ( X ) ter uma distribuio tambm normal com a mesma mdia da populao e com desvio padro (erro padro) raiz de n vezes menor que o desvio padro da populao, isto : Se X N(, ) ento X ser N(, (b) Teorema Central do Limite Se (X1, X2, ..., Xn) uma amostra aleatria extrada de uma populao com qualquer distribuio de mdia e desvio padro , ento a mdia da amostra ( X ) ter uma distribuio aproximadamente normal com a mesma mdia da populao e com desvio padro (erro padro) raiz de n vezes menor que o desvio padro da populao medida que o tamanho da amostra aumenta. OBS.: Para amostras de 30 ou mais valores, em geral, a aproximao j ser suficiente boa, para se poder utilizar este resultado. Assim: Se X tem qualquer distribuio ento X ter uma distribuio aproximadamente N(, para n grande (n 30).
n n

Exemplos:
(1) Uma populao X tem uma distribuio normal de mdia 100 e desvio padro 10. (a) Qual P(95 < X < 105)? (b) Se X a mdia de 16 elementos extrada desta populao, qual a P(95 < X < 105) ?

Soluo:
(a) Como X uma N(100, 10) vem: P(95 < X < 105) = P(-0,5 < Z < 0,5) = (0,5) - (-0,5) = 0,6915 - 0,3185 = 38,30%. Neste caso X uma N(100; 2,5), ento: (b) P(95 < X < 105) = P(-2,0 < Z < 2,0) = (2,0) - (-2,0) = 0,9772 - 0,0228 = 95,44%. (2) A renda de um conjunto de pessoas de uma certa regio tem mdia 6 s.m. e desvio padro de 2 s.m. Se desta populao for extrada uma amostra de n = 100 pessoas, qual a probabilidade de a mdia desta amostra acuse um valor superior a 6,3 s.m?

Soluo:
Neste caso, como no foi declarado que a populao normal necessrio aplicar o teorema central do limite, uma vez que n = 100 > 30, isto possvel. A mdia da amostra ter uma distribuio
Prof. Lor Viali, Dr. viali@mat.ufrgs.br http://www.mat.ufrgs.br/~viali/ 9

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

aproximadamente normal com mdia 6 s.m. e desvio padro de: 2 / 10 = 0,20, uma vez que o erro padro da mdia raiz de n vezes menor do que o desvio padro populacional. Ento, a probabilidade pedida ser: P( X > 6,30) = P(Z > (6,30 - 6)/0,20 ) = P (Z > 1,5) = (-1,5) = 6,68%, isto , apenas 6,68% das mdias de amostras de tamanho n = 100 apresentaro um valor superior a 6,30 s.m.

2.2. D ISTRIBUIO

AMOSTRAL DA PROPORO

2.2.1. Amostragem COM reposio


Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 obtidas com reposio. Para cada amostra vai-se calcular a proporo P de elementos pares na populao. Ter-se- assim um conjunto de 16 valores que sero dispostos em uma tabela, com as respectivas probabilidades, e que formaro ento a distribuio amostral da proporo. As possveis amostras com as respectivas propores so: Amostras p Amostras p (1, 1) 0 (5, 6) 1/2 (1, 3) 0 (6, 6) 1 (1, 5) 0 (3, 1) 0 (1, 6) 1/2 (5, 1) 0 (3, 3) 0 (6, 1) 1/2 (3, 5) 0 ( 5, 3) 0 (3, 6) 1/2 (6, 3) 1/2 (5, 5) 0 (6, 5) 1/2

Colocando estes resultados em uma tabela (distribuio amostral da proporo) vem: p 0,0 0,5 1,0 f(p) = P(P = p) 9/16 6/16 1/16 1 pf(p) 0/16 3/16 1/16 4/16 p2f(p) 0,0/16 1,5/16 1,0/16 2,5/16

Pode-se ento calcular a expectncia e a varincia: E(P) = pf(p) = 4/16 = 0,25 = , isto o valor esperado (mdia) de todas as propores amostrais, extradas com reposio da populao P, e igual a proporo populacional (parmetro populacional ). Isto significa, que o estimador P um estimador no tendencioso (ou no viciado) da proporo populacional , quando as amostras so extradas com reposio da populao.
2 V(P) = p2f(p) - P = 2,5/16 - 0,252 = 0,09375 = (1 - ) / n, isto , a varincia entre as propores amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional. Isto porque quando se est trabalhando com propores, pode-se mostrar que a varincia populacional igual a (1 - ).

O valor

P =

(1 ) = 0,09375 denominado erro padro da proporo. Ele mede a van

riabilidade entre as propores amostrais e d uma idia do erro que se comete ao se substituir a proporo da populao pela proporo da amostra.

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/

10

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

2.2.2. Amostragem SEM reposio


Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 extradas sem reposio. As possveis amostras com as respectivas propores so: Amostras p (1, 3) 0 (1, 5) 0 (1, 6) 1/2 (3, 5) 0 (3, 6) 1/2 (5, 6) 1/2

Colocando estes resultados em uma tabela (distribuio amostral da proporo) vem: p 0,0 0,5 Portanto: E(P) = pf(p) = 0,5/2 = 0,25 = , isto a expectncia (mdia) de todas as propores amostrais, extradas sem reposio da populao P, e igual a proporo populacional (parmetro populacional ). Isto significa, que o estimador P um estimador no tendencioso (ou no viciado) da proporo populacional , quando as amostras so retiradas sem reposio.
2 V(P) = p2f(p) - P = 0,25/2 - 0,252 = 0,0625 =

f(p) = P(P = p) 1/2 1/2 1

pf(p) 0,0/2 0,5/2 0,5/2

p2f(p) 0,00/2 0,25/2 0,25/2

pores amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional multiplicada pelo fator de correo de populao finita. Este fator, pode ser considerado como o fator de eficincia da amostragem sem reposio sobre a amostragem com reposio que, neste exemplo, (N = 4 e n = 2) vale 2/3. Evidentemente as consideraes acima valem para populaes pequenas. Se a populao bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para representar a distribuio das propores amostrais. Nesta situao necessrio procurar por modelos probabilsticos que descrevam a distribuio da proporo amostral. Neste caso, tambm, como declarado acima a distino entre amostragem com e sem reposio no ser necessria, pois o fator de correo ser aproximadamente um e no precisar ser utilizado. O modelo probabilstico para a proporo amostral dada pelo seguinte resultado: (a) Se (X1, X2, ..., Xn) uma amostra aleatria retirada de uma populao com proporo , ento a distribuio da proporo amostral ser aproximadamente normal com mdia P = e desvio padro P =
(1 ) . n

(1 ) N n . , isto , a varincia entre as pro2 N1

OBS.: Para amostras de 30 ou mais valores, em geral, a aproximao j ser suficiente boa, para se poder utilizar este resultado. Para amostras pequenas a distribuio da proporo amostral Binomial.

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/

11

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

Exemplo:
A proporo de eleitores do candidato D. M. A. Gogo numa certa regio de 20%. Extrada uma amostra de 100 eleitores desta regio, qual a probabilidade que ela apresente um nmero de eleitores do candidato (a) Abaixo de 15% (b) Superior a 30%

Soluo:
Como n > 30 pode-se usar a distribuio normal com mdia = = 20% e desvio padro

(1 ) = n

0 , 2( 1 0 , 2 ) 100

= 0,04 = 4%, Ento:

(a) P(P < 15%) = P(Z < -1,25) = (-1,25) = 10,56%. (b) P(P > 30) = P(Z > 2,5) = (-2,5) = 0,62%.

2.3. D ISTRIBUIO

AMOSTRAL DA VARINCIA

2.3.1. Amostragem COM reposio


Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 extradas com reposio. Para cada amostra vai-se calcular a varincia. Ter-se- assim um conjunto de 16 valores que sero dispostos em uma tabela, com as respectivas probabilidades, e que constituir ento a distribuio amostral da varincia. As possveis amostras com as respectivas varincias so: Amostras
x s2 Amostras x s2

(1, 1) 1 0 (5, 6) 5,5 0,5

(1, 3) 2 2 (6, 6) 6 0

(1, 5) 3 8 (3, 1) 2 2

(1, 6) 3,5 12,5 (5, 1) 3 8

(3, 3) 3 0 (6, 1) 3,5 12,5

(3, 5) 4 2 ( 5, 3) 4 2

(3, 6) 4,5 4,5 (6, 3) 4,5 4,5

(5, 5) 5 0 (6, 5) 5,5 0,5

Colocando estes resultados em uma tabela (distribuio amostral da varincia) vem: s2 0,0 0,5 2,0 4,5 8,0 12,5 f(s2) = P(S2 = s2) 4/16 2/16 4/16 2/16 2/16 2/16 1 s2f(s2) 0/16 1/16 8/16 9/16 16/16 25/16 59/16

Da tabela segue que:

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/

12

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

E(S2) = s2f(s2) = 59/16 = 3,6875 = 2, isto a expectncia (mdia) de todas as varincias das amostras de tamanho n = 2, extradas com reposio da populao P, igual a varincia populacional (parmetro populacional varincia). Em outras palavras, pode-se dizer que quando a amostragem com reposio a varincia amostral S2 um estimador no tendencioso da varincia populacional 2. Desta forma, sempre que se desejar estimar a varincia de uma populao onde as amostras foram retiradas com reposio, pode-se usar a varincia amostral como estimador.

2.3.2. Amostragem SEM reposio


Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 obtidas sem reposio. As possveis amostras com as respectivas varincias so: Amostras
x s2

(1, 3) 2 2

(1, 5) 3 8

(1, 6) 3,5 12,5

(3, 5) 4 2

(3, 6) 4,5 4,5

(5, 6) 5,5 0,5

Colocando estes resultados em uma tabela (distribuio amostral da varincia) vem: s2 0,5 2,0 4,5 8,0 12,5 f(s2) = P(S2 = s2) 1/6 2/6 1/6 1/6 1/6 1 s2f(s2) 0,5/6 4,0/6 4,5/6 8,0/6 12,5/6 29,5/6

Pela tabela pode-se ver que: E(S2) = s2f(s2) = 29,5/6 3,6875 = 2, isto a expectncia (mdia) de todas as varincias das amostras de tamanho n = 2, extradas sem reposio da populao finita P, no igual a varincia populacional (parmetro populacional varincia). Neste caso, para que se obtenha um estimador no tendencioso da varincia populacional necessrio corrigir a varincia amostral atravs do fator (N - 1) / N. Assim se cada varincia acima for multiplicada por este fator, que neste caso ser, (N - 1) / N = 3 / 4 = 0,75, ento, se ter:
$2 s
$2 = s f( s $2 ) = P( S $2 ) 1/6 2/6 1/6 1/6 1/6 1

s $2 f( s $2 )

0,375 1,500 3,375 6,000 9,375

0,375/6 3,000/6 3,375/6 6,000/6 9,375/6 22,125/6

2 $ 2 ) = s E( S $ 2 f( s $ 2 ) = 22,125 / 6 = 3,6875 = , isto a expectncia (mdia) de todas as varin2 cias corrigidas igual ao parmetro populacional . Assim quando a populao pequena e amostra-

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/

13

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

gem for sem reposio necessrio corrigir a varincia da amostra pelo fator (N - 1) / N, para que ela seja um bom estimador da varincia populacional. claro que esta correo s ser importante para populaes pequenas. Se a populao for grande, por exemplo, N = 1000, ento o fator (N - 1) / N = 999 / 1000 = 0,999 o que aproximadamente 1. Neste caso, no necessrio usar esta correo e a amostragem sem reposio pode ser considerada equivalente a com reposio para efeitos de estimao da varincia populacional. Evidentemente as consideraes acima valem para populaes pequenas. Se a populao bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para representar a distribuio das varincias amostrais. Neste caso necessrio procurar por modelos probabilsticos (funes) que descrevam a distribuio da varincia amostral. Para a varincia este modelo existe e denominado de distribuio Qui-quadrado (2).

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/

14

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

3. EXERCCIOS
(01) De uma populao com N = 12 elementos retirada uma amostra aleatria simples, sem reposio, de n = 5. (01.1) Quantas so as possveis amostras? (01.2) Qual a probabilidade de cada uma destas amostras ser selecionada? (02) Uma populao composta dos elementos: A, B, C, D e F. (02.1) Liste todas as possveis amostras aleatrias simples, sem reposio, com n = 2. (02.2) Liste todas as aas, sem reposio, de tamanho n = 3. (02.3) Determine a probabilidade de ser sorteada a amostra BC. (02.4) Determine a probabilidade de ser sorteada a amostra ACD. (03) A tabela, ao lado, a distribuio de freqncias de uma amostra proveniente de determinada populao. (03.1) Determine o tamanho da amostra. (03.2) Determine uma estimativa da mdia da populao. (03.3) Determine uma estimativa da varincia da populao. (03.4) Determine uma estimativa da proporo de valores pares na populao. (04) A tabela ao lado apresenta valores amostrais. (04.1) Qual o tamanho da amostra? (04.2) Determine uma estimativa para a mdia da populao. (04.3) Determine uma estimativa do desvio padro populacional. (04.4) Determine uma estimativa dos valores mpares de X. (05) Uma populao formada pelos elementos: A = 3, B = 6, C = 9 e D = 12. (05.1) Determine os seguintes parmetros: (a) mdia, (b) varincia e (c) proporo de elementos menores que 8. (05.2) (a) Construa a distribuio amostral da mdia da amostra utilizando aas, sem reposio, de tamanho n = 2. (b) Determine a expectncia e a varincia da distribuio amostral em (a) (c) Construa a distribuio amostral da mdia da amostra utilizando aas, sem reposio, de tamanho n = 3. (d) Determine a expectncia e a varincia da distribuio amostral em (c)
X 1 2 3 4 f 40 45 8 7

Elementos A B C D E

X 5 7 12 15 10

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/

15

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

(5.3) (a) Construa a distribuio amostral da varincia amostral utilizando aas, sem reposio, de tamanho n = 2 e determine a sua expectncia. (b) Utilize a correo de populao finita para as varincias obtidas em (a) obtendo a distribuio amostral da varincia corrigida e determine sua expectncia. (c) Construa a distribuio amostral da varincia corrigida utilizando aas, sem reposio, de tamanho n = 3 e determine sua expectncia. (d) Utilize a correo de populao finita para as varincias obtidas em (c) obtendo a distribuio amostral da varincia corrigida e determine sua expectncia. (5.4) (a) Construa a distribuio amostral para o estimador da proporo de elementos menores que 8 utilizando aas, sem reposio, de tamanho n = 2. (b) Determine a expectncia e a varincia da distribuio em (a). (c) Construa a distribuio amostral para o estimador da proporo de elementos menores que 8 utilizando aas, sem reposio, de tamanho n = 3. (d) Determine a expectncia e a varincia da distribuio em (c). (06) Utilize os valores da amostra tabelada ao lado, extrada aleatoriamente e sem reposio, de uma populao com N = 2000 elementos, para estimar: (06.1) A mdia da populao. (06.2) A varincia da populao. (06.3) O percentual de elementos menores que 6. (06.4) O erro amostral da mdia.
X 0 |-- 2 2 |-- 4 4 |-- 6 6 |-- 8 8 |-- 10 f 27 51 49 48 25

(07) De uma populao com N = 4000 pessoas de uma regio foi obtida uma amostra aleatria, sem reposio, de 400 pessoas que revelou 60 analfabetos. Estime: (07.1) A proporo de analfabetos da regio. (07.2) O erro amostral do estimador proporo. (08) Uma aas de tamanho 900 extrada de uma populao bastante grande apresentou 40% de pessoas do sexo masculino. Estime o erro amostral do estimador proporo de pessoas do sexo masculino. (09) Uma populao tem mdia 500 e desvio padro 30. (09.1) Determinar a probabilidade que uma aas de 100 elementos apresentar um valor mdio superior a 504,50. (09.2) Calcule a probabilidade de que uma aas com n = 64 valores apresentar mdia entre 492,5 e 507,5. (09.3) Se uma aas de n = 144 for extrada desta populao, qual o percentual de mdias amostrais que estaro entre 495,5 e 504,5? (10) Uma populao normalmente distribuda com mdia 800 e desvio padro 60.
Prof. Lor Viali, Dr. viali@mat.ufrgs.br http://www.mat.ufrgs.br/~viali/ 16

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

(10.1) Determine a probabilidade de que uma aas de tamanho 9 apresentar mdia menor que 780. (10.2) Calcule a probabilidade de que uma aas de tamanho n = 16 tenha mdia entre os valores 781,4 e 818,6. (10.3) Que percentual de mdias amostrais de uma amostra de tamanho n = 25 estaro no intervalo [776; 824]? (11) A proporo de eleitores de um candidato 20%. (11.1) Qual a probabilidade de uma amostra aleatria simples de 100 eleitores apresentar uma proporo amostral superior a 26%? (11.2) Qual a probabilidade de uma amostra aleatria simples de 400 eleitores apresentar uma proporo de eleitores do candidato entre 17% e 23%? (11.3) Se a amostra aleatria for de 625 eleitores, qual a percentual de valores do estimador proporo amostral que estaro no intervalo [0,16864; 0,23136]? (12) Admitindo que a probabilidade nascer um menino ou uma menina seja iguais, determine a probabilidade de que das prximas 400 crianas a nascerem: (12.1) Menos de 45% sejam meninas. (12.2) Mais de 54% sejam meninos.

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/

17

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

4. RESPOSTAS DOS EXERCCIOS


(01) (1.1) 792 (1.2) 1/792

(02) (2.1) AB AC AD AE BC BD BE CD CE DE (2.2) ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE (2.3) 1/10 (2.4) 1/10 (03) (3.1) 100 (04) (4.1) 5 (05) (5.1) (a) = 7,50 (5.2) (a)
x f( x )

(3.2) 1,82 (4.2) 9,80 (b) 2 = 11,25 6 1/4 7 1/4 8 1/4 9 1/4

(3.3) 0,73 (4.3) 3,96 (c) = 0,50

(3.4) 0,52 = 52% (4.4) 0,60 = 60%

(b) E( X ) = 7,50 (c)


x f( x )

V( X ) = 3,75 6,0 1/6 7,5 2/6 9,0 1/6 10,5 1/6

4,5 1/6

(d) E( X ) = 7,50 (5.3) (a) s2 f(s2) 4,5 3/6

V( X ) = 1,25 18,0 2/6 40,5 1/6 30,375 1/6

E(S2) = 15 2 (b)
$2 s $2 ) f( s

3,375 3/6

13,500 2/6

$ 2 ) = 11,25 = 2 E( S
(c) s2 f(s2) 9 1/2 21 1/2 9 1/2 17 1/2

E(S2) = 15 2 (d)
$2 s $2 ) f( s

$ 2 ) = 11,25 = 2 E( S

(5.4) (a) p f(p) 0 1/ 6 0,5 4/ 6 1 1/ 6

(b)

E(P) = 0,50

V(P) = 1/12

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/

18

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

(c)

p f(p)

1/3 1/2

2/3 1/2 V(P) = 1/36 (6.2) s2 = 6,1628 (7.2) 1,69% (6.3) p = 63,50% (6.4) 0,1666

(d) E(P) = 0,50 (06) (6.1) x = 4,93 (07) (7.1) 60/400 = 15% (08) 1,63% (09) (9.1) 6,68% (10) (10.1) 15,87% (11) (11.1) 6,68% (12) (12.1) 2,28%

(9.2) 95,44 (10.2) 78,50% (11.2) 86,64% (12.2) 5,48%

(9.3) 92,82% (10.3) 95,44% (11.3) 95%

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/

19

SRIE: Estatstica Bsica Texto 2: AMOSTRAGEM

5. REFERNCIAS
BUSSAB, Wilton O, MORETTIN, Pedro A. Estatstica Bsica. 3. ed. So Paulo, Atual, 1986. HOFFMAN, Rodolfo. Estatstica para Economistas. So Paulo. Livraria Pioneira Editora, 1980. NETO, Pedro Luiz de Oliveira Costa. Estatstica. So Paulo, Edgard Blcher, 1977. NETO, Pedro Luiz de Oliveira Costa, CYMBALISTA, Melvin. Probabilidades: resumos tericos, exerccios resolvidos, exerccios propostos. So Paulo, Edgard Blcher, 1974. MASON, Robert D., DOUGLAS, Lind A. Statistical Techniques in Business And Economics. IRWIN, Boston, 1990. MEYER, Paul L. Probabilidade: aplicaes Estatstica. Traduo do Prof. Ruy C. B. Loureno Filho. Rio de Janeiro, Livros Tcnicos e Cientficos Editora S.A., 1978 STEVENSON, William J. Estatstica Aplicada Administrao. So Paulo. Editora Harbra, 1981. WONNACOTT, Ronald J., WONNACOTT, Thomas. Fundamentos de Estatstica. Rio de Janeiro. Livros Tcnicos e Cientficos Editora S. A., 1985.

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/

20