Você está na página 1de 26

Introduo Amostragem

Introduo amostragem
1 - Introduo1
No uma tarefa simples definir o que a Estatstica. Por vezes define-se como sendo
um conjunto de tcnicas de tratamento de dados, mas muito mais do que isso! A
Estatstica uma "arte" e uma cincia que permite tirar concluses e de uma maneira
geral fazer inferncias a partir de conjuntos de dados.
At 1900, a Estatstica resumia-se ao que hoje em dia se chama Estatstica Descritiva
ou Anlise de Dados. Apesar de tudo, deu contribuies muito positivas em vrias
reas cientficas.
A necessidade de uma maior formalizao nos mtodos utilizados, fez com que, nos
anos seguintes, a Estatstica se desenvolvesse numa outra direco, nomeadamente
no que diz respeito ao desenvolvimento de mtodos e tcnicas de Inferncia
Estatstica. Assim, por volta de 1960 os textos de Estatstica debruam-se
especialmente sobre mtodos de estimao e de testes de hipteses, assumindo
determinadas famlias de modelos, descurando os aspectos prticos da anlise dos
dados.
Porm, na ltima dcada, em grande parte devido s facilidades computacionais
postas sua disposio, os Estatsticos tm-se vindo a preocupar cada vez mais, com
a necessidade de desenvolver mtodos de anlise e explorao dos dados, que dem
uma maior importncia aos dados e que se traduz na seguinte frase "Devemos deixar
os dados falar por si".
Do que dissemos anteriormente, podemo-nos aperceber que a Estatstica uma
cincia que trata de dados e que num procedimento estatstico esto envolvidas duas
fases importantes, nomeadamente a fase que diz respeito organizao de dados Anlise de Dados, e a fase em que se procura retirar concluses a partir dos dados,
dando ainda informao de qual a confiana que devemos atribuir a essas concluses Inferncia Estatstica. Existe, no entanto, uma fase pioneira, que diz respeito
Produo ou Aquisio de Dados. Para realar a importncia desta fase
consideremos, por analogia, o que se passa quando se pretende realizar um
determinado cozinhado. Comea-se por seleccionar os ingredientes, que sero depois
manipulados de acordo com determinada receita. O resultado do cozinhado pode ser
desastroso, embora de aspecto agradvel. Efectivamente se os ingredientes no
estiverem em condies, resulta um prato de aspecto semelhante ao que se obteria
com ingredientes bons, mas de sabor intragvel. O mesmo se passa com o
procedimento estatstico. Se os dados no forem bons, embora se aplique a tcnica
correcta, o resultado pode ser desastroso, na medida em que se pode ser levado e
retirar concluses erradas.

Esta seco segue de perto o texto Introduo s Probabilidades e Estatstica de Maria Eugnia Graa
Martins, Edio da Sociedade Portuguesa de Estatstica, 2005.

Maria Eugnia Graa Martins - DEIO

Introduo Amostragem

Hoje em dia com a utilizao cada vez maior de dados nas mais variadas profisses e
nas mais diversas situaes do dia a dia, torna-se necessrio acompanhar este
processo de uma cultura estatstica que cada vez mais abarque um maior nmero de
pessoas, para que mais facilmente se consiga compreender o mundo que nos rodeia.
Sendo a Estatstica a cincia que trata dos dados, gostaramos desde j de chamar a
ateno para que fazer estatstica muito mais do que fazer clculos e manipular
frmulas. Tambm no matemtica, embora utilize a matemtica. Efectivamente, ao
fazer estatstica trabalhamos com dados, que so mais do que nmeros! Como diz
David Moore (1997) " Data are numbers, but they are not "just numbers". Data are
numbers with a context. The number 10.5, for example, carries no information by
itself. But if we hear that a friend's new baby weighed 10.5 pounds at birth, we
congratulate her on the healthy size of the child. The context engages our background
knowledge and allows us to make judgements. We know that a baby weighing 10.5
pounds is quite large, and that it isn't possible for a human baby to weigh 10.5 ounces
or 10.5 kilograms. The context makes the number informative".
Da experincia que temos no dia a dia com os dados j conclumos, com certeza, que
estes apresentam variabilidade. Por exemplo comum que um pacote de acar que
na embalagem tenha escrito um quilograma, no pese exactamente um quilograma.
Por outro lado ao pesar duas vezes o mesmo pacote, possivelmente no obteremos o
mesmo valor. Assim, ao dizermos que o peso do pacote um determinado valor, no
podemos ter a certeza que esse valor seja correcto. Esta variabilidade est presente
em todas as situaes do mundo que nos rodeia, pelo que as concluses que tiramos a
partir dos dados que se nos apresentam, tm inerente um certo grau de incerteza.
A Estatstica trata e estuda esta variabilidade apresentada pelos dados. Permite-nos a
partir dos dados retirar concluses, mas tambm exprimir o grau de confiana que
devemos ter nessas concluses. precisamente nesta particularidade que se manifesta
toda a potencialidade da Estatstica.
Podemos ento, e tal como refere David Moore em Perspectives on Contemporary
Statistics, considerar trs grandes reas nesta cincia dos dados:

Aquisio de dados

Anlise dos dados

Inferncia a partir dos dados

Neste mdulo vamos abordar o primeiro tema considerado, ou seja o que diz respeito
Aquisio de Dados, numa perspectiva em que pretendemos obter dados, a partir
dos quais seja possvel responder a determinadas questes, isto , posteriormente
retirar concluses para as Populaes a partir das quais esses dados so adquiridos
contexto em que tem sentido fazer inferncia estatstica. Vamos assim, preocupar-nos
em obter amostras representativas de Populaes que se pretendem estudar.

Introduo Amostragem

- Aquisio de dados: sondagens.


amostra. Parmetro e Estatstica.

Populao e

O mundo que nos rodeia ser mais facilmente compreendido se puder ser quantificado.
Em todas as reas do conhecimento necessrio saber o que medir e como medir.
Na Estatstica ensina-se a recolher dados vlidos, assim como a interpret-los.
Perante um conjunto de dados podem-se distinguir duas situaes:

Aquela em que o estatstico confrontado com conjuntos de dados sem ter


qualquer ideia preconcebida sobre o que que vai encontrar e ento procede a
uma anlise exploratria de dados, quase sempre utilizando processos grficos,
anlise esta que revelar aspectos do comportamento dos dados. Neste caso no
se fala em amostras, mas sim conjuntos de dados (Murteira, 1993) e de uma
maneira geral a anlise exploratria suficiente para os fins que se tm em vista;

Uma outra em que procede anlise de dados com propsitos bem definidos no
sentido de responder a questes especficas. Neste caso os dados tm que ser
produzidos ou adquiridos por meio de tcnicas adequadas de forma a que resultem
dados vlidos (amostras representativas). Estas tcnicas, em que fundamental a
interveno do acaso, revolucionaram e fizeram progredir a maior parte dos
campos da cincia aplicada. Pode-se dizer que hoje em dia no existe rea do
conhecimento para cujo progresso no tenha contribudo a Estatstica.

De entre as tcnicas de aquisio de dados, que se enquadram nesta ltima situao,


distinguem-se as
Sondagens e Experimentaes (aleatoriezadas)
O objectivo deste texto o de explorar, de uma forma simples, algumas das tcnicas
de amostragem, com vista realizao de sondagens, situaes que se encontram de
um modo geral nas Cincias Sociais, ao contrrio das Cincias experimentais, tais
como Fsica ou Qumica, em que a recolha de dados se faz fundamentalmente
recorrendo a experincias. Por exemplo, a populao constituda pelos eleitores, a
populao constituda pela contas sedeadas num banco, etc, que s contm um
nmero finito de elementos, ao contrrio da Populao conceptual de respostas
geradas por um processo qumico.
No demais realar a importncia desta fase, a que chamamos de Produo ou
Aquisio de Dados. Como referido em Tannenbaum (1998), pgina 426: Behind
every statistical statement there is a story, and like a story it has a beginning, a
middle, an end, and a moral. In this first statistics chapter we begin with the
beginning, which in statistics typically means the process of gathering or collecting
data. Data are the raw material of which statistical information is made, and in order
to get good statistical information one needs good data.

Maria Eugnia Graa Martins - DEIO

Introduo Amostragem

2.1 - Sondagens. Populao e amostra. Parmetro e Estatstica.


O objectivo de uma sondagem o de recolher informao acerca de uma populao,
seleccionando e observando um conjunto de elementos dessa populao.
Sondagem Estudo estatstico de uma populao, feito atravs de uma amostra,
destinado a estudar uma ou mais caractersticas tais como elas se apresentam nessa
populao.
Por exemplo, numa fbrica de parafusos o departamento de controlo de qualidade
pretende saber qual a percentagem de parafusos defeituosos. Tempo, custos e outros
inconvenientes impedem a inspeco de todos os parafusos. Assim, a informao
pretendida ser obtida custa de uma parte do conjunto - amostra, mas com o
objectivo de tirar concluses para o conjunto todo - populao. Se se observarem
todos os elementos da populao tem-se um recenseamento. Por vezes confunde-se
sondagem com amostragem. No entanto a amostragem diz respeito ao procedimento
da recolha da amostra qualquer que seja o estudo estatstico que se pretenda fazer,
pelo que a amostragem uma das fases das sondagens, j que estas devem incluir
ainda o estudo dos dados recolhidos, assim como a elaborao do relatrio final.
Populao o conjunto de objectos, indivduos ou resultados experimentais acerca do
qual se pretende estudar alguma caracterstica comum. As Populaes podem ser
finitas ou infinitas, existentes ou conceptuais. Aos elementos da populao chamamos
unidades estatsticas.
Amostra uma parte da populao que observada com o objectivo de obter
informao para estudar a caracterstica pretendida.
Dimenso da amostra nmero de elementos da amostra.
Dissemos anteriormente que uma Populao um conjunto de indivduos (no
necessariamente pessoas), com algumas caractersticas comuns, que se pretendem
estudar. A uma caracterstica comum, que possa assumir valores diferentes de
indivduo para indivduo, chamamos varivel. Sendo ento o nosso objectivo o estudo
de uma (ou mais) caracterstica da Populao, vamos identificar Populao com a
varivel que se est a estudar, dizendo que a Populao constituda por todos os
valores que a varivel pode assumir. Por exemplo, relativamente populao
constituda pelos portugueses adultos, se o objectivo do nosso estudo for a
caracterstica Peso, diremos que a Populao constituda por todos os valores
possveis para a varivel Peso. Do mesmo modo identificaremos amostra com os
valores observados para a varivel em estudo, sobre alguns elementos da Populao.
Assim, na continuao do exemplo referido, os valores 71 kg, 82 kg, 79 kg, 90 kg, 63
kg, 101 kg, obtidos ao pesar 6 homens portugueses, constituem uma amostra da
populao a estudar.
Geralmente, h algumas quantidades numricas acerca da populao que se
pretendem conhecer. A essas quantidades chamamos parmetros.
Por exemplo, ao estudar a populao constituda por todos os potenciais eleitores para
as legislativas, dois parmetros que podem ter interesse so:

Introduo Amostragem

idade mdia dos potenciais eleitores que esto decididos a votar;

percentagem de eleitores que esto decididos a votar.

Para conhecer aqueles parmetros, teria de se perguntar a cada eleitor a sua idade,
assim como a sua inteno no que diz respeito a votar ou no. Esta tarefa seria
impraticvel, nomeadamente por questes de tempo e de dinheiro.
Os parmetros so estimados por estatsticas, que so nmeros que se calculam a
partir dos valores da amostra. Como, de um modo geral, podemos recolher muitas
amostras diferentes, embora da mesma dimenso, teremos muitas estatsticas
diferentes, como estimativas do parmetro em estudo. Tantas as amostras diferentes
(2 amostras da amesma dimenso sero diferentes se diferirem pelo menos num dos
elementos) que se puderem obter da populao, tantas as estimativas eventualmente
diferentes que se podem calcular para o parmetro. Ento podemos considerar que
todas estas estimativas so os valores observados de uma funo dos elementos da
amostra, a que se d o nome de estimador. A esta funo tambm se d o nome de
estatstica, utilizando-se assim, indevidamente, o mesmo termo para a varivel e o
valor observado da varivel.
No caso do exemplo anterior, se estivermos interessados em estimar o parmetro ou
proporo populacional "percentagem de eleitores que esto decididos a votar" atravs
de amostras de dimenso 1000, o estimador ser a proporo amostral "percentagem
de eleitores, em 1000, que interrogados disserem estar decididos a votar". Quando se
efectivar a recolha de uma amostra (de dimenso 1000) e se, por exemplo, se concluir
que 578 eleitores esto decididos a votar, ento uma estimativa do parmetro em
estudo 57,8%. estimativa tambm se chama estatstica. Assim, depender do
contexto, interpretar a palavra estatstica como uma funo dos valores da amostra
(estimador) ou j o valor observado dessa funo para uma determinada amostra
(estimativa). nesta perspectiva que se pode dizer que:
Um parmetro uma caracterstica numrica da Populao, enquanto que a
estatstica uma caracterstica numrica da amostra.

Estas quantidades so conceptualmente distintas, pois enquanto a caracterstica


populacional parmetro, pode ser considerada um valor exacto, embora (quase
sempre) desconhecido, a caracterstica amostral estatstica, pode ser calculada,
Maria Eugnia Graa Martins - DEIO

Introduo Amostragem

embora difira de amostra para amostra, mas que todavia pode ser considerada uma
estimativa til da caracterstica populacional respectiva.

Populao
Amostra

Parmetro

Estatstica

Para que os estimadores forneam estimativas teis, necessrio que as amostras


utilizadas, para obter essas estimativas, sejam representativas das populaes de
onde foram retiradas.
Um Estimador uma funo dos elementos da amostra, que se utiliza para estimar
parmetros. Ao valor do estimador calculado para uma amostra que se recolheu, d-se
o nome de Estimativa.
Nota Do que dissemos anteriormente, no esquecer que a palavra estatstica pode
ser utilizada no sentido de estimador ou de estimativa. Tem assim de se tomar
ateno ao contexto em que est a ser utilizada.

Exemplos
1. Se estivermos interessados em estudar a mdia obtida no exame nacional de
Matemtica, no ano lectivo 2006-2007, ento a populao a estudar
constituda por todos os alunos que fizeram o exame nacional de Matemtica
nesse ano lectivo. Estamos interessados em conhecer o valor do parmetro valor mdio da varivel Nota do exame nacional de Matemtica. Para obter
uma estimativa deste parmetro, seleccionam-se alguns alunos que tenham
feito o exame, regista-se a nota obtida por cada um e calcula-se a mdia
dessas notas. O valor obtido uma estimativa do parmetro desconhecido. Por
exemplo, se seleccionarmos 10 alunos e as notas obtidas por esses 10 alunos
fossem (numa escala de 0 a 200):
125, 97, 58, 29, 101, 65, 107, 37, 29, 127
ento uma estimativa para o parmetro valor mdio das notas no exame de
Matemtica seria 77,5=

125 + 97 + 58 + 29 + 101 + 65 + 107 + 37 + 29 + 127


10

. O valor 77,5,

calculado a partir dos dados da amostra, uma estimativa. Se


seleccionssemos outra amostra de 10 alunos, as notas seriam diferentes e o
valor do estimador Mdia tambm viria diferente, dando uma estimativa
diferente da obtida anteriormente.

Introduo Amostragem

2. Suponhamos que em vez da mdia no exame nacional de Matemtica,


estvamos interessados em conhecer a proporo de positivas. O parmetro
desconhecido seria agora esta proporo. Utilizando a mesma amostra do
exemplo anterior, uma estimativa para a proporo (populacional) de positivas
no exame de matemtica, ser a proporo (amostral) de positivas na amostra,
ou seja 40%.
3. O gestor de uma agncia bancria pretende saber qual o tempo mdio que as
pessoas esperam para serem atendidas, durante o perodo de uma hora, aps a
abertura da agncia (entre as 8h30m e as 9h30m). Identificando a populao
com a varivel em estudo, podemos dizer que a populao constituda pelos
tempos de espera de todos os possveis clientes da agncia, desde que chegam
at serem atendidos, durante aquele perodo. Para estimar o parmetro tempo
mdio de espera, pode-se recolher uma amostra de tempos de espera de
alguns clientes e calcular a mdia desses tempos. Por exemplo se os tempos
(em minutos) observados em 10 clientes, escolhidos ao acaso, foram
8, 5, 12, 7, 9, 5, 4, 5, 4, 4
ento uma estimativa para o tempo mdio de espera, durante o perodo
considerado, ser 6,3 minutos (mdia dos valores anteriores).
4. A lista X candidata a dirigir a Associao de estudantes de uma dada
universidade pretende saber se ter a maioria de votos nas prximas eleies,
que se avizinham. Assim, pediu ao Departamento de Estatstica da sua
Universidade que realizassem uma sondagem que lhes permitisse ter uma ideia
do que os esperaria se se candidatassem. O Departamento de Estatstica
procedeu recolha de uma amostra de 150 estudantes, potenciais eleitores, a
quem perguntou se pensavam votar na lista X. Dos 150 inquiridos, 87
responderam que sim, pelo que uma estimativa para a proporo de alunos
que pensa votar na lista X de 58%.
5. O Conselho executivo da escola pretende reivindicar uma melhoria nos
transportes pblicos, alegando que os alunos esperam muito tempo, na
paragem, quando saem da parte da tarde. Assim, encarregou um grupo de
alunos para, entre as 15 e as 19 horas, durante alguns dias, registarem os
tempos entre passagens sucessivas dos autocarros da carreira que serve a
escola. A mdia dos valores registados fornecer uma estimativa para o tempo
mdio entre as passagens dos autocarros da carreira. Se a mdia obtida for
superior ao estipulado pela Carris, ento haver efectivamente lugar para a
reivindicao.

Maria Eugnia Graa Martins - DEIO

Introduo Amostragem

3 Amostra enviesada. Amostra aleatria e amostra


no aleatria.
Uma amostra que no seja representativa da Populao diz-se enviesada e a sua
utilizao pode dar origem a interpretaes erradas.
Um processo de amostragem diz-se enviesado quando tende sistematicamente a
seleccionar elementos de alguns segmentos da Populao, e a no seleccionar
sistematicamente elementos de outros segmentos da Populao.
Surge assim, a necessidade de fazer um planeamento da amostragem, onde se decide
quais e como devem ser seleccionados os elementos da Populao, com o fim de
serem observados, relativamente caracterstica de interesse.
Amostra aleatria e amostra no aleatria Dada uma populao, uma amostra
aleatria uma amostra tal que qualquer elemento da populao tem alguma
probabilidade de ser seleccionado para a amostra. Numa amostra no aleatria, alguns
elementos da populao podem no poder ser seleccionados para a amostra.
A seguir apresentamos exemplos de ms amostras ou amostras enviesadas e resultado
da sua aplicao:


Amostra 1 - A SIC pretende saber qual a percentagem de pessoas que a favor


da despenalizao do aborto. Para isso indicou dois nmeros de telefone, um
dos quais para as respostas SIM e o outro para a resposta NO.
Resultado - A utilizao da percentagem de respostas positivas como indicao
da percentagem da populao portuguesa que a favor da despenalizao do
aborto enganadora. Efectivamente s uma pequena percentagem da
populao responde a estas questes e de um modo geral tendem a ser
pessoas com a mesma opinio.

Amostra 2 - Uma estao de televiso preparou um debate sobre o aumento de


criminalidade, onde enfatizou o facto de ter aumentado o nmero de crimes
violentos. Ao mesmo tempo decorria uma sondagem de opinio sobre se as
pessoas eram a favor da implementao da pena de morte. Esta recolha de
opinies era feita no molde descrito no exemplo anterior, isto , por resposta
voluntria.
Resultado - A utilizao da percentagem de SIMs, que naturalmente se espera
elevada, d uma indicao errada sobre a opinio da populao em geral. As
pessoas influenciadas pelo debate e pelo medo da criminalidade sero levadas a
telefonar dando indicao de estarem a favor da pena de morte.

Amostra 3 - Opinies de alguns leitores de determinada revista tcnica, para


representar as opinies dos portugueses em geral.
Resultado - Diferentes tipos de pessoas lem diferentes tipos de revistas, pelo
que a amostra no representativa da populao. Basta pensar que, de um
modo geral, a populao feminina ainda no adere s revistas tcnicas como a

Introduo Amostragem

populao masculina. A amostra daria unicamente indicaes sobre a populao


constituda pelos leitores da tal revista.


Amostra 4 - Utilizar alguns alunos de uma turma, para tirar concluses sobre o
aproveitamento de todos os alunos da escola.
Resultado - Poderamos concluir que o aproveitamento dos alunos pior ou
melhor do que na realidade . As turmas de uma escola no so todas
homogneas, pelo que a amostra no representativa dos alunos da escola.
Poderia servir para tirar concluses sobre a populao constituda pelos alunos
da turma.

Amostra 5 - Utilizar os jogadores de uma equipa de basquete de uma


determinada escola para estudar as alturas dos alunos dessa escola.
Resultado - O estudo concluiria que os estudantes so mais altos do que na
realidade so.

Normalmente obtm-se amostras enviesadas quando existe a interveno do factor


humano. Com o objectivo de minimizar o enviesamento, no planeamento da escolha
da amostra deve ter-se presente o princpio da aleatoriedade de forma a obter uma
amostra aleatria.
Quando se pretende recolher uma amostra de dimenso n, de uma Populao de
dimenso N, podemos recorrer a vrios processos de amostragem. Como o nosso
objectivo , a partir das propriedades estudadas na amostra, inferir propriedades para
a Populao, gostaramos de obter processos de amostragem que dem origem a
bons estimadores e consequentemente boas estimativas.
Acontece que as propriedades dos estimadores, como veremos num mdulo seguinte,
s podem ser estudadas se conseguirmos estabelecer um plano de amostragem que
atribua a cada amostra seleccionada uma determinada probabilidade, e esta atribuio
s pode ser feita com planos de amostragem aleatrios. Assim, importante termos
sempre presente o princpio da aleatoriedade, quando vamos proceder a um estudo em
que procuramos alargar para a Populao as propriedades estudadas na amostra.
Seguidamente apresentaremos alguns dos planeamentos mais utilizados para
seleccionar amostras aleatrias. Dos vrios tipos de planeamento utilizados, destacamse os que conduzem a amostras aleatrias simples (sem reposio), amostras
sistemticas, amostras estratificadas e amostras aleatrias com reposio.

Maria Eugnia Graa Martins - DEIO

10

Introduo Amostragem

3.1 Amostragem aleatria simples


O plano de amostragem aleatria mais bsico o que permite obter a amostra
aleatria simples:
Amostra aleatria simples Dada uma populao de dimenso N, uma amostra
aleatria simples, de dimenso n, um conjunto de n unidades da populao, tal que

N
conjuntos diferentes de n unidades, teria igual
n

qualquer outro conjunto dos

probabilidade de ser seleccionado.


Se de uma Populao com dimenso N, se selecciona uma amostra aleatria simples
(a.a.s.) de dimenso n, qual a probabilidade de esta amostra ser seleccionada?
De acordo com a definio dada anteriormente para a.a.s., vem que cada amostra tem

N
a mesma probabilidade, igual a
n

de ser seleccionada.

A seleco dos elementos da amostra pode ser feita em bloco ou pode ser escolhida
sequencialmente da populao, escolhendo um elemento de cada vez, sem
reposio, pelo que em cada seleco cada elemento tem a mesma probabilidade de
ser seleccionado. Tendo em considerao as probabilidades de escolher estes
elementos (sequencialmente), confirma-se que a probabilidade de cada amostra

N

n

, como se apresenta a seguir:

1 elemento

2 elemento

3 elemento

n
N

n 1
N 1

n2
N 2

...
...

e-nsimo elemento

n (n 1)
=
N (N 1)

Probabilidade da amostra

n! (N n)!
1
=
N!
N

n

Ser que um esquema de amostragem aleatria simples implica que cada elemento da
Populao tenha igual probabilidade de ser seleccionado?
Sim. Um esquema de amostragem aleatria simples, conduz a que cada elemento da
Populao tenha a mesma probabilidade de ser seleccionado para a amostra, podendose demonstrar que igual a

n
N

Efectivamente, para demonstrar este resultado, basta fazer o seguinte raciocnio: o


N - 1

,
nmero de amostras de n elementos que no contm um qualquer elemento
n

donde a probabilidade de um qualquer elemento no ser includo (nmero de casos

Introduo Amostragem

11

N - 1

favorveis sobre o nmero de casos possveis)


/ =
n n
de um qualquer elemento ser seleccionado (1- N n )=
N

n
N

Nn
N

. Ento, a probabilidade

Num esquema de amostragem aleatria simples, verifica-se que cada elemento da


populao tem igual probabilidade de ser seleccionado para a amostra.
Nota No entanto, existem outros esquemas de amostragem em que cada elemento
tem igual probabilidade de ser seleccionado, sem que cada conjunto de n elementos
tenha a mesma probabilidade de ser seleccionado e portanto no uma amostra
aleatria simples. o que se passa, por exemplo, com a amostragem aleatria
sistemtica, em determinadas situaes particulares, como veremos na seco
seguinte.

Exemplo prtico 1 Processo para obter uma amostra aleatria


simples
Vamos exemplificar um processo para obter uma amostra aleatria simples.
Consideremos a populao constituda pelos 18 alunos de uma turma do 10 ano de
uma determinada Escola Secundria, em que a varivel de interesse a estudar a
altura desses alunos, ou mais propriamente, estamos interessados em conhecer o
parmetro valor mdio da caracterstica altura. Uma maneira possvel de recolher
desta populao uma amostra aleatria, seria escrever cada um dos indicadores (n do
aluno, nome, ) dos elementos da populao num quadrado de papel, inserir todos
esses bocados de papel numa caixa e depois seleccionar tantos quantos a dimenso da
amostra desejada. Se os alunos estiverem numerados de 1 a 18, inserem-se numa
caixa 18 quadrados de papel, cada um com o seu nmero e de seguida seleccionam-se
tantos quantos a dimenso desejada para a amostra. Aos alunos cujos nmeros foram
seleccionados, pergunta-se qual a altura e regista-se. Admitindo que se seleccionou
uma amostra de dimenso 5 e que as alturas dos alunos seleccionados foram 144 cm,
134 cm, 148 cm, 150 cm e 139 cm, uma estimativa para a altura mdia da turma ser
144 + 134 + 148 + 150 + 139
5

= 143 cm.

A recolha tem de ser feita sem reposio pois quando se retira um papel (elemento
da populao), ele no reposto enquanto a amostra no estiver completa (com a
dimenso desejada). Qualquer conjunto de nmeros recolhidos desta forma dar
origem a uma amostra aleatria simples (desde que se tenha o cuidado de cortar os
bocadinhos de papel todos do mesmo tamanho, para ficarem semelhantes, e de os
baralhar convenientemente), constituda pelas alturas dos alunos seleccionados. A
partir de cada amostra, pode-se calcular o valor da estatstica mdia, que ser uma
estimativa do parmetro a estudar - valor mdio da altura dos alunos da turma. Obterse-o tantas estimativas, quantas as amostras retiradas.
Chama-se a ateno para o facto de nesta fase no se poder dizer qual das estimativas
"melhor", isto , qual delas a melhor aproximao do parmetro a estimar, j que
esse parmetro desconhecido (obviamente que nesta populao to pequena seria
possvel estudar exaustivamente todos os seus elementos, no sendo necessrio
recolher nenhuma amostra - este exemplo s serve para ilustrar uma situao)!

Maria Eugnia Graa Martins - DEIO

12

Introduo Amostragem

O processo que acabmos de descrever no prtico se a populao a estudar tiver


dimenso elevada. Vamos exemplificar um processo expedito, utilizando o Excel.



1 passo inserir os nomes (ou outra identificao, como por exemplo o


nmero) dos alunos numa folha de Excel
2 passo utilizando a funo RAND(), atribuir um nmero aleatrio a cada
aluno. Para isso basta inserir a funo na clula B1 e replic-la at clula B18.
Como esta funo voltil, isto , muda quando se recalcula a folha, copiamos
os valores gerados e atravs do Edit, fazemos um Paste Special - Values, para a
coluna C, como se apresenta na figura da esquerda (repare-se que os valores
que estavam inicialmente na coluna B foram alterados, devido ao facto de a
funo RAND() ser voltil, como referimos anteriormente):

Embora os nmeros anteriores sejam referidos como aleatrios, convm ter


presente que os nmeros que se obtm so pseudo-aleatrios, j que um
mecanismo determinista que lhes d origem, embora se comportem como nmeros
aleatrios (passam uma bateria de testes destinados a confirmar a sua
aleatoriedade);



3 passo ordenar o ficheiro, utilizando como critrio a coluna C


4 passo seleccionar para elementos da amostra os primeiros 5 alunos da
coluna A. Como se verifica no lado direito da figura anterior, os cinco alunos
seleccionados foram o Andr, a Isabel, a Helena, o Miguel e o Pedro.

Este processo pode ser generalizado para qualquer dimenso da Populao e qualquer
dimenso da amostra.
O nmero de amostras aleatrias simples, de dimenso 5, que se podem extrair de
18
).
5

uma populao de dimenso 18 igual a 8568 (

Assim, pode-se utilizar o mesmo

processo para obter outras amostras aleatrias simples de dimenso 5, j que a


probabilidade de obter 2 amostras iguais extremamente pequena (0,0001).

Introduo Amostragem

13

3.2 - Amostra aleatria sistemtica


Mesmo considerando a tecnologia, se a dimenso da populao for grande o processo
anterior torna-se algo trabalhoso. Ento uma alternativa considerar uma amostra
aleatria sistemtica. Por exemplo, se pretendermos seleccionar uma amostra de 150
alunos de uma Universidade com 6000 alunos, considera-se um ficheiro com o nome
dos 6000 alunos, ordenados, por exemplo, por ordem alfabtica. Considera-se o
quociente 6000/150=40 e dos primeiros 40 elementos da lista, selecciona-se um
aleatoriamente. A partir deste elemento seleccionamos sistematicamente todos os
elementos distanciados de 40 unidades. Assim, se o elemento seleccionado
aleatoriamente de entre os primeiros 40, foi o 27, os outros elementos a serem
seleccionados so o 67, 107, 147, etc. Obviamente que o quociente entre a dimenso
da populao e a da amostra no necessariamente inteiro, como anteriormente, mas
no h problema pois considera-se a parte inteira desse quociente.
Amostra aleatria sistemtica Dada uma populao de dimenso N, ordenada por
algum critrio, se se pretende uma amostra de dimenso n, escolhe-se aleatoriamente
um elemento de entre os k primeiros, onde k a parte inteira do quociente N/n. A
partir desse elemento escolhido, escolhem-se todos os k-simos elementos da
populao para pertencerem amostra.
A amostra aleatria sistemtica no uma amostra aleatria simples, j que nem
todas as amostras possveis, de dimenso n, tm a mesma probabilidade de serem
seleccionadas. No entanto, se o quociente N/n for inteiro, mostra-se que a
probabilidade de qualquer elemento ser seleccionado igual a n/N. Pensemos nos N
elementos colocados em crculo e seja N=nk. Comecemos por fixar uma posio inicial
N

j. A probabilidade de um elemento A ser seleccionado igual a

j=1

posio inicial j) P(posio inicial ser j) =

Nn N1 = Nn .
j=1

Maria Eugnia Graa Martins - DEIO

P(Aamostra/

14

Introduo Amostragem

Exemplo prtico 2 Processo para obter uma amostra aleatria


sistemtica
Consideremos o ficheiro do exemplo anterior de onde pretendemos seleccionar 5
alunos, de forma sistemtica. Como a dimenso da populao 18, selecciona-se
aleatoriamente 1 elemento de entre os 3 (parte inteira de 18/5) primeiros. Para isso
utilizamos a funo RANDBETWEEN (i;j), que devolve um nmero aleatrio, inteiro,
entre i e j. No nosso caso considermos i=1 e j=3 e o valor devolvido foi o 2 (poderia
ter sido tambm o 1 ou o 3). De seguida seleccionam-se os elementos cujos nmeros
estejam espaados de 3 unidades, at completar a dimenso da amostra:

Nota Ver na pgina 18 um processo de seleccionar uma amostra sistemtica,


utilizando a funo Sampling do Excel.

Introduo Amostragem

15

3.3 - Amostra estratificada


Pode acontecer que a populao possa ser subdividida em vrias sub populaes, mais
ou menos homogneas relativamente caracterstica a estudar. Por exemplo, se se
pretende estudar o salrio mdio auferido pelas famlias lisboetas, possvel dividir a
regio de Lisboa segundo zonas mais ou menos homogneas, estratos, quanto
caracterstica em estudo salrio de uma famlia portuguesa, e posteriormente extrair
de cada um destes estratos uma percentagem de elementos que iro constituir a
amostra, sendo esta percentagem, de um modo geral, proporcional dimenso dos
estratos.
Amostra estratificada Divide-se a populao em vrias sub populaes estratos,
e de cada um destes estratos extrai-se aleatoriamente uma amostra. O conjunto de
todas estas amostras constitui a amostra pretendida.
A seleco de uma destas amostras no oferece dificuldade, a partir do momento em
que os estratos estejam definidos. Os diferentes estratos so considerados como sendo
populaes distintas, pelo que de cada uma destas populaes basta seleccionar uma
amostra aleatria simples, utilizando o processo j considerado anteriormente.

3.4 Amostragem com reposio


Nos esquemas de amostragem anteriormente referidos, utiliza-se a amostragem sem
reposio, j que um elemento da populao que seja seleccionado para a amostra,
no volta a ser reposto, antes de se seleccionar o seguinte. Na amostragem com
reposio, sempre que um elemento seleccionado, reposto na populao.
O tratamento estatstico das propriedades dos estimadores mais simples na
amostragem com reposio do que na amostragem sem reposio, j que existe
independncia entre os elementos seleccionados. No entanto, como veremos no
mdulo de Introduo Estimao, a amostragem sem reposio mais eficiente
do que a com reposio. Esta propriedade de certo modo intuitiva, pois se
recolhermos informao sobre elementos que anteriormente j tinham sido recolhidos,
no estamos a acrescentar nada de novo.
Veremos tambm que se a populao for muito grande2, as amostragens sem e com
reposio so equivalentes. Esta propriedade tambm intuitiva, pois se a dimenso
da populao for muito grande, a probabilidade de o mesmo elemento ser seleccionado
2 vezes muito pequena.
Dada uma populao de dimenso N, referir-nos-emos a uma amostra aleatria, de
dimenso n, com reposio, como um conjunto de n unidades da populao, tal que
qualquer outro conjunto dos Nn conjuntos diferentes de n unidades, teria igual
probabilidade de ser seleccionado.

Mais frente diremos o que se entende por uma populao muito grande.

Maria Eugnia Graa Martins - DEIO

16

Introduo Amostragem

A probabilidade de cada uma das amostras ser seleccionada igual a 1/Nn. Fazendo
um esquema idntico ao considerado para obter a probabilidade de uma amostra
aleatria simples, temos, agora para o caso da seleco ser feita com reposio:
1 elemento

2 elemento

1
N

3 elemento

1
N

...
...

e-nsimo elemento

Probabilidade da amostra

1
N

1
Nn

Exemplo - Seleco com reposio e sem reposio


Colocaram-se (Adaptado de Graa Martins, et al, 1999) numa caixa 3 papis com o
nome de 3 meninas: Ana, Maria e Filipa. Considere a seleco de amostras de
dimenso 2, isto , a experincia aleatria que consiste em retirar da caixa 2 papis e
verificar os nomes que saram. Quais as amostras possveis? Para responder a esta
questo necessrio saber se a extraco se faz com reposio, isto , se uma vez
retirado um papel e verificado o nome se volta a colocar o papel na caixa, antes de
proceder extraco seguinte, ou se a extraco feita sem reposio, isto , uma
vez retirado um papel, ele no reposto antes de se proceder prxima extraco. No
esquema seguinte procuramos representar as duas situaes:

Admitimos que na 1 extraco saiu o papel com o nome da Maria. Na 2 extraco,


saiu o nome da Filipa nos dois casos, mas na extraco com reposio havia uma
possibilidade em trs de ele sair, tal como na 1 extraco, enquanto que na extraco
sem reposio havia uma possibilidade em duas de ele sair. Quer dizer que neste caso
havia uma maior probabilidade de sair o nome da Filipa. Os conjuntos de amostras
possveis Sc e Ss correspondentes s duas situaes com reposio e sem reposio,
so respectivamente:
Sc = {(Ana, Ana), (Ana, Maria), (Ana, Filipa), (Maria, Ana), (Maria, Maria), (Maria, Filipa), (Filipa, Ana);
(Filipa, Maria), (Filipa, Filipa)}
Ss = {(Ana, Maria), (Ana, Filipa), (Maria, Ana), (Maria, Filipa), (Filipa, Ana), (Filipa, Maria)}.

Introduo Amostragem

17

Exemplo prtico 3 Processo para obter uma amostra aleatria com


reposio
Considere a populao constituda pelos deputados da actual Legislatura (X
Legislatura), que se pode obter a partir da pgina da Assembleia da Republica, e que
apresentamos em anexo. Uma parte dessa tabela apresentada a seguir, numa folha
de Excel:

Na tabela anterior a coluna das idades foi acrescentada, tendo a idade de cada
deputado sido calculada data de 31/12/2007.
Admitamos que estamos interessados em estimar o parmetro idade mdia dos
deputados, a partir de amostras de dimenso 10. Vamos exemplificar a utilizao do
Excel, na obteno de uma amostra aleatria, com reposio. Consideraremos dois
processos: num dos processos utilizaremos a funo Sampling e no outro a funo
Randbetween.
Processo de seleco da amostra aleatria com reposio, utilizando a funo
Sampling
Para utilizar este procedimento tem de se comear por verificar nos Tools se existe a
opo Data Analysis. Caso no exista tem de se instalar, para o que basta aceder ao
menu Tools, escolher o comando Add-Ins e seleccionar a opo Analysis ToolPack e
clicar OK.
Processo de seleco da amostar:
a) Seleccione Tools Data Analysis Sampling.
Na janela que se abre

Maria Eugnia Graa Martins - DEIO

18

Introduo Amostragem

em Input Range inserimos os endereos da coluna que contm os elementos da


populao de onde se vai seleccionar a amostra; em Number of Samples inserimos o
nmero de elementos que queremos seleccionar e em Output Range inserimos o
endereo da clula para onde tencionamos colocar o 1 elemento dos elementos
seleccionados. O resultado da operao anterior, depois de clicar o OK :

Observao 1 A populao de onde pretendemos seleccionar os elementos tem de


ser constituda por valores numricos. Este procedimento no serviria para seleccionar
uma amostra de 10 nomes de deputados.
Observao 2 A funo Sampling tambm pode ser utilizada para seleccionar uma
amostra sistemtica, com perodo k, desde que tenhamos o seguinte cuidado: em
Input Range colocamos os endereos das clulas onde esto os elementos da
populao, mas a iniciar na posio do 1 elemento que seleccionamos para a
amostra, que um nmero aleatrio entre a posio 1 e k. Por exemplo, admitindo
que pretendemos seleccionar uma amostra sistemtica de 10 elementos, dos primeiros
23 (=230/10) elementos seleccionamos um ao acaso. Admitamos que sau o 15. Isto
significa que o elemento da populao na posio 15 (clula $H$16) o primeiro
elemento a ser seleccionado para a amostra. Colocamo-lo na clula $M$2. Ento em
Input Range colocamos $H$17:$H$231, em Period escrevemos 23 e em Output Range
escrevemos $M$3. Clicando em OK a funo Sampling selecciona os 9 elementos que

Introduo Amostragem

19

faltavam para a amostra, nomeadamente os elementos das posies 38 = 15+23


(clula $H$39), 61=15+2x23 (clula $H$62), 84=15+3x23 (clula $H$85), ...,
222=15x9x23 (clula $H$223):
A amostra obtida encontra-se na coluna M:

Processo de seleco da amostra aleatria com reposio, utilizando a funo


RANDBETWEEN
A partir da tabela inicial com a idade dos deputados, construmos uma outra tabela,
em que inserimos, esquerda da coluna dos nomes, uma coluna com um nmero, de
1 a 230. Para tornar a tabela mais simples, eliminamos as colunas respeitantes ao
Partido, Crculo eleitoral, Sexo e Data de nascimento:

Processo de seleco da amostra:


a) Utilizar a funo RANDBETWEEN (a;b), com a=1 e b=230, para obter um
nmero aleatrio, inteiro, entre 1 e 230;
b) Replicar essa frmula mais 9 vezes para obter uma amostra de 10 nmeros de
deputados. A utilizao desta frmula vrias vezes, simula a extraco, com
reposio, j que pode sair repetidas vezes o mesmo nmero:

Maria Eugnia Graa Martins - DEIO

20

Introduo Amostragem

c) Uma vez que a funo RANDBETWEEN(;) voltil, fazer o Paste Special


Values, para outras clulas, dos 10 valores obtidos:

Colmos na coluna G, os 10 valores obtidos na coluna E, e so estes os


nmeros dos deputados a quem vamos recolher a informao sobre a Idade.
Observe-se que agora os valores obtidos na coluna E, j so outros, pois como
se disse, a funo RANDBETWEEN(;) voltil e altera, sempre que se recalcula
a folha;
d) Para obter as idades dos deputados cujos nmeros foram seleccionados, vamos
utilizar funo do Excel VLOOKUP que, com os argumentos utilizados, devolve o
elemento da 3 coluna (coluna das idades) da matrix constituda pelos dados
dos deputados (3 colunas), que corresponde ao nmero do deputado
seleccionado para a amostra (coluna G):

Esta funo vai devolver o valor 41, que a idade do deputado nmero 127.
Replicamos esta frmula pelas clulas I3:I11, obtendo as idades dos 10
deputados seleccionados:

Introduo Amostragem

21

e) Uma estimativa para a idade mdia dos deputados, obtm-se calculando a


mdia das idades dos 10 deputados seleccionados anteriormente, e que 44,5
anos.
A funo VLOOKUP(a, b; c) pode ser utilizada para seleccionar uma amostra de
elementos no numricos. Por exemplo no caso anterior se estivermos interessados
nos nomes dos deputados com os nmeros 127, 207, ..., 196, basta no terceiro
argumento da funo, ou seja no lugar do c, escrever o 2, para significar que
pretendemos seleccionar os elementos na 2 coluna.

No esquecer que se estivessemos interessados em seleccionar uma comisso de


deputados para realizarem determinado trabalho, este processo de seleco no
deveria ser utilizado, j que o mesmo deputado pode ser seleccionado mais do que
uma vez. Nesta situao s teria sentido fazer uma seleco sem reposio.

Maria Eugnia Graa Martins - DEIO

22

Introduo Amostragem

Exerccios
1.1 - Populao, Amostra, Varivel de interesse, Parmetro de interesse,
Estatstica utilizada
Identifique, no que se segue, Populao e Amostra:
a) Numa determinada empresa, pretende-se saber qual o salrio mdio dos seus
empregados, pelo que se recolheu informao sobre os salrios mensais, auferidos
pelos empregados dessa empresa;



Populao empregados da empresa.


Varivel de interesse - Salrio auferido por um empregado, escolhido ao acaso, da populao

anterior.
Parmetro salrio mdio dos empregados. Como se recolheu informao sobre o salrio de todos
os empregados, a mdia dos valores obtidos d o valor do salrio mdio pretendido.

b) Prendia-se saber a nota mdia obtida na prova global de Matemtica no ano lectivo
2000-2001, dos alunos do 10 ano da Escola Secundria Prof. Herculano de Carvalho,
pelo que se recolheu informao sobre as notas obtidas nessa disciplina por todos os
alunos da Escola;


Populao alunos do 10 ano, que realizaram a prova global de Matemtica no ano lectivo 20002001.




Varivel de interesse - Nota obtida por um aluno, escolhido ao acaso, da populao anterior.
Parmetro nota mdia obtida pelos alunos da populao anterior. Como se recolheu informao
sobre a nota de todos os alunos, a mdia destas notas d o valor da nota mdia pretendida.

c) Pretendia-se averiguar a idade mdia dos alunos do 10 ano da Escola Secundria


Prof. Herculano de Carvalho, no ano lectivo 2007/2008, pelo que se recolheu
informao sobre a idade de 45 alunos do 10 ano dessa Escola;


Populao - alunos do 10 ano da Escola Secundria Prof. Herculano de Carvalho, no ano lectivo




2007/2008.
Varivel de interesse - Idade de um aluno, escolhido ao acaso, da populao anterior.
Parmetro idade mdia dos alunos do 10 ano da Escola Secundria Prof. Herculano de Carvalho,

no ano lectivo 2007/2008.


Amostra - conjunto das idades dos 45 alunos seleccionados (como j foi referido, estamos a
identificar os indivduos da amostra, com os valores observados, da varivel de interesse, sobre

esses indivduos .
Estatstica - A mdia das idades dos 45 alunos a estatstica que se utiliza como estimatva do
parmetro pretendido, ou seja, da idade mdia.

d) Pretendia-se averiguar a quantidade de vinho (em litros) produzida no Alentejo, no


ano de 1999, pelo que se recolheu informao sobre as quantidades de vinho
produzidas por 10 agricultores da regio do Alentejo;



Populao conjunto dos agricultores do Alentejo que produziram vinho em 1999.


Varivel de interesse - quantidade de vinho produzida por um agricultor, escolhido ao acaso, da
populao anterior.





Parmetro quantidade total de litros produzida pelos agricultores do Alentejo no ano de 1999.
Amostra quantidades de litros produzidas pelos 10 agricultores seleccionados.
Estatstica - mdia das quantidades de litros produzidas pelos 10 agricultores, vezes o nmero total
de agricultores da populao considerada.

e) Pretendia-se saber o salrio mdio auferido pelos trabalhadores da indstria txtil,


pelo que se recolheu informao sobre os salrios mensais auferidos por 250 desses
trabalhadores;



Populao conjunto dos trabalhadores da indstria txtil.


Varivel de interesse - salrio auferido por um trabalhador, escolhido ao acaso, da populao

anterior.
Parmetro salrio mdio auferido pelos trabalhadores da indstria txtil.

Introduo Amostragem




23

Amostra salrios auferidos pelos 250 trabalhadores seleccionados.


Estatstica - mdia dos valores da amostra.

f) Pretendia-se averiguar a quantidade mensal (em kg) de batata consumida nos lares
portugueses, pelo que se recolheu informao sobre as quantidades de batata
consumidas mensalmente em 100 lares portugueses;


Populao conjunto dos lares portugueses.




Varivel de interesse quantidade de quilos de batata, consumidos mensalmente num lar


portugus, escolhido aoa acaso.
Parmetro quantidade mdia de batata consumida mensalmente, nos lares portugueses.




Amostra quantidades de quilos de batata consumidos nos 100 lares seleccionados.


Estatstica - mdia dos valores da amostra considerada.

g) Pretendia-se estudar a eficcia de um medicamento novo para curar determinada


doena, pelo que se seleccionaram 20 doentes padecendo dessa doena;



Populao conjunto dos doentes padecendo da doena em estudo.


Parmetro percentagem de curas que se obtm, utilizando o medicamento.




Amostra conjunto dos 20 doentes seleccionados, a quem se deu o medicamento.


Estatstica percentagem de curas obtidas, nos 20 doentes seleccionados.

h) Pretendia-se averiguar o n de carros vendidos num dia por um stand de


automveis, pelo que se investigou junto de por cada um dos 5 empregados desse
stand, quantos carros tinha vendido;



Populao os 5 vendedores do stand de automveis.


Parmetro total de carros vendidos pelos 5 vendedores. Como se investigou o nmero de carros
que cada vendedor tinha vendido, o total de carros d o valor do parmetro pretendido.

i) Pretendia-se averiguar o nmero de leitores dos jornais dirios (editados em


Portugal), pelo que se investigou junto de 6 jornais dirios, o nmero de leitores;




Populao conjunto dos jornais dirios.


Parmetro nmero total de leitores de jornais dirios.
Amostra nmero de leitores dos 6 jornais dirios.

Estatstica nmero total de leitores dos 6 jornais seleccionados para a amostra vezes N/6, em que
N o nmero de jornais dirios.

j) Pretendia-se averiguar a percentagem de raparigas que frequentam a FCUL, no ano


lectivo de 2007/2008, pelo que se seleccionaram 50 alunos dessa faculdade;



Populao conjunto dos alunos que frequentam a FCUL, no ano lectivo de 2007/2008.
Parmetro percentagem de raparigas na populao anterior.




Amostra conjunto dos 50 alunos seleccionados.


Estatstica percentagem de raparigas na amostra anterior.

Parmetro e Estatstica
1.2 - Diga se so verdadeiras ou falsas as seguintes afirmaes:
a) Uma estatstica um nmero que se calcula a partir dos dados da amostra;
Verdadeiro (Chamamos, no entanto, a ateno para o facto de tambm interpretarmos estatstica como uma
funo que s depende dos valores da amostra e no depende de parmetros desconhecidos. Ao valor
observado desta funo, para uma dada amostra que se observou, tambm usual dar o nome de
estatstica. Assim, neste caso, estatstica seria um nmero).

b) Os parmetros utilizam-se para estimar estatsticas;


Falso.

c) A mdia populacional um parmetro;


Verdadeiro.

d) Um parmetro uma caracterstica numrica da varivel que se est a estudar na


Populao.
Verdadeiro.

1.3 - Identifique cada uma das quantidades seguintes, a carregado, como parmetro
ou estatstica:

Maria Eugnia Graa Martins - DEIO

24

Introduo Amostragem

a) Nas ltimas eleies para a Associao de Estudantes da Escola, 67% dos


estudantes que votaram, fizeram-no na lista vencedora;
Parmetro.

b) Para obter uma estimativa do nmero de irmos dos alunos que frequentam o 4
ano de uma escola bsica, perguntou-se a 30 alunos, escolhidos ao acaso, quantos
irmos tinham. Verificou-se que em mdia, tinham 1.5 irmos.
Estatstica.

c) Dos 230 deputados que compunham a VIII legislatura, 21.3% eram mulheres.
Parmetro.
d) Perguntou-se a 80 deputados qual o partido que representavam, tendo-se concludo
que 49% representavam o PS.
Estatstica. (A populao constituda por 230 deputados).

e) Perguntou-se a 10 deputados qual a sua idade, tendo-se concludo que a mdia das
idades era de 45 anos.
Estatstica.

Amostras enviesadas e amostras aleatrias


1.4 - (Adaptado de Rossman, 2001) Considere a Populao constituda pelos
deputados da X legislatura, que se encontra em anexo. Seleccione 5 deputados de que
j tenha ouvido falar.
a) Estes deputados constituem uma amostra ou uma populao?
Constituem uma amostra.

b) Quantos deputados, nos 5 seleccionados, pertencem ao crculo eleitoral da sua


residncia?
c) Suponha que est interessado em estudar o n mdio de anos de servio dos
deputados que constituem a X legislatura. Considera o conjunto de deputados
seleccionados representativos da populao? Porqu?
No. Ao seleccionarmos deputados de que j tenhamos ouvido falar, natural que eles j tenham pertencido
a legislaturas anteriores, pelo que os valores obtidos para o nmero de anos ao servio, so superiores ao
que seria de esperar, se a seleco fosse aleatria.

d) Se calculasse a mdia dos anos de servio dos deputados seleccionados esperava


obter um valor superior ou inferior ao da mdia populacional?
Tendo em conta a resposta alnea anterior, ao calcularmos a mdia dos nmeros de anos de servio, de
esperar obter um valor maior do que o da mdia populacional.

e) Se na sua aula ou outros colegas seleccionassem conjuntos de 5 deputados, pelo


mesmo processo, isto , deputados que lhe sejam familiares, espera que a mdia dos
anos de servio, tenha a mesma tendncia, de sistematicamente exibir um
enviesamento em determinado sentido? Explique.
Sim. Como estamos sistematicamente a escolher deputados conhecidos, de esperar que estejam h mais
anos no Parlamento.

f) Se tivesse seleccionado pelo mesmo processo 10 deputados, obteria uma amostra


mais representativa do que a constituda pelos 5 deputados? Explique.
No. Se o processo de seleco da amostra for enviesado, que o caso, aumentar a dimenso da amostra
no elimina o problema.

1.5 - Para que uma amostra seja representativa da populao, basta que cada
elemento da populao tenha igual probabilidade de ser seleccionado?
No. Pode acontecer que cada elemento da populao tenha igual probabilidade de ser seleccionado e no
entanto a amostra no ser representativa. Considere por exemplo uma populao constituda por um certo
nmero de estratos, com igual nmero de elementos: por exemplo, uma populao constituda por 6
estratos, estrato 1, estrato 2, ..., estrato 6, com igual nmero de elementos. Lana um dado e se sair a face
i, com i=1,...,6, selecciona o estrato i. Depois selecciona todos os elementos deste estrato. A amostra
resultante no representativa da populao dada.

Introduo Amostragem

25

Projectos
1 - Numa empresa de 97 trabalhadores, pretende-se seleccionar aleatoriamente 10
trabalhadores para integrarem uma comisso que se encarregar da festa de Natal.
Como sugere que se faa a recolha da amostra? Com ou sem reposio? Explique
porqu. Obtenha uma dessas amostras.
Trabalhadores da empresa
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33

Nome
Alexandra Almeida
Alexandre Carmo
Alda Morais
Ana Ribeiro
Ana Cristina Santos
Ana Cristina Oliveira
Anabela Pais
Antnio Couto
Antnio Fernandes
Antnio Pinto
Armando Ferreira
Carlos Matos
Carlos Sampaio
Cristina Vicente
Cristina Zita
Dora Ferreira
Elsa Sampaio
Fernando Barroso
Fernando Martins
Fernando Santos
Filomena Silva
Francisco Gomes
Isabel Soares
Isabel Silva
Joo Morais
Joo Sousa
Lus Horta
Lus Sousa
Lus Ribeiro
Manuel Santos
Manuel Pereira
Manuel Teixeira
Margarida Almeida

N
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66

Nome
Margarida Simes
M. Adelina Azevedo
M. Alexandra Almeida
M. Alexandra Ribeiro
M. Cristina Carvalho
M. Cristina Freire
M. de Ftima Osrio
M. Fernanda Rocha
M. Isabel Frade
M. Isabel Santos
M. Lusa Faria
M. Manuel Trindade
M. Manuela Lino
M. Nazar Pinto
M. Neusa Lopes
M. Olga Martins
M. Paula Pitarra
M. Paula Garcs
M. Rosrio Gomes
M. Rute Costa
M. Rute Rita
M. Teresa Antnio
M. Teresa Bento
M. Teresa Garcia
Mrio Martins
Mrio Reis
Nuno Simes
Nuno Ventura
Olga Martins
scar Trigo
Osvaldo
Paulo Nunes
Paulo Martins

N
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97

Nome
Paulo Santos
Paulo Valente
Pedro Casanova
Pedro Dalo
Pedro Martins
Pedro Lisboa
Pedro Sintra
Pedro Valente
Pedro Viriato
Rita Amaral
Rita Bendito
Rita vora
Rita Seguro
Rita Valente
Rufo Almeida
Rui Andr
Rui Martins
Rui Teixeira
Rui Vasco
Srgio Teixeira
Slvio Lino
Tnia Lopes
Tnia Martins
Teresa Ado
Teresa Paulo
Teresa Vasco
Vera Mnica
Vera Patrcia
Vera Teixeira
Vitor Santos
Vitor Zinc

A seleco dos 10 trabalhadores dever ser feita sem reposio, porque se se fizer
com reposio o mesmo trabalhador poderia ser seleccionado mais do que uma vez.
Vamos ento proceder seleco de uma amostra aleatria simples, de dimenso 10.
Comemos por considerar um ficheiro em Excel, com os nmeros e nomes dos
trabalhadores e depois utilizmos a seguinte metodologia:
a) Utilizando a funo RAND(), atribumos a cada empregado um nmero aleatrio
(pseudo-aleatrio) que inserimos na coluna C;
b) Como a funo RAND() voltil, utilizando o Paste Special Values, copimos os
valores obtidos anteriormente, para a coluna D;

Maria Eugnia Graa Martins - DEIO

26

Introduo Amostragem

c) Ordenar as 97 linhas que contm informao sobre os trabalhadores, utilizando


como critrio de ordenao os valores da coluna D;
d) Seleccionar os primeiros 10 trabalhadores, para integrarem a comisso:

e) A comisso constituda pelos seguintes trabalhadores: Tnia Lopes, Lus Ribeiro,


M. Paula Garcs, Rita Bendito, M. Olga Martins, Vera Patrcia, Elsa Sampaio, Lus
Sousa, Perro Martins e Manuel Santos.
2 - A Presidente do Conselho Executivo da sua escola secundria encarregou uma
comisso de alunos de fazer uma sondagem para averiguar quantas horas, por
semana, os alunos gastavam a ver televiso. Admitindo que um dos elementos da
comisso, faa um pequeno relatrio onde identifica a Populao, a caracterstica
populacional de interesse, o parmetro a estudar e descreva o processo de
amostragem utilizado e os resultados obtidos.

Você também pode gostar