Escolar Documentos
Profissional Documentos
Cultura Documentos
3AULA Nº7 - Nº8 - &nº9 - 05 - Out - 20 - EInf - Amostragem
3AULA Nº7 - Nº8 - &nº9 - 05 - Out - 20 - EInf - Amostragem
Sumário:
• UNIVERSO ( POPULAÇÃO) – Conjunto de elementos que apresentam pelo menos uma característica comum ( Objecto de estudo).
Exemplo: O Conjunto de todos os trabalhadores ou alunos da Universidade Politécnica.
• POPULAÇÃO FINITA - Número limitado de pessoas (N 100.000 unidades).
Exemplo: População constituída por todos os telefones produzidos numa fábrica num dia.
• POPULAÇÃO INFINITA – Número ilimitado de pessoas ( N>100.000 unidades).
Exemplo: Resultado Cara ou Coroa para vários lançamentos de uma moeda.
• CENSO - É uma colecção de dados relativos a todos os elementos de uma população
• UNIDADE ESTATÍSTICA – É cada elemento que constitui a população observada, sobre o qual recai a observação estatística. É praticamente o objecto a partir do qual
são procurados todos os detalhes da variável ou o fenómeno a estudar.
Exemplo: Um trabalhador da Universidade Politécnica.
• AMOSTRA - É um subconjunto ou parte das unidades estatísticas seleccionadas da população a ser estudada ( usada quando não é possível ou é difícil estudar toda a
população).
• DIMENSÃO DA AMOSTRA - Número de elementos da amostra
✓ Se n 30 a amostra é considerada pequena.
✓ Se n 30 a amostra é considerada grande.
• SONDAGEM - Estudo estatístico com base numa amostra.
• PARÂMETRO - É uma medida numérica que descreve uma característica de uma população.
• AMOSTRAGEM - Estuda o processo de extracção de amostras ou de seleccionar da população os elementos que devem pertencer a amostra
1
AULA nº 7 a 9 : 07/10/20
Sumário:
POPULAÇÃO
ALVO
POPULAÇÃO
A INQUIRIR
2
AULA nº 7 a 9 : 07/10/20
Sumário:
3
AULA nº 7 a 9 : 07/10/20
Sumário:
• A REPRESENTATIVIDADE DE UMA AMOSTRA - Para que a Informação obtida de uma amostra seja verdadeiramente válida é necessário que a amostra correspondente
seja representativa. Para isso deve-se ter o maior cuidado no dimensionamento da amostra bem como no método usado para a escolha dos elementos que devem
pertencer a amostra.
4
AULA nº 7 a 9 : 07/10/20
Sumário:
2.1 Métodos de Amostragem Probablísticos (Aleatórios): Em cada unidade estatística têm uma certa probabilidade conhecida pertencente a amostra,a qual é diferente de
zero.
Métodos de amostragem probabilísticos
1. Amostragem aleatória simples sem e com reposição (*)(processo mais elementar e frequentemente usado)- A probabilidade de cada elemento pertencer a amostra
é a mesma para todos 1/N
2. Amostragem sistemática (*)( é uma variação da amostragem aleatória simples) - A população alvo é ordenada de modo que, cada elemento seja identificado pela posição.
A extracção do primeiro elemento é feita ao acaso e os restantes é feita mecanicamente mediante uma progressão aritmética de razão k
3.Amostragem estratificada (*) - (prática e vantajosa se N> 10.000) - A população alvo é dividida em grupos homogéneos denominados estratos e, cada unidade estatística
deve pertencer a um e um só estrato. Efectua-se o processo de amostragem em cada um dos estratos
4. Amostragem por conglomerados ( é uma variação da amostragem estratificada, é usada quando a construção da listagem dos elementos da população alvo é demorada
e acarreta custos elevados quase que proibitivos) - Consiste em dividir a população alvo em subgrupos que se excluem um a outro, sendo estes exaustivos de acordo com as
variáveis que caracterizam o universo e com aproximadamente o mesmo número de elementos.
5. Amostragem por estágio duplo ( é u ma extensão do conceito de amostragem por conglomerados, é usada quando o tamanho dos conglomerados é muito grande) -
Consiste em seleccionar no primeiro estágio uma amostra casual simples de conglomerados, no segundo estágio seleccionar uma amostra casual simples de unidades
estatísticas em cada conglomerado.
Exemplos de tratamento dos métodos de amostragem probabilísticos
1. Amostragem aleatória simples sem e com reposição (*)(processo mais elementar e frequentemente usado)- A probabilidade de cada elemento pertencer a amostra
é a mesma para todos 1/N
Exemplo “Amostragem aleatória simples sem e com reposição”: Seja dada uma população de 1.000 ( N=1000) , para seleccionar uma amostra de 20 elementos ( n= 20)
procede-se da seguinte maneira:
5
AULA nº 7 a 9 : 07/10/20
Sumário:
Resolução:
039 104 937 168 989 732 395 724 824 255
385 955 328 597 099 180 816 187 533 442
3. Os elementos da lista cujos números coincidem com esta série, serão seleccionados para formar a amostra.
NOTA:
• Este processo embora seguro, necessita de um domínio no uso de tabelas de números aleatórios.
• Processo usado frequentemente no sorteio de papelinhos que normalmente são baralhados num recipiente, no uso da roleta de lotaria, roleta giratória com números
fixos, etc
2. Amostragem sistemática (*)( é uma variação da amostragem aleatória simples) - A população alvo é ordenada de modo que, cada elemento seja identificado pela posição.
A extracção do primeiro elemento é feita ao acaso e os restantes é feita mecanicamente mediante uma progressão aritmética de razão k.
Procedimento:
Exemplo”Amostragem sistemática”: Num determinado prédio sediado na cidade de Maputo existem 46 famílias. Um investigador sobre a situação social das famílias,
escolheu aquele prédio para inquirir 15 famílias. Usando um processo de amostragem sistemática, determine os números das flats que deverão ser inquiridas.
6
AULA nº 7 a 9 : 07/10/20
Sumário:
Resolução”Amostragem sistemática”::
7
AULA nº 7 a 9 : 07/10/20
Sumário:
3. Amostragem estratificada (*)( Prática e vantajosa para populações grandes por exemplo mais de 10.000 unidades , onde a sua amostra deve representar pelo menos 10%
de 10.000 unidades i.é
(1.000)
Procedimento :
• Aqui, a população alvo é dividida em grupos homogéneos denominados de estratos e, cada unidade estatística deve pertencer a um e um só estrato. Seguidamente
usa –se o processo de amostragem aleatória em cada estrato.
• Este tipo de amostragem subdivide-se em:
✓ a (*) ) amostragem estratificada proporcional – Consiste em seleccionar no estrato uma quantidade de unidades proporcional ao tamanho do estrato na
população
✓ b) amostragem estratificada de fracção contínua – Para além da proporção exigida na primeira situação, os elementos extraídos devem guardar a
proporcionalidade em relação a minimização da variabilidade de cada estrato.
NOTA:
• As variáveis de estratificação mais comuns são encontradas nas modalidades tais como:
✓ Classe social;
✓ Idade;
✓ Sexo;
✓ Profissão; e
✓ Qualquer outro atributo relevante dentro da população.
• (*) Iremos tratar apenas o caso da amostragem estratificada proporcional
Exemplo “Amostragem estratificada”: Um estudo deve ser feito para se apurar o rendimento anual nas escolas moçambicanas. Para tal, o Ministério de Educação e Cultura,
tem uma população de 15.000 alunos distribuídos por 4 níveis de ensino segundo a tabela :
8
AULA nº 7 a 9 : 07/10/20
Sumário:
Primário 6.000
Secundário 4.000
Médio 3.000
Superior 2.000
Total 15.000
a) Determine a taxa ou fracção de amostragem
b) Determine, usando o processo de amostragem estratificada proporcional, o número de alunos que deverão ser extraídos em cada estrato de
ensino.
Resolução“Amostragem estratificada”:
a) f = (1500
15000) = 0,1
f = 0,1*100 = 10%
b) O cálculo do número de elementos a seleccionar em cada estrato de ensino será feito com base na fórmula:
9
AULA nº 7 a 9 : 07/10/20
Sumário:
2.2 Métodos de amostragem não probabilísticos (não dirigida): A escolha dos elementos a pertencer a amostra não depende de alguma probabilidade. O método não
generaliza os resultados das pesquisas para a população alvo , pode apenas ajudar ao pesquisador na formulação de boas hipóteses em relação ao problema à investigar.
4.Amostragem por quotas (*)- Consiste em classificar a população abrangida por características relevantes, determinar proporções N1, N2, N3, …. NK que constituem as
partições da população abrangida segundo as suas características, calcular as quotas (ni) a seleccionar no grupo N para pertencer a amostra.
• Amostragem vantajosa pois, não necessita de uma base amostral mais rigorosa, é fácil de se aplicar, tem baixo custo e assegura uma representatividade dos
elementos de cada grupo populacional.
• Tem desvantagem porque necessita de informação exacta em cada passo e a selecção da amostra em cada grupo não é aleatória.
10
AULA nº 7 a 9 : 07/10/20
Sumário:
Exemplo “.Amostragem por quotas”: Seja dada uma população com N = 1.000 unidades divididas em três grupos com N1 = 200 ; N 2 = 300 e N3 = 500 ,
respectivamente. Pretende-se extrair desta população uma amostra de tamanho 350. Encontre as quotas ou percentagens que devem ser tiradas em cada grupo.
Resolução” Amostragem por quotas”
Na tabela a proporção dos elementos no subgrupo populacional é igual à proporção nos grupos cuja soma formará o número das unidades na amostra ni = pi * n
Ni Qi Pi (%) pi (%) qi ni
(População) (Unidade da
amostral
N1 200 20 20 70 n1
N2 300 30 30 105 n2
N3 500 50 50 175 n3
Q1 = N1 = 200
Seja N i = Qi ; N = 1.000 ; n = 350 f = ( n ) = (350 e Q2 = N 2 = 300
N 1.000) = 0,35
Q3 = N 3 = 500
n
Seja ni = qi e f = ( n , então: qi = * Ni qi = f * N i
N) N
q1 = 0,35 * 200 = 70
q2 = 0,35 * 300 = 105
q3 = 0,35 * 500 = 175
11
AULA nº 7 a 9 : 02/10/20
Sumário:
Amostragem: Exemplos - Exercícios
Finito se N 100.000unidades
3. O erro de estimação permitido pelos orgãos controlo de qualidade da informação – erro de vieses [(ou de observação), erro de amostragem ( ou aleatórios)]
4. Proporção da característica pesquisada no universo – consiste em ter a estimativa do fenómeno a pesquisar em (%) da proporção.
4.TAMANHO DO UNIVERSO
Para a determinação do tamanho do universo , a que ter em conta se este é finito( N 100.000unidades) ou infinito ( N 100.000unidades).
Esta distinção é importante porque para cada caso usam-se fórmulas diferentes.
5. NÍVEL DE CONFIANÇA ESTABELECIDO
De acordo com as estatísticas realizadas e da teoria de probabilidades, qualquer distribuição obtida por uma amostra extraída de uma população normalmente distribuída, se
ajusta à lei normal, apresentando valores centrais mais elevados e valores extremos mais reduzidos.
Assim sendo, o nível de confiança é a área da curva normal que se pretende abranger.
12
AULA nº 7 a 9 : 02/10/20
Sumário:
Amostragem: Exemplos - Exercícios
• Exemplo “Nível de confiança estabelecido” : Se pretender fazer inferências com 95% de segurança, abrange-se 95% da área total da curva normal.
Nível de Confiança ( ) Coeficiente de Confiança (Z )
(Desvios em relação à média)
(área da curva em %)
NOTA: Em pesquisas sociais trabalha-se com 95% de nível de confiança( Pois, existe uma probabilidade de 95% em cada 100% de que qualquer resultado obtido da
amostra seja válido para o universo).
6.ERRO DE ESTIMAÇÃO
É necessário considerar os erros cometidos na obtenção das estatísticas amostrais quando se pretende generalizar os resultados.
Existem dois tipos de erros, numa estimativa baseada na teoria de amostragem:
a) Erros de Vieses ( ou de observação) – São aqueles que se relacionam com o estudo da amostra ( preparação inadequada da pesquisa,
dificuldade dos conceitos, má interpretação da informação, mau registo dos dados, etc). Podendo minimizar –se a operação se fôr bem planificada.
b) Erros de amostragem ( ou aleatórios) - São aqueles que se relacionam com a maneira como se obtêm a amostra e as possíveis relações entre
as estatísticas e os parâmetros populacionais.
𝜀 ≤ |𝜇 − 𝑥|
NOTA:
13
AULA nº 7 a 9 : 02/10/20
Sumário:
Amostragem: Exemplos - Exercícios
DISTRIBUIÇÃO NORMAL
1
2,0
xi
3,0
14
AULA nº 7 a 9 : 02/10/20
Sumário:
Amostragem: Exemplos - Exercícios
A proporção da característica pesquisada - consiste em ter uma estimativa prévia do fenómeno a pesquisar em (%) da proporção (P) na população.
✓ Se P > 50% - Significa que a situação é favorável para o estimador ( podendo – se ter uma amostra pequena).
✓ Se P = 50% - Significa que a situação é desfavorável para o estimador ( a amostra deve ser grande).
✓ Se P < 50% - Significa que a situação é muito desfavorável para o estimador ( Na amostra deve-se necessariamente incluir o maior número possível
de unidades do universo)
Descrição Fórmula
SITUAÇÂO 1: 𝑍∗𝜎 2
Se a variável escolhida na população for intervalar , e a população 𝑛=( )
𝜀
considerada for infinita, o tamanho da amostra é determinada pela fórmula
seguinte Onde:
Z= Valor Crítico, obtido a partir de um nível de confiança:
= Desvio padrão da população
= Erro de estimação
SITUAÇÂO 2: 𝑍2 ∗ 𝜎 2 ∗ 𝑁
Se a variável escolhida na população for intervalar, e a população 𝑛=( )
𝜀 2 (𝑁 − 1) + 𝑧 2 ∗ 𝜎 2
considerada for finita, o tamanho da amostra é determinada pela fórmula Onde:
seguinte: Z= Valor Crítico, obtido a partir de um nível de confiança:
= Desvio padrão da população
N= Tamanho da população
= Erro de estimação
15
AULA nº 7 a 9 : 02/10/20
Sumário:
Amostragem: Exemplos - Exercícios
Descrição Fórmula
SITUAÇÂO 3: 𝑍2 ∗ 𝑃 ∗ 𝑞
Se a variável escolhida na população for nominal ou ordinal, e a população 𝑛 = ( )
𝜀2
considerada for infinita, o tamanho da amostra é determinada pela fórmula Onde:
seguinte: Z= Valor Crítico, obtido a partir de um nível de confiança:
p - proporção do fenómeno pesquisado na população, e será expressa em
percentagem ou decimais;
q =1 − p - expressa a proporção da característica não pesquisada na população.
= Erro de es
SITUAÇÂO 4:
Se a variável escolhida na população for nominal, e a população 𝑍2 ∗ 𝑝 ∗ 𝑞 ∗ 𝑁
considerada for finita, o tamanho da amostra é determinada pela fórmula 𝑛=( )
𝜀 2 (𝑁 − 1) + 𝑧 2 ∗ 𝑝 ∗ 𝑞
seguinte: Onde:
Z= Valor Crítico, obtido a partir de um nível de confiança:
p - proporção do fenómeno pesquisado na população, e será expressa em
percentagem ou decimais;
q =1 − p - expressa a proporção da característica não pesquisada na população.
N= Tamanho da população
= Erro de estimação
16
AULA nº 7 a 9 : 02/10/20
Sumário:
Amostragem: Exemplos - Exercícios
Exemplo SITUAÇÂO 1:
: Suponha que tenha sido escolhida a variável peso, de certa peça e que a população seja infinita. Pelas especificações do produto, o desvio padrão é de 10Kg. Admitindo –
se um nível de confiança de 95,44%, e um erro de estimativa amostral de 1,5 Kg, Calcule o tamanho da amostra:
RESOLUÇÃO:
Dados:
n − é infinito
= 1,5
= 10
2 ( z) = 0,9544
0,9544
( z) =
2
( z) = 0,4772 z = 2 ; ( vêr, Tabela de Distribuição Normal Padrão)
Z *
2
Substituindo na fórmula : n = tem-se :
2
2 *10
n = = 177,77 178 n = 178
1,5
NOTA: 95,44% corresponde a um nível de confiança de 0,9544 correspondente ao coeficiente de confiança (ou desvios em relação a média) de 2,0 2,0 daí, a
0,9544
representação de 2 ( z) = 0,9544 onde para se obter o z, basta dividir = 0,4772 , que corresponde na Tabela Tabela de Distribuição Normal Padrão a
2
0,4772
e z =2
17
AULA nº 7 a 9 : 02/10/20
Sumário:
Amostragem: Exemplos - Exercícios
Exemplo SITUAÇÂO 2: : Tendo como base o exemplo anterior , suponha que a população seja finita de 700 peças. Calcule o tamanho da amostra
RESOLUÇÂO:
Z 2 * 2 * N 2 2 *102 * 700
n = 2
2
n =
n = 144,4 n 144
2
( N − 1) + z * (1,5) * (700 − 1) + (2) * (10)
2 2 2
EXEMPLO SITUAÇÂO 3:
: Um pesquisador, pretende saber “as atitudes dos estudantes universitários em relação a suas experiências pré –matrimoniais”, a proporção dos estudantes que apresentam
um lar satisfatório é de 50%. A pesquisa deve ser realizada a um nível de confiança de 99,7% e a um erro de 4%, qual deve ser o tamanho da amostra representativa se o
número de estudantes é mais de 100.000 unidades estatísticas?
RESOLUÇÂO:
Dados:
N − é infinito
p = q = 50%
= 4%
= 0,997
0,997
2 ( z) = 0,997 ( z) = = 0,49846 z = (2,9 + 0,06) z = 2,96
2
18
AULA nº 7 a 9 : 02/10/20
Sumário:
Amostragem: Exemplos - Exercícios
EXEMPLO SITUAÇÂO 4:
: Suponha que na pesquisa feita no exemplo anterior, o número de estudantes não ultrapasse a 50.000 unidade, e que além disso o pesquisador pretenda trabalhar apenas
com um nível de confiança de 95% e um erro de estimação de 4%. Qual deve ser o tamanho mínimo da amostra para que seja representativa? Considere 50% como sendo a
proporção dos estudantes com a característica pesquisada
RESOLUÇÂO
N = 50.000
p = q = 50%
= 4%
= 95% 2 ( z) = 0,95 ( z) =
0,95
= 0,4750 z = (1,9 + 0,06) = 1,96 z = 1,96
2
𝑍2 ∗𝑝∗𝑞∗𝑁
Substituindo os dados na fórmula: 𝑛 = (𝜀2 (𝑁−1)+𝑧2 ∗𝑝∗𝑞)
(1,96) 2 * 50 * 50 * 50.000
n = 2 n = 593
(4) * (50.000 − 1) + (1,96) * 50 * 50
2
EXERCÍCIOS
19