Você está na página 1de 48

PRO3200 - Estatística

Material elaborado pelas


professoras
Celma de Oliveira Ribeiro
Linda Lee Ho

Celma de Oliveira Ribeiro/ Linda Lee Ho 1


PRO3200 - Estatística

Referências
◼ DEVORE, J.L.; Probabilidade e Estatística para Engenharia e
Ciências, Editora Thomson, 2006.
◼ BUSSAB, W.O.; MORETTIN, P.A., Estatística Básica, Editora Saraiva,
2003.
◼ COSTA NETO, P.L.O., Estatística, Editora Edgard Blucher, 1977.
◼ MEYER, P.L., Probabilidade: Aplicações à Estatística, Livros Técnicos
e Científicos Editora, 1977.

Celma de Oliveira Ribeiro/ Linda Lee Ho 2


Introdução

◼ Era do BIG DATA


◼ Empresas/órgãos governamentais
coletam um grande volume de dados
◼ Exemplos: Dados de censo; Call
Center; Notificação de doenças tipo
zika, dengue; Dados sobre acidentes
em rodovias; Dados de carros que
passam nos pedágios, etc
Celma de Oliveira Ribeiro/ Linda Lee Ho 3
Introdução

◼ Alguns sites:
◼ www.transparencia.sp.gov.br;
www.ssp.sp.gov.br – dados sobre
segurança pública
◼ www.ibge.org.br – dados de censo
populacional/agropecuário/industrial/
commercial e serviços/ outros estudos
do ibge
Celma de Oliveira Ribeiro/ Linda Lee Ho 4
Introdução

◼ Desafio: Organizar e extrair


informações relevantes – ajudar na
tomada de decisão

◼ Uso de ferramentas estatísticas


◼ Uso de softwares para analisar os
dados: R (free); Stat Suite (app trial
free); Minitab; SPSS; SAS, etc
Celma de Oliveira Ribeiro/ Linda Lee Ho 5
Introdução

◼ Estatística – ciência nova comparada


com a matemática
◼ Mundo era determinístico –
aleatoriadade não fazia parte
◼ Muitas teorias foram desenvolvidas no
começo do século passado

Celma de Oliveira Ribeiro/ Linda Lee Ho 6


Introdução

◼ O termo “variância” – criado nos anos


30
◼ Sobre a evolução da Estatística ler:

◼ “Uma Senhora Toma chá” – David


Salsburg
Celma de Oliveira Ribeiro/ Linda Lee Ho 7
Fluxograma

Objetivo

Planejamento: Conclusões
instrumento de coleta
Plano amostral

Coleta Análise

Celma de Oliveira Ribeiro/ Linda Lee Ho 8


Conceitos de amostragem

Celma de Oliveira Ribeiro/ Linda Lee Ho 9


Estatística descritiva

Definições
População Todos elementos de interesse

Amostragem
Parte da população separada para análise
Amostra
Estatística descritiva
Informação
Inferência

Conclusões sobre a população


Celma de Oliveira Ribeiro/ Linda Lee Ho 10
Amostragem

Perguntas importantes....
Qual é sua população de interesse?
A quem se destina seus resultados?
(Médicos de São Paulo, Alunos da EPUSP, Índios, Mulheres
entre 25 e 45 anos)
Você tem acesso a toda a população?

Celma de Oliveira Ribeiro/ Linda Lee Ho 11


Amostragem

Atenção:

O que é a população? - depende da natureza da investigação

O que é uma unidade amostral? - depende da natureza da


população/ amostragem.

O que é uma unidade observacional? – depende da


amostragem

Celma de Oliveira Ribeiro/ Linda Lee Ho 12


Objetivo:investigar QI médio dos alunos
Homogênea da EPUSP.
População homogênea (todos alunos)
População Não importa grupo socioeconômico,
religioso , gênero...

Objetivo: identificar se ambiente da


Heterogênea EPUSP é satisfatório para alunos.
Homens e mulheres devem ter opiniões
diferentes. (Conhecimento prévio indica
que mulheres e trans enfrentam
problemas de assédio, discriminação de
gênero, etc.).
A população precisa ser dividida em
grupos: masculino e feminino (trans?)
População pode ser homogênea em uma situação e heterogênea em outra

Celma de Oliveira Ribeiro/ Linda Lee Ho 13


◼ Cuidados... Exemplo
Pesquisa considera pessoas em um hospital. Consideram-se pessoas que
podem estar dispostas a participar da pesquisa (as que parecem
amigáveis e menos perturbadas possivelmente participarão da pesquisa.)

A amostra não reflete toda a população hospitalar!!!!!!!!!!

Os mais agressivos, as pessoas hostis e perturbadas também são uma


parte da população-alvo.

A amostra é tendenciosa, devido ao julgamento subjetivo do


pesquisador. Um erro sistemático ocorreu pela representação excessiva
de pessoas amigáveis

Celma de Oliveira Ribeiro/ Linda Lee Ho 14


Tipos de amostragem

◼ Probabilística (Todos os elementos da população tem


probabilidade conhecida, e não nula, de pertencer à amostra)
– Casual simples
– Sistemática Permite mais inferências
sobre a população estudada;
– Estratificada Pode-se calcular o erro amostral
– Conglomerados
◼ Não Probabilística
– Por conveniência Não permite mais inferências
sobre a população estudada;
– Intencional
Não pode-se calcular o erro amostral
– Cotas

Celma de Oliveira Ribeiro/ Linda Lee Ho 15


1. Amostragem casual simples

Cada unidade amostral, antes da tomada da amostra, tem igual


probabilidade de pertencer a ela.

População finita e homogênea com N elementos, e deseja-se amostra de


tamanho n. Cada unidade amostral terá probabilidade n/N de pertencer
a amostra.

Os indivíduos da população são numerados e a seleção é feita através


de um sorteio.

Usualmente:
➢ Sorteio;
➢ Tabela de números aleatórios;
➢ Geração de números pseudo aleatórios em sw
Celma de Oliveira Ribeiro/ Linda Lee Ho 16
Tabela de números aleatórios

Exemplos:
a) linha 9 coluna 5,
– 10 primeiros valores
– 1,0, 0, 1, 8, 4, 7, 0, 1, 3

b) 5 alunos na amostra
900 alunos na população
Inicio linha 3 coluna 8
246, 828, 716, 751, 188

Celma de Oliveira Ribeiro/ Linda Lee Ho 17


2. Amostragem estratificada

◼ População é heterogênea (segundo uma


variável de interesse) e composta de
subpopulações (estratos) bem definidos,
◼ Exemplos: Sexo, idade, condição sócio-
econômica .
◼ Os estratos devem ser levados em consideração
e o sorteio da amostra deve ser feito em cada
um deles independentemente.
◼ Amostra de cada estrato é proporcional ao
número de indivíduos que compõem a
população do mesmo.
Celma de Oliveira Ribeiro/ Linda Lee Ho 18
2. Amostragem estratificada

◼ Usa informação à priori para dividir a população


alvo em subgrupos internamente homogêneos.
◼ Cada subgrupo (estrato) é então amostrado por
amostragem aleatória simples.
◼ Os estratos podem ser definidos com base em
fatores como topografia, fronteiras políticas,
estradas, rios, características humanas,
dependendo do contexto do problema

Celma de Oliveira Ribeiro/ Linda Lee Ho 19


2. Amostragem estratificada

Esquematicamente (fonte: “google”)

Celma de Oliveira Ribeiro/ Linda Lee Ho 20


2. Amostragem estratificada

Alguns tipos de amostragem estratificada:


➢Mesmo tamanho em cada estrato
➢ (Precisa ponderar os resultados
posteriormente para extrapolar
resultados para população)
➢Proporcional
▪ N → Nº de unidades da população n
▪ n → Nº de unidades das amostras n j = Nj
▪ Nj → Nº de unidades do estrato j
N
▪ nj → Nº de elementos amostrais
Celma de Oliveira Ribeiro/ Linda Lee Ho do estrato j 21
2. Amostragem estratificada

Exemplo 1:
– Estimar a concentração média e a quantidade total
de fósforo na água de um lago.
– O lago foi dividido em três estratos: uma zona
superficial, uma em profundidade e uma
intermediária.
– Dentro de cada estrato, foram recolhidas
aleatoriamente L amostras de água de 100 ml, onde
o fósforo foi medido..

Celma de Oliveira Ribeiro/ Linda Lee Ho 22


Amostragem probabilística
2. Amostragem estratificada

Exemplo 2 -
52 meninos e 38 meninas. Amostra proporcional estratificada
de 10%.

Sexo População 10% Núm. Elementos


amostra

Masculino 52 5,2 5

Feminino 38 3,8 4

Total 90 9,0 9
3. Amostragem sistemática

◼ A amostra é coletada utilizando a ordenação natural dos indivíduos,


como prontuários, quarteirões de uma cidade e etc.
N = total de unidades amostrais (quando se conhece tamanho
da população)
n = tamanho da amostra desejada,
Intervalo de amostragem: N/n = k,

◼ Importante: verificar se a ordenação das unidades amostrais não


apresenta periodicidade, com certas características se repetindo em
intervalos iguais.

◼ A probabilidade de que cada elemento tenha sido incluído não é a


mesma
– elementos são selecionados em um intervalo regular.
– intervalo pode ser em termos de tempo, espaço ou ordem.

Celma de Oliveira Ribeiro/ Linda Lee Ho 24


3. Amostragem sistemática

◼ Deve obedecer o mesmo princípio da amostragem aleatória


simples de iguais probabilidades de pertencer à amostra para
todos os componentes da população estudada.

◼ Prevê a coleta de dados ao longo de um período de tempo e


arbitra um ritmo para tomada de unidades da população para
compor a amostra.

◼ A amostragem sistemática é utilizada quando se quer planejar


um período de tempo para execução da coleta de dados ou
quando se deseja cobrir um determinado período de tempo
com a amostra estudada.

Celma de Oliveira Ribeiro/ Linda Lee Ho 25


3. Amostragem sistemática

Exemplo

Listagem de indivíduos da população


Sorteio um nome entre os dez primeiros da lista. A partir do nome sorteado,
selecionamos um a cada dez indivíduos (o décimo primeiro, vigésimo primeiro e
assim por diante).

Pacientes em um ambulatório
Toma-se para amostra 1 em cada 10 pessoas que se apresentam para consulta
médica. A amostra será aleatória se a apresentação de pacientes puder ser
assumida como igualmente aleatória.

Aleatoriedade só está garantida se a apresentação de casos for


também aleatória

Celma de Oliveira Ribeiro/ Linda Lee Ho 26


3. Amostragem sistemática

Exemplo
✓ Rua com quinhentos prédios. Amostra formada de vinte
prédios;
✓ Gera aleatoriamente primeiro elemento.

Solução:
a) Calcular k (intervalo de amostragem). k=500/20. Portanto, k=25.
b) Sorteio aleatório = 12
Composição da amostra
✓ 1º item → 12
✓ 2º item → 12 + 25 = 37
✓ 3º item → 12 + 2*25 = 62 …..
✓ 20º item → 12 +19*25 = 487

Celma de Oliveira Ribeiro/ Linda Lee Ho 27


4. Amostragem por conglomerados

Conglomerado (ou cluster) : conjunto de unidades


elementares da população.

◼ Cada conglomerado é visualizado como uma


espécie de miniatura da população;

◼ Será tanto melhor quanto maior a heterogeneidade


da população. Conglomerados podem ser
quarteirões, domicílio e etc.

Celma de Oliveira Ribeiro/ Linda Lee Ho 28


4. Amostragem por conglomerados

Exemplo

◼ Ministério da Agricultura pretende investigar o uso de agrotóxicos


pelos agricultores.
◼ Cada diferente município é um cluster.
◼ Uma amostra destes clusters seria escolhida aleatoriamente, para
todos os agricultores nos municípios escolhidos seriam incluídas na
amostra.
(é mais fácil de visitar vários agricultores, no mesmo município do
que é viajar para cada exploração agrícola em uma amostra
aleatória).

Celma de Oliveira Ribeiro/ Linda Lee Ho 29


4. Amostragem por conglomerados

Estudo sobre a percepção social dos problemas de


quantidade, qualidade e custo do transporte em São Paulo:
Suponho: quarteirões como sendo os conglomerados:

a) Amostragem por conglomerados em 1 estágio:


Amostragem aleatória simples (AAS)para a seleção de uma amostra
aleatória de quarteirões
Questionário aplicado a todos os domicílios dos quarteirões
selecionados.

Celma de Oliveira Ribeiro/ Linda Lee Ho 30


4. Amostragem por conglomerados

Estudo sobre a percepção social dos problemas de


quantidade, qualidade e custo do transporte em São Paulo:
Suponho: quarteirões como sendo os conglomerados:

b) Amostragem por conglomerados em 2 estágios:


1º. estágio: aplica-se uma A.A.S. para se selecionar uma amostra de
quarteirões;
2º. estágio: dentre os quarteirões selecionados no 1º. estágio, sorteia-se
uma amostra aleatória de domicílios que efetivamente participarão da
amostra.

Celma de Oliveira Ribeiro/ Linda Lee Ho 31


Amostragem estratificada
X conglomerados
.
Estratificada - os estratos são construídos de tal
forma que são
Homogêneos dentro do grupo e heterogêneos entre grupos.

Conglomerados - os clusters são construídos de tal


forma que são
Heterogêneos dentro do grupo e homogêneos entre grupos.

Celma de Oliveira Ribeiro/ Linda Lee Ho 32


Graficamente

Simples Estratificada

Conglomerados

Celma de Oliveira Ribeiro/ Linda Lee Ho 33


Uso de amostragem por
conglomerados no Brasil
◼ Muito utillizado no Brasil:
– Devido à ausência de uma lista referência
de dados primários (a lista de moradores
de um bairro, lista de padarias,
mecânicos, etc)
– Pode existir a base mas não tem acesso
(por exemplo, lista dos eleitores)

Celma de Oliveira Ribeiro/ Linda Lee Ho 34


Uso de amostragem por
conglomerados no Brasil
◼ Muito utillizado no Brasil:
– Única fonte de referência dos municípios:
Mapa da cidade:
– Delimitam-se os bairros/quarteirões
– Sorteiam-se bairros/quarteirões
– Em seguida, é feito um Censo ou Uma
fração é amostrada dos
bairros/quarteirões
Celma de Oliveira Ribeiro/ Linda Lee Ho 35
Uso de amostragem por
conglomerados no Brasil
◼ Exemplo real:
– Pesquisa nacional por amostragem de
domicílios (PNAD) do IBGE
– Brasil está dividido em muitos setores
censitários (cada setor tem em torno de
300 domicílios)
– Uma amostra aleatória de setores é
selecionada (é feito um censo ou uma
fração)
Celma de Oliveira Ribeiro/ Linda Lee Ho 36
-Qual o tipo de amostragem utilizada?

a) Criação de comissão para avaliar uma nova política pública:


decidiu-se selecionar aleatoriamente 4 pessoas brancas, 3 pardas
e 4 negras.

b) Um professor escreve número usp dos seus alunos em


pedaços de papel e os coloca em uma caixa. Depois de misturá-
los, sorteia 10 nomes.

c) Processo de avaliação de qualidade dos produtos: analisa uma


peça a cada 100 produzidas.

d) Seleção de uma amostra de domicílios de uma cidade. As ruas


estão identificadas pelas letras de A à F. As casas de cada rua
estão identificadas pelo nome da rua, seguido por um número.
Primeiro foram sorteadas duas ruas (B e F) e depois, foram
selecionados ao acaso 50% dos domicílios de cada rua.
-Qual o tipo de amostragem utilizada?

a) Criação de comissão para avaliar uma nova política pública: Amostragem


decidiu-se selecionar aleatoriamente 4 pessoas brancas, 3 pardas estratificada
e 4 negras.

b) Um professor escreve número usp dos seus alunos em


pedaços de papel e os coloca em uma caixa. Depois de misturá-
los, sorteia 10 nomes.

c) Processo de avaliação de qualidade dos produtos: analisa uma


peça a cada 100 produzidas.

d) Seleção de uma amostra de domicílios de uma cidade. As ruas


estão identificadas pelas letras de A à F. As casas de cada rua
estão identificadas pelo nome da rua, seguido por um número.
Primeiro foram sorteadas duas ruas (B e F) e depois, foram
selecionados ao acaso 50% dos domicílios de cada rua.
-Qual o tipo de amostragem utilizada?

a) Criação de comissão para avaliar uma nova política pública: Amostragem


decidiu-se selecionar aleatoriamente 4 pessoas brancas, 3 pardas estratificada
e 4 negras.

Amostragem
b) Um professor escreve número usp dos seus alunos em
aleatória
pedaços de papel e os coloca em uma caixa. Depois de misturá-
los, sorteia 10 nomes.

c) Processo de avaliação de qualidade dos produtos: analisa uma


peça a cada 100 produzidas.

d) Seleção de uma amostra de domicílios de uma cidade. As ruas


estão identificadas pelas letras de A à F. As casas de cada rua
estão identificadas pelo nome da rua, seguido por um número.
Primeiro foram sorteadas duas ruas (B e F) e depois, foram
selecionados ao acaso 50% dos domicílios de cada rua.
-Qual o tipo de amostragem utilizada?

a) Criação de comissão para avaliar uma nova política pública: Amostragem


decidiu-se selecionar aleatoriamente 4 pessoas brancas, 3 pardas estratificada
e 4 negras.

Amostragem
b) Um professor escreve número usp dos seus alunos em
aleatória
pedaços de papel e os coloca em uma caixa. Depois de misturá-
los, sorteia 10 nomes.

c) Processo de avaliação de qualidade dos produtos: analisa uma Amostragem


peça a cada 100 produzidas. sistemática

d) Seleção de uma amostra de domicílios de uma cidade. As ruas


estão identificadas pelas letras de A à F. As casas de cada rua
estão identificadas pelo nome da rua, seguido por um número.
Primeiro foram sorteadas duas ruas (B e F) e depois, foram
selecionados ao acaso 50% dos domicílios de cada rua.
-Qual o tipo de amostragem utilizada?

a) Criação de comissão para avaliar uma nova política pública: Amostragem


decidiu-se selecionar aleatoriamente 4 pessoas brancas, 3 pardas estratificada
e 4 negras.

Amostragem
b) Um professor escreve número usp dos seus alunos em
aleatória
pedaços de papel e os coloca em uma caixa. Depois de misturá-
los, sorteia 10 nomes.

c) Processo de avaliação de qualidade dos produtos: analisa uma Amostragem


peça a cada 100 produzidas. sistemática

d) Seleção de uma amostra de domicílios de uma cidade. As ruas


estão identificadas pelas letras de A à F. As casas de cada rua Amostragem
estão identificadas pelo nome da rua, seguido por um número. por
Primeiro foram sorteadas duas ruas (B e F) e depois, foram conglomerados
selecionados ao acaso 50% dos domicílios de cada rua. e amostragem
aleatória
Amostragem não probabilística

Observações:
Muito praticado em pesquisas de mercado
É relativamente mais fácil, rápida, menos custoso
do que amostragem probabilística
PORÉM, Conclusões NÃO podem ser extrapoladas
para a população

Celma de Oliveira Ribeiro/ Linda Lee Ho 42


Amostragem não probabilística

Amostragem a esmo
Não há sorteio formal, mas procura-se ser o mais aleatório
possível. Retiram-se os elementos a esmo.

Exemplo: lote de 10000 parafusos, queremos uma amostra de 100.

Utilizada para população formada por material contínuo (gases,


líquidos, minérios). Basta homogeneizar o material e proceder a
retirada da amostra.

Celma de Oliveira Ribeiro/ Linda Lee Ho 43


Amostragem não probabilística

Amostragem intencional
Seleciona-se deliberadamente alguns elementos para
fazer parte da amostra, com base no julgamento do
pesquisados de aqueles seriam representativos da
população.
Risco elevado de vícios, pois se baseia nas preferências
do pesquisador.

Celma de Oliveira Ribeiro/ Linda Lee Ho 44


Amostragem não probabilística

Amostragem por cotas.


Semelhante a uma amostragem estratificada proporcional, mas não
utiliza sorteio na seleção dos elementos.
População dividida em vários subgrupos
Divide-se a população por sexo, nível de instrução, faixas de renda.
Obtenham-se cotas proporcionais ao tamanho dos grupos (e.g.
através das informações do IBGE).
Entrevistadores escolhem Elementos da amostra dentro dos
grupos. (Geralmente locais movimentados).

Celma de Oliveira Ribeiro/ Linda Lee Ho 45


Amostragem não probabilística

Exemplo: Pesquisa de opinião sobre governo/pesquisa


eleitoral/INTENÇÃO DE VOTO.

Implica em certa subjetividade e impede que quem não esteja


passando pelo local no exato momento da pesquisa possa ser
selecionado.

Coincidência dos resultados da pesquisa x eleição – MERO


ACASO

Celma de Oliveira Ribeiro/ Linda Lee Ho 46


Amostragem não probabilística

Alguns casos de não coincidência de pesquisa eleitoral e


resultado da eleição:

1 – Eleição do Presidente Roosevelt nos EUA


2 – Eleição à Prefeitura de SP : Janio Quadros (eleito) x
Fernando H. Cardoso

Celma de Oliveira Ribeiro/ Linda Lee Ho 47


Amostragem não probabilística

Outros tipos de amostragem não probabilística

Pesquisa via Internet


Mala Direta

Celma de Oliveira Ribeiro/ Linda Lee Ho 48

Você também pode gostar