Escolar Documentos
Profissional Documentos
Cultura Documentos
4. Exemplos
5. Exercícios
2
1. O Sistema Integrado de Pesquisas
Domiciliares (SIPD)
3
1. O Sistema Integrado de Pesquisas Domiciliares (SIPD)
4
1. O Sistema Integrado de Pesquisas Domiciliares (SIPD)
5
1. O Sistema Integrado de Pesquisas Domiciliares (SIPD)
6
1. O Sistema Integrado de Pesquisas Domiciliares (SIPD)
8
2. Planejamento da Amostra Mestra
9
2. Planejamento da Amostra Mestra
➢ Administrativas;
➢ Geográficas e Espaciais;
➢ Estatísticas.
10
2. Planejamento da Amostra Mestra
11
2. Planejamento da Amostra Mestra
12
2. Planejamento da Amostra Mestra
• Pesquisa trimestral;
13
2. Planejamento da Amostra Mestra
PNAD Contínua
Trimestre X Trimestre X+1
20% 20%
1ª Entrevista 2ª Entrevista
20% 20%
2ª Entrevista 3ª Entrevista
20% 20%
3ª Entrevista 4ª Entrevista
20% 20%
4ª Entrevista 5ª Entrevista
14
2. Planejamento da Amostra Mestra
16
2. Planejamento da Amostra Mestra
19
3. Entendendo o pacote PNADcIBGE – R
• É um software gratuito.
20
3. Entendendo o pacote PNADcIBGE – R
21
3. Entendendo o pacote PNADcIBGE – R
23
3. Entendendo o pacote PNADcIBGE – R
24
3. Entendendo o pacote PNADcIBGE – R
25
3. Entendendo o pacote PNADcIBGE – R
27
3. Entendendo o pacote PNADcIBGE – R
29
3. Entendendo o pacote PNADcIBGE – R
30
3. Entendendo o pacote PNADcIBGE – R
31
3. Entendendo o pacote PNADcIBGE – R
Microdados Trimestrais:
ftp://ftp.ibge.gov.br/Trabalho_e_Rendimento/Pesquisa_Nacional_p
or_Amostra_de_Domicilios_continua/Trimestral/Microdados/Docu
mentacao/PNADcIBGE_Deflator_Trimestral.pdf
32
3. Entendendo o pacote PNADcIBGE – R
33
3. Entendendo o pacote PNADcIBGE – R
Por fim, existe uma função, pnadc_example, para exibir os arquivos de
exemplo do 4º trimestre de 2017 da PNAD Contínua que são baixados junto
com o pacote PNADcIBGE e podem ser úteis para realização de testes.
35
3. Entendendo o pacote PNADcIBGE – R
36
4. Exemplos
37
4. Exemplos
Pacotes necessários:
• PNADcIBGE, para leitura dos dados e incorporação dos rótulos, dos
deflatores e do plano amostral;
• survey, pacote criado especificamente para análise e modelagem de
dados provenientes de pesquisas com planos amostrais complexos.
Maiores detalhes sobre o pacote podem ser encontrados no site do autor:
<http://faculty.washington.edu/tlumley/old-survey/index.html>.
Microdados necessários:
• PNAD Contínua – 3º trimestre de 2018.
Passo 1:
Carregar os microdados com o auxílio do pacote PNADcIBGE e
delimitar somente as variáveis que serão utilizadas.
Código:
Passo 2:
Carregar o pacote survey para realizar as análises. Caso
contrário, as funcionalidades deste pacote não estarão
disponíveis.
Uma boa prática é primeiro verificar se o pacote já está
instalado no computador e depois carrega-lo.
Código:
40
4. Exemplos
Exemplo 1:
Estimar o total de uma variável numérica, como o rendimento
mensal habitual de todos os trabalhos para pessoas de 14 anos ou
mais de idade.
Será utilizada a função svytotal do pacote survey.
Código:
Exemplo 2:
Obter o coeficiente de variação e os intervalos de confiança a 95%
para a estimativa do total do rendimento mensal habitual de todos
os trabalhos para pessoas de 14 anos ou mais de idade.
A função svytotal informa, junto com a estimativa do total, o erro-
padrão dessa estimativa.
Códigos:
42
4. Exemplos
Exemplo 3:
Estimar o total de sexo e cor/raça, isto é, considerando as
categorias destas duas variáveis.
A função svytotal também permite obter estimativas por categorias
de variáveis categóricas.
Código:
43
4. Exemplos
Exemplo 4:
1 – Estimar a média da variável de rendimento mensal habitual.
A função svymean do pacote survey possui sintaxe idêntica a da
svytotal. Porém é utilizada para estimativas de média e não total.
Código:
44
4. Exemplos
Exemplo 5:
Estimar a mediana, os quartis e os percentis 90, 95 e 98 da
variável de rendimento mensal habitual.
A função svyquantile do pacote survey tem os mesmo argumentos
da svymean acrescido do argumento quantile, que define os
quantis que serão estimados. Este argumento aceita como entrada
um vetor, possibilitando a obtenção conjunta de vários quantis.
Vale lembrar que o quantile 0.50 corresponde à mediana.
Código:
45
4. Exemplos
Exemplo 6:
Estimar a média da variável de rendimento mensal habitual das
mulheres com mais de 30 anos.
A função subset do pacote survey permite a análise para um
domínio específico da população.
Código:
46
4. Exemplos
Exemplo 7:
Estimar a proporção de homens e mulheres por nível de instrução mais
elevado alcançado.
A função svyby do pacote survey permite estimar quantidade de interesse
para domínios mutualmente exclusivos, de forma a permitir comparação
entre eles.
Código:
Obs.: O argumento formula indica a variável para a qual será obtida a estimativa; o
argumento by define a variável com domínios mutualmente exclusivos; design
indica a base de dados com o plano amostral incorporado; FUN indica a
função da estimativa de interesse; na.rm remove os valores faltantes; e
vartype define a medida de variabilidade que será exibida, por exemplo,
variância, erro-padrão ou coeficiente de variação.
47
4. Exemplos
Exemplo 8:
Construir um boxplot do número de horas habitualmente trabalhadas por
semana em todos os trabalhos, por sexo.
A função svyboxplot do pacote survey constrói boxplot que considera o
plano amostral dos dados.
Código:
48
4. Exemplos
Exemplo 9:
Construir um histograma do número de horas habitualmente trabalhadas
por semana em todos os trabalhos.
A função svyhist do pacote survey constrói histogramas considerando o
plano amostral e tem os mesmo argumentos da svyboxplot acrescido dos
argumento main, xlab e ylab, que definem título principal e rótulo dos
eixos.
Código:
49
4. Exemplos
Exemplo 10:
Construir um gráfico de dispersão para verificar a relação entre horas
habitualmente trabalhadas por semana em todos os trabalhos e
rendimento mensal habitual de todos os trabalhos.
A função svyplot do pacote survey constrói gráfico de dispersão
considerando o plano amostral e tem os mesmo argumentos da svyhist
acrescido do argumento style que define o estilo dos pontos desenhados.
Código:
50
4. Exemplos
Exemplo 11:
Testar, utilizando o Teste t de Student, se a diferença da variável
de rendimento utilizada entre os sexos é estatisticamente
significativa.
A função svyttest do pacote survey realiza o Teste t para as
estimativas, já considerando o desenho amostral dos dados. A
função possui argumentos semelhantes as das funções já aqui
apresentadas.
Código:
51
4. Exemplos
Comentários gerais:
1. O pacote survey permite realizar algumas modelagens, como
modelos de regressão linear, de regressão logística e outros
modelos lineares generalizados. Para maiores detalhes das
funções deste pacote, pode-se utilizar o comando abaixo para
navegar pelas páginas do manual:
52
5. Exercícios
53
5. Exercícios
Exercício 1:
Carregar os pacotes necessários e realizar os seguintes passos:
1. Realizar a leitura das bases trimestrais do 3º trimestre de 2017
ao 3º trimestre de 2019;
2. Realizar a leitura das bases anuais de 1ª entrevista de 2018 e
5ª entrevista de 2018;
3. Realizar a leitura das bases anuais para temas do 2º trimestre
de 2017 (Educação Anual) e 4º trimestre de 2017 (TIC);
4. Acrescentar os rótulos e as variáveis de deflatores nas bases
trimestrais e anuais geradas;
5. Incorporar o plano amostral nestas bases para obtenção correta
dos resultados dos exercícios posteriores.
Exercício 2:
Para todos os trimestres de 2018, obter:
1. Total da população por nível de instrução mais elevado
alcançado (VD3004);
2. Média do rendimento real mensal habitual de todos os
trabalhos (A variável nominal deste rendimento, isto é, não
deflacionada, é a VD4019);
3. Média do rendimento real mensal efetivo de todos os
trabalhos (A variável nominal deste rendimento, isto é, não
deflacionada, é a VD4020).
55
5. Exercícios
Exercício 3:
Para as bases de 3º trimestre de 2017, 2018 e 2019, obter:
1. Proporção da população na força de trabalho e fora da força
de trabalho (VD4001);
2. Proporção da população na força de trabalho e fora da força
de trabalho (VD4001), levando em consideração somente a
população em idade de trabalhar (V2009), por nível de
instrução (VD3004).
56
5. Exercícios
Exercício 4:
Para todas as bases trimestrais, obter:
1. Taxa de desocupação, que é a razão entre a população
desocupada (VD4002) e a população na força de trabalho
(VD4001), de cada base trimestral;
2. Gráfico para o acompanhamento da série histórica das taxas
de desocupação calculadas acima.
57
5. Exercícios
Exercício 5:
Para a base anual de 1ª entrevista de 2018, obter total do
rendimento real domiciliar per capita por UF.
Contatos:
Gabriel Henrique Oliveira Assunção
pacotepnadc@ibge.gov.br
gabriel.assuncao@ibge.gov.br
60