Você está na página 1de 3

Bases de dados de empresas:

RAIS: censitária – todos setores

PIA – apenas indústria de transformação e mineração – censitária para empresas com 30 ou


mais empregados – amostra aleatória representativa para empresas entre 5 e 29 empregados,
por setor 3 dígitos. Amostra pode ser expandida e pesquisa tem fator de expansão que pode
ser utilizado. Se não me engano, a pesquisa entrevista cerca de 30 mil empresas.

PINTEC – censitária para empresas com 500 ou mais empregados. Inclui alguns setores de
serviços, além daqueles cobertos pela PIA. Amostra representativa por faixa de tamanho, 10 a
29 empregados, 30 a 99, 100 a 249, 250 a 499, e por setor dois dígitos. Amostra escolhe às
empresas que são sabidamente inovadoras. Dependendo da versão a pesquisa entrevista de
10 mil a mais de 14 mil empresas.

Os dados cobertos pela PIA não são questionados pela PINTEC. No caso das empresas de
serviços, dados são importados da PAS.

Assim, temos um problema de como trabalhar, principalmente na amostra de 10 a 29


empregados e de 5 a 9.

***

Passo 1

O primeiro trabalho será formatar a base de dados da RAIS. Envio, em anexo, um arquivo “do”
do stata que contém o algoritmo. Por favor, um arquivo por ano.

***

Passo 2

Integração (merger) das bases de dados – cuidado a ser tomado. Há três arquivos que foram
enviados por mim que contêm variáveis de política: subvenção, crédito e Lei do Bem. Os
arquivos de subvenção e crédito contêm, além da identificação da empresa tratada, variáveis
referentes a auxílio. Acontece que, em muitos casos, há mais de um auxílio por empresa, no
mesmo ano e, nos exercícios, iremos tentar calcular elasticidade. Peço que some os valores por
ano.

Queria que primeiro fizesse o merger entre os arquivos de subvenção e crédito e a RAIS. Aí,
identificasse quais as empresas que aparecem nas bases de dados dos tratamentos e na base
de dados da RAIS. Na teoria, deveriam ser TODAS, mas isso muitas vezes não acontece.

O mesmo passará com PIA e PINTEC e, aqui, quero especial cuidado: identificar o quanto
estamos perdendo de empresas na medida em que trabalhamos com a PIA e a PINTEC.

Passo 3 – checagem de consistência (aqui, por favor, salvar os dados para checagem posterior)

Estatísticas para checagem:

3.1) comando tabstat, no caso de stata


O interessante é obter estatísticas com obs, média, desvio padrão, por tamanho e por
tratamento, 1, quando tratada por um instrumento, 0, demais casos. Isso com as principais
variáveis dependentes e independentes, expressas nos arquivos de testes que enviei. Então,
observar a perda de observações por tamanho de empresa, na medida em que saímos da RAIS,
entramos na PIA e, posteriormente, PINTEC.

3.2) Comando tabulate ou table

Correlacione as variáveis de política da PINTEC com as variáveis administrativas de política que


estamos levando. É importante para a pesquisa (mas também para o sistema estatístico) ver o
quantitativo de empresas que recebem auxílio não registrado pela PINTEC e o quantitativo
registrado na PINTEC que não recebe auxílio.

No caso da Lei do Bem – tabule (table ou tabulate) os registros administrativos dos três anos
cobertos pela PINTEC com a questão 156 da PINTEC.

No caso de subvenção (só a partir da PINTEC 2008) – registros administrativos x questão 157.1

No caso de crédito – registros administrativos x 158.1 – o único erro justificável é nesse caso,
pois as operações de crédito podem também ser realizadas pelo BNDES e outros bancos, além
da FINEP

3.3) Comando correlate

Correlacionar todas as variáveis. Ver se batem. Atenção especial a duas variáveis bastante
importantes – pessoal ocupado, que tem na PIA e na RAIS. Tem de ver as eventuais
disparidades, lembrando que a PIA costuma ter análise crítica e a RAIS não tem.

Relacionar pessoal ocupado da PIA com PoTec da RAIS – não pode haver PoTec maior do que
PO da PIA, caso haja, é inconsistência.

Relacionar PoTec com gastos em P&D e gastos em inovação – as correlações devem dar algo
próximo a 0,9. Aqui, cabe checagem de duas situações específicas para todas as empresas que
estejam simultaneamente na RAIS e na PINTEC. Quais as PoTec>0 e Gastos em P&D e/ou
gastos em inovação = 0 e quais os gastos em inovação e gastos em P&D >0 e PoTec = 0. O
primeiro me parece esperado, já o segundo, não.

Este passo 3 é importante porque vamos querer atribuir valor zero nas variáveis de inovação
àquelas empresas presentes à PIA e não presentes à PINTEC.

Passo 4 – Alguns dados preliminares

Nesse caso específico, queria que você centrasse a avaliação de estatísticas descritivas
referentes às variáveis de tratamento e as variáveis:

1.1. Enfrentamento de obstáculos (PINTEC questão 174)


1.2. Redução dos riscos (PINTEC questão 176)
1.3. Custos econômicos (PINTEC questão 177)
1.4. Acesso a financiamento (PINTEC questão 178)
Da PINTEC.

**

Você também pode gostar