Você está na página 1de 10

SO PAULO EM PERSPECTIVA, 17(3-4): 125-134, 2003

PLANO AMOSTRAL: PESQUISA DE EMPREGO E DESEMPREGO

PLANO AMOSTRAL Pesquisa de Emprego e Desemprego

WILTON DE OLIVEIRA BUSSAB NDIA PINHEIRO DINI SILVIA REGINA MANCINI

Resumo: Discusso dos aspectos principais do plano amostral de uma pesquisa domiciliar, a PED Pesquisa de Emprego e Desemprego, realizada mensalmente pela Fundao Seade e pelo Dieese desde 1985. Abordamse questes metodolgicas, tericas e prticas e as solues para elas adotadas, bem como procura-se avaliar a contribuio da realizao dessa pesquisa para o desenvolvimento da Fundao Seade. Palavras-chave: plano amostral; pesquisa domiciliar; painel rotativo. Abstract: A discussion of the principle aspects of the sampling plan of a household survey, the PED Survey of Employment and Unemployment, conducted monthly by Fundao Seade and Dieese since 1985. Methodological, theoretical and practical issues, as well as adopted solutions, are addressed. An attempt is made to evaluate the contribution of this survey to the development of Fundao Seade. Key words: sampling plan; household survey; rotating panel.

PED surgiu em 1984, a partir de um convnio firmado entre a Fundao Seade Sistema Estadual de Anlise de Dados e o Dieese Departamento Intersindical de Estatstica e Estudos Scio-Econmicos, com o objetivo principal de acompanhar a insero da populao em idade ativa PIA no mercado de trabalho da Regio Metropolitana de So Paulo, caracterizado por grande heterogeneidade e por tnues limites entre as possveis condies de atividade dos indivduos (ocupao, desemprego e inatividade). Desde seu incio, a pesquisa buscou ser fonte de informaes que subsidiem a formulao de polticas econmicas e sociais, em especial de emprego e de renda, atravs da gerao de indicadores referentes medio de desemprego, s caractersticas dos postos de trabalho e aos rendimentos do trabalho, entre outros (Troyano, 1990). Para melhor atender a esses objetivos, a pesquisa realizada em carter contnuo e atravs de entrevistas diretas com a populao da Regio Metropolitana de So Paulo. Selecionam-se, para tanto, domiclios particulares de maneira probabilstica, de acordo com um plano amos-

tral predefinido, e entrevistam-se todos os moradores desses domiclios. CARACTERSTICAS DO PLANO AMOSTRAL A descrio de um plano amostral probabilstico deve especificar o universo de investigao, as unidades amostrais, os critrios de estratificao, os procedimentos de sorteio das unidades amostrais, as probabilidades de incluso, os estimadores e os respectivos erros amostrais. Desse modo, saberemos do que e de quem estamos falando e avaliando os desvios esperados para as estimativas (Bolfarine; Bussab, 2000). Outros aspectos e decises operacionais tambm precisam ser considerados a fim de se obter um planejamento amostral eficiente, em relao a custo e preciso, e bem ajustado aos propsitos da investigao a ser realizada. Esses objetivos s sero alcanados com um estudo detalhado das informaes e recursos disponveis para a realizao da pesquisa. Aps a identificao e conhecimento do cenrio disposio, pode-se escolher o plano amostral e respectivos estimadores que melhor respondam aos interesses do levantamento.

125

SO PAULO EM PERSPECTIVA, 17(3-4) 2003

Universo da Pesquisa A populao-alvo ou universo inicial de interesse era a populao em idade ativa moradora na rea urbana da Regio Metropolitana de So Paulo, que em 1984 era constituda por 37 municpios. Tambm tinha-se como acordado que as informaes seriam obtidas nos domiclios particulares que, portanto, constituiriam a ltima unidade amostral, qualquer que fosse o plano amostral adotado. Sistema de Referncia O uso de amostras probabilsticas exige uma listagem das unidades amostrais, ou seja, um sistema de referncia das unidades amostrais. Em 1984, momento de implantao da pesquisa, consideraram-se, como possveis fontes de informao, os cadastros telefnicos, de suprimento de gua ou ainda de energia eltrica. Alm da dificuldade de acesso a esses cadastros, eles excluam parcelas importantes da populao urbana da Regio Metropolitana de So Paulo, como, por exemplo, aquela moradora em favelas, alm de parcelas de domiclios que ainda no estavam cobertos por esses servios e apresentavam caractersticas indesejveis de identificao, como falta de clareza entre consumidores comerciais e residenciais e outras especificidades. Optou-se, ento, por usar as informaes fornecidas pelo Instituto Brasileiro de Geografia e Estatstica IBGE por meio dos Censos Demogrficos na Regio Metropolitana de So Paulo, detalhadas ao nvel menor de Setor Censitrio SC. Tais setores censitrios correspondem a regies geogrficas delimitadas com cerca de 300 domiclios cada uma, definidas previamente realizao de cada Censo Demogrfico para todo o territrio nacional. Desse modo, tem-se cobertura total de todos os municpios por setores censitrios, com a vantagem adicional de que, em regies de elevada densidade demogrfica, como o caso da Regio Metropolitana de So Paulo, esses setores so geograficamente pequenos, o que facilita muito o trabalho de um entrevistador ao percorr-los a p. A escolha de tal sistema de referncia geogrfico obriga-nos utilizao de planos amostrais em mltiplos estgios, modelo bastante difundido em pesquisas amostrais domiciliares. Assim, em uma primeira etapa sero selecionados SCs e dentro deles sero sorteados domiclios. O cadastro de setores censitrios urbanos do Censo Demogrfico de 1980 do IBGE constituiu o sistema de referncia original por ocasio da implantao da pesqui-

sa. Esse sistema atualizado medida que as informaes dos censos mais recentes so disponibilizadas. Independentemente da atualizao do cadastro de setores atravs do Censo, procede-se regularmente a uma renovao dos setores que compem a amostra, selecionando-se novos setores para substitu-los. Mensalmente, uma pequena parcela dos setores da amostra substituda, o que a mantm atualizada e ao mesmo tempo evita impactos bruscos s sries de dados. Organizao do Cadastro Conhecer bem e trabalhar o sistema de referncia importante para aumentar a preciso dos resultados de pesquisas amostrais. Um dos recursos bastante comuns para isso a utilizao de estratificao, ou seja, a organizao do sistema de referncia adotado em subgrupos ou estratos de tal forma que esses estratos sejam ao mesmo tempo bastante homogneos internamente quanto a certas caractersticas relacionadas ao que se busca medir, e to heterogneos quanto possvel entre si, no que se refere a essas mesmas caractersticas. No caso da PED, um dos indicadores cujo erro se pretendia controlar a taxa de desemprego, que serve de base para todo o planejamento da amostra. As informaes disponveis no Censo Demogrfico mais relacionadas a esse indicador so aquelas referentes insero da mo-de-obra no mercado de trabalho, tais como a distribuio dos ocupados por setor de atividade econmica e o rendimento dos chefes de domiclio, que foram utilizados para a estratificao do sistema de referncia. Por meio de tcnicas estatsticas multivariadas como a anlise de agrupamentos, produziram-se regies homogneas demunicpios ou distritos (dez regies em 1980 e sete regies em 1991) (Bussab; Dini, 1985). Cada uma dessas regies pode ser caracterizada pela maior ou menor presena de sua mo-de-obra ocupada em cada um dos principais setores de atividade econmica. Como exemplo, um dos resultados da aplicao dessa tcnica aos dados de 1980 foi a obteno de uma regio que inclua os principais municpios do ABC paulista, alm de Caieiras e de Cajamar, com forte presena de mo-de-obra inserida no setor industrial, refletindo a realidade dessa regio naquele momento. A anlise dos tipos de SC existentes no Censo sugeriu eliminar do cadastro os setores rurais e alguns setores especiais, entre eles os quartis, as cadeias, os asilos e as aldeias indgenas. Desse modo, a populao de refern-

126

PLANO AMOSTRAL: PESQUISA DE EMPREGO E DESEMPREGO

cia da pesquisa passou a ser constituda pelos moradores de domiclios particulares em setores censitrios urbanos e suburbanos da RMSP, inclusive aqueles de favelas e de alojamentos. Deve-se salientar que a quase totalidade dos domiclios dessa regio considerada urbana (cerca de 98%). Determinao do Tamanho da Amostra Estudos realizados com o objetivo de balancear o custo da pesquisa com a preciso desejada para seus principais indicadores (dos quais considerou-se principalmente a taxa de desemprego desagregada em seus tipos total, aberto, oculto pelo trabalho precrio e oculto pelo desalento) previam amostras de 9 mil unidades domiciliares a serem selecionadas trimestralmente. Aps analisar as dificuldades operacionais de treinamento e aplicao de questionrios de forma no-contnua, decidiu-se alterar o procedimento inicial de uma nica tomada a cada trs meses, e dividi-la em trs tomadas a cada ms, com cerca de 3 mil domiclios entrevistados em cada tomada. Esse procedimento implicou propor novos parmetros e estimadores, bem como a deciso do uso de acmulo de informaes para a produo de estatsticas de tendncias. Amostras Selecionadas com Probabilidade Proporcional ao Tamanho O principal cuidado a ser tomado com planos amostrais em mltiplos estgios o controle do tamanho final da amostra, que pode ser conseguido com sorteio do conglomerado (SC) com probabilidade propocional ao tamanho (PPT) e, no segundo estgio, selecionar um nmero fixo de domiclios (Bolfarine; Bussab, 2000). Assim, o plano amostral pode ser resumido como a seleo de a setores censitrios com probabilidade proporcional ao tamanho, e b domiclios com igual probabilidade dentro de cada SC sorteado. Usou-se como medida do tamanho do SC o nmero de domiclios ocupados no Censo Demogrfico disposio. A probabilidade de seleo do domiclio i dentro do setor j, passa a ser: Pij=(aNj/T)(b/Nj) = ab/T Nj =nmero de domiclos no setor j T = total de domiclios no Censo Ou seja, com esse procedimento cada domiclio teria a mesma probabilidade de pertencer amostra, pelo menos teoricamente.

Entretanto, quanto mais a pesquisa se afasta da data do Censo, mais desatualizadas vo ficando as informaes dos SCs, o que recomenda a recontagem do nmero de domiclios dentro dos setores sorteados (relistagem dos SCs). Como o nmero de domiclios pode crescer ou decrescer, a recontagem usualmente altera o nmero existente para um novo nmero N*j, necessitando-se, ento, corrigir a probabilidade de seleo. Em tais casos, costuma-se alterar o nmero de domiclios sorteados dentro dos setores de tal modo que se mantenha a probabilidade de seleo inicial, ou seja, b/Nj = bj/N*j Com essa alterao, perde-se um pouco o controle sobre o tamanho final da amostra, mas de um modo geral no so modificaes dramticas. Deve-se enfrentar agora a questo de como alocar a amostra pelos SCs e domiclios, ou seja, quantos setores e quantos domiclios selecionar para obter a amostra final de cerca de 3 mil domiclios por ms. Para melhor definir esses dois nmeros, devem ser considerados aspectos como os custos associados incluso de cada setor censitrio na amostra e realizao das entrevistas em cada unidade domiciliar e o grau de correlao entre as informaes de unidades domiciliares pertencentes a um mesmo setor censitrio, a chamada correlao intraclasse. Quanto maior o nmero de setores censitrios na amostra, maiores as despesas com seu arrolamento e com os deslocamentos dos pesquisadores para a realizao das entrevistas. Por outro lado, espera-se uma forte correlao entre as informaes de domiclios dentro de um mesmo setor; assim, quanto maior a correlao entre as informaes de unidades domiciliares pertencentes a um mesmo setor censitrio, menor dever ser o nmero de unidades domiciliares selecionadas por setor censitrio. Entretanto, como a correlao desconhecida at que o levantamento seja de fato efetuado, procura-se, nessa fase, utilizar a experincia proveniente de outras pesquisas e o senso comum para se estabelecer a diviso mais conveniente do tamanho total previsto para a amostra entre setores censitrios e unidades domiciliares por setor censitrio. Experincia anterior e simulaes de custos sugeriram que a alocao da amostra deveria ser feita em 600 SCs e 15 domiclios em cada um, perfazendo um total de 9 mil domiclios trimestralmente. Com essa escolha, a frao amostral passou a corresponder a cerca de um domiclio sorteado para cada 500 existentes na RMSP.

127

SO PAULO EM PERSPECTIVA, 17(3-4) 2003

Como j mencionado, a fim de realmente garantir que todos os domiclios tenham a mesma probabilidade de seleo, necessrio que cada um dos setores censitrios selecionados seja arrolado por completo e o nmero esperado de unidades domiciliares para cada setor (15) seja ajustado proporcionalmente s alteraes encontradas entre o tamanho presumido do setor e o observado em campo no momento do arrolamento. Dessa forma, setores que apresentem, no arrolamento, um nmero maior de domiclios do que o divulgado no Censo devero tambm ter um acrscimo s 15 unidades domiciliares esperadas, e esse acrscimo dever ser proporcional ao crescimento observado no setor. Inversamente, setores que apresentem menos domiclios no arrolamento do que no Censo devero ter um nmero proporcionalmente menor de unidades domiciliares selecionadas. Tais alteraes no tamanho do setor so comuns em uma regio dinmica como a metrpole paulistana, onde so freqentes fenmenos como o brusco aumento do nmero de residncias graas verticalizao ou a sua reduo devido ao surgimento de grandes eixos comerciais em reas anteriormente residenciais. Assim, devem-se realizar esforos constantes para a manuteno de arrolamentos atualizados. Quando a implantao da pesquisa ocorre em um momento outro que o do Censo Demogrfico, convm que o clculo inicial do tamanho da amostra leve em considerao as estimativas do crescimento populacional anual ocorrido, evitando-se, assim, a indesejada perda de controle do tamanho final. Sistema de Ponderao O sistema de referncia (setores censitrios) foi inicialmente agrupado de acordo com as regies homogneas definidas. Em seguida, dentro de cada regio homognea, foi ordenado por municpio e distrito e, dentro destes, por rendimento mdio dos chefes de domiclio. A partir do sistema assim ordenado, realizou-se o sorteio de setores censitrios em pares aleatrios, o que garantiu uma estratificao implcita da amostra. Isso quer dizer que a distribuio da amostra pelos estratos considerados coincide com aquela da populao, sem outro esforo adicional para se obter essa caracterstica. Alm disso, a utilizao de uma frao amostral constante, ou seja, o fato de que todas as unidades domiciliares tm a mesma chance de ser includas na amostra, garante que os dados sejam autoponderados, no havendo, portanto, a necessidade de criao de pesos para o

processamento dos indicadores. Esse aspecto bastante vantajoso para uma pesquisa de carter contnuo, pois, se houver necessidade de pesos, o clculo exato destes no trivial e exige informaes extras sobre a distribuio populacional, podendo estar sujeito a distores medida que a pesquisa se distancia de seu sistema de referncia, ou seja, do ltimo Censo Demogrfico disponvel. Alm das facilidades computacionais que advm da autoponderao, existe outra vantagem adicional expressa em menores erros amostrais. A teoria de amostragem determina que quanto maior a diferena entre as fraes amostrais utilizadas e, conseqentemente, entre os pesos posteriormente atribudos aos dados, maiores os erros amostrais dos indicadores calculados. Com a autoponderao, a maioria dos indicadores divulgados pode ser calculada diretamente a partir dos dados amostrais; j para os indicadores de contingentes populacionais preferiu-se adotar um sistema misto: utilizam-se os resultados da amostra aplicados a dados externos, ou seja, projees populacionais produzidas pela Gerncia de Demografia da Fundao Seade. Periodicidade da Coleta O tamanho inicial definido para a amostra (9 mil domiclios) por trimestre, por razes j mencionadas de custo, no levantado em um nico ms, mas em trs meses, com a coleta de 3 mil domiclios por ms. Para tanto, divide-se o nmero total de setores censitrios sorteados em trs painis distintos rotulados de A, B e C. Nos trs primeiros meses da pesquisa, levantam-se as informaes dos painis A, B e C, respectivamente. No quarto, stimo e dcimo ms da pesquisa, utilizam-se novamente os setores censitrios do painel A, selecionando-se, entretanto, novas unidades domiciliares nesses setores. No quinto, oitavo e dcimo primeiro ms, repetem-se os setores censitrios do painel B, ao passo que o painel C serve de base para o sorteio do sexto, nono e dcimo segundo ms. A partir do dcimo terceiro ms, repete-se esse esquema, sempre com a seleo de novas unidades domiciliares a cada novo ms. Dessa forma, podem-se aproveitar os custos despendidos no processo de arrolamento dos setores censitrios e ao mesmo tempo obter amostras mensais independentes (Figura 1). Divulgao das Informaes Embora o levantamento seja realizado todos os meses, para garantir a preciso desejada, o clculo dos indicadores

128

PLANO AMOSTRAL: PESQUISA DE EMPREGO E DESEMPREGO FIGURA 1 Esquema de Coleta de Dados da PED Meses Painis 1 A 2 B trim. 1 trim. 2 trim. 3 trim. 4 trim. 5 Base para Clculo dos Indicadores trim. 6 trim. 7 trim. 8 trim. 9 trim. 10
Fonte: Fundao Seade. PED.

3 C

4 A

5 B

6 C

7 A

8 B

9 C

10 A

11 B

12 C

efetuado com a amostra acumulada do trimestre. Como ser apresentado a seguir, a independncia das amostras mensais permite esse acmulo, bem como a divulgao, todos os meses, de novos resultados obtidos a partir de trimestres mveis, uma vez que incluem sempre os trs painis definidos. Dessa forma, possvel acompanhar mensalmente a tendncia dos principais indicadores divulgados, entre os quais se destacam as estimativas dos contingentes de ocupados, desempregados e inativos, as taxas de desemprego total, por tipo e por atributos pessoais, a distribuio dos ocupados por setor de atividade econmica e por posio na ocupao e os rendimentos mdios da populao ocupada e assalariada. Clculo dos Indicadores Conforme j mencionado, o plano amostral em dois estgios, utilizado com a seleo, no primeiro estgio, de conglomerados (setores censitrios) e, no segundo, de domiclios dentro dos setores previamente selecionados, faz com que o tamanho da amostra a cada ms possa oscilar, dependendo do crescimento ou da diminuio do SC sorteado. Desse modo, a maioria dos indicadores produzidos tais como taxas, distribuies de freqncias e mdias, calculada por meio de estimadores do tipo razo, ou seja, pelo quociente de duas variveis aleatrias ou caractersticas. Por exemplo, a taxa de desemprego total divulgada corresponde ao estimador razo combinado no trimestre, expresso pelo quociente entre o nmero total de desempregados obtido em trs meses de pesquisa e o nmero total de pessoas economicamente ativas obtido no mesmo perodo.

O clculo das estimativas obtido diretamente dos dados acumulados no banco de dados, ao passo que o dos erros amostrais, sendo bastante complexo, requer a utilizao de softwares especficos, como PCCARP, SAS e Sudaan. Atualmente, a Fundao Seade vem utilizando o software SAS para o clculo dos erros. Controle de Qualidade dos Resultados O tamanho da amostra foi calculado a fim de garantir a preciso desejada para alguns indicadores, considerandose principalmente a taxa de desemprego total. Para garantir a confiabilidade de todos os resultados divulgados, quer em estudos de carter conjuntural, quer de carter estrutural, determinou-se que sejam disponibilizados de forma rotineira apenas os indicadores cujo coeficiente de variao seja no mximo 7,5%. Estudos com erros superiores a esse limite s so divulgados em casos muito especiais. Erros No Amostrais Alm do esforo para controlar os erros amostrais, atravs da determinao do tamanho de amostra adequado para a preciso desejada e da divulgao de indicadores com coeficiente de variao de no mximo 7,5%, a PED tambm realiza diversos procedimentos a fim de controlar os erros de origem no amostral, entre eles os relacionados a cobertura, coleta e processamento de informaes. Uma equipe de checagem investiga aproximadamente 30% do material coletado pela PED, verificando tanto aspectos de cobertura, ou seja, da realizao da entrevis-

129

SO PAULO EM PERSPECTIVA, 17(3-4) 2003

ta no domiclio preestabelecido, como de qualidade das principais informaes levantadas. Uma equipe interna de crtica analisa todos os questionrios preenchidos, dando ateno especial coerncia das informaes e existncia de possveis vises devidos atuao dos entrevistadores. Aps a entrada eletrnica dos dados, efetuada com programa especfico para minimizar erros, realizase o controle final pela execuo de um programa de consistncia eletrnica de dados, que busca eliminar possveis erros ocorridos durante a entrada dos mesmos e incoerncias que tenham passado despercebidas no processo de crtica. Tipo de Amostra Levantamentos amostrais peridicos envolvem decises metodolgicas difceis e controversas, principalmente aquelas relativas ao uso de painis fixos, amostras independentes, rotacionadas ou de outras combinaes. Maiores informaes podem ser encontradas em Duncan e Kalton (1987). Amostras independentes so aquelas em que, a cada novo momento ou tomada do levantamento, sorteiam-se unidades domiciliares que nunca haviam sido selecionadas. Por outro lado, o uso de painis fixos implica a utilizao das mesmas unidades amostrais em todas as tomadas do levantamento, ao passo que as amostras rotacionadas combinam parcela de unidades amostrais que permanecem na amostra por um nmero predeterminado de tomadas (sendo substitudas findo esse prazo) e parcela de novas unidades, da a referncia rotao em seu nome. Um dos principais guias para orientar a opo por um ou outro plano amostral deve ser o objetivo primrio para o levantamento das informaes. Freqentemente, as pesquisas contnuas so utilizadas para estimar parmetros pontuais e ao mesmo tempo avaliar as mudanas ocorridas entre um instante e outro, como nas pesquisas sobre desemprego, por exemplo. Isso poderia sugerir o uso de painis, rotacionados ou no, devido menor variabilidade das estimativas entre uma tomada e outra, o que garante a confiabilidade da informao. A variabilidade de um momento a outro tende a ser menor, j que toda a amostra, no caso de painis fixos, ou parcela dela, no caso de amostras rotacionadas, composta pelas mesmas unidades domiciliares, onde pode-se esperar que, para intervalos relativamente curtos entre uma tomada e outra, como no caso de levantamentos mensais, os entrevistados no tenham sofrido alteraes substanciais em sua condio

de atividade. Por exemplo, mais provvel que um entrevistado que j se encontrava ocupado no ms anterior de pesquisa continue nessa situao no ms atual do que um desempregado se torne ocupado, no mesmo intervalo de tempo. Ou seja, existe correlao, quase sempre positiva, nas partes fixas dos painis. A utilizao desse recurso tambm pode contribuir para reduzir custos, se houver a possibilidade, para a parte fixa da amostra, de simplificar a coleta das informaes, como por exemplo, atravs da realizao da entrevista inicial, pessoalmente, e das subseqentes, por telefone. As vantagens potenciais desse esquema de coleta de dados, entretanto, so muitas vezes suplantadas pelas srias dificuldades em sua aplicao, que no devem ser desconsideradas no momento do planejamento. Uma delas reside em se efetuarem anlises estatsticas que tirem o justo proveito desses modelos mais complexos de amostragem. Outra, no menos importante, deve-se j mencionada dinmica das metrpoles e a conseqente dificuldade de localizao dos domiclios que compem a parte fixa da amostra comum que, embora a mesma unidade domiciliar seja entrevistada em dois momentos diferentes, os moradores j no sejam mais os mesmos ou que simplesmente no seja possvel localizar exatamente a mesma unidade domiciliar, em reas de rpido crescimento e mudanas, como favelas, por exemplo. Um dos problemas mais srios desse mtodo de coleta, todavia, encontra-se no aumento da taxa de recusa dos moradores em responder pesquisa, que tende a ocorrer justamente quando se localiza a unidade domiciliar procurada e ela continua habitada pelos mesmos moradores. Isso se deve a um desgaste natural produzido pela realizao de entrevistas consecutivas com os mesmos indivduos. Outro efeito prejudicial comum o condicionamento dos entrevistados, ou seja, suas respostas passam a ser influenciadas pelo conhecimento prvio do que lhes ser perguntado. Finalmente, pode haver discrepncias importantes e difceis de serem contornadas entre as respostas oferecidas pelos mesmos entrevistados em tomadas diferentes. As amostras independentes, por outro lado, permitem que se realizem estimativas pontuais e tambm que se avaliem as alteraes ocorridas entre duas tomadas determinadas, sem as dificuldades e desvantagens das amostras de painis, embora com uma variabilidade maior para as comparaes entre tomadas distintas. No entanto, cabe ressaltar que a PED, ao divulgar seus indicadores baseados em trimestres mveis, controla a variabilidade das

130

PLANO AMOSTRAL: PESQUISA DE EMPREGO E DESEMPREGO

comparaes entre trimestres consecutivos graas presena, nesses trimestres, de dois meses com as mesmas informaes. Alm disso, as amostras independentes so particularmente interessantes quando se deseja acumular informaes de vrias tomadas. O acmulo de dados coletados em momentos diversos constitui uma boa alternativa para o estudo de fenmenos raros pois, sem esse recurso, seria necessrio o levantamento de uma nica amostra suficientemente grande para tal, cujo custo poderia, muitas vezes, inviabilizar por completo o estudo desses fenmenos. Entretanto, ao utilizar o acmulo de informaes, importante ter sempre em mente questes relacionadas estabilidade das populaes em estudo. Por exemplo, quando o fenmeno de interesse bastante mutvel com o passar do tempo, no conveniente que se acumulem dados referentes a longos perodos de coleta, sob pena de se obterem resultados e concluses distorcidos. Por outro lado, se os fenmenos ou caractersticas que se pretende estudar apresentam relativa estabilidade ao longo do tempo, os resultados dos dados acumulados so bastante confiveis. Outra importante utilizao das amostras independentes encontra-se na construo de bancos de dados que possam servir como uma amostra mestra para o planejamento de amostras futuras, como ser visto a seguir. A PME (Pesquisa Mensal de Emprego) do IBGE e a LFS (Labor Force Survey Pesquisa de Mo-de-Obra) do Canad constituem exemplos de pesquisas sobre mercado de trabalho realizadas com painis rotacionados. Alm da PED, outro exemplo de pesquisa que se serve de amostras independentes a U.K. General Household Survey, pesquisa geral domiciliar do Reino Unido. Utilizao da Amostra da PED Para o planejamento da PED, optou-se pela utilizao de amostras independentes graas a duas grandes vantagens que ela apresenta: a possibilidade de acumular informaes e a de utilizar a amostra da PED como uma amostra mestra para outras pesquisas. Acmulo de informaes A PED serve-se do acmulo de informaes oferecido pelas amostras independentes de trs formas distintas. A primeira refere-se ao acmulo dos prprios dados levantados pelo questionrio-padro da pesquisa, seja para anlises conjunturais, com a divulgao mensal de indicadores produzidos a partir dos dados de trimestres mveis, como mencionado anteriormente,

seja para anlises de carter mais estrutural, por meio do acmulo de informaes ao longo de perodos mais extensos, em geral um ano ou binio. Diversos estudos desse tipo foram e continuam sendo realizados periodicamente com os dados acumulados da PED. Destacam-se os perfis traados de importantes grupos de mo-de-obra, entre eles os jovens, os idosos, os negros e as mulheres e de diversas categorias profissionais como metalrgicos, trabalhadores nos servios creditcios e financeiros, na construo civil e nos servios domsticos. Estudam-se tambm os desempregados, sua estrutura familiar e seus meios de sobrevivncia utilizados, os ocupados e sua insero setorial, jornada de trabalho e rendimentos recebidos. A segunda forma de aproveitar a possibilidade de acmulo de dados oferecida pelas amostras independentes consiste em coletar, alm dos dados normalmente levantados pela PED atravs de seu questionrio-padro, informaes adicionais nos mesmos domiclios selecionados para entrevista, por questionrios complementares desenhados com o objetivo de colher informaes que ajudem a aprofundar as anlises normalmente realizadas, possibilitando um melhor entendimento ou detalhamento de questes relacionadas mo-de-obra da regio. Como exemplos, podem ser citados os questionrios referentes mobilidade ocupacional da populao em idade ativa e formao profissional. Tal procedimento mostra-se bastante adequado, uma vez que certos aspectos relacionados ao mercado de trabalho urbano, embora relevantes, no justificam a coleta permanente de informaes a seu respeito e sua conseqente sobrecarga nos custos e prazos da pesquisa. A terceira forma consiste na obteno de dados referentes a novas dimenses normalmente no investigadas, por meio de questionrios suplementares ao da PED. Constituem exemplos j realizados a pesquisa sobre hbitos de leitura e acesso Internet e a pesquisa sobre renda e pobreza e acesso a programas sociais. Esses questionrios complementares ou suplementares so geralmente aplicados durante um perodo predeterminado, como um ano ou um semestre, podendo repetir-se o processo a grandes intervalos de tempo, a fim de se obterem parmetros de comparao. A PED como amostra mestra Devido ao tamanho da amostra mensal da PED (aproximadamente 3 mil novos domiclios a cada ms) e tambm ao fato de vir sendo realizada ininterruptamente desde 1985, tem-se, hoje, um grande conjunto de domiclios j selecionados que pode,

131

SO PAULO EM PERSPECTIVA, 17(3-4) 2003

por sua vez, servir como base para a seleo de novas amostras. Esse fim tambm pode ser alcanado aproveitando-se o arrolamento de domiclios dos 600 setores censitrios que totalizam cerca de 300 mil domiclios. Ou seja, a PED pode ser utilizada como uma amostra mestra para outras pesquisas, entre as quais se destacam a de Condies de Vida PCV na Regio Metropolitana de So Paulo e a de Acidentes de Trabalho e Doenas Profissionais. A extenso do banco de dados acumulado da PED tambm permite que ele seja considerado como universo para estudos de simulao (Figura 2). Disponibilizao dos Microdados Todas as informaes coletadas pela PED desde seu incio esto disponveis aos usurios que tenham interesse em estud-las mediante recortes diferentes daqueles normalmente divulgados. Os dados encontram-se em bancos estruturados anualmente e extensivamente documentados, com o objetivo de simplificar sua utilizao.

Embora os microdados estejam disponveis, a privacidade dos entrevistados est completamente protegida graas a diversas caractersticas desses bancos de dados: no constam os nomes nem os endereos dos entrevistados e as informaes referentes aos setores censitrios encontram-se descaracterizadas, servindo apenas para o clculo de erros amostrais. Resumo do Plano Amostral Conforme o apresentado, podemos resumir que o plano amostral utilizado na PED : - uma amostra probabilstica estratificada obtida em dois estgios dos moradores da RMSP localizados nos setores censitrios urbanos do IBGE listados no ltimo Censo disponvel; - o uso de dois critrios de estratificao: um explcito, resultante de agrupamentos homogneos segundo as caractersticas do emprego, e outro implcito, obtido da ordenao geogrfica e por renda dos SCs;

FIGURA 2 Utilizao da Amostra da PED

ACUMULAO DE INFORMAES

AMOSTRA MESTRA

Pesquisa sobre Hbitos de Leitura e Acesso e Usos da Internet

Pesquisa de Condies de Vida (PCV)

Pesquisa sobre Mobilidade Ocupacional da PIA

Posio sobre Formao Profissional

Pesquisa de Emprego e Desemprego (PED)

Pesquisa sobre Acidentes de Trabalho e Doenas Profissionais

Pesquisa sobre Renda e Pobreza e Acesso a Programas Sociais

Pesquisa Oramento Familiar (POF)

Fonte: Fundao Seade. PED.

132

PLANO AMOSTRAL: PESQUISA DE EMPREGO E DESEMPREGO

- sorteio dos SCs com probabilidade proporcional ao nmero de domiclios residenciais ocupados na poca do Censo, e este nmero atualizado antes do sorteio dos domiclios; - sorteio dos domiclios com igual probabilidade dentro de cada SC; - sorteio mensal dos SCs, conjugado em trs painis rotativos. CONTRIBUIO AO DESENVOLVIMENTO DA FUNDAO SEADE No momento da implantao da PED, a Fundao Seade no dispunha de um corpo tcnico especializado na elaborao de planos amostrais de pesquisas domiciliares, o que a levou a buscar profissionais acadmicos com esse perfil. Alm da realizao do plano amostral, a necessidade de acompanhamento permanente da pesquisa, devida ao seu carter de levantamento contnuo, fez com que alguns desses profissionais passassem a integrar o corpo de funcionrios da Fundao. A incorporao desses tcnicos e a experincia adquirida com a realizao da PED possibilitaram Fundao Seade o desenvolvimento e a realizao de diversas outras pesquisas domiciliares e no-domiciliares por amostragem. Alm disso, o desafio de obter controle de qualidade praticamente total nos resultados da pesquisa, que s poderia ser superado com o trabalho integrado de todas as equipes envolvidas em sua produo, levou a uma nova conscincia e a um novo padro de trabalho, por sua vez tambm estendido a futuras pesquisas e estudos realizados. Um dos aspectos de controle de qualidade das informaes que merece destaque o da opo por divulgar apenas indicadores com confiabilidade fixada (coeficiente de variao de no mximo 7,5%), o que garante a preciso de todos os dados que vm a pblico, e permite que especialistas ou leigos utilizem os resultados da pesquisa divulgados sem a necessidade de cuidados adicionais. Outra contribuio importante oferecida pela PED instituio foi a introduo e incorporao de tcnicas estatsticas at ento pouco exploradas, por exemplo, os mtodos multivariados, como anlise de agrupamentos (clusters), discriminante e outras. A familiarizao dos analistas com tais tcnicas permitiu a gerao de indicadores capazes de refletir diversas dimenses de uma realidade. A anlise de agrupamentos foi utilizada com sucesso na Pesquisa de Condies de Vida, na qual se procura classificar as famlias com

base em sua condio de vida, avaliada em dimenses distintas, como caractersticas da moradia e educao, rendimento, insero no mercado de trabalho e sade dos membros da famlia. Outro exemplo de seu uso encontra-se na gerao do IPRS ndice Paulista de Responsabilidade Social, que tem o objetivo de analisar os municpios do Estado de So Paulo por meio de indicadores sintticos que abrangessem diversas dimenses de riqueza dos municpios e de educao e sade de seus habitantes. CONSIDERAES FINAIS Assim como em sua parte conceitual, a PED busca atender a questes especficas da realidade brasileira, como a grande heterogeneidade dos mercados de trabalho urbanos e a dificuldade de se estabelecerem limites especficos entre as possveis condies de atividade da populao em idade ativa, no que se refere ao levantamento da amostra tambm foi considerada a especificidade regional, bem como a experincia internacional, a fim de se obter um planejamento eficiente e condizente com os recursos disponveis. A limitao de recursos financeiros e a necessidade de um tamanho mnimo de amostra para garantir a confiabilidade dos resultados levaram soluo de se realizarem levantamentos trimestrais com divulgao mensal de dados, obtendo-se, assim, a possibilidade de acompanhamento conjuntural do mercado de trabalho com uma amostra mensal relativamente pequena e custos menores. A adoo de amostras independentes, alm de simplificar o procedimento de coleta dos dados, permitiu que se acumulassem informaes por perodos mais extensos e, dessa forma, se realizassem anlises estruturais ou estudos de fenmenos raros. Tal possibilidade de acmulo de dados, combinada longa durao da pesquisa, realizada ininterruptamente desde sua origem em 1985, faz com que a amostra da PED possa, por sua vez, ser considerada uma amostra mestra para futuros estudos. A organizao de todos os dados at hoje coletados em bancos estruturados e bem documentados garante a facilidade de acesso da sociedade s informaes que buscam retratar alguns de seus aspectos importantes. Finalmente, a realizao da PED exigiu a formao de uma equipe interna com um novo perfil profissional que pde servir-se da experincia adquirida nessa pesquisa para o desenvolvimento e a realizao de outras investigaes, domiciliares ou no, e para a gerao de indicadores sociais inovadores.

133

SO PAULO EM PERSPECTIVA, 17(3-4) 2003

REFERNCIAS BIBLIOGRFICAS
BOLFARINE, H.; BUSSAB, W.O. Elementos de amostragem. Verso preliminar. So Paulo: Instituto de Matemtica e Estatstica da Universidade de So Paulo, 2000. BUSSAB, W.O.; DINI, N.P. Pesquisa de Emprego e Desemprego Seade/ Dieese: regies homogneas da Grande So Paulo. So Paulo em Perspectiva, So Paulo, Fundao Seade, v.1, n.3, p.5-11, set./ dez. 1985. COCHRAN, W.G. Sampling techniques. 3. ed. New York: John Wiley & Sons, Inc., 1977. DUNCAN, G.J.; KALTON, G. Issues of design and analysis of surveys across time. International Statistical Review, Great Britain, v.55, n.1, p.99-117, 1987. KALTON, G. Introduction to survey sampling. 4. ed. Beverly Hills: Sage Publications, Inc., 1983.

KISH, L. Survey sampling. 3. ed. New York: John Wiley & Sons, Inc., 1965. TROYANO, A.A.A. Trajetria de uma pesquisa: avanos e obstculos. So Paulo em Perspectiva, So Paulo, Fundao Seade, v.4, n.3/4, jul./dez. 1990.

WILTON DE OLIVEIRA BUSSAB: Professor de Mtodos Quantitativos da Escola de Administrao de Empresas de So Paulo FGV. NDIA PINHEIRO DINI: Estatstica, Gerente de Mtodos Quantitativos da
Fundao Seade.

SILVIA REGINA MANCINI: Estatstica, Analista da Fundao Seade.

134