Você está na página 1de 19

UNIVERSIDADE FEDERAL DA PARAÍBA - UFPB

CENTRO DE CIÊNCIAS SOCIAIS APLICADAS - CCSA


DEPARTAMENTO DE FINANCAS E CONTABILIDADE - DFC

Análise da opção de optar ou não uma


previdência complementar no estado da Paraíba

João Pedro Stênia Farias da Silva


Isais Felipe Silva de Sousa
Beatriz Gomes Olimpio

JOÃO PESSOA - PB
2023

1
Sumário
1 Introdução 3
1.1 Pirâmide etária . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Projeção da pirâmide etária . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Metodologia 6
2.1 Variáveis escolhida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.1 Idade - (V2009) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.2 Sexo - (V2007) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.3 Etnia - (V2010) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.4 Regime trabalhista CLT - (V4012) . . . . . . . . . . . . . . . . . . . . . 7
2.1.5 Renda mensal - (V403412) . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.6 Educação - (VD3004) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.7 Contribuição previdenciária - (V4032) . . . . . . . . . . . . . . . . . . . . 7
2.2 Modelo empírico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3 Função logit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3 Regressão logística binária 10

4 Estatísticas descritivas 11
4.1 Contribuição por etnia e gênero . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2 Salário médio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.3 Distribuição do salário por sexo . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

5 Pressupostos da regressão logit 13


5.1 Heterocedasticidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.2 Multicolinearidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
5.3 Autocorrelação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

6 Resultados 15
6.1 Estimação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
6.2 Curva de ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
6.3 Interpretação dos resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

7 Considerações finais 18

8 Referências 19

2
1 Introdução
No Brasil, um dos três pilares do sistema nacional de seguridade social é o sistema pre-
videnciário, sendo essse, destrinchado em: regime geral de previdência social, regime próprio
de previdência social e previdencia complementar. Sendo assim, o regime geral (RGPS) vem
sendo um assunto bastante caloroso na política brasileira. São discutidos várias maneiras de
realizar uma reforma previdenciária a fim de banalizar o deficit do RGPS. No meio de toda
essa discussão, alguns acreditam que o investimento na previdencia complementar, que possui
caracter optativo, é uma solução para não depender do sistema social.
A previdência privada é um investimento que proporciona suporte financeiro após o período
de trabalho. No Brasil, o governo é encarregado de administrar os benefícios previdenciários
oficiais, coletando contribuições ao longo da vida produtiva do indivíduo, que serão usadas
para cobrir os gastos com a aposentadoria. Na previdência privada, o próprio indivíduo faz
contribuições periódicas para garantir uma renda no futuro, de acordo com o montante de
recursos acumulados e o tipo de plano escolhido.
A previdência privada pode servir como um complemento à previdência social no período
da aposentadoria, por isso também é chamada de previdência complementar. Nesse sentido,
ela pode ser vista como um meio de manter o padrão de vida obtido durante a vida laboral, já
que a previdência oficial possui um valor máximo para o benefício individual (MADUREIRA
et al., 2016).
De acordo com o Instituto Brasileiro de Geografia e Estatística (IBGE), a expectativa de
vida da população brasileira subiu para 77 anos. Com o aumento da expectativa de vida do
brasileiro, é compreensível concluir que contar apenas com a previdência social pode não ser
suficiente para manter certos padrões de vida na aposentadoria. O aumento da longevidade
traz desafios para o sistema previdenciário, uma vez que mais tempo de aposentadoria requer
uma fonte de renda sólida para sustentar um padrão de vida desejado.
Isso enfatiza a importância de considerar alternativas de planejamento financeiro para a
aposentadoria, como a previdência privada, investimentos em longo prazo e a formação de uma
poupança pessoal. Diversificar as fontes de renda na aposentadoria pode ajudar as pessoas a
garantir um futuro financeiramente estável e manter um padrão de vida satisfatório à medida
que vivem mais tempo.

1.1 Pirâmide etária


A pirâmide etária brasileira é uma representação gráfica que fornece informações valiosas
sobre a estrutura demográfica da população do Brasil. Ela é uma ferramenta importante para
analisar tendências relacionadas a natalidade, idade média da população, longevidade e muitos
outros aspectos demográficos e sociais.
A pirâmide etária do Brasil reflete um aumento na expectativa de vida, que se reflete
no crescimento do número de pessoas idosas. No entanto, esse aumento na longevidade é
acompanhado por uma redução na taxa de natalidade ao longo das últimas décadas, o que

3
pode levar a uma diminuição no número de jovens na população. Essas mudanças na estrutura
etária da população brasileira têm gerado discussões sobre a sustentabilidade do sistema de
previdência pública.
Se a proporção de idosos continuar a crescer e ultrapassar a de indivíduos em idade ativa, a
capacidade de financiar as aposentadorias no sistema de previdência oficial pode ser comprome-
tida, tornando-o deficitário. Nesse cenário, é crucial entender o comportamento do indivíduo
em relação ao financiamento de sua própria aposentadoria. Isso envolve a compreensão das
características daqueles que optam por investir em planos privados de previdência no Brasil.
Muitas pessoas recorrem à previdência privada como uma forma de complementar a previdên-
cia social, garantindo uma renda mais estável e adequada na aposentadoria. Essa escolha pode
depender de diversos fatores, como o nível de renda, o grau de confiança no sistema público
de previdência, o conhecimento financeiro e a capacidade de poupança do indivíduo. O en-
tendimento dessas características é fundamental para o planejamento de políticas públicas e a
adequação do sistema previdenciário brasileiro às necessidades da população em um contexto
de envelhecimento demográfico.
A tabela abaixo mostra a proporção da população residente por grupos etários específicos
no Brasil entre 1980 e 2022.

Ano População de 0 a 14 População de 15 a 59 População de 60 anos


anos (%) anos (%) ou mais de idade (%)
1980 38,2 55,6 6,1
1991 34,7 58,0 7,3
2000 29.6 61,9 8,6
2010 24,1 65.1 10,8
2022 19,8 64,4 15,8

Tabela 1: Fonte: IBGE, Censo Demográfico 1980/2022.

A partir da tabela acima, é possível observar a problemática abordada. Com o passar dos
anos a população brasileira envelheceu a uma taxa significante. A proporção da população com
idade de 0 a 14 anos diminuiu consideravelmente ao longo das décadas, o que indica uma queda
na taxa de natalidade. A proporção da população com idade entre 15 e 59 anos, que geralmente
é considerada a população em idade produtiva, aumentou, embora tenha havido uma diminuição
relativa em relação à população mais idosa. A proporção da população com 60 anos ou mais
aumentou significativamente, refletindo um envelhecimento da população brasileira.
Essa mudança na estrutura etária da população, com um aumento na proporção de pessoas
idosas, é um desafio demográfico importante. Ela tem implicações significativas para a previ-
dência social, especialmente pelo tipo de estrutura que é formada a previdência social brasileira,
pois uma população mais idosa pode exigir apoio financeiro na aposentadoria.

4
1.2 Projeção da pirâmide etária
Segundo o Instituto Brasileiro de Geografia e Estatística (IBGE), o índice de envelhecimento
aponta para mudanças na estrutura etária da população brasileira. Em 2008, para cada grupo
de 100 crianças de 0 a 14 anos existem 24,7 idosos de 65 anos ou mais. Em 2050, o quadro
muda e para cada 100 crianças de 0 a 14 anos existirão 172, 7 idosos. O Instituto Brasileiro de
Geografia e Estatística ainda ressalva que vida média do brasileiro chegará ao patamar de 81
anos em 2050.
A partir dos dados projetos pelo IBGE, foi possível elaborar as seguintes pirâmides etárias
para o Brasil:

Fonte: Elaboração própria

Com base nos gráficos e informações apresentados anteriormente, é possível reforçar a preo-
cupação com os desafios que o sistema previdenciário brasileiro enfrenta. Os dados demográficos
que indicam o envelhecimento da população, com uma diminuição na proporção de jovens e um
aumento na proporção de idosos.

5
2 Metodologia
A base de dados utilizada neste estudo é a Pesquisa Nacional por Amostra de Domicílios
(PNAD), conduzida pelo Instituto Brasileiro de Geografia e Estatística (IBGE) em 2012. A
PNAD tem como objetivo investigar as características gerais da população e do mercado de
trabalho. Este estudo se baseia nos microdados dos indivíduos coletados na PNAD para o
primeiro trimestre de 2022. A análise se concentra nos indivíduos com idades entre 18 e 65
anos, que são considerados na faixa etária produtiva.

2.1 Variáveis escolhida


Saliento que todas as hipóteses aqui descritas representam as expectativas prévias relacio-
nadas às variáveis em questão.

2.1.1 Idade - (V2009)

A idade está diretamente ligada à expectativa de vida e representa um fator crucial a ser
levado em consideração. Indivíduos mais jovens tendem a desfrutar de uma expectativa de
vida mais longa e, portanto, podem necessitar de uma reserva de aposentadoria maior para
manter seu padrão de vida durante a velhice. Geralmente, os jovens têm uma capacidade de
contribuição mais alta, uma vez que estão em uma fase da vida dedicada à construção de suas
carreiras e podem alocar uma parcela maior de sua renda para investimentos de longo prazo,
como uma previdência complementar. Em contrapartida, pessoas mais velhas podem enfrentar
outras obrigações financeiras, como despesas educacionais de seus filhos, o que pode limitar a
disponibilidade de recursos para contribuir.

2.1.2 Sexo - (V2007)

Ao longo da história, as mulheres têm geralmente uma expectativa de vida superior à dos
homens. Isso implica que as mulheres podem necessitar de uma renda de aposentadoria por um
período mais prolongado, fator que pode influenciar suas escolhas em relação às contribuições
para um plano de previdência complementar. Em diversas sociedades, as mulheres enfrentam
discrepâncias salariais em comparação com os homens, auferindo uma remuneração menor
ao longo de suas trajetórias profissionais. Isso pode afetar a capacidade de uma mulher de
economizar e investir em um plano de previdência complementar. Para fins de modelagem
estatística, essa variável foi considerada binária, ou seja, 1 para o sexo masculino ou 0 para o
sexo feminino.

2.1.3 Etnia - (V2010)

Muitos conjuntos étnicos e grupos raciais têm históricos de enfrentar discriminação e de-
safios financeiros únicos. Essas disparidades podem resultar em acesso limitado a empregos
bem pagos, educação de excelência e chances de desenvolvimento econômico. Freqüentemente,

6
grupos étnicos e raciais minoritários apresentam uma média de renda inferior à dos grupos
dominantes. Devido a essas desigualdades socioeconômicas, a possibilidade de investir em um
plano de previdência complementar é reduzida. Salienta-se aqui, novamente, para fins de mo-
delagem, a variável em questão foi considerada binaria, ou seja, 1 para pessoas brancas e 0 para
as demais raças (indígenas, negros, pardos e amarelos).

2.1.4 Regime trabalhista CLT - (V4012)

Inicialmente, uma pessoa que desfruta de uma remuneração acima da média possui uma
vantagem significativa quando se trata de planejar seu futuro financeiro. Essa situação finan-
ceira favorável cria um cenário propício para considerar a adesão a um plano de previdência
complementar, e isso pode ter um impacto positivo na decisão de optar ou não por esse tipo
de investimento. Para fins de modelagem, a variável comentada foi considerada como binária,
de forma que, seja igual a 1 se o entrevistado seja um trabalhador sobre o regime CLT e 0 se
não. A variável em questão possuí tanto informações sobre se o entrevistado atuava no regime
trabalhista CLT ou demais tipos de regime trabalhistas, dessa forma, pode-se fazer uma outra
variável sobre o regime dos servidores públicos.

2.1.5 Renda mensal - (V403412)

Inicialmente, alguém com um rendimento mais elevado provavelmente possui uma maior
capacidade financeira, o que aumenta suas chances de considerar a adesão a um plano de
previdência complementar visando à segurança financeira no futuro.

2.1.6 Educação - (VD3004)

A priori, esperamos que uma pessoa que tenha o nível de educação de uma graduação, tenha
uma influência positiva que nos demosntra uma melhor administração da sua renda e dos seus
gastos. Para uma pessoa que tenha o nível de educação de uma graduação, essa pode tender
a optar por um plano de previdência complementar, por ter uma bagagem e experiências com
seus gastos financeiros.

2.1.7 Contribuição previdenciária - (V4032)

A contribuição previdênciaria é nossa variavel endógena, ou seja, a variável dependente


cujo comportamente está sendo analisado a partir da supostas influências das demais variáveis
independentes.

2.2 Modelo empírico


O processo de modelagem por regressão é uma abordagem estatística que visa entender
e descrever as relações entre variáveis. É frequentemente usado para prever o valor de uma
variável dependente com base nas variações de uma ou mais variáveis independentes. No

7
presente estudo, a variável que é estudanda, contribuição previdenciária, pode ter apenas dois
resultados possíveis "sim"ou "não".
Nesse contexto, a regressão logística se revela uma técnica altamente adequada para a análise
do problema em questão. A regressão logística se destaca das outras técnicas de modelagem,
especialmente devido à sua aplicação em situações em que a variável dependente é categórica.
Esta técnica é projetada para avaliar a probabilidade de ocorrer uma das categorias da variável
dependente. Portanto, tem a capacidade de estimar a probabilidade de ocorrência de um evento
específico e também de quantificar a influência de cada variável independente sobre o evento
em estudo.
Mesquita (2014) observa que, embora a regressão logística tenha tido sua origem na área
médica, sua eficácia notável possibilitou sua aplicação em uma ampla variedade de campos do
conhecimento.

Segundo Gonzalez (2018) o modelo de regressão logística permite:

• Modelagem da probabilidade de ocorrência de um evento, com base em variáveis inde-


pendentes, que podem ser categóricas ou contínuas, é um objetivo da regressão logística.
Como exemplo, consideremos a aplicação de um modelo logístico no contexto de doenças
cardíacas. Nesse cenário, desejamos calcular a probabilidade de um indivíduo, com 50
anos de idade e um peso de 120 quilos, desenvolver doença cardíaca. Ao inserir esses
dados no modelo, o resultado será um valor situado entre 0 e 1, representando essa pro-
babilidade. Por exemplo, se o valor for igual a 0,60, isso significa que uma pessoa com 50
anos e 120 quilos tem uma probabilidade de 60% de ter doença cardíaca;

• A estimativa da probabilidade de ocorrência de um evento em comparação com a proba-


bilidade de não ocorrência desse evento é uma parte fundamental da análise estatística.
Para ilustrar, consideremos o exemplo de uma pessoa com 50 anos e um peso de 120 qui-
los, que tem uma probabilidade P = 0, 75 de desenvolver uma doença cardíaca. Portanto,
a probabilidade de não desenvolver a doença é 1 − P = 0, 25. Nesse contexto, a razão de
probabilidades 1−PP
, conhecida como "odds,"seria igual a 3. Isso implica que uma pessoa
com essas características tem três vezes mais chances de desenvolver uma doença cardíaca
do que de não desenvolvê-la. A relação de odds é uma medida importante utilizada na re-
gressão logística para quantificar e comparar as chances de um evento ocorrer em relação
a não ocorrer com base em diferentes variáveis independentes;

• Prever o impacto do conjunto de variáveis sobre a variável dependente que é binária;

• Classificar observações ao estimar a probabilidade de uma observação pertencer a uma


categoria específica.

8
Pelo fato da variável dependente ser binária, isto é, assume apenas dois valore, 1 ou 0. Por-
tanto, a mesma possui uma distribuição de Bernoulli, onde esse distribuição é um caso especial
da distribuição binomial. A distribuição de Bernoulli possui uma probabilidade desconhecida
P.

1, caso ocorra sucesso
Y =
0, caso ocorra fracasso

2.3 Função logit


Conforme mencionado anteriormente, a variável dependente em uma regressão logística
segue uma distribuição de Bernoulli, o que requer a utilização de um link denominado "logit."Na
regressão logística, não trabalhamos diretamente com a probabilidade padrão p da distribuição
de Bernoulli. Dessa forma, o objetivo do modelo econométrico é estimar p com base em uma
combinação linear das variáveis independentes. O valor estimado de p é representado como p̂.
Para relacionar a combinação linear das variáveis à distribuição de Bernoulli, é necessário
uma função que as conecte ou mapeie a combinação linear de variáveis para que ela possa
retornar valores dentro de uma distribuição de probabilidade de Bernoulli. A razão de pro-
babilidades é chamada de "odds", e seu logaritmo natural, o logit, é representado da seguinte
forma:
 
p
ln(odds) → ln (1)
1−p

Fonte: Adaptado de (Gujarati; Porter; 2011)

Entretanto, no gráfico da função logit mostrada, os valores entre 0 e 1 percorrem o eixo x, mas
desejamos que as probabilidades estejam no eixo y. Isso pode ser alcançado através da inversa
da função logit. A partir da equação (1), temos:

1 eα
logit−1 (α) = = (2)
1 + e−α 1 + eα

Onde α é a combinação linear das variáveis e seus coeficientes. A função logit inversa, nos
retornará uma gráfico em formato de "S"da seguinte forma:

9
3 Regressão logística binária
Seja:
g(x) = β0 + β1 x1 + ... + βn xn (3)

Uma função linaer das variáveis independentes, sendo que β0 , β1 até βn são os coeficientes
e x1 até xn as variáveis independentes do modelo. Dessa forma, igualando (3) e (1), temos:

p
ln( ) = β0 + β1 x1 + ... + βn xn (4)
1−p
Entretando, o objetico do modelo logístico é estimar p, logo, se faz necessário isolar o mesmo.
Utilizando o antilogaritmo:

p
= eβ0 +β1 x1 +...+βn xn (5)
1−p
Isolando o p, obtemos:

eβ0 +β1 x1 +...+βn xn 1


p̂ = β +β x +...+β x
= −(β
(6)
1+e 0 1 1 n n 1 + e 0 1 x1 +...+βn xn )

Onde a equação (6) é a chamada "regressão estimada", e é, essencialmente a função que


representa o objetivo do modelo de regressão logística, pois p̂ é a probabilidade estimada para
quaisquer valores de coeficiente e variáveis que venhamos a colocar nesta equação (Gonzalez,
2018).
Neste estudo, será utilizada a razão de chances do modelo logit para estimar a demanda por
previdência privada. Os efeitos de cada variável serão interpretados como uma variação percen-
tual na razão de chances. Em outras palavras, um aumento de uma unidade em uma variável
explicativa resultará em um aumento (ou redução) percentual nas chances de contribuir para
a previdência complementar. Como o modelo logit é não-linear, os parâmetros são estimados
pelo método de máxima verossimilhança (Gujarati; Porter, 2011). O modelo a ser análisado é
estrurado da seguinte forma:

p
ln = β0 + β1 idade + β2 sexo + β3 etnia + β4 CLT + β6 Renda + β7 Educ + µ
1−p

10
4 Estatísticas descritivas
4.1 Contribuição por etnia e gênero

Etnia Contribuição PC
Gênero Brancos Outros Brancos Outros
Masculino 1112 2399 111 165
Feminino 1196 2576 107 174
Total 2308 4975 218 339

Tabela 2: Fonte: Elaboração própria

Os dados apresentados revelam que a proporção de pessoas que investem em uma previdência
complementar é significativa, representando cerca de 7% da amostra. É notável que as pessoas
de origem étnica branca contribuem mais para a previdência complementar do que os outros
grupos étnicos, com uma taxa de aproximadamente 5%. No entanto, ao analisar por gênero,
observa-se que cerca de 10% dos homens brancos e cerca de 9% das mulheres brancas contribuem
para uma previdência complementar. Essa análise destaca a proporção significativa e uma
espécie de "domínio"da etnia branca nas contribuições para a previdência complementar.
Para efeitos de comparação, aproximadamente 9, 5% dos indivíduos brancos na amostra
contribuem para uma previdência complementar, enquanto os outros grupos étnicos juntos
possuem uma taxa de aproximadamente 6% de contribuição para uma previdência privada.
Portanto, fica evidente que os indivíduos de etnia branca têm uma predominância mais signi-
ficativa nesse contexto.

Com base nessa informações, pode-se concluir que:

• A proporção de pessoas que não investem em uma previdência complementar é relativa-


mente alta, atingindo cerca de 7% da amostra. Isso sugere que uma parte significativa da
população não está se preparando financeiramente para a aposentadoria por meio desse
tipo de investimento.

• Há uma diferença notável na contribuição para a previdência complementar entre dife-


rentes grupos étnicos. Pessoas de origem étnica branca contribuem em maior proporção,
representando cerca de 5% da amostra. Esse grupo étnico parece estar mais envolvido em
investimentos de previdência complementar.

• Ao desagregar os dados por gênero, notamos que a taxa de contribuição para a previdência
complementar é ainda mais alta entre homens brancos, atingindo cerca de 10%. Isso sugere
uma tendência de maior participação dos homens brancos nesse tipo de investimento.

• Por outro lado, os outros grupos étnicos juntos possuem uma taxa de contribuição consi-
deravelmente menor, aproximadamente 6%, indicando uma menor participação na previ-
dência complementar em comparação com os brancos.

11
Em resumo, os dados sugerem que a etnia branca está mais fortemente representada na
contribuição para a previdência complementar, com os homens brancos mostrando a maior taxa
de participação. No entanto, é importante observar que as conclusões podem ser influenciadas
por diversos fatores, incluindo condições socioeconômicas e culturais.

4.2 Salário médio

Fonte: Elaboração própria

Ao examinar a distribuição da renda média em relação à idade, observa-se uma tendência


crescente no início da carreira profissional, atingindo o pico por volta dos 40 anos de idade. No
entanto, a curva de distribuição posteriormente começa a declinar com o passar do tempo. É
importante notar que existe uma disparidade na distribuição final dos dados obtidos por meio
dessa regressão polinomial simples. Para esta seção do estudo, o objetivo principal é obter
uma compreensão geral da base de dados, sem aprofundar-se nas causas dessa disparidade. No
entanto, essa análise inicial fornece pistas valiosas para investigações posteriores e análises mais
detalhadas.

12
4.3 Distribuição do salário por sexo

Fonte: Elaboração própria

Ao examinar essa distribuição, é evidente que os homens não apenas possuem uma média
salarial superior, mas também apresentam uma maior dispersão na distribuição de salários.
Isso pode ser devido a uma série de fatores, como diferenças nas carreiras, negociação salarial
e representatividade em setores de maior remuneração. Além da média mais alta, os dados dos
salários masculinos também exibem uma variação maior, o que sugere uma dispersão ampla
nos valores dos salários dos homens. Isso pode ser resultado da diversidade de carreiras.

5 Pressupostos da regressão logit


5.1 Heterocedasticidade
Segundo (Hua, Choi, Shi, 2014) A regressão logística permite analisar as relações e a força
das variáveis. Diferentemente da regressão linear, a regressão logística não assume uma relação
linear entre as variáveis dependentes e independentes. No entanto, a regressão logística pres-
supõe a linearidade das variáveis independentes e dos logaritmos das probabilidades (log odds)
da variável dependente. As variáveis independentes não precisam ser intervalares, nem seguir
uma distribuição normal, nem estar relacionadas de forma linear, nem apresentar igual variân-
cia em cada grupo. A homoscedasticidade não é um requisito. Os termos de erro (resíduos)
não precisam seguir uma distribuição normal. Dito, temos o seguinte resultado para o teste de
heterocedasticidade:

Teste Valor (
Breusch-Pagan 2.2e-16 H0 → Heterocedasticidade
H1 → Homocedasticidade
Tabela 3: Fonte: Elaboração própria

Dessa forma, não rejeitamos a hipótese nula, indicando que há heterocedasticidade no mo-
delo.

13
5.2 Multicolinearidade
Ausência de multicolinearidade, a regressão logística exige que haja pouca ou nenhuma
multicolinearidade entre as variáveis independentes. Isso implica que as variáveis independentes
não devem estar altamente correlacionadas entre si (Gregory, Bader, Karlen., (2018).
Abaixo podemos ver a matriz de correlação entre as variáveis:

Sexo Idade Etnia CLT Renda Educação Contri. prev.


Sexo 1.00 -0.269 -0.00038 0.2581 0.1086 -0.085 0.00723
Idade -0.269 1.00 0.124 -0.148 0.060 0.0053 0.055
Etnia -0.0003 0.0124 1.00 -0.15 0.0941 0.137 0.045
CLT 0.258 -0.147 -0.015 1.00 0.124 0.0022 -0.0834
Renda 0.108 0.0608 0.0941 0.1241 1.00 0.39 0.218
Educação -0.085 0.0053 0.137 0.0022 0.3901 1.00 0.1866
Contri. previ. 0.0072 0.055 0.0456 -0.0834 0.218 0.186 1.00

Tabela 4: Fonte: Elaboração própria

Abaixo temos os valores dos VIF das variáveis independentes:

Idade Sexo Etnia CLT Renda Educação


1.026274 1.066515 1.034780 1.049391 1.335344 1.32859

Tabela 5: Fonte: Elaboração própria

5.3 Autocorrelação
A autocorrelação em uma regressão logística é um conceito que se relaciona com a de-
pendência entre as observações ou erros residuais do modelo. Ela indica se os erros residuais
das observações não são independentes entre si, o que pode afetar a qualidade do modelo de
regressão logística.
A autocorrelação geralmente é mais discutida em contextos de séries temporais, onde as ob-
servações ao longo do tempo podem estar correlacionadas. No entanto, em análises de regressão
logística, a autocorrelação também pode ser relevante em algumas situações, como quando as
observações não são independentes ou quando os dados têm uma estrutura de agrupamento
(por exemplo, dados longitudinais).

Teste Valor (
Durbin Watson 6.531e-13 H0 → Autocorrelação
H1 → Ausência da autocorrelação
Tabela 6: Fonte: Elaboração própria

Dessa forma, não rejeitmos a hipótese nula da presença de autocorrelação nos dados.

14
6 Resultados
Os resultados foram derivados da estimativa econometricamente de um modelo logit, utili-
zando os microdados da PNAD referentes ao primeiro trimestre de 2022 no estado da Paraíba.
Nesse processo, foi estimada a relação entre as variáveis de interesse, ou seja, a contribuição
para um plano de previdência privada, e as variáveis independentes.
Os efeitos de cada variável serão interpretados como uma variação percentual na razão de
chances. Em outras palavras, um aumento de uma unidade em uma variável explicativa resulta
em um aumento (ou redução) percentual nas chances de contribuir para a previdência privada,
conforme expresso na seguinte equação: eβi xi

6.1 Estimação

Coeficiente Parâmetro std error z-value Pr(>|z|)


Intercepto -3.2527290 0.1837636 -17.701 < 2e-16 ***
Idade 0.0107741 0.0040907 2.634 0.00844 **
Sexo 0.2069073 0.0948806 2.181 0.02920 *
Renda 0.0001337 0.0000174 7.682 1.57e-14 ***
Etnia 0.0993955 0.0968344 1.026 0.30468
CLT -1.0653546 0.1444720 -7.374 1.65e-13 ***
Educação 1.0486418 0.1191297 8.803 < 2e-16 ***

Tabela 7: Fonte: Elaboração própria

Pseudo R2 Valor
McFadden 0.09027353

Tabela 8: Fonte: Elaboração própria

A estimativa dos parâmetros por meio do método de máxima verossimilhança indica que,
com exceção da variável etnia, todas as demais são estatisticamente significantes a um nível de
5%, que é um nível de significância amplamente utilizado na análise estatística.

6.2 Curva de ROC


A Curva ROC (Receiver Operating Characteristic) é uma ferramenta gráfica usada para avaliar
o desempenho de um modelo de classificação binária. Ela representa a relação entre a taxa de
verdadeiros positivos (TPR) e a taxa de falsos positivos (FPR) em diferentes pontos de corte
(thresholds) usados para classificar as observações em uma das duas classes.
A curva AUC - ROC é uma medida de desempenho para os problemas de classificação em
várias configurações de limite. ROC é uma curva de probabilidade e AUC representa o grau
ou medida de separabilidade. Diz o quanto o modelo é capaz de distinguir entre as classes.
Quanto maior a AUC, melhor será o modelo em prever 0 classes como 0 e 1 classe como 1.

15
O modelo possui a seguinte curva de ROC com AUC = 0,773:

6.3 Interpretação dos resultados

Coeficiente Odds
Intercepto 0.03866854
Idade 1.010832
Sexo 1.229869
Renda 1.000134
Etnia 1.104503
CLT 0.3446056
Educação 2.853772

Tabela 9: Fonte: Elaboração própria

Quando o valor das chances (odds) é menor do que 1 em um modelo logit, indica que a
interpretação do coeficiente correspondente é diminutiva. Isso significa que um aumento na
variável independente associada a esse coeficiente diminuirá a probabilidade de uma pessoa ter
uma previdência complementar em relação à probabilidade de não ter. Em outras palavras, a
variável está negativamente relacionada com a probabilidade de contribuir para a previdência
complementar.
No caso da variável idade com um odd de 1.010832, isso significa que, à medida que a
idade aumenta em um ano, a chance de um indivíduo optar por uma previdência complementar
aumenta em aproximadamente 1%. Portanto, a idade tem uma influência positiva no modelo,
sugerindo que, quanto mais velho o indivíduo, maior a probabilidade de aderir a uma previdência
complementar.
A variável "sexo"tem uma influência positiva nas chances de um indivíduo optar por uma
previdência complementar. Como a variável é binária (homem ou mulher), a interpretação
é que um indivíduo do sexo masculino possui aproximadamente 23% a mais de chances de
optar por uma previdência complementar em comparação com um indivíduo do sexo feminino.

16
Isso significa que, todas as outras variáveis constantes, a probabilidade de um homem escolher
uma previdência complementar é aproximadamente 23% maior do que a probabilidade de uma
mulher fazer a mesma escolha.
Para a variável "renda", quando o odds de uma variável é igual a 1.000134 em um modelo
logit, isso sugere que a variável praticamente não afeta as chances de o evento ocorrer. que
um aumento na variável "renda"terá um impacto muito pequeno ou quase insignificante nas
chances de um indivíduo optar por uma previdência complementar. Isso significa que a variável
"renda"não é um preditor forte ou significativo da decisão de contribuir para a previdência
privada no modelo logit. Talvez a decisão de optar por uma previdência complementar esteja
mais atrelada a educação financeira e economica do individuo do que com sua renda de fato.
A decisão de contribuir para uma previdência complementar não se resume apenas à renda
disponível, mas também à compreensão do indivíduo sobre as vantagens e desvantagens desse
tipo de investimento, seu planejamento financeiro e sua capacidade de avaliar o impacto a
longo prazo. Educação financeira e conhecimento sobre previdência privada podem influenciar
a tomada de decisões informadas.
Para a variável "etnia,"que é binária, o odds de uma pessoa branca optar por uma previ-
dência complementar é aproximadamente 10% maior do que o odds de uma pessoa das demais
etnias optar por uma previdência complementar. Isso significa que, mantendo todas as outras
variáveis constantes, as chances de uma pessoa branca aderir a uma previdência complemen-
tar são cerca de 10% maiores do que as chances de uma pessoa de outras etnias aderir a essa
previdência.
Para a variável "CLT", ou seja, se a pessoa trabalha sobre o regime CLT, temos que seu
odds é inferior a 1, sendo assim influenciando negativamente a probabilidade de uma pessoa
optar ou não uma previdência complementar. Para a variáel em questão, o odds de uma pessoa
que trabalha sob o regime CLT optar por uma previdência complementar é aproximadamente
34,5% menor do que o odds de uma pessoa que não trabalha sob o regime CLT optar por uma
previdência complementar. Isso significa que, mantendo todas as outras variáveis constantes, as
chances de uma pessoa que trabalha sob o regime CLT aderir a uma previdência complementar
são cerca de 34,5% menores do que as chances de uma pessoa que não trabalha sob o regime
CLT aderir a essa previdência.
Para a variável "Educação", ou seja, se a pessoa possuíl um nível de educação de ensino
superior completo. Tem-se uma odd de 1.852804, de forma que, isso significa que as chances
de uma pessoa com ensino superior completo optar por uma previdência complementar são
aproximadamente 2,9 vezes maiores do que as chances de uma pessoa sem ensino superior com-
pleto optar por uma previdência complementar. Isso indica que a variável "Educação"tem uma
influência positiva nas chances de contribuir para uma previdência complementar para aqueles
com ensino superior completo. Ter um diploma de ensino superior completo está associado a
uma probabilidade significativamente maior de optar por uma previdência complementar em
comparação com aqueles que não possuem esse nível de educação.

17
7 Considerações finais
O objetivo deste estudo foi analisar como variáveis como idade, gênero, renda, etnia, tipo de
regime trabalhista e nível de escolaridade (completo ou incompleto) afetam a decisão das pessoas
de investir em previdência privada como uma alternativa para complementar a previdência
oficial. O estudo teve como propósito contribuir com evidências, que ainda são limitadas, sobre
a demanda por previdência privada no Brasil.
Os dados coletados na Pesquisa Nacional por Amostra de Domicílios (PNAD) revelaram que
as adesões aos planos de previdência privada ainda são relativamente baixas. Isso é notável, uma
vez que a previdência privada representa uma opção de investimento para garantir o sustento
pós-laboral e a manutenção do padrão de vida, especialmente em cenários relacionados ao
sistema previdenciário oficial. Portanto, o estudo se mostra relevante ao destacar a necessidade
de compreender os fatores que influenciam a escolha das pessoas em aderir ou não à previdência
privada.
É importante ressaltar que a literatura empírica que aborda os determinantes do investi-
mento em previdência privada ainda é relativamente escassa. A maior parte dos estudos tem
se concentrado na previdência pública, o que tem limitado a compreensão sobre a previdência
privada e a possibilidade de comparações com pesquisas anteriores. Além disso, a escassez de
estudos empíricos sobre o tema no Brasil é em parte atribuída à falta de dados específicos re-
lacionados ao mercado de planos de previdência privada, bem como à ausência de informações
abrangentes sobre os demandantes e fornecedores desses planos. Essas limitações evidenciam a
necessidade de expandir a pesquisa nessa área e a importância de obter dados mais abrangentes
para uma análise mais completa do cenário previdenciário.

18
8 Referências
GUJARATI, D. N., PORTER, D. C. Econometria Básica. 5.ed. Porto Alegre: AMGH Editora
Ltda., 2011.
MESQUITA, P.S.B. Um modelo de regressão logística para avaliação dos programas de pós-
graduação no Brasil(Mestrado) - Universidade Estadual do Norte Fluminense, Campos dos
Goytacazes, 2014.
GONZALEZ, Leadro de Azevedo. Regressão logística e suas aplicações. Universidade Federal
do Maranhão., 2017
IBGE: população brasileira envelhece em ritmo acelerado.
IGBE, Censo Demográfico 2022
Cheng Hua, Dr. Youn-Jeng Choi, Qingzhou Shi, Companion to BER 642: Advanced Regression
Methods., 2014.
Schreiber-Gregory, Deanna Bader, Karlen. (2018). Logistic and Linear Regression Assumpti-
ons: Violation Recognition and Control.

19

Você também pode gostar