Você está na página 1de 19

UNIVERSIDADE FEDERAL DO PARANÁ

YASMIN FERREIRA DA PAIXÃO

O Rendimento-hora Médio Brasileiro


Um estudo sobre raça e escolaridade

Curitiba
2023
YASMIN FERREIRA DA PAIXÃO

O Rendimento-hora Médio Brasileiro


Um estudo sobre raça e escolaridade

Trabalho final apresentado ao Programa de


Graduação em Ciências Econômicas, como parte
dos requisitos necessários à aprovação na
disciplina de Econometria I.

Orientador: Prof. Marcos Minoru Hasegawa

Curitiba
2023
SUMÁRIO

1 ............................................................
INTRODUÇÃO 3
2 ............................................................
OBJETIVO 4
3 . . . . . . . . . DA
REVISÃO . . . LITERATURA
................................................ 5
3.1 . . . . . . . . . . . . LINEAR
REGRESSÃO . . . . . . . .MÚLTIPLA
........................................ 5
3.2 . . . VARIÁVEIS
AS . . . . . . . . . . .DUMMY
.............................................. 6
3.3 .O. PROBLEMA
. . . . . . . . . . . DA
. . . MULTICOLINEARIDADE
............................................ 6
3.4 . . PROBLEMA
O . . . . . . . . . . . DA
. . . HETEROCEDASTICIDADE
............................................ 7
3.5 . . PROBLEMA
O . . . . . . . . . . . DA
. . . AUTOCORRELAÇÃO
............................................ 8
4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
METODOLOGIA
4.1 . . . . . . . . .ECONÔMICO
MODELO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
DADOS
4.3 . . . . . . . .ESTATÍSTICOS
TESTES .................................................... 11
5 .RESULTADOS
. . . . . . . . . . . . E. .DISCUSSÃO
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5.1 RESULTADOS DA ESTIMAÇÃO E TESTES ESTATÍSTICOS
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
REALIZADOS
5.1.1 Regressão
. . . . . . . . . . Linear
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5.1.2 Teste
. . . . . .de
. . Breusch-Pagan
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5.1.3 Teste
. . . . . .de
. . Durbin-Watson
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
DISCUSSÃO
5.2.1 A
. . regressão
. . . . . . . . . linear
. . . . . .múltipla
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.2.2 Presença
. . . . . . . . .de
. . .heterocedasticidade
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
5.2.3 .Presença
. . . . . . . .de
. . .autocorrelação
................................................ 15
6 ............................................................
CONCLUSÃO 16
7 . . . . . . . . . . . . . .BIBLIOGRÁFICAS
REFERÊNCIAS .............................................. 17
.......A
ANEXO . .—. . SUBTITÍTULO
. . . . . . . . . . . . .DO
. . . ANEXO
................................. 18
3

1 INTRODUÇÃO

O rendimento médio é um dos principais indicadores que nos ajudam a


entender as características de renda e decisões de consumo das famílias. Os dados
deste indicador são coletados pelo IBGE através da Pesquisa Nacional por Amostra
de Domicílios Contínua - PNAD Contínua, Pesquisa de Orçamentos Familiares -
POF, Pesquisa Nacional de Saúde do Escolar - PeNSE, Pesquisa Nacional de
Saúde - PNS e Pesquisa de Informações Básicas Municipais - Munic. Após isso, são
publicadas por meio de um informativo em seu portal oficial na internet e sua base
de dados é disponibilizada para a população.
A publicação Desigualdades Sociais Por Cor ou Raça no Brasil, fonte dos
dados sobre rendimento médio brasileiro, busca, desta forma, elaborar conclusões e
sugestões para a formulação de políticas públicas com o objetivo de reduzir
discrepâncias sociais.
Como um país diverso e de dimensões continentais, o Brasil conta com
múltiplas raças e etnias, macrorregiões com realidades sociais distintas e uma
população estimada pelo Instituto Brasileiro de Geografia e Estatística (IBGE) em
213 milhões de pessoas em 2021. Natualmente, em um país de proporções como
estas, é importante levar em consideração estes e outros aspectos socioeconômicos
que permeiam a situação de renda das famílias brasileiras para, enfim, elaborar uma
análise sobre o rendimento médio do país.
Assim, as perguntas que devem ser feitas são: quais são os principais fatores
que afetam o rendimento médio obtido pela população trabalhadora e em qual
magnitude se dá o impacto de cada uma?
Este estudo lançará mão de instrumentos econométricos para relacionar o
resultado do rendimento-hora médio da última década com duas variáveis de
extrema relevância no debate de desigualdade social no Brasil.
4

2 OBJETIVO

O estudo em questão propõe avaliar os resultados do rendimento médio e sua


conexão com dois aspectos socieconômicos da população: o nível de escolaridade e
a raça dos indivíduos.
Assim, busca-se entender, por exemplo, se cidadãos de baixa escolaridade
ou pertencentes ao grupo racial de pretos e pardos têm sua renda afetada em uma
visão geral do país. Apesar de entender que uma questão de tal complexidade deva
envolver diversas outras variáveis, o objetivo, no presente momento, é testar a
hipótese de que maiores níveis de escolaridade e raça branca estão associadas a
um efeito positivo no rendimento médio, enquanto baixos níveis de escolaridade e
pretos e pardos impactam negativamente os números em questão.
Com base nesta formulação, será possível confirmar ou não o impacto dessas
características indicativas de vulnerabilidade social e econômica, além de legitimar e
embasar políticas públicas não só a nível nacional como também aquelas voltadas à
comunidade em torno da Universidade Federal do Paraná, um importante agente
social no estado.
5

3 REVISÃO DA LITERATURA

3.1 REGRESSÃO LINEAR MÚLTIPLA

Sobre regressões lineares múltiplas, pode-se dizer que:

"A análise de regressão diz respeito ao estudo da dependência de uma


variável, a variável dependente, em relação a uma ou mais variáveis, as
variáveis explanatórias, visando estimar e/ou prever o valor médio (da
população) da primeira em termos dos valores conhecidos ou fixados (em
amostragens repetidas) das segundas." (GUJARATI E PORTER, 2011,
p.39)

Assim, o objetivo de uma análise de regressão é delinear a dependência de


um fenômeno em relação às variáveis que podem ser relacionadas em maior ou
menor grau - que vai ser mensurado, por sua vez, pela análise de correlação.
Para obter respostas mais completas, estudos econométricos, na maioria das
vezes, lançam mão de técnicas de regressão linear múltipla, para garantir que
fenômenos complexos sejam tratados como tal. Assim, inclui-se as variáveis
necessárias para explicar realidades que não são simples e realizar as previsões
desejadas.
No modelo clássico de regressão linear, é preciso observar as hipóteses
abaixo:
1. Linearidade nos parâmetros da regressão;
2. Valor médio do temro de erro igual a zero;
3. Homocedasticidade ou variância constante do termo de erro;
4. Termos de erro sem presença de autocorrelação;
5. Número de parâmetros excedido pelo número de observações;
6. Presença de variações nas variáveis X;
7. Colinearidade exatada não observada nas variáveis X;
8. Ausência de problemas de especificação do modelo;

Na regressão linear, os coeficientes parciais, isto é, os parâmetros β, vão


indicar o efeito de uma variação de sua respectiva variável X no valor médio da
variável dependente Y. Estes parâmetros são usualmente estimados pelo método
dos Mínimos Quadrados Ordinários, onde se obtém estimadores lineares eficientes
e não viesados.
6

Uma vez determinadas as variáveis a serem incluídas, os dados utilizados


para a amostra e o método - neste caso, MQO, os cálculos da regressão podem ser
facilmente realizados. Os resultados, naturalmente, dependerão da qualidade dos
dados e da especificação.

3.2 AS VARIÁVEIS DUMMY

Ao longo das análises de regressão, os quatro tipos de variáveis mais comuns


de serem utilizadas são: proporcionais, de intervalo, ordinais e nominais.
Muitas vezes, se faz necessário ir além das variáveis proporcionais e incluir
também elementos qualitativos na análise de regressão, isto é, de escala nominal.
Para isso, usa-se as variáveis binárias (ou dummies) para indicar a presença ou
ausência de determinada qualidade.
A característica de binariedade se dá pelo uso de 0 ou 1 para fazer a
indicação de ausência ("0") ou presença ("1") da característica em questão, que são
necessariamente excludentes.
Para fazer a aplicação de um certo número n de categorias para uma
determinada qualidade, é necessário ter em mente que, no modelo, devem ser
incluídas n-1 categorias, para evitar armadilha da variável binária: a ocorrência de
colinearidade perfeita. Usando o exemplo do presente estudo, ao analisar a
qualidade "raça", tem-se quatro categorias: branca, preta, parda e preta ou parda.
Assim, para a formulação do modelo, é necessário omitir uma das quatro categorias,
que será tomada como categoria de referência.
O valor médio da categoria de referência será representada pelo intercepto β0
e servirá como base de comparação. Já os outros coeficientes, chamados
diferenciais de intercepto, vão indicar quanto a mais (ou a menos) será observado
quando houver presença de sua respectiva categoria, isto é, quando possuir o valor
1.
Outra forma de se contornar a armadilha da variável binária é incluir suas n
categorias para a qualidade em questão, ao mesmo tempo em que se retira o
intercepto do modelo. Para fins de comparação das categorias, de acordo com a
formulação e objetivos do presente estudo, será utilizado um modelo de n-1
categorias para cada qualidade.

3.3 O PROBLEMA DA MULTICOLINEARIDADE

A multicolinearidade é a violação da oitava hipótese do modelo clássico de


regressão linear, segundo a qual não pode haver multicolinearidade entre os
7

regressores em questão. Essa hipótese do modelo clássico surge para evitar que os
erros padrão sejam infinitos ou muito grandes, o que acontece na presença de
multicolinearidade. Como consequência da inflação dos erros padrão, observa-se
também intervalos de confiança mais amplos, que implicam em uma maior aceitação
da hipótese nula.
A questão da multicolinearidade pode se dar de forma perfeita e menos que
perfeita, onde o que varia é o grau de correlação entre as variáveis. Sua presença
pode ser causada, por exemplo, por problemas de especificação do modelo, coleta
de dados e restrições ao próprio modelo.
Como métodos de identificação da multicolinearidade, é possível citar o Fator
de Inflação da Variância (conhecido como FIV), que mostra o aumento da variância
causada pela multicolinearidade, com o auxílio do coeficiente de correlação das
variáveis X.
Se o coeficiente de correlação (r23) for próximo de 1, o FIV será próximo ao
infinito. Em caso de ausência de colinearidade, o valor final obtido para FIV será 1.
Por fim, uma forma de correção recomendada, caso o cientista econômico
julgue necessário, é a melhoria da especificação do modelo de regressão.

3.4 O PROBLEMA DA HETEROCEDASTICIDADE

A heterocedasticidade, por sua vez, é a violação da hipótese de


homocedasticidade nos termos de erro, prevista no modelo clássico de regressão
linear. Em outras palavras, a heterocedasticidade surge quando os termos de erro
não possuem variância constante.
Essa variância não constante pode ser gerada por questões de
comportamento das variáveis e dos agentes relacionados, melhorias nas técnicas de
coleta de dados, problemas de especificação, entre outros.
Na presença de heterocedasticidade, uma medida corretiva possível é a
substituição do método dos Mínimos Quadrados Ordinários (MQO) pelos Mínimos
Quadrados Ponderados (MQP), uma vez que os estimadores de MQO deixam de ser
eficientes. O uso do método MQP pretende obter resultados mais precisos para a
regressão, com base em um sistema onde observações de populações com maior
variabilidade exerçam uma influência ("peso") menor do que aquelas de menor
variabilidade.
O processo de detecção de heterocedasticidade possui diversas questões a
serem consideradas. Para fazer a identificação dos erros heterocedásticos, é
possível aplicar alguns métodos formais, como:
8

1. Testes de Park e Glejser;


2. Teste de correlação por ordem de Spearman;
3. Teste de Goldfeld-Quandt;
4. Teste de Breusch-Pagan-Godfrey;
5. Teste geral de heterocedasticidade de White;
Cada teste possui suas características, e a escolha do mais apropriado deve
levar em consideração os aspectos do modelo a ser analisado, da amostra e das
limitações de cada método.
Para este estudo, será aplicado o teste de Breusch-Pagan-Godfrey, através
da função específica disponível no R, como apresentado na rotina em anexo.

3.5 O PROBLEMA DA AUTOCORRELAÇÃO

A autocorrelação, por sua vez, é a presença da correlação entre observações


de series temporais e dados de corte transversal, mais especificamente nos termos
de erro Ui. Assim como o caso da heterocedasticidade, a autocorrelação também
terá como consequência uma inflação da variância, logo, os estimadores MQO
deixam de ser eficientes, gerando uma possível invalidade dos testes t, F e X².
Algumas possíveis causas da existência da correlação serial são inércia da
séries temporais econômicas, problemas de especificação, defasagens,
manipulação dos dados, entre outros.
Também de forma similar à questão da heterocedasticidade, a autocorrelação
exige a substituição do método MQO, dado que seus estimadores deixam de ser
eficientes. No caso da autocorrelação, recomenda-se o uso dos Mínimos Quadrados
Gerais.
Como métodos para identificação da autocorrelação, é possível utilizar o
Teste de Carreiras (não paramétrico) e testes formais, como os de Durbin-Watson e
Breusch-Godfrey.
Nesse estudo, o teste aplicado para verificação da autocorrelação será o de
Durbin- Watson, calculado através de uma função específica disponível em R. No
que se refere à parte teórica, o teste DW usa a estatística d para testar a hipótese
nula de ausência de autocorrelação.
No teste de Durbin-Watson, encontra-se, por meio da tabela e os valores Dl e
Du:
1. As zonas de rejeição de H0 (ausência de correlação positiva) e H*0
(ausência de correlação negativa);
2. As zonas de indecisão (onde não se pode rejeitar uma hipótese em favor
de outra);
9

3. A zona de aceitação das hipóteses nulas.

Assim, usa-se o valor da estatística d para localizar a zona correspondente e


assumir rejeição, aceitação ou indecisão em relação às hipóteses nulas, isto é, a
presença ou não de autocorrelação."
10

4 METODOLOGIA

4.1 MODELO ECONÔMICO

Como mencionado anteriormente, o presente estudo busca validar a hipótese


de que o nível de escolaridade e raça estão relacionados ao nível de rendimento
obtido pelos indivíduos da população brasileira.

4.2 DADOS

Para fundamentar a análise, os dados de rendimento-hora médio


segmentados por raça (branca, parda, preta, parda ou preta) e nível de escolaridade
(sem instrução ou fundamental incompleto, ensino fundamental completo ou médio
incompleto, ensino médio completo ou superior incompleto) foram extraídos do
portal online oficial do IBGE, referentes ao período de 2012 a 2021.
Originalmente, os dados de rendimento-hora médio foram fornecidos pela
fonte com segmentação por raça, escolaridade e macrorregião brasileira (Norte,
Nordeste, Centro-Oeste, Sudeste, Sul). Como o estudo não deseja incluir análise
regional e os números nacionais compilados não foram fornecidos, buscou-se obter
valores totais para o país através de manipulações simples de dados, calculando
uma média nacional ponderada com base da população macrorregional de cada ano
correspondente.
Os dados da população brasileira correspondentes a cada ano do período
entre 2012 a 2021 foram também extraídos do portal do IBGE. Assim, usou-se os
dados da população por macrorregião para ponderar os dados de rendimento-hora
médio, encontrando uma média nacional ponderada, de acordo com a significância
de cada região. Esse cruzamento de dados foi repetido para todos os anos do
período de estudo.
Ao obter os valores totais nacionais de rendimento, montou-se uma tabela de
oito colunas (uma para cada atributo possível para as duas variáveis inclusas no
estudo), atribuindo 0 e 1 para indicar ausência ou presença de tal característica para
cada observação de rendimento médio. Assim, através de variáveis dummy, dados
expressos de forma qualitativa foram transformados para sua forma quantitativa,
permitindo aplicação de técnicas econométricas.
Após a obtenção da tabela, omitiu-se duas colunas, sendo uma característica
de cada variávei - raça e escolaridade. Assim, atriubui-se ao intercepto a
representação da raça branca e o nível de ensino superior completo.
Quando concluída a preparação da tabela final, essa base de dados final foi
importada para a plataforma Posit Cloud para a aplicação dos testes automáticos em
11

R.

4.3 TESTES ESTATÍSTICOS

Dando continuidade à execução do exercício na plataforma Posit Cloud,


instalou-se o pacote lm_test para a realização da regressão linear:

Y= β0 + β1X1i + β2X2i + β3X3i + β4X4i + β5X5i + β6X6i + ε

Após a regressão inicial, as funções bptest e dwtest foram utilizadas para a


verificação da presença ou ausência de heterocedasticidade e autocorrelação
através dos testes de Breusch-Pagan e Durbin-Watson, respectivamente.
Por se tratar de um modelo composto por variáveis binárias, a aplicação de
teste para verificação de multicolinearidade não foi necessária.
12

5 RESULTADOS E DISCUSSÃO

5.1 RESULTADOS DA ESTIMAÇÃO E TESTES ESTATÍSTICOS REALIZADOS

5.1.1 Regressão Linear

Com a realização da regressão linear em R, os resultados obtidos para os


coeficientes estão representados na tabela abaixo:

Tabela 1 — Resultados da regressão linear múltipla

Variável Coeficiente Valor P

Intercepto 28,9478 2e-16


X1 -3,4391 3e-10
X2 -7,1920 2e-16
X3 -7,2222 2e-16
X4 -17,3392 2e-16
X5 -16,6549 2e-16
X6 -14,5876 2e-16
Fonte: O autor (2023).

Já em relação aos resíduos, isto é, a diferença entre os valores observados e


aqueles obtidos pelo modelo, a regressão retornou os seguintes valores:

Tabela 2 — Resultados dos resíduos da regressão

Minímo 1o quartil Média 3o quartil Máximo

-4,540 -1,960 0,061 1,230 7,699


Fonte: O autor (2023).

O coeficiente de determinação observado é de 0,9225 e o teste F, por sua


vez, retornou o valor de 303.4, com 6 e 153 graus de liberade.

5.1.2 Teste de Breusch-Pagan

Seguindo a regressão linear, obteve-se os resultados do teste de


heterocedasticidade de Breusch-Pagan, onde duas hipóteses são avaliadas:
13

1. H0: Presença de homocedasticidade


2. Ha: Ausência de homocedasticidade
Os valores obtidos através do teste estão representados na seguinte tabela:

Tabela 3 — Resultados do teste de heterocedasticidade

Valor da estatística Graus de liberdade Valor P

93,592 6 2,2e-16
Fonte: O autor (2023).

5.1.3 Teste de Durbin-Watson

Por fim, o teste de autocorrelação de Durbin Watson também trabalha com


duas hipóteses:
1. H0: Ausência de autocorrelação
2. Ha: Presença de autocorrelação maior que zero

Tabela 4 — Resultados do teste de autocorrelação

Valor da estatística Valor P

1.8875 0.2143
Fonte: O autor (2023).

5.2 DISCUSSÃO

5.2.1 A regressão linear múltipla

Dados os resultados descritos na seção anterior, é possivel elaborar


conclusões sobre os valores retornados na regressão linear e nos testes realizados.
Para a utilização de variáveis dummy indicativas de presença ou ausência de
certo atributo mutuamente excludente, omitiu-se uma qualidade de cada variável
(isto é, raça e escolaridade). Como mencionado anteriormente, os atributos omitidos
no presente estudo são a raça branca e o nível de escolaridade mais alto, sendo
ensino superior completo.
Dada as especificações acima, a análise se inicia com o entendimento de
cada coeficiente e o atributo que ele expressa:
14

1. β0: coeficiente do intercepto, expressando raça branca e ensino superior


completo;
2. β1: coeficiente relacionado à expressão do atributo "raça preta";
3. β2: coeficiente relacionado à expressão do atributo "raça parda";
4. β3: coeficiente relacionado à expressão do atributo "raça preta ou parda";
5. β4: coeficiente relacionado à expressão do atributo "sem instrução ou
fundamental incompleto"
6. β5: coeficiente relacionado à expressão do atributo "ensino fundamental
completo ou médio incompleto"
7. β6: coeficiente relacionado à expressão do atributo "ensino médio completo
ou superior incompleto"
Assim, o coeficiente do intercepto indica que o rendimento hora-médio das
categorias de referência é R$ 28,9478. Para descobrir o rendimento relacionado aos
outros atributos, basta fazer a soma do coeficiente de referência β0 e o respectivo
coeficiente do atributo em questão. Portanto, os rendimentos-hora com base nos
atributos se dá da seguinte maneira:

Tabela 5 — Rendimento-hora médio por atributo

Rendimento-hora médio (em


Coeficiente Atributo
reais)

β0: 28,9478 Raça branca e ensino superior completo 28,9478


β1: -3,4391 Raça preta 25,5087
β2: -7,1920 Raça parda 21,7558
β3: -7,2222 Raça preta ou parda 21,7256
β4: -17,3392 Sem instrução ou fundamental incompleto 11,6086
Ensino fundamental completo ou médio
β5: -16,6549 12,2929
incompleto
Ensino médio completo ou superior
β6: -14,5876 14,3602
incompleto
Fonte: O autor (2023).

Desta forma, é possível verificar o impacto negativo que todos os atributos


não omitidos têm sobre o resultado da categoria de referência, indicando que as
outras raças que não a branca e os outros níveis de escolaridade que não o superior
completo apresentam um rendimento-hora mais baixo em relação a estes.
Além disso, a tabela acima também permite a compreensão de que, no geral,
o níveis de escolaridade têm maior impacto sobre o rendimento, relativamente à
15

raça. É possível também notar que os indivíduos de raça preta ou parda e os


cidadãos sem instrução ou com fundamental incompleto são aqueles mais
impactados dentro da respectiva qualidade que representam.
Já se tratando das variáveis do modelo, os baixos valores P obtidos
confirmam que todas são estatisticamente significativas a 5% de significância, ou
seja, todas têm importância para a explicação da variável dependente Y.
O coeficiente de determinação obtido (0,9225), por sua vez, indica que
92,25% da variação do rendimento-hora em questão é explicada pelas variáveis
incluídas no modelo, o que indica qualidade da especificação.
Por fim, o teste F também é significativo a 5% de significância, visto que o
valor P é baixo (2.2e-16). Assim, é possível rejeitar a hipótese nula de que todos os
coeficientes são simultaneamente iguais a zero em favor da hipótese alternativa de
que há relação linear entre (ao menos uma das) variáveis explicativas e a variável
dependente.

5.2.2 Presença de heterocedasticidade

Com base no valor P obtido como resultado do teste Breusch-Pagan, é


possível concluir que rejeita-se a hipótese nula de presença de homocedasticidade
nos resíduos a 5% de significância. Portanto, há evidências de presença de
heterocedasticidade nos termos de erro.
No entanto, dado que o modelo apresenta boas características, foi decidido
pela autora não aplicar medidas corretivas, como a substituição do método MQO por
MQP. Na literatura, Gujarati e Porter destacam o ponto de vista de Gregory Mankiw
sobre a questão da heterocedasticidade:

"A mudança é tão significativa que seria preocupante na prática? Em outras


palavras, quando devemos ficar preocupados com o problema da
heterocedasticidade? Como defende um autor, "a heterocedasticidade
nunca foi razão para descartar-se um modelo que, sob outros aspectos, é
considerado bom." (GUJARATI E PORTER, 2011, p.401)

5.2.3 Presença de autocorrelação

Em relação ao teste de Durbin-Watson, dado o resultado do valor P obtido


(0,2143), não é possível rejeitar a hipótese nula de ausência de autocorrelação em
favor da hipótese alternativa a 5% de significância.
Sendo assim, é seguro dizer que os dados do presente estudo não
apresentam correlação, logo, nenhuma medida corretiva é necessária.
16

6 CONCLUSÃO

Considerando a interpretação de todos os resultados obtidos através da


regressão linear múltipla e dos testes BP e DW, é possível confirmar a hipótese
inicial de que o maior nível de escolaridade (superior completo) e a raça branca
estão associadas a um efeito positivo no rendimento médio, enquanto baixos níveis
de escolaridade e pretos e pardos impactam negativamente os números em
questão, o que foi expresso pelos coeficientes da regressão associados a cada um
dos atributos.
Desta forma, o estudo confirma a importância da educação para o fator renda
e, consequentemente, para qualidade de vida dos brasileiros. Os resultados também
reforçam a necessidade de atenção especial por parte dos formuladores de políticas
públicas para ações assistencialistas e afirmativas dos governos Estadual e Federal,
oferecendo apoio para população de baixa instrução, medidas contra a
discriminação racial no mercado de trabalho e acesso à educação para todos.
17

7 REFERÊNCIAS BIBLIOGRÁFICAS

Desigualdades Sociais por Cor ou Raça no Brasil | IBGE. Disponível em:


<https://www.ibge.gov.br/estatisticas/sociais/populacao/25844-desigualdades-
sociais-por-cor-ou-raca.html?=&t=sobre>.
GUJARATI, D.N.; PORTER, D.C. Econometria Básica. 5ª ed. Porto Alegre:
AMGH Editora. 2011.
Painel de Indicadores | IBGE. Disponível em:
<https://www.ibge.gov.br/indicadores.html?view=default>.
18

ANEXO A — SUBTITÍTULO DO ANEXO

Anexos são elementos que dão suporte ao texto, mas que não foram
elaborados pelo autor.

Você também pode gostar