Você está na página 1de 12

INSTITUTO FEDERAL DE EDUCAÇÃO,

CIÊNCIA E TECNOLOGIA DA PARAÍBA


CURSO: ENGENHARIA CIVIL

APLICAÇÃO PRÁTICA DA ANÁLISE ESTATÍSTICA DA PESQUISA ANUAL DA


INDÚSTRIA DA CONSTRUÇÃO (PAIC) - NOVOS DADOS PARA 2019 E
ATUALIZAÇÃO DE DADOS PARA 2017 E 2018 ATRAVÉS DO MODELO
PROBABILÍSTICO

ALEF LENOAN SOARES DANTAS MOTA (202012200041) – Eng. Civil


MARIA ALYCE BARRETO BEZERRA (202012200008) – Eng. Civil
TALYSSON ALVES DA SILVA (202012200037) – Eng. Civil

Cajazeiras
28/08/2021
1. INTRODUÇÃO

O presente trabalho tem por objetivo selecionar algumas variáveis quantitativas


contínuas dos dados gerais das Empresas de Construção segundo as Unidades da Federação,
obtidos pelo banco de dados disponibilizado pelo IBGE (Instituto Brasileiro de Geografia e
Estatística), na Pesquisa Anual da Indústria da Construção (PAIC) do ano 2019. Para serem
avaliadas em relação a sua distribuição de probabilidade e assim caracterizar se aquele banco
de dados pode ter uma boa aproximação para distribuição dos seus dados a partir da distribuição
de probabilidade normal.
Dito isso, serão apresentados os estudos feitos no site Statistcs Kingdom para seis
variáveis selecionadas a partir do banco de dados, apresentando seus histogramas, boxplot, teste
de Shapiro-Wilk e a interpretação dos dados obtidos.

2. APRESENTAÇÃO/ANÁLISE DOS DADOS

2.1 PESSOAL OCUPADO

A primeira variável selecionada foi a de Pessoal Ocupado:

HISTOGRAMA 01 - FONTE: STATISTICS KINGDON BOXPLOT 01

A partir da análise visual, percebe-se que os dados já não se caracterizam como uma
distribuição normal, pois seu histograma não apresenta formato de sino e o boxplot não segue
uma certa simetria. Mas, ainda não se pode concluir muita coisa sem a análise mais específica
dos dados.
TESTE SHAPIRO-WILK 01 – FONTE: STATISTICS KINGDOM

Observando os dados obtidos através do teste de Shapiro Wilk pelo Statistics Kingdom,
a média (𝑥̅ ) encontrada foi de 279,39, já o p-valor foi de 0,00000178356, ou seja < 0,05. Dessa
forma, pode-se presumir que os dados de Pessoal Ocupado não seguem uma distribuição
normal, assumindo assim H1, outro tipo de distribuição.

2.2 CUSTOS DE INCORPORAÇÃO

A segunda variável selecionada foi a de Custos de Incorporação e/ou das Obras e


Serviços da Construção, que trata dos gastos relacionados a construção.
HISTOGRAMA 02 – FONTE: STATISTICS KINGDON BOXPLOT 02

TESTE SHAPIRO-WILK 02 – FONTE: STATISTICS KINGDOM


Como o p-valor extraído do banco de dados foi < 0,05, rejeita-se H0, assumindo uma
distribuição dos dados que não é normal, o p-valor = 0,00000364639, sendo muito pequeno,
suportando assim H1 (outro tipo de distribuição). A assimetria é evidente e sua média (𝑥̅ ) foi
de 315,75.

2.3 NÚMERO DE EMPRESAS ATIVAS

A terceira variável selecionada foi o Número de Empresas Ativas, relacionada com os


dados brutos do Brasil inteiro por estados, assim como os dados anteriores. Esse banco de dados
faz a relação dos Números de Empresas Ativas na Área da Construção.

HISTOGRAMA 03 – FONTE: STATISTICS KINGDON BOXPLOT 03


TESTE SHAPIRO-WILK 03 – FONTE: STATISTICS KINGDOM

O histograma do Número de Empresas Ativas apresenta uma distribuição homogênea a


partir de 200, mas não apresenta simetria e não aceita o formato de sino. Pelo teste do Shapiro-
Wilk, obteve-se o valor de 331,53 para a média (𝑥̅ ) e um p-valor de 0,000238092, sendo < 0,05
e, portanto, não suportando H0. Apesar de potencialmente simétrico não se enquadra na
distribuição normal.
2.4 GASTOS DE PESSOAL

Tendo a variável de Gastos de Pessoal como a quarta selecionada, que relaciona os


dados brutos do Brasil inteiro por estados, apresentando os gatos relativos a mão de obra
(pessoal).

HISTOGRAMA 04 – FONTE: STATISTICS KINGDON BOXPLOT 04

TESTE SHAPIRO-WILK 04 – FONTE: STATISTICS KINGDOM


A variável de gastos de pessoal também rejeita distribuição dos dados normais, pois
seu p-valor < 0,05, e a média (𝑥̅ ) 381,96. Apresenta potencial simetria, mas sua diferença
entre a amostra e a distribuição é significativa, não possibilitando a aproximação pela
distribuição normal.

2.5 RECEITA BRUTA TOTAL

HISTOGRAMA 05 – FONTE: STATISTICS KINGDON BOXPLOT 05

O histograma da 5ª variável escolhida, receita bruta total, apresenta certa


homogeneidade dos dados da amostra, mas a análise característica deve ser feita para poder
obter o p-valor, e o teste de Shapiro-Wilk.
TESTE SHAPIRO-WILK 05 – FONTE: STATISTICS KINGDOM

Com média (𝑥̅ ) 380,38, potencial simetria e um desvio padrão de 338,276414, a amostra
de n = 76, não apresenta distribuição normal pois seu p-valor não se enquadra como < 0,05.
Nesse caso a variável de receita bruta total, assim como as anteriores, não pode ser
aproximada pela distribuição normal.
2.6 RECEITA LÍQUIDA TOTAL

A 6ª e última variável selecionada trata a respeito da Receita Líquida Total, abaixo


encontram-se seu histograma e o boxplot.

HISTOGRAMA 06 – FONTE: STATISTICS KINGDON BOXPLOT 06

O histograma apresenta um pico no primeiro intervalo e depois vai se distribuindo,


mas a análise visual não basta para poder caracterizar a amostra. Necessitando o estudo do
banco de dados selecionado para poder concluir algo sobre a amostra.
TESTE SHAPIRO-WILK 06 – FONTE: STATISTICS KINGDOM

Mais uma vez o p-valor apresenta valor < 0,05, exatamente igual a 0,0000145255 que
não enquadra a amostra apta para a aproximação estatística pela distribuição dos dados
normalmente. Com isso, o estudo assume outro tipo de distribuição que não seja a normal.
3. CONCLUSÃO

Assim, fazendo a análise dos dados brutos das Empresas de Construção segundo as
Unidades da Federação, obtidos pelo IBGE (Instituto Brasileiro de Geografia e Estatística), na
Pesquisa Anual da Indústria da Construção (PAIC) do ano 2019, através do site Statistics
Kingdom (Reino das Estatísticas) com a construção de histogramas, bloxplot e fazendo o teste
de Shapiro-Wilk. Obtivemos resultados de interesse referentes a média (𝑥̅ ), p-valor e por meio
da observação visual dos gráficos, intrínsecos ao conteúdo programático de Distribuição
Normal, visto em sala na disciplina de Probabilidade e Estatística.
As variáveis selecionadas foram de Pessoal Ocupado, Custos de Incorporação, Número
de Empresas Ativas, Gastos de Pessoal, Receita Bruta Total e Receita Líquida Total,
relacionadas às Unidades da Federação Brasileira (estados), todos os resultados alcançados não
assumiram valores que se encaixassem no perfil de uma distribuição normal. Os valores de p-
valor, no geral, foram menores do que 0,05, não correspondentes para um modelo normal de
distribuição. Apesar da homogeneidade de alguns dos dados pelo histograma, exemplo da
Receita Bruta Total, só se pôde ver com certeza o desenlace pelo teste do Shapiro-Wilk.
Concluímos, então, que essa distribuição não-normal ocorreu pelo fato de que as
Unidades da Federação sofrem diferentes circunstâncias referentes à população,
desenvolvimento tecnológico, extensão territorial, gestão, e, sobre-tudo, no investimento no
setor da Construção Civil.

4. REFERÊNCIAS
IBGE – INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Pesquisa Anual
da Indústria da Construção (PAIC) - 2019. Rio de Janeiro: IBGE, 2019. Disponível em:
http://www.cbicdados.com.br/menu/estudos-especificos-da-construcao-civil/pesquisa-anual-
da-industria-da-construcao-paicibge. Acesso em: 08 jul. 2021.

CALCULADORAS DE ESTATÍSTICAS (Austrália) (org.). Reino das Estatísticas. 2017.


Disponível em: http://www.statskingdom.com. Acesso em: 23 ago. 2021.

Você também pode gostar