Escolar Documentos
Profissional Documentos
Cultura Documentos
VITÓRIA
2017
PEDRO DE OLIVEIRA PANTUSA
VITÓRIA
2017
PEDRO DE OLIVEIRA PANTUSA
Resultado:______________________
BANCA EXAMINADORA:
Prof.
Universidade Cidade de São Paulo ______________________________________
Prof.
Universidade Cidade de São Paulo ______________________________________
Dedico este trabalho aos meus pais Fátima
Catarina de Oliveira Pantusa e Carlos Henrique
Pantusa, exemplos de honra e dignidade, pelo
altruísmo e dedicação dispensados à minha
criação e educação, fatores que hoje definem
meu caráter.
AGRADECIMENTOS
Agradeço a todos aqueles que, por querer ou por acaso, contribuíram para o meu
crescimento acadêmico. Aos meus pais, avós e irmã, pelo carinho e apoio, ao meu tio Fernando,
por semear em mim a paixão pela geologia, ao meu tio Alexandre, por me guiar pelos nebulosos
caminhos da estatística, e à minha namorada, Vanessa Frasson, pela paciência, respeito e
compreensão.
Agradeço aos amigos, Camila Maria, pelas incontáveis horas extras de trabalho árduo,
Vinicius e Lidiane Ubaldino, pela acolhida desta insueta personalidade, e aos grandes amigos
de Belo Horizonte que, mesmo na distância, representaram um papel importante na manutenção
da minha sanidade ao longo dos muitos dias de labuta.
Finalmente agradeço aos professores, pilares da construção do conhecimento, pela
disposição e dedicação em repassar parte de seus conhecimentos para mentes em construção.
Agradeço excepcionalmente ao professor Heber Oliveira que, prontamente, me apoiou na busca
pelo aprimoramento da minha técnica e na divulgação do meu conhecimento.
“O conhecimento só é verdadeiro quando
adquirido por esforço do intelecto, não pela
memória.”
Conde Leon Nikolaievitch Tolstoi
RESUMO
Considering the importance of the California Bearing Ratio (CBR) on subgrade and local
deposits, to reduce the costs associated with road enterprises, and the legal obligation to
elaborate Technical and Economic Feasibility Studies (EVTE) for major road projects, the
geotechnical knowledge of materials that occur along the geological environment transposed is
determinant for the correct feasibility analysis. Considering that the Barreiras group is an
important lithologic entity in the national scenario, but lightly studied as to material
geotechnics, this work aimed to study the correlation between the CBR, the grain size and the
consistency limits of soils occurring under the domains of this geological entity, in the State of
Espírito Santo. For this purpose, the results of 295 geotechnical tests performed on samples
collected in a good part of the Barreiras espiritossantense group were selected. Once the
relevant geotechnical data were obtained and compiled for the desired analysis, they were
subjected to statistical treatment and modeling processes with the support of the IBM SPSS
Modeler software to verify the existence of linear, continuous numerical, and, subsequently,
categorical ordinal correlations between the predictor variables and the response variable. In
the automated processing several methods of statistical analysis were used so that one could
observe the relation between the independent variables, referring to the physical parameters,
and the ISC, a mechanical parameter. At first, the existence of linear correlation was ruled out
due to the erratic distribution of the predictor variables. On the other hand, the qualitative
statistical analysis performed on the predictive model showed a high rate of correctness after
the categorization of variables. Right results were obtained in more than 90% in partition 01
and more than 94% in partition 02 demonstrating the existence of a correlation between the
predictor variables and the response variable. However the low performance of the model, when
analyzed by the ROC curve method, points to assertiveness problems in the prediction of CBR
in the case of application on samples different from those used in the training and test phases
of the designed model, even if they originate from the same geological group.
Figura 1 – Concentração de rodovias não pavimentadas por jurisdição (em km) .................... 15
Figura 2 – Investimentos previstos nas distintas microrregiões de planejamento - 2011 e 2015
(em milhões de reais) ........................................................................................................ 17
Figura 3 – Investimentos em microrregiões de planejamento – Barreiras x Demais ............... 17
Figura 4 – (a) Exemplo de plano de regressão para um modelo n=2 (b) condições de contorno
........................................................................................................................................... 28
Figura 5 – (a) Plano de regressão de modelo polinomial cúbico n=3 (b) condições de contorno
........................................................................................................................................... 29
Figura 6 – Proposição dos passos que compõem o processo de KDD ..................................... 31
Figura 7 – Ambiente de montagem de um novo fluxo no SPSS Modeler ............................... 37
Figura 8 – Fluxos com: (a) um método estatístico (b) múltiplos métodos de estatísticos ........ 38
Figura 9 – Seleção do nó Excel, na barra de seleção de nós, na paleta “Origens”. .................. 39
Figura 10 – Modelagem do fluxo até o primeiro filtro e janela de regras de amostragem....... 40
Figura 11 – Primeira tipificação de variáveis. .......................................................................... 41
Figura 12 – Resultados da análise de qualidade de dados de entrada no nó Auditoria de Dados.
........................................................................................................................................... 42
Figura 13 – Resultados da análise estatística no nó Auditoria de Dados. ................................ 42
Figura 14 – Modelagem do fluxo até primeira tipificação e janela de tipificação de variáveis.
........................................................................................................................................... 43
Figura 15 – Janela de definição da largura de faixas categóricas para a variável resposta. ..... 45
Figura 16 – Modelagem do fluxo até primeira categorização de variáveis. ............................. 45
Figura 17 – Segunda tipificação de variáveis e supressão do papel da variável CBR (%). ..... 46
Figura 18 – Distribuição da largura de amostragem para a variável LL. ................................. 47
Figura 19 – Auditoria estatística associada ao primeiro nó de Categorização. ........................ 48
Figura 20 – Auditoria da qualidade associada ao primeiro nó de Categorização..................... 49
Figura 21 – Modelagem do fluxo até a segunda etapa de categorização de variáveis. ............ 50
Figura 22 – Modelagem do fluxo até o segundo filtro e janela de regras de filtragem. ........... 51
Figura 23 – Fluxo até a terceira tipificação de variáveis e janela de definição dos tipos......... 52
Figura 24 – Janela de regras de partição para treinamento e teste. .......................................... 53
Figura 25 – Janela de premissas de montagem dos modelos estatísticos finais. ...................... 54
Figura 26 – Modelamento final do fluxo de análise estatística para predição de correlação. .. 55
Figura 27 – Resultados obtidos a partir do teste do modelo para as partições 01 e 02. ........... 57
Figura 28 – Seleção dos métodos de maior exatidão pelo previsor - partição 01. ................... 58
Figura 29 – Seleção dos métodos de maior exatidão pelo previsor - partição 02. ................... 58
Figura 30 – Importância dos preditores nas partições 01(a) e 02(b). ....................................... 59
Figura 31 – Importância dos preditores na partição 01. ........................................................... 59
Figura 32 – Importância dos preditores nas partições 01(a) e 02(b). ....................................... 60
LISTA DE TABELAS
1. INTRODUÇÃO................................................................................................................................ 13
2.3.1. Geologia................................................................................................................................ 17
4. RESULTADOS OBTIDOS..........................................................................................................57
5. CONSIDERAÇÕES FINAIS........................................................................................................61
REFERÊNCIAS ................................................................................................................................64
1. INTRODUÇÃO
2. REVISÃO BIBLIOGRÁFICA
1.234.918,30
É importante salientar que o Brasil é o único dos países de dimensão continental que
promoveu o desmantelamento do modal ferroviário e que, consequentemente, depende quase
exclusivamente do transporte rodoviário, devendo os investimentos previstos no setor serem
muito bem avaliados e estudados para que sejam resguardados os interesses nacionais e
atendidas as expectativas dos brasileiros.
De acordo com DNIT (2013) o Estado do Espírito Santo detinha uma malha rodoviária
de 1.682 quilômetros de extensão sob jurisdição federal, se enquadrando como o sexto Estado
com a menor malha rodoviária federal. Esta malha, representada exclusivamente pelas rodovias
identificadas como “BRs”, era composta por 503,9 km de rodovias planejadas ou coincidentes
com rodovias estaduais, 125,2 km de rodovias não pavimentadas, ou em processo de
pavimentação, e 1.053,4 km de rodovias pavimentadas.
O Departamento de Estradas de Rodagem do Estado do Espírito Santo (DER-ES), por
sua vez, apresentou em 2009 o trabalho intitulado Plano Estratégico de Logística e de
Transportes do Espírito Santo, no qual apresentou-se a malha rodoviária sob jurisdição estadual
com um total de 5.614,8 quilômetros de extensão, sendo 53,1% destes pavimentados.
Ainda segundo DER-ES (2009) as regiões com menor índice de pavimentação
rodoviária seriam o Extremo Norte, o Noroeste I, o Noroeste II e o Litoral Norte, áreas com
maiores exposições dos litotipos Barreiras, com distâncias médias à uma rodovia pavimentada
avaliadas em 23,9, 10,3, 9,9 e 8,0 km, respectivamente, enquanto a média estadual é de 6 km.
De acordo com o Plano Estratégico elaborado pelo DER-ES, para a consolidação dos
programas idealizados seria necessário um investimento total da ordem de R$ 2,4 bilhões, a
preços de 2009 que, considerando-se a capacidade de investimento estadual no setor de 160
milhões de reais/ano, determinou o período de aplicação do Plano em 15 anos (2011 – 2025).
A Figura 2 apresenta os valores, em milhões, previstos para investimento em todo o
estado enquanto a Figura 3 aponta para a participação percentual das áreas sob influência dos
litotipos do grupo Barreiras neste investimento, considerando-se o período de (2011 a 2025).
17
49%
51%
2.3.1. Geologia
verificar a abrangência total do grupo Barreiras internamente aos limites do Espírito Santo.
De acordo com os dados extraídos do SIG da CPRM, de forma geral, os sedimentos
indivisos do grupo Barreiras se espalham por 9.041,57 km², representando 19,62% do território
estadual, ocorrendo em 29 dos 78 municípios, conforme tabela apresentada no anexo II, com
evidente predomínio no extremo norte e no litoral norte espírito-santense, onde ocorre de forma
contínua, sendo interceptado somente pelos sedimentos aluvionares depositados pelos
principais cursos hídricos nos fundos dos vales dissecados.
Importante salientar que, dentro do ambiente geológico estadual, o grupo Barreiras é a
entidade geológica com maior potencial para ocorrência de solos com granulometria mais
grosseira, representando a área de maior interesse para o estudo de materiais passiveis de
utilização em camadas de base de pavimentos in-natura.
- Abertura do sulco padrão: Com o apoio de cinzel padronizado, produzir uma abertura
na massa de solos orientada de acordo com o eixo geométrico da concha em uma única
passada, para solos argilosos, ou em diversas passadas, em caso de solos arenosos;
- Realização do ensaio: Acionar a manivela e golpear a concha, em frequência de dois
golpes por segundo, até que as duas bordas inferiores da abertura se unam ao longo de
1 cm. Uma vez obtido o fechamento da abertura, colhe-se uma porção de solos de ambos
os lados e transversalmente à canelura, pesando-o e levando-o para uma estufa para
𝑃ℎ−𝑃𝑠
determinação da umidade de acordo com fórmula ℎ = 𝑥 100, sendo h o teor de
𝑃𝑠
umidade, Ph a massa de solo úmido e Ps a massa de solo seco. O ensaio deve ser
realizado para duas determinações distintas, atendendo ao intervalo de 20 a 30 golpes
para fechamento da canelura.
𝑁
- Cálculo do LL: O resultado do LL é determinado pela fórmula 𝐿𝐿 = ℎ 𝑥 ( ) 𝑥 0,156,
20
O conceito de Limite de Plasticidade (LP) é um tanto mais complexo do que aquele que
caracteriza o LL. Segundo Milléo (2010) o LP corresponde a um teor de umidade do solo que,
para valores menores do que ele, as propriedades físicas da água não mais se igualam às da
água livre. Soares et al (2006) por sua vez descreve o LL como o teor de umidade mínimo, no
qual a coesão é pequena demais para permitir deformação, porém, suficientemente alta para
garantir a manutenção da forma adquirida.
As diretrizes de execução do ensaio de LP são dadas pela norma DNER-ME 82/94. Os
passos para desenvolvimento do ensaio são resumidos a seguir.
- Preparação da amostra: Toma-se uma amostra com cerca de 50 g, previamente
preparada segundo as diretrizes do item 4.d da norma DNER-ME 41/94. Acrescenta-se
água destilada em quantidade suficiente e homogeneíza-se para se obter uma massa
plástica Homogeneizar a amostra com 15 a 20 cm³ de água destilada e, quando
necessário, proceder novas adições de água, em volumes de 1 a 3 cm³, até que a mistura
de solo se apresente como uma massa plástica;
24
𝐼𝑃 = 𝐿𝐿 − 𝐼𝑃 (em %) ...(01)
Neste ponto é importante ressaltar que se o LL e o IP não puderem ser determinados, ou quando
o LP for superior ao LL, o material é considerado não plástico.
= 100%) e todos os ensaios realizados a partir de então consistem em uma análise da qualidade
do material ensaiado em relação àqueles empregados quando da obtenção do valor de
referência.
No Brasil o ensaio de ISC é balizado pela norma DNIT 172/2016-ME, de título Solos –
Determinação do Índice de Suporte Califórnia utilizando amostras não trabalhadas – Método
de ensaio, que fixa os procedimentos para determinação do ISC. A execução do ensaio, extraída
de forma resumida da norma supra citada, consiste na sequência de passos descritos a seguir.
- Preparação da amostra: Colhe-se, destorroa-se, homogeneíza-se e seca-se ao ar uma
quantidade de solo determinada em função da granulometria predominante no material
a ser ensaiado (6000 g, para solos siltosos ou argilosos, e 7000 g, para os arenosos ou
pedregulhosos). Passa-se essa amostra representativa na peneira de 19 mm devendo ser
substituído, em mesmo peso, todo o material retido nesta. A substituição se dá por
material encerrado entre as peneiras de 19mm e 4,8mm provenientes de outra parcela
da amostra colhida;
- Confecção do corpo-de-prova (CP): Compacta-se o material preparado acima com o
martelo padronizado, empregando-se a energia de 12, 26 ou 55 golpes em cinco camadas
distintas, em um molde cilíndrico de 150mm de diâmetro até que se obtenha uma altura
total de cerca de 125mm após a compactação. O acabamento do CP poderá ser feito com
régua rígida, biselada, para que posteriormente seja aferido o peso do material;
- Determinação do teor de umidade: Colhe-se, do material excedente da moldagem, uma
amostra de aproximadamente 100 g para a determinação do teor de umidade;
- Saturação do corpo-de-prova: Coloca-se o cilindro com o material compactado em um
reservatório de água durante quatro dias, com aplicação de uma sobrecarga-padrão de
4,536 kg. Adapta-se a haste de expansão com extensômetro, aferindo-se a qualquer
expansão ou retração ocorrida a cada 24 horas;
- Penetração do corpo-de-prova: Realizado em prensa padronizada e aferida aplicando-
se uma carga de, aproximadamente, 45N a partir de um pistão com 50mm de diâmetro,
sob uma velocidade de penetração de 1,27mm/min. A partir de então são registradas as
medidas do extensômetro do anel, que é função da penetração do pistão no solo em
determinado tempo, medindo encurtamentos diametrais devidos à aplicação da carga;
- Cálculo do ISC: Utilizando-se planilha automatizada, corrige-se a curva pressão-
penetração obtida durante o ensaio de forma a determinar a pressão corrigida. O ISC,
em porcentagem, é determinado pelo maior dos valores obtidos nas penetrações de 0,1
e 0,2 polegadas, a partir da equação 02 a seguir:
26
𝑌 = β0 + 𝛽1𝑋1 + ℰ ...(03)
Regressão Linear Múltipla (RLM) consiste em um modelo de predição linear similar àquele
caracterizado pela RLS, porém dotado de mais de uma variável regressora conforme definido
na equação 04 a seguir.
Figura 4 – (a) Exemplo de plano de regressão para um modelo n=2 (b) condições de contorno
Segundo Montgomery et al. (2001) as RLMs são usualmente utilizadas como modelos
empíricos, ou funções de aproximação onde a relação funcional entre as variáveis Y, X1, X2, ...,
Xn é desconhecida mas, em determinados intervalos das variáveis preditoras, o modelo de
regressão linear representa uma aproximação adequada das variáveis dependentes.
As diferentes técnicas de RLM tais como modelo polinomial cúbico, representado pela
equação 05 a seguir, modelos de segunda ordem, etc., permitem que diversos modelos, mesmo
aqueles muito mais complexos do que aquele descrito pela equação 04, sejam analisados.
Figura 5 – (a) Plano de regressão de modelo polinomial cúbico n=3 (b) condições de contorno
No final, seja qual for o modelo adotado para desenvolvimento da regressão, o objetivo
da RLM é obter uma relação aproximada entre a variável dependente e o restante das variáveis
que compõem a matriz de correlação. Para tanto a RLM estuda um grupo de variáveis distintas
e elimina aquelas que não representam elementos correlacionados à predição da variável
resposta, com perda mínima da informação, garantindo condições de determinação de padrões
de similaridade, associação e correlação entre as variáveis.
KDD e Data Mining, sendo diversos os autores que, de um lado, defendem que os termos são
sinônimos enquanto outra vertente de estudiosos afirma que o KDD refere-se a todo o processo
de descoberta de conhecimento, e a Mineração de Dados a uma das atividades do processo. Na
figura 6 apresentada a seguir podemos ver uma representação do processo de KDD, conforme
proposto por Fayyad (1996).
- Nó C5.0
- Nó Lista de Decisão
- Nó Regressão Linear
- Nó PCA/Factor
- Nó Seleção de Variável
- Nó Análise Discriminante
- Nó Regressão Logística
- Nó Modelo Linear Generalizado
- Nó Modelo Linear Generalizado Misto (GLMM)
- Nó Regressão de Cox
- Nó Support Vector Machine (SVM)
- Nó Rede Bayesiana
- Nó Self-Learning Response Model (SLRM)
- Nó Séries Temporais
- Nó k-Nearest Neighbor (KNN)
- Nó Spatio-Temporal Prediction (STP)
3. MATERIAIS E MÉTODOS
Uma vez definidas as condições básicas de utilização dos ensaios levantados, foi
realizado o procedimento de identificação do local de origem da amostra ensaiada. Para tanto
foi realizada a verificação das coordenadas de cada um dos furos de coleta das amostras a partir
da leitura dos planos de sondagem originalmente elaborados pela empresa Única Consultores
de Engenharia Urbana.
A tabela a seguir apresenta a condição de distribuição das amostras ensaiadas.
A tabela a anterior representa uma parte da planilha de ensaios compilada, composta por
linhas que representam as distintas amostras ensaiadas e colunas que representam os parâmetros
obtidos. A planilha completa segue apresentada no anexo IV.
Neste tópico será apresentada toda a análise estatística realizada sobre os dados de
entrada, variáveis preditoras, com o auxílio do software SPSS Modeler, desde o tratamento
inicial dos dados de entrada, permeando pela seleção dos métodos de modelamento, até a
estruturação do fluxo lógico dentro do ambiente de programação.
IBM (2015) determina, no manual intitulado Nós de Modelagem do IBM SPSS Modeler
17.1, que para a construção de um fluxo que criará um modelo, pelo menos três elementos são
necessários:
- Nó de origem: lê dados a partir de alguma origem externa;
- Nó Tipo: que especifica as propriedades do campo e o papel de cada campo;
- Nó de modelagem: que gera um nugget do modelo quando o fluxo é executado.
Em associação a estes nós principais, o fluxo pode ser munido de diversos processos
estatísticos intermediários que tem como objetivo localizar campos e registros que forem de
maior interesse para modelagem.
É importante salientar que grande parte da eficiência do modelo de correlação proposto,
caso esta exista, está associado à qualidade dos dados referentes às variáveis preditoras. Logo,
torna-se imperativo que sejam procedidos métodos de filtragem tais que minimizem, ou
suprimam completamente, a ocorrência deste tipo de dados.
Após a filtragem inicial de dados, todo o fluxo de modelamento estatístico pode ser
montado no canvas como estrutura lógica composta por um eixo com poucas variações a partir
dos nós, para modelos mais simples, ou por uma complexa árvore lógica com inúmeras
ramificações.
Figura 8 – Fluxos com: (a) um método estatístico (b) múltiplos métodos de estatísticos
(a) (b)
Fonte: Autor, 2017.
Uma vez estabelecido o nó Origem torna-se imperativo, para bancos de dados muito
amplos, que seja realizada a seleção, limpeza ou construção de uma nova matriz de dados para
análise e, para tanto foi empregado o nó Filtro.
Neste foram mapeados os campos oriundos do nó Origem e, a partir da associação do
nó Filtro a uma operação de registro de amostragem, com a conexão do primeiro a um nó
Amostra, foi possível selecionar um subconjunto de registros a partir do banco de dados original
com o intuito de melhorar o desempenho do fluxo sendo montado.
40
Após a filtragem dos dados foi inserido um procedimento de tipificação das variáveis lidas pelo
SPSS com vistas a caracterizar exatamente o tipo de resposta, ou níveis de medição, numérica
contínua, nominal, ordinal, categórico ou flag, lida em cada campo das variáveis preditoras.
41
Uma vez encerrado o modelamento desta etapa do fluxo obtêm-se o segundo nível do
fluxo de modelamento estatístico pretendido e o último passo da análise preliminar inicialmente
planejada.
Até esta etapa todos os nós incluídos no fluxo representam processos de tratamento
estatístico que objetivam verificar as condições de distribuição das variáveis e determinar se,
dentre os campos de entrada, existem informações incoerentes com os tipos de dados esperados
sem que haja, ainda, verificação de correlação potencial entre preditores e resposta.
A seguir a figura 14 apresenta a formatação intermediária do fluxo de modelamento até
a etapa de tipificação das variáveis.
A dispersão errática de todas as variáveis que não fossem representadas por constantes,
ou que apresentassem uma quantidade mínima de valores não constantes, demonstra que a
busca por uma equação baseada na RLM não importará em resultados representativos da
realidade.
Logo, optou-se pela exclusão do modelo RLM como modelo preditivo neste trabalho,
partindo-se então para métodos mais robustos como o da Regressão Logística e de Previsores
Categóricos, porém, para tanto, um novo tratamento preliminar, identificado neste trabalho
como procedimentos estatísticos preliminares de segunda fase, foi necessário para adequar as
variáveis preditoras e resposta às premissas de adoção nos novos métodos de análise.
Como se pode ver na figura acima, a partir deste tratamento, não mais se tem o valor de
ISC definido como um valor contínuo aferido em %, mas sim um valor nominal que pode ser
igual a 1, 2 ou 3, dependendo de em qual faixa o valor original se enquadrava. Para
diferenciação entre a variável contínua e a variável nominal agrupada foi inserido do sufixo
_BIN. A figura 16 a seguir apresenta a formatação intermediária do fluxo de modelamento até
a primeira etapa de categorização das variáveis.
A determinação da abrangência de cada uma das categorias foi definida sob as mesmas
premissas adotadas para a variável CBR (%) com larguras iguais a um terço da variação total
de valores em cada uma das variáveis.
Neste ponto torna-se imperioso ressaltar que aquelas variáveis que não apresentavam
variação entre máximos e mínimos, tais como a #200, apresentam três categorias com o mesmo
valor conforme representado na figura 18 a seguir.
Após a categorização de todas as variáveis uma nova seleção de quais dados deveriam
continuar sendo empregados na análise estatística foi necessária. Com o emprego de um
segundo nó filtro realizou-se a exclusão de todas as variáveis contínuas, aquelas não terminadas
com o sufixo _BIN, que, em função da opção pelos métodos estatísticos de Regressão Logística
e Métodos Categóricos, tornaram-se obsoletas para o fluxo a partir da categorização.
A seguir a figura 22 apresenta a formatação intermediária do fluxo de modelamento até
a etapa de filtragem da amostra, bem como a janela de regras determinadas para filtrar as
variáveis ainda existentes no fluxo modelado.
Um terceiro nó Tipo foi adicionado e nele foram definidos o tipo nominal para todas as
variáveis preditoras com sufixo _BIN, desta forma o processamento futuro se baseará na análise
de variáveis preditoras nominais, com vistas a verificar uma resposta também nominal. A figura
23 a seguir apresenta a lógica de modelamento do fluxo e a janela de definição das condições
de tipificação das variáveis preditoras até esta fase do processamento estatístico intermediário.
Figura 23 – Fluxo até a terceira tipificação de variáveis e janela de definição dos tipos.
Considerando que todo o preparo das variáveis foi realizado nos nós preliminares,
conforme descrito anteriormente durante a montagem do fluxo, e que a seleção dos modelos de
Previsão Categórica se deu quando percebida a distribuição errática das variáveis preditoras em
relação à resposta, o procedimento estatístico definitivo consistiu no lançamento dos nós de
modelagem estatística sobre o fluxo pré-estabelecido.
O processamento final dos dados a partir de diversos modelos de Previsão Categórica
permitiu a análise dos dados tratados em uma bateria de modelos de análise binária diferentes,
com variáveis preditoras e resposta associadas a valores de sim ou não de acordo com o
enquadramento nas categorias compostas pelos processos descritos no item 3.4.2.3.
Toda a análise estatística realizada se deu de forma automatizada a partir do nó Previsor
Categórico Automático, que analisa os dados em todos os métodos disponíveis selecionados
pelo usuário, permitindo escolher a melhor abordagem para a obtenção da correlação. É
importante ressaltar que associados ao nó Previsor foram lançados dois nós de saída para que
fosse possível realizar a leitura dos resultados.
A previsão categórica empregada neste trabalho previu a análise a partir de 11 modelos
distintos (C5, Rede Bayesiana, Discriminante, LSVM, Árvores Aleatórias, Árvore AS, Chaid,
Quest, Árvore C&R, Regressão Logística e Redes Neurais), porém, na definição de premissas,
somente os modelos com os três melhores resultados de correlação foram considerados pelo
sistema para criação do modelo de testes, conforme demonstrado pela figura 25 a seguir.
Neste ponto é importante ressaltar que a descrição da forma como funcionam cada um
dos métodos, bem como se dá o seu processamento individual foi suprimida deste trabalho uma
vez que tal tarefa extrapola os objetivos do trabalho que consiste na busca pela predição da
correlação entre as variáveis.
55
4. RESULTADOS OBTIDOS
Figura 28 – Seleção dos métodos de maior exatidão pelo previsor - partição 01.
Figura 29 – Seleção dos métodos de maior exatidão pelo previsor - partição 02.
5. CONSIDERAÇÕES FINAIS
REFERÊNCIAS
AMADOR ES. 1982. Depósitos relacionados à Formação inferior do Grupo Barreiras no estado
do Espírito Santo. In: Congresso Brasileiro de Geologia, 32, 1982, Salvador. Anais... Salvador:
SBG, 1982. v. 4, p. 1451-1460.
BIGARELLA, J. J. The Barreiras Group in Northeastern Brazil. An. Acad. Bras. Ci. v. 47,
(suplemento), p. 366-392, 1975.
DNER, Departamento Nacional de Estradas de Rodagem. DNER 80/94 – ME. Solos – análise
granulométrica por peneiramento – Método de ensaio. 03p. Brasília, 1994.
GIOLO, S. R. Introdução à análise de dados categóricos. 57ª Reunião Anual da RBras. 2012.
Minicurso – Universidade Federal do Paraná. Piracicaba. São Paulo.
HAIR, J. F. Et al. Multivariate Data Analysis with Readings. 4 ed. New Jersey: Prentice Hall,
1995.
IBGE, Instituto Brasileiro de Geografia e Estatística. Mapa de solos do Brasil. Rio de Janeiro.
2001.
IBGE, Instituto Brasileiro de Geografia e Estatística. Mapa de solos do Brasil. Rio de Janeiro.
2001.
MILLÉO, Ida Agner de Faria. Análise de especificações de aterro e correlação entre CRB e
capacidade de carga em solos compactados. 2012. 175 f. Dissertação (Mestrado) –
Universidade Federal do Paraná. Curitiba.
PORTER, O.J. Development of the original method for highway design. Development of CBR
flexible pavement design method for airfields. Transactions of American Society of Civil
Engineers, New York, v. 115, p. 461-7, 1950.
66
VILAS BOAS, G. S.; SAMPAIO, F. J.; PEREIRA, A. M. S. The Barreiras Group in the
northeastern coast of the State of Bahia, Brasil: depositional mechanisms and processes. Anais
da Academia Brasileira de Ciências, v. 73, n. 3, p. 417-427, 2001.
67