Você está na página 1de 89

UNIVERSIDADE CIDADE DE SÃO PAULO

PÓS-GRADUAÇÃO EM ENGENHARIA GEOTÉCNICA

PEDRO DE OLIVEIRA PANTUSA

ANÁLISE DE CORRELAÇÃO ENTRE O ÍNDICE DE


SUPORTE CALIFÓRNIA E OS PARÂMETROS FÍSICOS DE
SOLOS:
UM ESTUDO SOBRE OS SOLOS SUPERFICIAIS OCORRENTES NO
DOMÍNIO GEOLÓGICO DO GRUPO BARREIRAS NO ESPÍRITO
SANTO

VITÓRIA
2017
PEDRO DE OLIVEIRA PANTUSA

ANÁLISE DE CORRELAÇÃO ENTRE O ÍNDICE DE


SUPORTE CALIFÓRNIA E OS PARÂMETROS FÍSICOS DE
SOLOS:
UM ESTUDO SOBRE OS SOLOS SUPERFICIAIS OCORRENTES NO
DOMÍNIO GEOLÓGICO DO GRUPO BARREIRAS NO ESPÍRITO
SANTO

Monografia apresentada à Pós-graduação em


Engenharia Geotécnica, Universidade Cidade
de São Paulo, como requisito parcial para
obtenção do título de Especialista.
Orientador: Prof. Francisco Heber Lacerda de
Oliveira, D.Sc.

VITÓRIA
2017
PEDRO DE OLIVEIRA PANTUSA

ANÁLISE DE CORRELAÇÃO ENTRE O ÍNDICE DE


SUPORTE CALIFÓRNIA E OS PARÂMETROS FÍSICOS DE
SOLOS:
UM ESTUDO SOBRE OS SOLOS SUPERFICIAIS OCORRENTES NO
DOMÍNIO GEOLÓGICO DO GRUPO BARREIRAS NO ESPÍRITO
SANTO

Monografia apresentada à Pós-graduação em


Engenharia Geotécnica, Universidade Cidade
de São Paulo, como requisito parcial para
obtenção do título de Especialista.
Orientador: Prof. Francisco Heber Lacerda de
Oliveira, D.Sc.

Área de concentração: Geotecnia em obras de infraestrutura


Data da apresentação: 30/03/2017

Resultado:______________________

BANCA EXAMINADORA:

Prof.
Universidade Cidade de São Paulo ______________________________________

Prof.
Universidade Cidade de São Paulo ______________________________________
Dedico este trabalho aos meus pais Fátima
Catarina de Oliveira Pantusa e Carlos Henrique
Pantusa, exemplos de honra e dignidade, pelo
altruísmo e dedicação dispensados à minha
criação e educação, fatores que hoje definem
meu caráter.
AGRADECIMENTOS

Agradeço a todos aqueles que, por querer ou por acaso, contribuíram para o meu
crescimento acadêmico. Aos meus pais, avós e irmã, pelo carinho e apoio, ao meu tio Fernando,
por semear em mim a paixão pela geologia, ao meu tio Alexandre, por me guiar pelos nebulosos
caminhos da estatística, e à minha namorada, Vanessa Frasson, pela paciência, respeito e
compreensão.
Agradeço aos amigos, Camila Maria, pelas incontáveis horas extras de trabalho árduo,
Vinicius e Lidiane Ubaldino, pela acolhida desta insueta personalidade, e aos grandes amigos
de Belo Horizonte que, mesmo na distância, representaram um papel importante na manutenção
da minha sanidade ao longo dos muitos dias de labuta.
Finalmente agradeço aos professores, pilares da construção do conhecimento, pela
disposição e dedicação em repassar parte de seus conhecimentos para mentes em construção.
Agradeço excepcionalmente ao professor Heber Oliveira que, prontamente, me apoiou na busca
pelo aprimoramento da minha técnica e na divulgação do meu conhecimento.
“O conhecimento só é verdadeiro quando
adquirido por esforço do intelecto, não pela
memória.”
Conde Leon Nikolaievitch Tolstoi
RESUMO

Considerando-se a importância do Índice de Suporte Califórnia (ISC), também conhecido como


California Bearing Ratio (CBR), em subleito e jazidas locais, para a redução de custos
associados à execução de obras rodoviárias, e a obrigação legal de elaboração de Estudos de
Viabilidade Técnica e Econômica – EVTE para projetos rodoviários de grande vulto, o
conhecimento geotécnico dos materiais ocorrentes ao longo do ambiente geológico de inserção
é determinante para a correta análise de viabilidade. Considerando-se ser o grupo Barreiras uma
entidade litológica importante no cenário nacional, porém pouco estudada no tocante à
geotecnia de materiais, este trabalho objetivou estudar a correlação entre o ISC, a granulometria
e os limites de consistência de solos ocorrentes sob os domínios desta entidade geológica, no
Estado do Espírito Santo. Para tanto foram selecionados os resultados de 295 ensaios
geotécnicos realizados sobre amostras coletadas em boa parte da extensão do grupo Barreiras
espíritossantense. Uma vez obtidos e compilados os dados geotécnicos de relevância para a
análise pretendida estes foram submetidos a processos de tratamento e modelamento estatístico
com o apoio do software IBM SPSS Modeler para a verificação da existência de correlação
linear, numérica contínua, e, posteriormente, categórica ordinal entre as variáveis preditoras e
a variável resposta. A partir do processamento automatizado diversos métodos de análise
estatística foram utilizados de forma que se pudesse observar a relação entre as variáveis
independentes, referentes aos parâmetros físicos, e o ISC, um parâmetro mecânico. Em um
primeiro momento a existência da correlação linear foi descartada em função da distribuição
errática das variáveis preditoras. A análise estatística qualitativa realizada a partir do modelo
preditivo criado, por sua vez, retornou uma elevada taxa de acertos após a categorização das
variáveis. Acertos superiores a 90% na partição 01 e a 94% na partição 02 foram obtidos,
demonstrando a existência de correlação entre as variáveis preditoras e a variável resposta. No
entanto o baixo desempenho do modelo, quando analisados a partir do método da curva ROC,
aponta para problemas de assertividade na predição do CBR no caso de aplicação sobre
amostras distintas daquelas empregadas nas fases de treinamento e teste do modelo concebido,
mesmo que oriundas do mesmo grupo geológico.

Palavras-chave: Índice de Suporte Califórnia; Limites de Consistência; Granulometria; Grupo


Barreiras; Correlação estatística.
ABSTRACT

Considering the importance of the California Bearing Ratio (CBR) on subgrade and local
deposits, to reduce the costs associated with road enterprises, and the legal obligation to
elaborate Technical and Economic Feasibility Studies (EVTE) for major road projects, the
geotechnical knowledge of materials that occur along the geological environment transposed is
determinant for the correct feasibility analysis. Considering that the Barreiras group is an
important lithologic entity in the national scenario, but lightly studied as to material
geotechnics, this work aimed to study the correlation between the CBR, the grain size and the
consistency limits of soils occurring under the domains of this geological entity, in the State of
Espírito Santo. For this purpose, the results of 295 geotechnical tests performed on samples
collected in a good part of the Barreiras espiritossantense group were selected. Once the
relevant geotechnical data were obtained and compiled for the desired analysis, they were
subjected to statistical treatment and modeling processes with the support of the IBM SPSS
Modeler software to verify the existence of linear, continuous numerical, and, subsequently,
categorical ordinal correlations between the predictor variables and the response variable. In
the automated processing several methods of statistical analysis were used so that one could
observe the relation between the independent variables, referring to the physical parameters,
and the ISC, a mechanical parameter. At first, the existence of linear correlation was ruled out
due to the erratic distribution of the predictor variables. On the other hand, the qualitative
statistical analysis performed on the predictive model showed a high rate of correctness after
the categorization of variables. Right results were obtained in more than 90% in partition 01
and more than 94% in partition 02 demonstrating the existence of a correlation between the
predictor variables and the response variable. However the low performance of the model, when
analyzed by the ROC curve method, points to assertiveness problems in the prediction of CBR
in the case of application on samples different from those used in the training and test phases
of the designed model, even if they originate from the same geological group.

Keywords: California Bearing Ratio; Consistency Limits; Granulometry; Barreiras Group;


Statistical correlation.
LISTA DE ILUSTRAÇÕES

Figura 1 – Concentração de rodovias não pavimentadas por jurisdição (em km) .................... 15
Figura 2 – Investimentos previstos nas distintas microrregiões de planejamento - 2011 e 2015
(em milhões de reais) ........................................................................................................ 17
Figura 3 – Investimentos em microrregiões de planejamento – Barreiras x Demais ............... 17
Figura 4 – (a) Exemplo de plano de regressão para um modelo n=2 (b) condições de contorno
........................................................................................................................................... 28
Figura 5 – (a) Plano de regressão de modelo polinomial cúbico n=3 (b) condições de contorno
........................................................................................................................................... 29
Figura 6 – Proposição dos passos que compõem o processo de KDD ..................................... 31
Figura 7 – Ambiente de montagem de um novo fluxo no SPSS Modeler ............................... 37
Figura 8 – Fluxos com: (a) um método estatístico (b) múltiplos métodos de estatísticos ........ 38
Figura 9 – Seleção do nó Excel, na barra de seleção de nós, na paleta “Origens”. .................. 39
Figura 10 – Modelagem do fluxo até o primeiro filtro e janela de regras de amostragem....... 40
Figura 11 – Primeira tipificação de variáveis. .......................................................................... 41
Figura 12 – Resultados da análise de qualidade de dados de entrada no nó Auditoria de Dados.
........................................................................................................................................... 42
Figura 13 – Resultados da análise estatística no nó Auditoria de Dados. ................................ 42
Figura 14 – Modelagem do fluxo até primeira tipificação e janela de tipificação de variáveis.
........................................................................................................................................... 43
Figura 15 – Janela de definição da largura de faixas categóricas para a variável resposta. ..... 45
Figura 16 – Modelagem do fluxo até primeira categorização de variáveis. ............................. 45
Figura 17 – Segunda tipificação de variáveis e supressão do papel da variável CBR (%). ..... 46
Figura 18 – Distribuição da largura de amostragem para a variável LL. ................................. 47
Figura 19 – Auditoria estatística associada ao primeiro nó de Categorização. ........................ 48
Figura 20 – Auditoria da qualidade associada ao primeiro nó de Categorização..................... 49
Figura 21 – Modelagem do fluxo até a segunda etapa de categorização de variáveis. ............ 50
Figura 22 – Modelagem do fluxo até o segundo filtro e janela de regras de filtragem. ........... 51
Figura 23 – Fluxo até a terceira tipificação de variáveis e janela de definição dos tipos......... 52
Figura 24 – Janela de regras de partição para treinamento e teste. .......................................... 53
Figura 25 – Janela de premissas de montagem dos modelos estatísticos finais. ...................... 54
Figura 26 – Modelamento final do fluxo de análise estatística para predição de correlação. .. 55
Figura 27 – Resultados obtidos a partir do teste do modelo para as partições 01 e 02. ........... 57
Figura 28 – Seleção dos métodos de maior exatidão pelo previsor - partição 01. ................... 58
Figura 29 – Seleção dos métodos de maior exatidão pelo previsor - partição 02. ................... 58
Figura 30 – Importância dos preditores nas partições 01(a) e 02(b). ....................................... 59
Figura 31 – Importância dos preditores na partição 01. ........................................................... 59
Figura 32 – Importância dos preditores nas partições 01(a) e 02(b). ....................................... 60
LISTA DE TABELAS

Tabela 1 – Distribuição geográfica das amostras ensaiadas ..................................................... 35


Tabela 2 – Compilação das variáveis independentes (fração) .................................................. 36
Tabela 3 – Valores de qui-quadrado no cruzamento de variáveis categorizadas. .................... 50
SUMÁRIO

1. INTRODUÇÃO................................................................................................................................ 13

2. REVISÃO BIBLIOGRÁFICA ............................................................................................................. 15

2.1. Rodovias no Brasil ........................................................................................................................ 15

2.2. Rodovias no Espírito Santo .......................................................................................................... 16

2.3. Grupo Barreiras ............................................................................................................................ 17

2.3.1. Geologia................................................................................................................................ 17

2.3.2. Pedologia e geodiversidade ................................................................................................ 19

2.3.3. Grupo Barreiras no Espírito Santo ....................................................................................... 19

2.4. Estudos geotécnicos em obras rodoviárias ................................................................................. 20

2.4.1. Ensaios físicos ....................................................................................................................... 21

2.4.1.1. Granulometria por peneiramento ........................................................................................ 21

2.4.1.2. Limite de Liquidez.................................................................................................................. 22

2.4.1.3. Limite de Plasticidade e Índice de Plasticidade .................................................................... 23

2.4.2. Ensaios mecânicos .........................................................................................................24

2.4.2.1. Índice de Suporte Califórnia (ISC) ......................................................................................... 24

2.5. Estudos de Viabilidade Técnico-Econômica em rodovias (EVTE) ............................................26

2.5.1. Estudos geotécnicos em EVTEs e EVTEAs .......................................................................26

2.6. Estatística Aplicada ...............................................................................................................27

2.6.1. Regressão Linear Múltipla .............................................................................................27

2.6.2. Análise estatística categórica ........................................................................................29

2.6.3. Mineração de dados ......................................................................................................30

2.6.4. O Software IBM SPSS Modeler ® ....................................................................................31

2.6.4.1. Modelos de Classificação ...................................................................................................... 32

3. MATERIAIS E MÉTODOS ........................................................................................................34

3.1. Obtenção dos dados geotécnicos ..........................................................................................34


3.2. Seleção dos ensaios para análise de parâmetros ...................................................................34

3.2.1. Distribuição geográfica das amostras............................................................................35

3.3. Seleção dos parâmetros adotados como variáveis dependentes...........................................36

3.3.1. Compilação dos ensaios e individualização das variáveis independentes ......................36

3.4. Verificação da existência de correlação estatística com o SPSS Modeler ...............................37

3.4.1. Procedimentos estatísticos preliminares .......................................................................37

3.4.1.1. Criação do banco de dados e associação ao nó origem ....................................................... 39

3.4.1.2. Estabelecimento do primeiro filtro de variáveis ................................................................... 39

3.4.1.3. Primeira definição do tipo de variáveis ................................................................................ 40

3.4.1.4. Seleção dos métodos de análise ........................................................................................... 43

3.4.2. Procedimentos estatísticos preliminares de segunda fase .............................................44

3.4.2.1. Primeira categorização das variáveis ................................................................................... 44

3.4.2.2. Segunda definição do tipo de variáveis ................................................................................ 46

3.4.2.3. Segunda categorização das variáveis ................................................................................... 46

3.4.2.4. Estabelecimento do segundo filtro de variáveis ................................................................... 51

3.4.2.5. Terceira definição do tipo de variáveis ................................................................................. 51

3.4.2.6. Particionamento das variáveis ............................................................................................. 52

3.4.3. Procedimentos estatísticos definitivos: Busca da equação de correlação.......................53

4. RESULTADOS OBTIDOS..........................................................................................................57

5. CONSIDERAÇÕES FINAIS........................................................................................................61

6. RECOMENDAÇÕES PARA TRABALHOS FUTUROS ...................................................................63

REFERÊNCIAS ................................................................................................................................64

ANEXO I – Abrangência geológica do grupo Barreiras no Estado do Espírito Santo ........................... 67

ANEXO II – Tabela de área municipal com afloramento de litotipos do grupo Barreiras.................... 69

ANEXO III – Autorização para uso de dados ......................................................................................... 71

ANEXO IV – Planilha de ensaios compilados ........................................................................................ 73

ANEXO V – Histogramas e gráficos de dispersão – Nó de Auditoria .................................................... 79


ANEXO VI – TABELA DE RESULTADOS DO TESTE DO MODELO ESTATÍSTICO SOBRE OS DADOS DA
PARTIÇÃO 01 ......................................................................................................................................... 82

ANEXO VII – TABELA DE RESULTADOS DO TESTE DO MODELO ESTATÍSTICO SOBRE OS DADOS DA


PARTIÇÃO 02 ......................................................................................................................................... 85
13

1. INTRODUÇÃO

Considerando-se a importância do Índice de Suporte Califórnia (ISC) de subleito e de


jazidas locais para a redução de custos associados à execução de obras rodoviárias, o
conhecimento geotécnico dos materiais ocorrentes ao longo do ambiente geológico de inserção
é determinante para a verificação da viabilidade técnico-econômica de empreendimentos
rodoviários.
O grupo Barreiras é uma das entidades litológicas mais amplamente estudadas à luz da
geologia nacional em função da sua enorme abrangência geográfica e posicionamento
estratégico ao longo de praticamente todo o litoral brasileiro, no entanto, no tocante à geotecnia
de materiais, o conhecimento do grupo Barreiras é extremamente restrito.
No Estado do Espírito Santo, unidade federativa que, no ano de 2008, apresentava,
segundo o Plano Estratégico de Logística e de Transportes do Espírito Santo, 6.526,7km de
rodovias federais e estaduais, com densidade de 14,1km de rodovias para cada 100km² de
território, o grupo Barreiras encerra 19,62% do terreno estadual e sobre ele desenvolve-se
grande parte das rodovias, ainda não pavimentadas.
Para a análise de priorização de intervenções de pavimentação, dentro dos Estudos de
Viabilidade Técnica e Econômica – EVTE, a geotecnia é um elemento imprescindível pois
facilita a verificação de custos associados às intervenções de terraplenagem e pavimentação na
medida em que define as distâncias de transporte dos materiais necessários para as obras.
O trabalho ora apresentado encerra o estudo de uma correlação entre o Índice de Suporte
Califórnia (ISC), a granulometria e os limites de consistência objetivando que, através da
análise estatística de uma série de ensaios laboratoriais, seja possível se determinar, com
relativa precisão, a existência de correlação entre o valor do ISC a partir de ensaios menos
complexos passiveis de execução em campo ou em instalações provisórias com facilidade.
Para tanto foram compilados os resultados obtidos em ensaios granulométricos, de
limites, de compactação, de expansão e de ISC realizados, por três laboratórios distintos, sobre
295 amostras coletadas em boa parte da extensão do grupo Barreiras espírito-santense.
Todos os ensaios selecionados tiveram seu ISC determinado para a energia equivalente
ao Proctor Normal, visando restringir as variáveis independentes àquelas relacionadas
exclusivamente às condições físicas dos solos, variáveis estas passiveis de serem obtidas em
ensaios de execução extremamente simples, sem necessidade de emprego de muitos
equipamentos ou dispêndio exacerbado de tempo.
14

Todos os dados extraídos dos ensaios selecionados foram submetidos a processos de


tratamento e modelamento estatístico com o apoio do software IBM SPSS Modeler que permite,
a partir do modelamento de um fluxo lógico com apoio de nós conectados, realizar, em um
único processamento, todo o processo estatístico.
Em uma primeira fase foi percebido que não seria possível traçar-se uma correlação
linear entre as variáveis preditoras e resposta se a análise estatística se restringisse ao trabalho
sobre as variáveis numéricas contínuas. Logo, os dados de entrada foram submetidos a
processos de categorização visando permitir a análise estatística baseada em variáveis
categóricas ordinais.
A partir do processamento automatizado, facilitado pelo software IMB SPSS Modeler,
diversos métodos de análise estatística foram utilizados para a composição de um modelo de
treinamento, e posterior teste. As variáveis categorizadas foram particionadas na razão 70 e
30% para treinamento e teste do modelo, respectivamente.
Ao todo, dois processos de partimentação foram realizados de forma que se pudesse
observar se as diferenças entre as amostras de treinamento e de teste incorreriam em alteração
significativa dos resultados pretendidos pelo modelo. Os resultados do processamento se
basearam na combinação dos resultados provenientes dos três métodos de análise estatística
categórica considerados pelo software como de maior eficiência.
De forma geral os modelos preditivos estabelecidos pelos procedimento estatísticos
adotados apresentaram baixo desempenho quando submetidos à análise pelo método da curva
ROC, no entanto, para as amostras estudadas, os níveis de predição acertada ficaram acima de
90% em ambas as amostras particionadas.
15

2. REVISÃO BIBLIOGRÁFICA

2.1. Rodovias no Brasil

O setor rodoviário brasileiro é o mais expressivo modal de transporte de cargas do país


desde que, alguns anos antes da ditadura militar, houve o abandono das ferrovias pelo poder
público que tinha como objetivo fomentar a indústria dos automóveis e, concomitantemente,
expandir a malha rodoviária nacional.
Atualmente as rodovias brasileiras, sejam elas federais, estaduais ou municipais,
premeiam praticamente todo o território nacional e são o modal de maior importância na
economia de brasileira (DNIT, 2013), transportando boa parte dos produtos e serviços
demandados pelo mercado interno nacional.
Segundo dados levantados pelo Departamento Nacional de Transportes (DNIT) no ano
de 2013, a malha rodoviária nacional era composta por 1,691 milhão de quilômetros de
rodovias, sendo 12% pavimentadas, 80,4% não eram pavimentados e 7,6% planejadas. Fica
claro que o percentual de rodovias pavimentadas é restrito para um país que confia, quase
exclusivamente, no modal rodoviário para escoamento de produtos e serviços no mercado
interno.
Os problema se agrava ainda mais quando se pensa na produção decentralizada,
principalmente aquela relativa ao setor do agronegócio e extrativismo, que depende, em grande
parte, das rodovias que compõem as malhas rodoviárias municipais cujo nível de pavimentação,
segundo o Relatório dos Levantamentos Funcionais das Rodovias Federais elaborado pelo
DNIT em 2013, é de aproximadamente 9,1%.

Figura 1 – Concentração de rodovias não pavimentadas por jurisdição (em km)


111.333,70 12.661,70

1.234.918,30

Municipal Estadual Federal


Fonte: DNIT, 2013
16

É importante salientar que o Brasil é o único dos países de dimensão continental que
promoveu o desmantelamento do modal ferroviário e que, consequentemente, depende quase
exclusivamente do transporte rodoviário, devendo os investimentos previstos no setor serem
muito bem avaliados e estudados para que sejam resguardados os interesses nacionais e
atendidas as expectativas dos brasileiros.

2.2. Rodovias no Espírito Santo

De acordo com DNIT (2013) o Estado do Espírito Santo detinha uma malha rodoviária
de 1.682 quilômetros de extensão sob jurisdição federal, se enquadrando como o sexto Estado
com a menor malha rodoviária federal. Esta malha, representada exclusivamente pelas rodovias
identificadas como “BRs”, era composta por 503,9 km de rodovias planejadas ou coincidentes
com rodovias estaduais, 125,2 km de rodovias não pavimentadas, ou em processo de
pavimentação, e 1.053,4 km de rodovias pavimentadas.
O Departamento de Estradas de Rodagem do Estado do Espírito Santo (DER-ES), por
sua vez, apresentou em 2009 o trabalho intitulado Plano Estratégico de Logística e de
Transportes do Espírito Santo, no qual apresentou-se a malha rodoviária sob jurisdição estadual
com um total de 5.614,8 quilômetros de extensão, sendo 53,1% destes pavimentados.
Ainda segundo DER-ES (2009) as regiões com menor índice de pavimentação
rodoviária seriam o Extremo Norte, o Noroeste I, o Noroeste II e o Litoral Norte, áreas com
maiores exposições dos litotipos Barreiras, com distâncias médias à uma rodovia pavimentada
avaliadas em 23,9, 10,3, 9,9 e 8,0 km, respectivamente, enquanto a média estadual é de 6 km.
De acordo com o Plano Estratégico elaborado pelo DER-ES, para a consolidação dos
programas idealizados seria necessário um investimento total da ordem de R$ 2,4 bilhões, a
preços de 2009 que, considerando-se a capacidade de investimento estadual no setor de 160
milhões de reais/ano, determinou o período de aplicação do Plano em 15 anos (2011 – 2025).
A Figura 2 apresenta os valores, em milhões, previstos para investimento em todo o
estado enquanto a Figura 3 aponta para a participação percentual das áreas sob influência dos
litotipos do grupo Barreiras neste investimento, considerando-se o período de (2011 a 2025).
17

Figura 2 – Investimentos previstos nas distintas microrregiões de planejamento - 2011 e 2015


(em milhões de reais)
Pólo Linhares
113,98 62,53 34,64 Noroeste 1
118,46 Litoral Norte
133,8
411,18 Sudoeste Serrana
157,3 Pólo Cachoeiro
338,2
187,87 Caparaó
Noroeste 2
238,81 325,34
Central Serrana
280,91
Pólo Colatina
Extremo Norte
Metrópole Expandida Sul
Metropolitana

Fonte: DER-ES, 2009

Figura 3 – Investimentos em microrregiões de planejamento – Barreiras x Demais

49%
51%

Influência Barreiras Demais áreas

Fonte: Adaptado de DER-ES, 2009

2.3. Grupo Barreiras

2.3.1. Geologia

Em praticamente toda a faixa litorânea brasileira afloram rochas conformadas em


ambiente sedimentológico terrígeno de origem continental e/ou marinha que consolidam o
Grupo Barreiras que, segundo BEZERRA (2001), se constitui na última rocha sedimentar
terciária do Nordeste e Sudeste do Brasil, estabelecida durante a abertura do Atlântico.
18

De forma geral os litotipos do grupo Barreiras correspondem a arenitos ferruginosos,


associados a raros conglomerados de matriz argilosa, dispostos em uma sequência de
sedimentos detríticos, siliciclásticos (ARAI, 2006), pouco ou não consolidados, mal
selecionados, de cores variegadas (VILAS BOAS, 1996; VILAS BOAS; SAMPAIO;
PEREIRA, 2001), com granulometria variando entre areias grossas e argilas siltosas.
No Estado do Espírito Santo o grupo Barreiras apresenta exposição contínua desde a
divisa com a Bahia, no município de Pedro Canário, onde ocorre em uma faixa de dezenas de
quilômetros de largura, estreitando-se a sul até o distrito de Carapina, no município de Serra,
onde apresenta em uma faixa pouco superior a 5 quilômetros.
A sul da capital, até a divisa com o Rio de Janeiro, a exposição do grupo Barreiras torna-
se descontínua, com litotipos característicos ocorrendo em manchas de pequena expressão
geográfica nos municípios de Anchieta, Guaraparí e Marataízes, conforme observa-se no Mapa
de Abrangência Geológica do Grupo Barreiras no Estado do Espírito Santo (Anexo I).
AMADOR e DIAS (1978) e AMADOR (1982) estabelecem como “Grupo” Barreiras
uma série de depósitos sedimentares distintos que ocorrem segundo duas áreas principais:
Vitória, Guarapari e Marataízes (Barreiras Superior) e na região norte do Espírito Santo
(Formação Pedro Canário). TAMARA (1995) foi responsável pela revisão estratigráfica que
encerrou na subdivisão do Barreiras Superior, conforme proposto por Amador e Dias,
incorrendo no estabelecimento de uma terceira área na região de Vitória (Barreiras Inferior).
Para AMADOR e DIAS (1978) o grupamento Barreiras Superior é composto por um
expressivo pacote composto por camadas arenosas, tabulares, admitida como de idade terciária.
Ainda, segundo os autores, a formação Pedro Canário, por sua vez, é composta por arenitos
grossos, arcozianos, com coloração clara, ocorrendo, secundariamente, intercalações de
camadas de argilitos, de geometria lenticular, geralmente fossilíferos.
TAMARA (1995), em sua revisão estratigráfica realizada nas proximidades da capital
espiritossantense, com base em uma suposta discordância erosiva, subdividiu-os o grupamento
Barreiras Superior em duas unidades, designadas como Unidade Inferior e Unidade Superior.
De acordo com este autor, os sedimentos da Unidade Inferior são predominantemente
inconsolidados, mal selecionados, constituídos por camadas tabulares de areias arcozianas
estratificadas, areias cascalhosas e sedimentos argilosos e sílticos. A Unidade Superior, por sua
vez, seria composta por uma série de camadas predominantemente bem graduadas, que
encerram areias argilosas, argilas arenosas e argilas siltosas.
Ao longo de toda a exposição do grupo Barreiras, em território espírito-santense, são
abundantes as concreções ferruginosas cuja concentração e grau de consolidação variam
19

amplamente em função da maturidade dos sedimentos, tanto textural quanto


mineralogicamente, fato que pode ser explicado pela hipótese da área fonte, conforme
defendido por MABESSONE et al. (1972) e BIGARELLA (1975).

2.3.2. Pedologia e geodiversidade

A pedogênese, fenômeno que caracteriza a formação dos solos, depende diretamente da


interface entre as rochas, em sua composição química e física, e os efeitos meteorizadores
capazes de alterar a estrutura desta matriz rochosa.
Ao longo dos domínios geológicos do Grupo Barreiras a interação entre as
condicionantes geológicas, baseada em uma estratigrafia composta por acamamentos
irregulares de sedimentos distintos (arenito, siltito, argilito e cascalho), e o clima tropical
característicos das zonas de ocorrência dos litotipos do Grupo Barreiras, incorre na formação
de substratos pedológicos relativamente espessos, dotados de condições hidromecânicas e
geomecânicas muito variáveis, principalmente em função da variação granulométrica.
De forma geral, segundo SILVA e MACHADO (2010), os substratos pedológicos são
formados por pacotes com espessura variável, predominantemente sobre terrenos de relevos
suavizados, dotados de muito baixa fertilidade natural. A geoambiência é favorável à existência
de extensas e espessas camadas de diversos tipos de areia, argila e cascalho.
Analisando o Mapa de Solos do Brasil, publicação realizada pelo Instituto Brasileiro de
Geografia e Estatística (IBGE, 2001), grande parte dos solos ocorrentes ao longo de toda a
exposição do grupo Barreiras é constituída por Latossolos e Argissolos Vermelho-Amarelos.
Estas entidades pedológicas, principalmente no Espírito Santo, podem ser constituídas por,
virtualmente, todo o espectro granulométrico possível em solos tropicais.

2.3.3. Grupo Barreiras no Espírito Santo

A partir da análise do mapa geológico compilado com as informações geológicas


estaduais, obtidas junto ao Sistema de Informações Geográficas (SIG) da Companhia de
Pesquisa de Recursos Minerais (CPRM), e geográficas, extraídas do SIG do IBGE, foi possível
20

verificar a abrangência total do grupo Barreiras internamente aos limites do Espírito Santo.
De acordo com os dados extraídos do SIG da CPRM, de forma geral, os sedimentos
indivisos do grupo Barreiras se espalham por 9.041,57 km², representando 19,62% do território
estadual, ocorrendo em 29 dos 78 municípios, conforme tabela apresentada no anexo II, com
evidente predomínio no extremo norte e no litoral norte espírito-santense, onde ocorre de forma
contínua, sendo interceptado somente pelos sedimentos aluvionares depositados pelos
principais cursos hídricos nos fundos dos vales dissecados.
Importante salientar que, dentro do ambiente geológico estadual, o grupo Barreiras é a
entidade geológica com maior potencial para ocorrência de solos com granulometria mais
grosseira, representando a área de maior interesse para o estudo de materiais passiveis de
utilização em camadas de base de pavimentos in-natura.

2.4. Estudos geotécnicos em obras rodoviárias

A condição de elaboração dos Estudos Geotécnicos rodoviários varia de acordo com as


normas, diretrizes e instruções específicas de cada contratante, seja ele órgão público ou
empresa privada. Não obstante, de forma geral, todos os documentos normativos estão, de
alguma forma, associados à Instrução de Serviço IS-207 do DNIT ou representam cópias
reduzidas e simplificadas desta.
Segundo Instrução de Serviço, publicada em 1994 pelo Departamento de Estradas de
Rodagem do Estado do Rio Grande do Sul (DAER), os Estudos Geotécnicos tem como objetivo
a obtenção dos dados geotécnicos do subleito da rodovia projetada, empréstimos e jazidas, o
conhecimento de certos elementos tecnológicos de alguns materiais, a análise desses dados e
elementos, para orientação das Consultoras na elaboração de projetos de terraplenagem e do
pavimento, e recomendações no estabelecimento de alguns métodos construtivos.
De forma geral os Estudos Geotécnicos traduzem, em linguagem matemática, as
características físicas e mecânicas dos solos sobre os quais serão executadas as obras de infra-
estrutura pretendidas. Estes estudos são imprescindíveis para a escolha de traçados e
desenvolvimento de projetos tendo reflexo direto no custo da obra, que será mais alto na medida
em que os solos demonstrem-se menos competentes para a sustentação das estruturas propostas.
Destarte, verificação dos parâmetros de granulometria, limites de consistência,
densidades “in-situ” e de laboratório, expansão e ISC são relevantes na decisão e orçamentação
21

de empreendimentos rodoviários. É importante salientar que além dos parâmetros


anteriormente citados, diversos outros índices físicos dos solos são determinados como
elementos subordinados, necessários principalmente para determinação das condições de
compactação em laboratório.

2.4.1. Ensaios físicos

2.4.1.1. Granulometria por peneiramento

Ensaios granulométricos por peneiramento são o primeiro elemento para caracterização


de solos em empreendimentos rodoviários. As condições básicas para execução dos ensaios de
granulometria em rodovias são regidas pelo Método de Ensaio DNER-ME-80/94 – Solos:
análise granulométrica por peneiramento, a partir do emprego de peneiras com as aberturas de
malha, em mm de: 50 – 38 – 25 – 19 – 9,5 – 4,8 – 2,0 – 1,2 – 0,6 – 0,42 – 0,30 – 0,15 e 0,075.
A execução do ensaio, extraída de forma resumida da norma supra citada, consiste na
sequência de passos descritos a seguir.
- Preparação da amostra: Colhe-se e seca-se a amostra ao ar, ou em aparelho secador,
garantindo que sal temperatura não exceda 60°C. Destorroa-se o material de forma
delicada, de maneira a evitar que ocorra a redução do tamanho natural das partículas
individuais pelo fracionamento dos grânulos. Reparte-se o material por quarteamento
até que se obtenha uma amostra de 1500 ou 2.000 gramas para solos argilosos ou
arenosos/pedregulhosos, respectivamente. Do restante do material é separada uma
porção para determinação da umidade higroscópica;
- Procedimento de peneiramento: Verte-se a amostra, embebida em água, através das
peneiras de 2,0 e de 0,075 mm, tomando-se o cuidado de remover, com auxílio de jato
d’água, o material que ainda permanecer no recipiente. Este procedimento é repetido até
que a água de lavagem se apresente limpa.
- Pesagem das parcelas finas do material: Após lavadas as frações retidas nas peneiras
de 2 e 0,075mm são transferidas para a capsula de porcelana e secas em estufa, até a
constância de peso. Uma vez secos, os materiais contidos nas capsulas são peneirados
nas peneiras desejadas e, posteriormente, pesadas com aproximação de 0,1 g;
22

- Cálculo da granulometria passante/retida: Após a realização de todas as etapas do


ensaio, o cálculo do peso passante/retido em cada uma das peneiras se dá somando-se o
peso do material retido nas peneiras de 2,0 mm e nas de maior abertura, posteriormente
procedendo-se à subtração desta massa daquela definida quando da pesagem do material
seco ao ar para definição do peso de material passante na peneira de 2,0 mm. Multiplica-
100
se o valor da massa passante na peneira de 2,0 mm pelo fator de correção , sendo
100+ℎ

h a umidade higroscópica medida para o solo. Finalmente, o produto desta multiplicação


representa o peso seco do material passante na peneira de 2,0 mm. A partir deste ponto
os percentuais são definidos de forma direta em relação ao peso total seco do material.

2.4.1.2. Limite de Liquidez

O Limite de Liquidez (LL) de um solo é o teor de umidade que separa o estado de


consistência líquido do plástico e para o qual o solo apresenta uma pequena resistência ao
cisalhamento (Milléo, 2010). DNER (1994) define o LL como o teor de umidade do solo,
expresso em porcentagem, com o qual se unem, em um centímetro de comprimento, as bordas
inferiores de uma canelura feita em massa de solo colocada em uma concha de um aparelho
normalizado (aparelho de Casagrande), sob a ação de 25 golpes da concha.
Considerando-se as características físicas dos solos empregados em empreendimentos
rodoviários, com LL sempre inferior a 150%, a norma DNER-ME 122/94 determina que os
ensaios sejam realizados pelo método expedito, conforme sequencia resumida descrita a seguir.
- Preparação da amostra: Toma-se uma amostra com cerca de 70 g, previamente
preparada segundo as diretrizes do item 4.d da norma DNER-ME 41/94. Homogeneizar
a amostra com 15 a 20 cm³ de água destilada e, quando necessário, proceder novas
adições de água, em volumes de 1 a 3 cm³, até que a mistura de solo se apresente como
uma massa plástica;
- Preparo da massa no aparelho: Espalha-se a massa de solo na concha de forma a ocupar
2/3 de toda a superfície, empregando o menor número possível de passadas da espátula
para evitar a formação de bolhas no interior da massa. Alisa-se a massa dentro da concha
até que se apresente com 1cm de espessura no ponto mais espesso e retira-se o excesso
de solo do aparelho;
23

- Abertura do sulco padrão: Com o apoio de cinzel padronizado, produzir uma abertura
na massa de solos orientada de acordo com o eixo geométrico da concha em uma única
passada, para solos argilosos, ou em diversas passadas, em caso de solos arenosos;
- Realização do ensaio: Acionar a manivela e golpear a concha, em frequência de dois
golpes por segundo, até que as duas bordas inferiores da abertura se unam ao longo de
1 cm. Uma vez obtido o fechamento da abertura, colhe-se uma porção de solos de ambos
os lados e transversalmente à canelura, pesando-o e levando-o para uma estufa para
𝑃ℎ−𝑃𝑠
determinação da umidade de acordo com fórmula ℎ = 𝑥 100, sendo h o teor de
𝑃𝑠

umidade, Ph a massa de solo úmido e Ps a massa de solo seco. O ensaio deve ser
realizado para duas determinações distintas, atendendo ao intervalo de 20 a 30 golpes
para fechamento da canelura.
𝑁
- Cálculo do LL: O resultado do LL é determinado pela fórmula 𝐿𝐿 = ℎ 𝑥 ( ) 𝑥 0,156,
20

em que h é o teor de umidade (%) correspondente ao número de golpes do ensaio, N é


o número de golpes e LL o Limite de Liquidez em valores percentuais.

2.4.1.3. Limite de Plasticidade e Índice de Plasticidade

O conceito de Limite de Plasticidade (LP) é um tanto mais complexo do que aquele que
caracteriza o LL. Segundo Milléo (2010) o LP corresponde a um teor de umidade do solo que,
para valores menores do que ele, as propriedades físicas da água não mais se igualam às da
água livre. Soares et al (2006) por sua vez descreve o LL como o teor de umidade mínimo, no
qual a coesão é pequena demais para permitir deformação, porém, suficientemente alta para
garantir a manutenção da forma adquirida.
As diretrizes de execução do ensaio de LP são dadas pela norma DNER-ME 82/94. Os
passos para desenvolvimento do ensaio são resumidos a seguir.
- Preparação da amostra: Toma-se uma amostra com cerca de 50 g, previamente
preparada segundo as diretrizes do item 4.d da norma DNER-ME 41/94. Acrescenta-se
água destilada em quantidade suficiente e homogeneíza-se para se obter uma massa
plástica Homogeneizar a amostra com 15 a 20 cm³ de água destilada e, quando
necessário, proceder novas adições de água, em volumes de 1 a 3 cm³, até que a mistura
de solo se apresente como uma massa plástica;
24

- Realização do ensaio: Separam-se cerca de 20 g da massa da amostra e, posteriormente,


rola-a sobre uma placa de vidro esmerilhada com os dedos, na frequência de 80 a 90
rolagens por minuto, a fim de moldar um cilindro de diâmetro uniforme. Quando o
diâmetro do cilindro rolado atingir 3mm, ele é fracionado e amassado, dando reinício
ao procedimento de rolagem. Esta tarefa deve ser executada tantas vezes quantas forem
necessárias até que que o cilindro de solo desagregue-se sob a pressão requerida para a
rolagem e não mais seja possível formar um cilindro.
- Cálculo do LP: O solo proveniente do cilindro desagregado deve ser pesado e
conduzido a estufa para ter sua umidade aferida pela mesma equação do ensaio de LL.
Os valores de LP são dados em percentuais iguais à umidade no momento da
desagregação do cilindro.
Uma vez findado o ensaio de LP, obtêm-se o Índice de Plasticidade (IP) pela diferença
numérica entre o LL e o LP pela equação 01:

𝐼𝑃 = 𝐿𝐿 − 𝐼𝑃 (em %) ...(01)

Neste ponto é importante ressaltar que se o LL e o IP não puderem ser determinados, ou quando
o LP for superior ao LL, o material é considerado não plástico.

2.4.2. Ensaios mecânicos

2.4.2.1. Índice de Suporte Califórnia (ISC)

O Índice de Suporte Califórnia (ISC), traduzido do inglês Califórnia Bearing Ratio


(CBR), é o índice que referencia a capacidade de suporte de um solo, ou mistura de solos, e foi
concebido no final da década de 1920 para avaliar o potencial de ruptura do subleito, uma vez
que era o defeito mais frequentemente observado nas rodovias do estado da Califórnia naquele
período (Porter, 1950).
À época, os ensaios que definiram o conceito do ISC, se embasaram na seleção dos
melhores materiais granulares empregados em bases de pavimentos. A medida da penetração
no ensaio de ISC realizado sobre estes materiais foi estabelecida como valor de referência (ISC
25

= 100%) e todos os ensaios realizados a partir de então consistem em uma análise da qualidade
do material ensaiado em relação àqueles empregados quando da obtenção do valor de
referência.
No Brasil o ensaio de ISC é balizado pela norma DNIT 172/2016-ME, de título Solos –
Determinação do Índice de Suporte Califórnia utilizando amostras não trabalhadas – Método
de ensaio, que fixa os procedimentos para determinação do ISC. A execução do ensaio, extraída
de forma resumida da norma supra citada, consiste na sequência de passos descritos a seguir.
- Preparação da amostra: Colhe-se, destorroa-se, homogeneíza-se e seca-se ao ar uma
quantidade de solo determinada em função da granulometria predominante no material
a ser ensaiado (6000 g, para solos siltosos ou argilosos, e 7000 g, para os arenosos ou
pedregulhosos). Passa-se essa amostra representativa na peneira de 19 mm devendo ser
substituído, em mesmo peso, todo o material retido nesta. A substituição se dá por
material encerrado entre as peneiras de 19mm e 4,8mm provenientes de outra parcela
da amostra colhida;
- Confecção do corpo-de-prova (CP): Compacta-se o material preparado acima com o
martelo padronizado, empregando-se a energia de 12, 26 ou 55 golpes em cinco camadas
distintas, em um molde cilíndrico de 150mm de diâmetro até que se obtenha uma altura
total de cerca de 125mm após a compactação. O acabamento do CP poderá ser feito com
régua rígida, biselada, para que posteriormente seja aferido o peso do material;
- Determinação do teor de umidade: Colhe-se, do material excedente da moldagem, uma
amostra de aproximadamente 100 g para a determinação do teor de umidade;
- Saturação do corpo-de-prova: Coloca-se o cilindro com o material compactado em um
reservatório de água durante quatro dias, com aplicação de uma sobrecarga-padrão de
4,536 kg. Adapta-se a haste de expansão com extensômetro, aferindo-se a qualquer
expansão ou retração ocorrida a cada 24 horas;
- Penetração do corpo-de-prova: Realizado em prensa padronizada e aferida aplicando-
se uma carga de, aproximadamente, 45N a partir de um pistão com 50mm de diâmetro,
sob uma velocidade de penetração de 1,27mm/min. A partir de então são registradas as
medidas do extensômetro do anel, que é função da penetração do pistão no solo em
determinado tempo, medindo encurtamentos diametrais devidos à aplicação da carga;
- Cálculo do ISC: Utilizando-se planilha automatizada, corrige-se a curva pressão-
penetração obtida durante o ensaio de forma a determinar a pressão corrigida. O ISC,
em porcentagem, é determinado pelo maior dos valores obtidos nas penetrações de 0,1
e 0,2 polegadas, a partir da equação 02 a seguir:
26

𝑃𝑟𝑒𝑠𝑠ã𝑜 𝑐𝑜𝑟𝑟𝑖𝑔𝑖𝑑𝑎 𝑥 100


ISC = ...(02)
𝑃𝑟𝑒𝑠𝑠ã𝑜 𝑝𝑎𝑑𝑟ã𝑜

2.5. Estudos de Viabilidade Técnico-Econômica em rodovias (EVTE)

Segundo DNIT (2006), denomina-se Estudo de Viabilidade Técnico-Econômica


(EVTE) ou Técnico-Econômica-Ambiental (EVTEA) de Rodovias o conjunto de estudos
desenvolvidos para avaliação dos benefícios sociais e econômicos decorrentes dos
investimentos em implantação de novas rodovias ou melhoramentos de rodovias já existentes,
tendo como diferenciação entre cada um somente a inclusão, ou não, da variável ambiental, na
qual são previstos os custos dos impactos ambientais, bem como de sua mitigação e
compensação, como elementos condicionadores da análise .
Basicamente os EVTEs, ou EVTEAs, para obras rodoviárias consistem no conjunto de
estudos preliminares que garantem condições de análise da viabilidade de distintas alternativas
para um empreendimento, a partir do cruzamento e análise dos benefícios sociais e econômicos
em contraponto aos custos sociais, ambientais e financeiros para determinado empreendimento.
Neles avalia-se se os benefícios superam os custos de implantação levando em consideração os
indicadores de Taxa Interna de Retorno (TIR) e Valor Presente Líquido (VPL) entre outros.
A vertente legal, baseada sobre o artigo 3o da Lei No 5.917/73, incisos “f” e “i”, e do
Art. 1º da Portaria DNIT No 1.705, de 14/11/2007, determina que projetos e obras de
infraestrutura de transportes de grande vulto devem ser precedidos por EVTEs, podendo estes
serem acrescidos da variável ambiental, constituindo então EVTEAs. A vertente técnica, por
sua vez, é embasada pelo Escopo Básico EB-101 do DNIT que aborda a elaboração de EVTEAs
em rodovias.

2.5.1. Estudos geotécnicos em EVTEs e EVTEAs

Os estudos geotécnicos, em função de suas características de morosidade e alto custo de


desenvolvimento, não são alvo específico de elaboração em Estudos de Viabilidade, apesar a
sua indiscutível importância para a correta definição de traçados geométricos e custos finais em
obras rodoviárias.
27

DNIT (2006), em sua publicação Diretrizes Básicas para Elaboração de Estudos e


Projetos Rodoviários, apresenta o Escopo Básico EB-101: Estudos de Viabilidade Técnico-
Econômica-Ambiental de Rodovias, contendo todos os elementos para Elaboração de EVTEAs
para rodovias sob a jurisdição federal.
Dentro do escopo previsto pelo EB-101, DNIT (2006, p.35) mesmo considerando a
importância dos estudos geotécnicos para praticamente todas as disciplinas de projeto
rodoviário (geometria, terraplenagem, drenagem, pavimentação, etc.), cita um única vez os
estudos geotécnicos, como elemento acessório ao estudo de traçado conforme transcrição a
seguir.
[...] informações e outros dados disponíveis a respeito da região considerada, tais
como: mapas, cartas geográficas, imagens áreas ou de satélites, restituições
aerofotogramétricas, estudos geológicos e geotécnicos, dados das contagens
volumétricas, obtidas nos estudos de tráfego já realizados na área de interesse dos
estudos de viabilidade, e os custos estimados de construção e manutenção.

Neste ponto torna-se claro que, em função da complexidade e morosidade da pesquisa


primária de dados geotécnicos, estes estudos perdem a importância frente ao EVTE ou EVTEA
que, usualmente, devem ser elaborados em períodos que compreendem de três a seis meses.

2.6. Estatística Aplicada

2.6.1. Regressão Linear Múltipla

Segundo Montgomery, Peck & Vining (2001), o método de tratamento estatístico de


Regressão Linear Simples (RLS) consiste em um modelo de uma única variável regressora X1
(variável independente ou preditora) que apresenta relação linear direta com a variável resposta
Y, representada pela equação 03 a seguir.

𝑌 = β0 + 𝛽1𝑋1 + ℰ ...(03)

O intercepto β0 e a inclinação β1 São constantes desconhecidas, sendo ℰ uma


componente de erro aleatório, assumido como normal e independentemente distribuído, com
média zero e variância (s2) constante e desconhecida. Ainda segundo os autores, o modelo de
28

Regressão Linear Múltipla (RLM) consiste em um modelo de predição linear similar àquele
caracterizado pela RLS, porém dotado de mais de uma variável regressora conforme definido
na equação 04 a seguir.

𝑌 = β0 + 𝛽1𝑋1 + 𝛽2𝑋2 + ⋯ + 𝛽𝑛𝑋𝑛 + ℰ ...(04)

Neste modelo Y continua sendo a variável resposta, exatamente conforme o modelo da


RLS, no entanto, neste, a variável resposta está linearmente relacionada a mais de uma variável
preditora (X1, X2, ..., Xn) onde n é o número de variáveis preditoras. O modelo de regressão
representado pela equação 04 descreve um plano no espaço n-dimensional representado por Y,
X1, X2, .., Xn.

Figura 4 – (a) Exemplo de plano de regressão para um modelo n=2 (b) condições de contorno

Fonte: Montgomery, Peck & Vining, 2001.

Segundo Montgomery et al. (2001) as RLMs são usualmente utilizadas como modelos
empíricos, ou funções de aproximação onde a relação funcional entre as variáveis Y, X1, X2, ...,
Xn é desconhecida mas, em determinados intervalos das variáveis preditoras, o modelo de
regressão linear representa uma aproximação adequada das variáveis dependentes.
As diferentes técnicas de RLM tais como modelo polinomial cúbico, representado pela
equação 05 a seguir, modelos de segunda ordem, etc., permitem que diversos modelos, mesmo
aqueles muito mais complexos do que aquele descrito pela equação 04, sejam analisados.

𝑌 = β0 + 𝛽1𝑋1 + 𝛽2𝑋 2 + 𝛽3𝑋 3 + 𝛽𝑛𝑋 𝑛 + ℰ ...(05)


29

Figura 5 – (a) Plano de regressão de modelo polinomial cúbico n=3 (b) condições de contorno

Fonte: Montgomery, Peck & Vining, 2001.

No final, seja qual for o modelo adotado para desenvolvimento da regressão, o objetivo
da RLM é obter uma relação aproximada entre a variável dependente e o restante das variáveis
que compõem a matriz de correlação. Para tanto a RLM estuda um grupo de variáveis distintas
e elimina aquelas que não representam elementos correlacionados à predição da variável
resposta, com perda mínima da informação, garantindo condições de determinação de padrões
de similaridade, associação e correlação entre as variáveis.

2.6.2. Análise estatística categórica

Segundo Okura (2008) A análise estatística baseada em variáveis categóricas ordinais é


importante principalmente, em situações onde medidas exatas não são possíveis. Para Santos
(2017) variáveis categóricas podem ser derivadas de variáveis qualitativas (nominais ou
ordinais) ou quantitativas, sendo esta última a origem dos dados tratados neste trabalho.
Anderson (1984, apud Okura, 2008, p. 6) classifica as variáveis ordinais em contínuas
agrupadas e categóricas naturalmente ordenadas representando, o primeiro tipo, uma versão
categorizada de uma variável contínua, conforme utilizado neste trabalho.
A categorização de variáveis e, consequentemente, a análise estatística categórica deve
se dar quando a análise dos valores individuais da variável resposta não apresentam qualquer
correlação com os valores individuais das variáveis preditoras ou quando a análise de valores
numéricos pode não trazer à luz resultados coerentes ou compreensíveis relacionados ao
problema estudado.
É importante compreender que a análise estatística categórica, segundo Viali [199-], a
30

aplicação de métodos estatísticos baseados em variáveis categóricas é útil em situações onde a


amostra total pode ser dividida em grupos baseados na variável dependente, caracterizando
várias classes conhecidas, quando o principal objetivo é entender diferenças entre grupos e
prever a probabilidade de que uma entidade (indivíduo ou objeto) pertença a uma classe em
particular ou grupo baseado nas várias variáveis independentes.
Diversos são os métodos estatísticos desenvolvidos para a realização de análises sobre
dados categóricos: C5, Rede Bayesiana, Discriminante, LSVM, Árvores Aleatórias, Regressão
Logística, Árvore AS, Chaid, Quest, Árvore C&R, Redes Neurais, Algoritmo KNN e SVM que
não serão descritos neste estudo por extrapolarem o escopo pretendido no trabalho.

2.6.3. Mineração de dados

Atualmente, com a popularização dos computadores, percebe-se o crescimento do


interesse e da capacidade de armazenamento de dados, pelos servidores de pequenas, médias e
grandes empresas, no entanto a simples armazenagem de dados já não é mais o principal
interesse dos grandes provedores. Atualmente grande parte dos dados guardados em servidores
locais ou nas nuvens são utilizados para conferir condições de análise preditiva de padrões de
consumo, risco de negócios e para praticamente todos os demais pontos do desenvolvimento de
conhecimento.
Segundo Camilo e Silva (2009), com o volume de dados armazenados crescendo
diariamente, as técnicas tradicionais de exploração de dados não são mais adequadas para tratar
a grande maioria dos repositórios. Logo, foi proposta, no final da década de 80, a Mineração de
Dados, proveniente do inglês Data Mining.
Para os autores a Mineração de Dados é uma das tecnologias mais promissoras da
atualidade em função da capacidade de tratamento dos dados armazenados de forma a evitar a
acumulação de dados pobres em informação.
Fayyad (1996) em seu estudo Knowledge Discovery in Databases (KDD), ou
Descoberta de Conhecimento em Bases de Dados, defende que com o crescimento do volume
de dados armazenados o modelo tradicional de transformação de dados em informação, baseado
no processamento manual destes por especialistas, tem se tornado lento, dispendioso, subjetivo
e, em algumas áreas do conhecimento, completamente impraticável.
Para Camilo e Silva (2009) ainda hoje não há consenso quanto à definição dos termos
31

KDD e Data Mining, sendo diversos os autores que, de um lado, defendem que os termos são
sinônimos enquanto outra vertente de estudiosos afirma que o KDD refere-se a todo o processo
de descoberta de conhecimento, e a Mineração de Dados a uma das atividades do processo. Na
figura 6 apresentada a seguir podemos ver uma representação do processo de KDD, conforme
proposto por Fayyad (1996).

Figura 6 – Proposição dos passos que compõem o processo de KDD

Fonte: Montgomery, Peck & Vining, 2001.

2.6.4. O Software IBM SPSS Modeler ®

O SPSS Modeler é um software de análise estatística desenvolvido pela International


Business Machines (IBM) e constitui uma poderosa ferramenta para análise comparativa e
elaboração de modelos preditivos, principalmente quando existe um grande volume de dados
de entrada dos quais se pretende extrair a informação.
Segundo IBM (2015) este software foi desenvolvido em torno do modelo CRISP-DM,
32

padrão de mercado, e suporta todo o processo de mineração de dados, oferecendo uma


variedade de métodos de modelagem a partir do aprendizado de máquina, inteligência artificial
e estatísticas, permitindo derivar informações novas a partir dos dados de entrada, e desenvolver
modelos preditivos robustos.
Dentro do software métodos de modelagem são divididos em quatro categorias distintas:
Servidor Analítico; Classificação; Associação e Segmentação. Estas, somadas, encerram um
total de quarenta e um nós de modelamento distintos que processam os dados de entrada
segundo metodologias pré-determinadas.

2.6.4.1. Modelos de Classificação

Modelos de Classificação usam os valores de um ou mais campos de entrada para prever


o valor de um ou mais campos de saída ou resposta. Alguns dos diversos exemplos dessas
técnicas passíveis de serem utilizadas no software SPSS Modeler são: árvores de decisão
(algoritmo Árvore C e R, algoritmo de árvore estatística eficiente, rápido e imparcial, algoritmo
Detector de Interação Automático Chi-quadrado e C5.0), regressão (algoritmos linear, de
logística, linear generalizado e algoritmo de regressão de Cox), redes neurais, Support Vector
Machines e redes bayesianas (IBM - 2015).
Com os Modelos de Classificação é possível elaborar um algoritmo tal que faça
previsões de resultados baseados em dados de entrada, estudando a relevância das variáveis
preditoras e respostas utilizando, segundo IBM (2015) técnicas de modelagem de aprendizado
por máquina, indução de regra, identificação de subgrupo, métodos estatísticos e geração de
modelos múltiplos.
Os seguintes nós de modelamento, com seus símbolos representativos, estão disponíveis
para emprego de técnicas de classificação dentro do software IBM SPSS:

- Nó Previsor Categórico Automático


- Nó Previsor Contínuo Automático
- Nó Classificação e Regressão (C e R)
- Nó QUEST
- Nó CHAID
33

- Nó C5.0
- Nó Lista de Decisão
- Nó Regressão Linear
- Nó PCA/Factor
- Nó Seleção de Variável
- Nó Análise Discriminante
- Nó Regressão Logística
- Nó Modelo Linear Generalizado
- Nó Modelo Linear Generalizado Misto (GLMM)
- Nó Regressão de Cox
- Nó Support Vector Machine (SVM)
- Nó Rede Bayesiana
- Nó Self-Learning Response Model (SLRM)
- Nó Séries Temporais
- Nó k-Nearest Neighbor (KNN)
- Nó Spatio-Temporal Prediction (STP)

Obviamente, nem todos os nós devem ser utilizados em um único modelamento. O


operador do software deve ter conhecimento suficiente para compreender o problema e
selecionar técnicas de modelamento que melhor se encaixem em sua predição. Não obstante,
para a construção de do fluxo do modelo, pelo menos três elementos são necessários: Nó de
origem, que lê dados a partir de alguma origem externa; Nó Tipo, que especifica as propriedades
do campo e o papel de cada campo; e Nó de modelagem, que gera o nugget do modelo quando
o fluxo é executado.
34

3. MATERIAIS E MÉTODOS

3.1. Obtenção dos dados geotécnicos

Para obtenção das informações necessárias para o perfeito desenvolvimento deste


trabalho foram consultados os bancos de dados de estudos geotécnicos da Empresa Única
Consultores de Engenharia Urbana, conforme autorização apresentada no anexo III. Uma vez
acessado o banco de dados, foram pesquisados todos os ensaios geotécnicos realizados em
rodovias encerradas dentro dos limites do grupo Barreiras, no Estado do Espírito Santo.
Em se tratando de uma empresa de projetos de infraestrutura, os ensaios verificados nos
bancos de dados abrangiam estudos de ISC elaborados sobre materiais distintos, em 10 dos 29
municípios espírito-santenses onde ocorrem litotipos característicos do grupo Barreiras.
Ao todo foram verificadas 543 fichas de ensaios, realizados por três laboratórios
distintos, tendo como cliente a empresa Única Consultores de Engenharia Urbana.

3.2. Seleção dos ensaios para análise de parâmetros

Considerados os ensaios obtidos, com o intuito de se reduzir a quantidade de variáveis


independentes para verificação da correlação, foram extraídas todas as fichas de ensaios nas
quais o ISC tivesse sido obtido a partir de corpos de prova compactados em energias distintas
daquela inerente ao Proctor Normal (PN).
A opção pela adoção de uma única energia de compactação visou eliminar da análise de
correlação uma variável que, indubitavelmente, representa forte condicionador da elevação ou
redução do valor do ISC, que será tão mais alto quanto for maior a energia de compactação.
A utilização de ensaios cujo ISC fora obtido, exclusivamente, a partir de ensaios
realizados sobre corpos de prova compactados na energia do PN permitiu ainda que as
condições obtidas na correlação se aproximassem mais da realidade do material ocorrente no
terreno natural. A análise das densidades médias obtidas em campo e nas amostras
compactadas, acusaram uma relação mais aproximada entre os ensaios de densidade in-situ e
na compactação PN do que nos corpos de prova compactados na energia do Proctor
35

Intermediário e Modificado, com 26 e 55 golpes padronizados respectivamente.


Com o isolamento das amostras compactadas na energia do PN, restaram um total de
295 amostras dotadas de ensaios completos de caracterização (granulometria por peneiramento
e limites de Atterberg), compactação, expansão e ISC.

3.2.1. Distribuição geográfica das amostras

Uma vez definidas as condições básicas de utilização dos ensaios levantados, foi
realizado o procedimento de identificação do local de origem da amostra ensaiada. Para tanto
foi realizada a verificação das coordenadas de cada um dos furos de coleta das amostras a partir
da leitura dos planos de sondagem originalmente elaborados pela empresa Única Consultores
de Engenharia Urbana.
A tabela a seguir apresenta a condição de distribuição das amostras ensaiadas.

Tabela 1 – Distribuição geográfica das amostras ensaiadas


Número de
Município Rodovias de referência
amostras
Linhares BR-101 / ES-358 37
Sooretama ES-358 41
Vila Valério ES-358 49
Pedro Canário Municipais 4
Marataízes Municipais 63
Itaipava Municipais 9
Serra ES-010 / Municipais 10
Fundão ES-010 11
São Mateus ES-315 7
Aracruz ES-010 64
Total de amostras ensaiadas 295
Fonte: Autor, 2017.

Por se tratarem de ensaios realizados para projetos rodoviários, as amostras se apresentam


concentradas ao longo dos eixos projetados para as rodovias, logo, não há uma representação
espacial difusa capaz de traduzir de forma adequada a realidade de toda a área recoberta pelos
sedimentos do grupo Barreiras. Não obstante foram obtidas amostras ao longo de todas as
principais exposições da entidade geológica: extremo norte; litoral norte; região metropolitana
de Vitória e litoral sul.
36

3.3. Seleção dos parâmetros adotados como variáveis dependentes

Considerando-se o objetivo central deste trabalho, a obtenção de uma equação de


correlação entre o ISC e outros parâmetros do solo para adoção em EVTEs e EVTEAs, foram
imediatamente excluídos todos os ensaios que demandassem esforços expressivos de
laboratório ou campo, no tocante a tempo de execução e custo dos ensaios. A partir desta
premissa foram eliminadas as seguintes variáveis:
- Densidade in-situ;
- Densidade máxima de laboratório;
- Expansão; e
- Umidade ótima.
Restaram então as variáveis que representam os parâmetros físicos dos solos. O
diâmetro dos grãos, caracterizados pelos ensaios de granulometria por peneiramento, e a
interação solo/água, caracterizada pelos ensaios dos limites de consistência, ou limites de
Atterberg. Neste ponto é importante ressaltar que os resultados provenientes de ensaios de
granulometria por sedimentação, apesar de potencialmente relevantes na correlação com o ISC,
não foram empregados nesta análise de correlação uma vez que, dentre todas as amostras
adotadas, somente 7% delas apresentavam tal tipo de estudo e que o tempo gasto para execução
do ensaio de sedimentação enquadra esta variável na premissa de exclusão acima descrita.

3.3.1. Compilação dos ensaios e individualização das variáveis independentes

Uma vez definidos os parâmetros a serem empregados como variáveis independentes


na correlação os resultados dos ensaios obtidos junto à empresa foram compilados em uma
planilha eletrônica única, excluindo-se os parâmetros não considerados para a correlação.

Tabela 2 – Compilação das variáveis independentes (fração)


Amostra ISC 2" 1" 3/8" #4 #10 #40 #200 LL IP
1 16 100 100 100 98 93 36 2 0 0,0
2 30 100 100 100 99 97 57 11 0 0,0
3 27 100 100 99 98 93 51 3 0 0,0
4 14 100 100 100 99 94 42 4 0 0,0
5 27 100 96 88 85 79 46 30 40 8,9
Fonte: Autor, 2017.
37

A tabela a anterior representa uma parte da planilha de ensaios compilada, composta por
linhas que representam as distintas amostras ensaiadas e colunas que representam os parâmetros
obtidos. A planilha completa segue apresentada no anexo IV.

3.4. Verificação da existência de correlação estatística com o SPSS Modeler

Neste tópico será apresentada toda a análise estatística realizada sobre os dados de
entrada, variáveis preditoras, com o auxílio do software SPSS Modeler, desde o tratamento
inicial dos dados de entrada, permeando pela seleção dos métodos de modelamento, até a
estruturação do fluxo lógico dentro do ambiente de programação.

3.4.1. Procedimentos estatísticos preliminares

Dentro do sistema de modelamento do SPSS Modeler todo o trabalho é desenvolvido


em um ambiente, canvas, sobre o qual são lançados ícones, chamados de nós, que representam
distintas ações a serem tomadas pelo software.
O canvas é envolto por barras, menus e palhetas, a partir dos quais é possível se acessar
todas as ferramentas disponíveis no sistema, logo, todo o tratamento estatístico preliminar é
estabelecido na mesma tela onde ocorrerão as análises finais de correlação, compondo um único
fluxo capaz de ler os dados de entrada, processá-los, analisá-los e utilizá-los na elaboração da
equação de correlação que melhor representa o modelo.

Figura 7 – Ambiente de montagem de um novo fluxo no SPSS Modeler

Fonte: Autor, 2017.


38

IBM (2015) determina, no manual intitulado Nós de Modelagem do IBM SPSS Modeler
17.1, que para a construção de um fluxo que criará um modelo, pelo menos três elementos são
necessários:
- Nó de origem: lê dados a partir de alguma origem externa;
- Nó Tipo: que especifica as propriedades do campo e o papel de cada campo;
- Nó de modelagem: que gera um nugget do modelo quando o fluxo é executado.

Em associação a estes nós principais, o fluxo pode ser munido de diversos processos
estatísticos intermediários que tem como objetivo localizar campos e registros que forem de
maior interesse para modelagem.
É importante salientar que grande parte da eficiência do modelo de correlação proposto,
caso esta exista, está associado à qualidade dos dados referentes às variáveis preditoras. Logo,
torna-se imperativo que sejam procedidos métodos de filtragem tais que minimizem, ou
suprimam completamente, a ocorrência deste tipo de dados.
Após a filtragem inicial de dados, todo o fluxo de modelamento estatístico pode ser
montado no canvas como estrutura lógica composta por um eixo com poucas variações a partir
dos nós, para modelos mais simples, ou por uma complexa árvore lógica com inúmeras
ramificações.

Figura 8 – Fluxos com: (a) um método estatístico (b) múltiplos métodos de estatísticos

(a) (b)
Fonte: Autor, 2017.

Os fluxos representados pela figura 8 consistem nos fluxos genéricos já completamente


modelados para a análise de correlação, não representando exatamente o modelo elaborado para
o desenvolvimento deste trabalho que será apresentado mais à frente.
39

3.4.1.1. Criação do banco de dados e associação ao nó origem

Conforme já descrito no item 3.3.1 os resultados dos parâmetros geotécnicos adotados


como variáveis preditoras para o modelo em estudo, obtidos a partir das planilhas de ensaios
geotécnicos extraídas do banco de dados da empresa Única Consultores de Engenharia Urbana,
foram compilados em uma planilha única (DADOS COMPILADOS V3.xlsx), apresentada no
Anexo IV, utilizada como a matriz de dados de origem.
Para o modelamento, no ambiente SPSS, o primeiro procedimento consiste na leitura
dos dados de origem, para tanto, deve ser selecionado um dentre diversos nós de origem. Para
o trabalho em pauta foi selecionado o nó “Excel”, cujo ícone está representado na paleta
“Origens” conforme figura 9 a seguir.

Figura 9 – Seleção do nó Excel, na barra de seleção de nós, na paleta “Origens”.

Fonte: Autor, 2017.

Uma vez inserido o nó de origem “Excel” estabelece-se no sistema de processamento


do SPSS Modeler um procedimento reconhecimento de um arquivo de dados externo, com
extensão .xls ou .xlsx, que deve então ter seu caminho associado ao nó para leitura.

3.4.1.2. Estabelecimento do primeiro filtro de variáveis

Uma vez estabelecido o nó Origem torna-se imperativo, para bancos de dados muito
amplos, que seja realizada a seleção, limpeza ou construção de uma nova matriz de dados para
análise e, para tanto foi empregado o nó Filtro.
Neste foram mapeados os campos oriundos do nó Origem e, a partir da associação do
nó Filtro a uma operação de registro de amostragem, com a conexão do primeiro a um nó
Amostra, foi possível selecionar um subconjunto de registros a partir do banco de dados original
com o intuito de melhorar o desempenho do fluxo sendo montado.
40

O nó Amostra foi configurado para realizar uma amostragem simples, permitindo a


composição de um novo banco de dados a partir da seleção de uma porcentagem aleatória de
registros oriundos do nó Origem. O novo banco de dados, a ser empregado no processamento
do fluxo, foi composto a partir da seleção e inclusão automatizada de 25% dos dados válidos
em uma nova matriz.
A seguir a figura 10 apresenta a formatação intermediária do fluxo de modelamento até
a etapa de filtragem e amostragem dos dados originais, bem como expõe a janela de regras de
amostragem utilizada para estabelecimento do novo banco de dados que será empregado nas
análises estatísticas.

Figura 10 – Modelagem do fluxo até o primeiro filtro e janela de regras de amostragem.

Fonte: Autor, 2017.

3.4.1.3. Primeira definição do tipo de variáveis

Após a filtragem dos dados foi inserido um procedimento de tipificação das variáveis lidas pelo
SPSS com vistas a caracterizar exatamente o tipo de resposta, ou níveis de medição, numérica
contínua, nominal, ordinal, categórico ou flag, lida em cada campo das variáveis preditoras.
41

O nó Tipo permite que sejam especificados os níveis de medição de cada campo,


informando ao sistema computacional o tipo de dados presente no campo, bem como especificar
qual a função de cada elemento presente nos dados de origem para a análise estatística (entrada,
resposta, ambos, nenhum, partição, dividir, frequência e ID de registro).
O arquivo de dados de origem apresenta onze elementos (Número da amostra, CBR (%),
2”, 1”, 3/8”, #4, #10, #40, #200, LL e IP), um único nível de medição (valores numéricos
contínuos), e três funções distintas (entrada, resposta e ID de registro). A atribuição de níveis
de medição e funções, ou papel, de cada um dos elementos dentro do procedimento do nó Tipo,
foi realizada durante a edição dos processos associados a este nó conforme figura 11 a seguir.

Figura 11 – Primeira tipificação de variáveis.

Fonte: Autor, 2017.

Considerando-se a importância da utilização de um banco de dados de entrada coeso, a


partir da tipificação das variáveis, foi realizado o procedimento de Auditoria de Dados com
vistas a investigar a integridade dos dados de entrada no nó Tipo. O procedimento de Auditoria
de Dados permite um estudo automatizado das diversas características de cada um dos
elementos.
Como saída, o nó de Auditoria de Dados retorna duas tabelas sendo uma relativa a
qualidade dos dados analisados e outra da análise estatística dos parâmetros estatísticos para
todos os elementos estudados apontando, para cada um deles, os valores de mínima, máxima,
média, desvio padrão, assimetria, correlação, covariância e omissões, bom como o número de
entradas válidas, de valores discrepantes e de valores extremos.
42

As figuras 12 e 13 apresentam as saídas do nó de auditoria que não registrou qualquer


valor não válido dentro da base de dados estudada, porem detectou a presença de valores
discrepantes e extremos em sete das nove variáveis preditoras, bem como na variável resposta.
Vale salientar ainda que, além das informações acima descritas, a auditoria retorna ainda
o gráfico de dispersão e o histograma de pontos analisados, apresentados no Anexo V.

Figura 12 – Resultados da análise de qualidade de dados de entrada no nó Auditoria de Dados.

Fonte: Autor, 2017.

Figura 13 – Resultados da análise estatística no nó Auditoria de Dados.

Fonte: Autor, 2017.


43

Uma vez encerrado o modelamento desta etapa do fluxo obtêm-se o segundo nível do
fluxo de modelamento estatístico pretendido e o último passo da análise preliminar inicialmente
planejada.
Até esta etapa todos os nós incluídos no fluxo representam processos de tratamento
estatístico que objetivam verificar as condições de distribuição das variáveis e determinar se,
dentre os campos de entrada, existem informações incoerentes com os tipos de dados esperados
sem que haja, ainda, verificação de correlação potencial entre preditores e resposta.
A seguir a figura 14 apresenta a formatação intermediária do fluxo de modelamento até
a etapa de tipificação das variáveis.

Figura 14 – Modelagem do fluxo até primeira tipificação e janela de tipificação de variáveis.

Fonte: Autor, 2017.

3.4.1.4. Seleção dos métodos de análise

Com a finalização dos procedimentos preliminares de análise das variáveis e,


principalmente, após a construção dos gráficos de dispersão de pontos e dos histogramas de
cada uma destas variáveis demonstrado no Anexo V, fica fácil perceber que não há tendência
de correlação linear entre as variáveis preditoras e a variável resposta.
44

A dispersão errática de todas as variáveis que não fossem representadas por constantes,
ou que apresentassem uma quantidade mínima de valores não constantes, demonstra que a
busca por uma equação baseada na RLM não importará em resultados representativos da
realidade.
Logo, optou-se pela exclusão do modelo RLM como modelo preditivo neste trabalho,
partindo-se então para métodos mais robustos como o da Regressão Logística e de Previsores
Categóricos, porém, para tanto, um novo tratamento preliminar, identificado neste trabalho
como procedimentos estatísticos preliminares de segunda fase, foi necessário para adequar as
variáveis preditoras e resposta às premissas de adoção nos novos métodos de análise.

3.4.2. Procedimentos estatísticos preliminares de segunda fase

3.4.2.1. Primeira categorização das variáveis

De acordo com IBM (2015), a categorização de variáveis permite a criação de novos


campos nominais com base nos valores de um ou mais campos existentes contínuos,
caracterizados por intervalos numéricos. Com a categorização é possível transformar um campo
de idades, com valores numéricos contínuos, em um novo campo categórico que encerra faixas
etárias, agrupando, em um único campo (grupo), uma coleção de diversos valores de idade.
Este tratamento é imprescindível para a predição estatística de acordo com alguns determinados
algorítimos que, tais como a Regressão Logística, demandam para seu processamento, em via
de regra, que todas as suas entradas e saídas sejam categóricas.
Para a primeira categorização das variáveis foi acrescido, logo após o nó Tipo
anteriormente descrito, um nó Categorização e nele foram lançadas condicionantes de formação
dos grupos da variável resposta a partir da definição de larguras de distribuição iguais. Desta
forma ao invés de se ter valores de ISC contínuos entre 3,7 e 38,9, menor e maior valores
aferidos para o ISC na amostra estudada respectivamente, obtêm-se respostas nominais, cada
uma representando um grupo amostral de abrangência pré-determinada.
Para determinação da abrangência de cada categoria, definiu-se uma largura fixa,
representada pelo terço da variação total de valores na variável. Os valores limites que definem
a qual grupamento pertence o valor de ISC analisado estão demonstrados na figura 15 a seguir.
45

Figura 15 – Janela de definição da largura de faixas categóricas para a variável resposta.

Fonte: Autor, 2017.

Como se pode ver na figura acima, a partir deste tratamento, não mais se tem o valor de
ISC definido como um valor contínuo aferido em %, mas sim um valor nominal que pode ser
igual a 1, 2 ou 3, dependendo de em qual faixa o valor original se enquadrava. Para
diferenciação entre a variável contínua e a variável nominal agrupada foi inserido do sufixo
_BIN. A figura 16 a seguir apresenta a formatação intermediária do fluxo de modelamento até
a primeira etapa de categorização das variáveis.

Figura 16 – Modelagem do fluxo até primeira categorização de variáveis.

Fonte: Autor, 2017.


46

3.4.2.2. Segunda definição do tipo de variáveis

Obtida a nova variável resposta, CBR (%)_BIN, houve a necessidade de uma


retipificação das variáveis, atribuindo-se o nível de medição nominal à nova variável e
definindo o seu papel dentro do algorítimo estatístico.
Para tanto, assim como se deu no item 3.4.1.3, um nó Tipo foi adicionado ao fluxo e
nele foram definidos o tipo de resposta (nível de medição) esperado para a variável CBR
(%)_BIN e o papel desta na análise estatística. Cumpre ressaltar que nesta etapa, a variável
contínua CBR (%) teve seu papel suprimido de qualquer processo estatístico posterior. As
premissas de tipificação impostas ao segundo nó Tipo estão apresentadas na figura 17 a seguir.

Figura 17 – Segunda tipificação de variáveis e supressão do papel da variável CBR (%).

Fonte: Autor, 2017.

3.4.2.3. Segunda categorização das variáveis

Tendo-se categorizado a variável resposta CBR (%) em um grupamento nominal CBR


(%)_BIN, agora todas as variáveis preditoras foram alvo da mesma categorização, novamente,
somente em três valores categóricos por variável.
47

A determinação da abrangência de cada uma das categorias foi definida sob as mesmas
premissas adotadas para a variável CBR (%) com larguras iguais a um terço da variação total
de valores em cada uma das variáveis.
Neste ponto torna-se imperioso ressaltar que aquelas variáveis que não apresentavam
variação entre máximos e mínimos, tais como a #200, apresentam três categorias com o mesmo
valor conforme representado na figura 18 a seguir.

Figura 18 – Distribuição da largura de amostragem para a variável LL.

Fonte: Autor, 2017.

Novamente, agora associado ao nó Categorização, foi criado um nó de Auditoria de


Dados com vistas a investigar a integridade dos dados lidos e processados pelo primeiro.
Assim como verificado na Auditoria de dados apresentada no item 3.4.1.3, durante a
primeira tipificação de variáveis, o nó de Auditoria de Dados retornou duas tabelas relativas à
qualidade e à análise estatística dos parâmetros (figuras 17 e 18) que já apresentam todas as
variáveis categorizadas.
A principal diferença nas respostas do nó Auditoria associado ao nó Categorização é a
presença das variáveis _BIN juntamente às variáveis contínuas originais, bem como a
apresentação da distribuição da variável resposta categorizada (CBR(%)_BIN), em relação às
variáveis preditoras, categorizadas ou não.
Percebe-se na auditoria da qualidade dos dados que, após a categorização dos dados,
não mais se evidenciam valores discrepantes ou extremos.
48

Figura 19 – Auditoria estatística associada ao primeiro nó de Categorização.

Fonte: Autor, 2017.


49

Figura 20 – Auditoria da qualidade associada ao primeiro nó de Categorização.

Fonte: Autor, 2017.

Concomitantemente à auditoria dos dados, foram associados ao nó Categorização


diversos nós de saída do tipo Matriz. Com estes elementos, buscou-se verificar quais das
variáveis preditoras apresentavam maior probabilidade de não estarem relacionadas à variável
resposta.
A verificação da provável relação entre variáveis preditoras e resposta é checada neste
nó a partir do teste qui-quadrado que avalia a frequência da distribuição de uma em função da
outra. Segundo IBM (2015) se esta probabilidade for muito pequena, geralmente menor que
5%, então o relacionamento entre os dois campos é considerado significativo.
Apesar deste teste ser uma verificação preliminar do potencial de relação entre variáveis
a sua análise facilita a compreensão de quais elementos devem ser priorizados em uma análise
estatística que não envolva um método mais robusto de processamento dos dados. A partir do
teste do qui-quadrado pode-se verificar quais faixas granulométricas, ou índices físicos, estão
mais propensos a apresentar relações com determinados intervalos de ISC.
Em se tratando de um elemento de saída nenhum dos valores obtidos nos nós Matriz é
reintroduzido no fluxo de processamento estatístico. Os resultados do teste de qui-quadrado
estão descritos na tabela 3 a seguir.
50

Tabela 3 – Valores de qui-quadrado no cruzamento de variáveis categorizadas.


Teste proposto Qui-quadrado (%)
2”_BIN x CBR (%)_BIN *
1”_BIN x CBR (%)_BIN 17,986
3/8”_BIN x CBR (%)_BIN 8,925
#4_BIN x CBR (%)_BIN 8,454
#10_BIN x CBR (%)_BIN 3,168
#40_BIN x CBR (%)_BIN 41,847
#200_BIN x CBR (%)_BIN 52,773
LL_BIN x CBR (%)_BIN 22,523
IP_BIN x CBR (%)_BIN 17,170
* como não há qualquer variação na amostra da peneira 2”, não há condição de se verificar relação
Fonte: Autor, 2017.

A figura 21 a seguir apresenta a formatação intermediária do fluxo de modelamento até


a segunda etapa de categorização das variáveis e a matriz de saída da busca pela relação entre
a variável preditora #10_BIN e a variável resposta CBR (%)_BIN.

Figura 21 – Modelagem do fluxo até a segunda etapa de categorização de variáveis.

Fonte: Autor, 2017.


51

3.4.2.4. Estabelecimento do segundo filtro de variáveis

Após a categorização de todas as variáveis uma nova seleção de quais dados deveriam
continuar sendo empregados na análise estatística foi necessária. Com o emprego de um
segundo nó filtro realizou-se a exclusão de todas as variáveis contínuas, aquelas não terminadas
com o sufixo _BIN, que, em função da opção pelos métodos estatísticos de Regressão Logística
e Métodos Categóricos, tornaram-se obsoletas para o fluxo a partir da categorização.
A seguir a figura 22 apresenta a formatação intermediária do fluxo de modelamento até
a etapa de filtragem da amostra, bem como a janela de regras determinadas para filtrar as
variáveis ainda existentes no fluxo modelado.

Figura 22 – Modelagem do fluxo até o segundo filtro e janela de regras de filtragem.

Fonte: Autor, 2017.

3.4.2.5. Terceira definição do tipo de variáveis

Uma vez filtradas e excluídas do fluxo todas as variáveis preditoras contínuas,


substituídas pelas suas análogas nominais criadas durante o processamento no nó
Categorização, nesta fase foi necessário atribuir novos níveis de medição às variáveis
preditoras, assim como foi feito para a variável resposta CBR (%)_BIN.
52

Um terceiro nó Tipo foi adicionado e nele foram definidos o tipo nominal para todas as
variáveis preditoras com sufixo _BIN, desta forma o processamento futuro se baseará na análise
de variáveis preditoras nominais, com vistas a verificar uma resposta também nominal. A figura
23 a seguir apresenta a lógica de modelamento do fluxo e a janela de definição das condições
de tipificação das variáveis preditoras até esta fase do processamento estatístico intermediário.

Figura 23 – Fluxo até a terceira tipificação de variáveis e janela de definição dos tipos.

Fonte: Autor, 2017.

3.4.2.6. Particionamento das variáveis

A última tarefa associada aos procedimentos preliminares consistiu na partição das


informações do banco de dados para utilização em momentos distintos, um de treinamento e
outro de teste. Para tanto, no nó Partição, foram atribuídos tamanhos a dois subconjuntos que
se formam a partir dos dados originais sem que haja repetição de dados nos subgrupos, logo se
uma amostra foi escolhida para compor o primeiro, esta não estará disponível para o segundo.
Nesta tarefa, associada ao nó Partição lançado no fluxo, o treinamento do modelo
consiste, basicamente, na utilização de um subconjunto das amostras disponíveis para geração
do modelo e outro subconjunto para o teste da proposta formulada, sendo possível se obter uma
boa indicação do quão bem o modelo será generalizado para conjuntos de dados maiores.
53

Neste trabalho os subconjuntos de treinamento e teste foram definidos, respectivamente,


com 70 e 30% da quantidade total de amostras presentes no banco de dados, logo das 295
amostras cadastradas no banco de dados, 211 foram utilizadas para a montagem das regras de
correlação, enquanto 84 foram utilizadas como verificadores da eficiência das correlações.
Dois nós idênticos de particionamento foram criados de forma a compor amostragens
distintas para as fases de treino e de teste possibilitando, desta forma, verificar se a composição
aleatória das amostras a partir de um mesmo banco de dados pode incorrer em alterações
significativas dos resultados obtidos. A figura 24 apresenta a janela de regras de partição.

Figura 24 – Janela de regras de partição para treinamento e teste.

Fonte: Autor, 2017.

3.4.3. Procedimentos estatísticos definitivos: Busca da equação de correlação

Findados os procedimentos preliminares de primeira fase, quando a partir dos gráficos


de dispersão de pontos e histogramas das variáveis preditoras apontaram para a possível
inexistência de uma correlação linear, e de segunda fase, quando foram trabalhados os dados
numéricos contínuos de forma a prepará-los para o tratamento categórico, inicia-se então a fase
de modelamento estatístico final.
54

Considerando que todo o preparo das variáveis foi realizado nos nós preliminares,
conforme descrito anteriormente durante a montagem do fluxo, e que a seleção dos modelos de
Previsão Categórica se deu quando percebida a distribuição errática das variáveis preditoras em
relação à resposta, o procedimento estatístico definitivo consistiu no lançamento dos nós de
modelagem estatística sobre o fluxo pré-estabelecido.
O processamento final dos dados a partir de diversos modelos de Previsão Categórica
permitiu a análise dos dados tratados em uma bateria de modelos de análise binária diferentes,
com variáveis preditoras e resposta associadas a valores de sim ou não de acordo com o
enquadramento nas categorias compostas pelos processos descritos no item 3.4.2.3.
Toda a análise estatística realizada se deu de forma automatizada a partir do nó Previsor
Categórico Automático, que analisa os dados em todos os métodos disponíveis selecionados
pelo usuário, permitindo escolher a melhor abordagem para a obtenção da correlação. É
importante ressaltar que associados ao nó Previsor foram lançados dois nós de saída para que
fosse possível realizar a leitura dos resultados.
A previsão categórica empregada neste trabalho previu a análise a partir de 11 modelos
distintos (C5, Rede Bayesiana, Discriminante, LSVM, Árvores Aleatórias, Árvore AS, Chaid,
Quest, Árvore C&R, Regressão Logística e Redes Neurais), porém, na definição de premissas,
somente os modelos com os três melhores resultados de correlação foram considerados pelo
sistema para criação do modelo de testes, conforme demonstrado pela figura 25 a seguir.

Figura 25 – Janela de premissas de montagem dos modelos estatísticos finais.

Fonte: Autor, 2017.

Neste ponto é importante ressaltar que a descrição da forma como funcionam cada um
dos métodos, bem como se dá o seu processamento individual foi suprimida deste trabalho uma
vez que tal tarefa extrapola os objetivos do trabalho que consiste na busca pela predição da
correlação entre as variáveis.
55

Figura 26 – Modelamento final do fluxo de análise estatística para predição de correlação.

Fonte: Autor, 2017.


56

A figura 26, apresentada anteriormente, exibe a composição final do fluxo modelado


para o tratamento estatístico das variáveis, bem como para a proposição da correlação
categórica entre as variáveis preditoras e a variável resposta.
57

4. RESULTADOS OBTIDOS

Após o processamento do fluxo modelado percebeu-se, a partir de cada um dos nós


Categórico Automáticos associados às suas respectivas partições, que o modelo estabelecido
em ambos os casos obteve elevada precisão na predição dos CBRs, em suas distintas faixas
categóricas, em relação às variáveis preditoras categorizadas, conforme demonstrado na figura
27 a seguir obtida a partir do nó de saída Matriz conforme descrito no item 3.4.3.

Figura 27 – Resultados obtidos a partir do teste do modelo para as partições 01 e 02.

Fonte: Autor, 2017.

Na figura acima a coluna CBR (%)_BIN aponta para a faixa categórica de


enquadramento do CBR analisado, enquanto as colunas 1 e 2 indicam a contagem numérica e
o valor percentual de acertos (na coluna 1) e erros (na coluna 2) em relação às amostras testadas.
Os anexos VI e VII apresentam as tabelas com todos os resultados obtidos para a
variável resposta CBR (%)_BIN a partir dos modelos estatísticos treinados e testados a partir
dos valores constantes nas partições 01 e 02, respectivamente. Nelas a coluna $XS-CBR
(%)_BIN representa o valor previsto pelo modelo estatístico, enquanto a coluna CBR (%)_BIN
é o valor real da categoria do CBR.
Percebe-se que, apesar dos ótimos resultados obtidos na predição para as partições 01 e
02, com 90,476% e 94,444% de acertos respectivamente em ambos os casos, houve
diferenciação dos resultados obtidos em função da forma como foi montada a amostragem de
treinamento e de teste durante o particionamento das amostras.
58

Verificou-se que particionamento não influenciou somente os resultados obtidos, mas


também incorreu em seleção distinta de métodos de análise estatística e na atribuição de
importância às variáveis preditoras.
As figuras 28 e 29 demonstram a influência da amostra particionada sobre os melhores
métodos estatísticos verificados pelo nó Previsor Categórico Automático e posteriormente
utilizados para predição da variável resposta. A figura 30, por sua vez apresenta a diferenciação
na importância das variáveis.

Figura 28 – Seleção dos métodos de maior exatidão pelo previsor - partição 01.

Fonte: Autor, 2017.

Figura 29 – Seleção dos métodos de maior exatidão pelo previsor - partição 02.

Fonte: Autor, 2017.


59

Figura 30 – Importância dos preditores nas partições 01(a) e 02(b).

Fonte: Autor, 2017.

A verificação das condições preditivas do modelo podem ser realizadas a partir da


análise da curva Características de Operação do Receptor, ou curva ROC, onde se traça a
relação entre a sensibilidade e a especificidade dos valores de CBR (%)_BIN.
Nas curvas ROC o eixo Y traduz a sensibilidade da variável resposta, representando o
número de verdadeiros positivos, enquanto o eixo X traduz a especificidade, caracterizando os
resultados falsos positivos. As figuras 31 e 32, obtidas a partir do nó Avaliação, apresentam as
curvas ROC para os resultados provenientes das partições 01 e 02 respectivamente.
A linha vermelha representa a total aleatoriedade, caracterizando um teste totalmente
incapaz de discriminar o valor da variável resposta, tendo a taxa de acerto igual ao de um
lançamento lançar de uma moeda. A linha azul representa as condições de assertividade
evidenciadas no modelo estatístico estabelecido pela montagem do fluxo.

Figura 31 – Importância dos preditores na partição 01.

Fonte: Autor, 2017.


60

Figura 32 – Importância dos preditores nas partições 01(a) e 02(b).

Fonte: Autor, 2017.


61

5. CONSIDERAÇÕES FINAIS

Verificadas as condições de distribuição das variáveis preditoras, não foi possível se


traçar uma correlação linear entre os parâmetros físicos e o CBR dentro da amostragem utilizada
na elaboração deste trabalho.
É bastante plausível que a inexistência de uma correlação linear entre os parâmetros
físicos e o CBR, um parâmetro mecânico, se dê em função da expressiva presença de óxidos de
ferro e alumínio no substrato pedológico do Grupo Barreiras. Os óxidos favorecem uma
interface química no contato das partículas do solo que pode incorrer em incremento da
resistência à penetração.
Apesar do modelo teórico apresentar uma qualidade razoável e dos valores de acertos
evidenciados na determinação da variável resposta CBR (%)_BIN serem elevados, com
90,476% e 94,444% para as partições 01 e 02 respectivamente, o modelo de testes é ruim e não
deve ser considerado como elemento para predição de valores de CBR categorizados distintos
daqueles utilizados para modelamento do fluxo.
As curvas ROC de ambas as partições se aproximam muito da linha de aleatoriedade. A
área sotoposta à linha de aleatoriedade, mesma chance de acerto de um lançamento de moeda,
é de 0,5 e as áreas sotopostas aos limites das linhas que representam o modelo são de 0,550 e
0,558 para as partições 01 e 02, respectivamente. Bibliografias indicam que áreas superiores a
0,70 representam modelos com desempenho satisfatório.
O apontamento da variável #40_BIN, e consequentemente #40, como preditor de maior
relevância nas análises categóricas em ambas as partições, assim como a indicação de elevada
relevância para as variáveis #10 e #40 no teste Qui-quadrado, vão de encontro ao conhecimento
difundido na engenharia rodoviária de que as frações mais grossas do solo condicionam o CBR
que tenderá a ser tão maior quanto mais altas forem as frações grossas do material.
Com a evidenciação da alteração dos resultados e dos métodos estatísticos mais
indicados para o tratamento das variáveis de acordo com o particionamento das amostras,
trabalhos mais aprofundados de tratamento estatístico preliminar das amostras podem incorrer
em ganho de precisão nos modelos ora estabelecidos.
Apesar de não poder ser empregado para a correlação indiscriminada de solos em função
do baixo desempenho do modelo de testes, especificamente para a amostra em estudo o
resultado do modelamento estatístico foi satisfatório.
62

Ambas as partições retornaram valores categóricos corretos para a variável resposta em


mais de 90% dos casos estudados. O modelo originado pela Partição 02 apresentou valores
corretos para 94,444% dos testes realizados com a relação de acertos x erros de 68 x 1, 13 x 3
e 4 x 1 para as categorias 1, 2 e 3 de CBR, respectivamente.
Ainda que de aplicabilidade restrita, o modelo estatístico estabelecido neste trabalho
conseguiu traduzir de forma adequada as condições de predição do CBR, em faixas categóricas,
a partir dos parâmetros físicos do solo, também categorizados, para as amostras empregadas
durante o processamento estatístico.
63

6. RECOMENDAÇÕES PARA TRABALHOS FUTUROS

Como recomendação para trabalhos futuros indica-se a utilização do SPSS Modeler em


amostras maiores de solos que, preferencialmente, não tenham em sua matriz uma participação
tão significativa de óxidos ou outros elementos químicos que possam interferir na tentativa de
busca pela correlação entre os parâmetros físicos e o CBR de solos.
Ademais considerando-se a possibilidade de alterações nos resultados dos ensaios em
função da experiência dos laboratoristas, principalmente para ensaios de limites de consistência,
pode ser proposta a realização das análises estatísticas sobre materiais trabalhados por um único
laboratório, minimizando a influência humana sobre a variação dos resultados dos ensaios.
64

REFERÊNCIAS

AMADOR ES. 1982. Depósitos relacionados à Formação inferior do Grupo Barreiras no estado
do Espírito Santo. In: Congresso Brasileiro de Geologia, 32, 1982, Salvador. Anais... Salvador:
SBG, 1982. v. 4, p. 1451-1460.

AMADOR ES e DIAS GTM. 1978. Considerações preliminares sobre depósitos do Terciário


Superior do norte do Espírito Santo. An. Acad. bras. Ci. 50(1):121.

ARAI, M. A Grande elevação eustática do mioceno e sua influência na origem do Grupo


Barreiras. Geologia USP. Série Científica, São Paulo, v. 6, n. 2, p. 1-6, 2006

BIGARELLA, J. J. The Barreiras Group in Northeastern Brazil. An. Acad. Bras. Ci. v. 47,
(suplemento), p. 366-392, 1975.

BEZERRA, F. H. R. et al. Pliocene-quaternary fault control of sedimentation and coastal plain


morphology in NE Brazil. Journal of South American Earth Sciences. Amsterdam, v. 14, p. 61-
75, 2001.

CAMILO, C. O.; SILVA, J. C. D. Mineração de dados: Conceitos, Tarefas, Métodos e


Ferramentas. Instituto de Informática da UFG, 2009, 23 p. Relatório Técnico: RT-INF_001-09.
Disponível em: http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-
INF_001-09.pdf. Data de acesso: 23/03/2017.

CPRM. Companhia de Pesquisa de Recursos Minerais / Serviço Geológico do Brasil. Banco de


Dados GEOBANK. Disponível em: <http://geobank.sa.cprm.gov.br/>. Acesso em 07/01/2017.

DAER, Departamento de Estradas de Rodagem do Estado do Rio Grande do Sul. Instruções de


Serviço para Elaboração de Estudos Geotécnicos – IS 101/94, DAER, 1994.

DNER, Departamento Nacional de Estradas de Rodagem. DNER 122/94 – ME. Solos –


determinação do limite de liquidez – método de referência e método expedito – Método de
ensaio. 07p. Brasília, 1994.

DNER, Departamento Nacional de Estradas de Rodagem. DNER 082/94 – ME. Solos –


determinação do limite de plasticidade – Método de ensaio. 07p. Brasília, 1994.

DNER, Departamento Nacional de Estradas de Rodagem. DNER 80/94 – ME. Solos – análise
granulométrica por peneiramento – Método de ensaio. 03p. Brasília, 1994.

DNIT, Departamento Nacional de Infraestrutura de Transportes. Diretoria de Planejamento e


Pesquisa. Coordenação Geral de Estudos e Pesquisa. Instituto de Pesquisas Rodoviárias.
Diretrizes básicas para estudos e projetos rodoviários: escopos básicos / instruções de serviço.
- 3. ed., p. 273 – 281, Rio de Janeiro, 2006 (IPR. Publ., 726).

DNIT, Departamento Nacional de Infraestrutura de Transportes. DNIT 172/2016 – ME. Solos


– Determinação do Índice de Suporte Califórnia utilizando amostras não trabalhadas – Método
de ensaio. 17p. Brasília, 2016.

FAYYAD, U; PIATETSKY-SHAPIRO, G; SMYTH, P. From Data Mining to Knowledge


65

Discovery in Databases. American Association for Artificial Intelligence, 1996.

FERREIRA, Simone Pereira. Estudo Comparativo do Pós-Processamento Estatístico Aplicado


ao Modelo Brams. 2011. 132 f. Dissertação (Mestrado) – Universidade Federal do Rio Grande
do Sul. Porto Alegre.

GIOLO, S. R. Introdução à análise de dados categóricos. 57ª Reunião Anual da RBras. 2012.
Minicurso – Universidade Federal do Paraná. Piracicaba. São Paulo.

HAIR, J. F. Et al. Multivariate Data Analysis with Readings. 4 ed. New Jersey: Prentice Hall,
1995.

IBGE, Instituto Brasileiro de Geografia e Estatística. Mapa de solos do Brasil. Rio de Janeiro.
2001.

IBGE, Instituto Brasileiro de Geografia e Estatística. Mapa de solos do Brasil. Rio de Janeiro.
2001.

IBGE. Instituto Brasileiro de Geografia e Estatística. Organização do Território – Malhas


Municipais – Municípios 2015. Rio de Janeiro: IBGE, 2015. Disponível em
ftp://geoftp.ibge.gov.br/organizacao_do_territorio/malhas_territoriais/malhas_municipais/mun
icipio_2015. Acesso em 07/01/2017.

IBM. Nós de Modelagem do IBM SPSS Modeler 17.1, 2015. Disponível em


ftp://public.dhe.ibm.com/software/analytics/spss/documentation/modeler/17.1/br_po/Modeler
ModelingNodes.pdf. Acesso em 24/04/2017.

KARAM, K. A. Regressão logística: um modelo de risco de cancelamento de clientes / Karine


de Almeida Karam; orientador: Jorge Ferreira da Silva. – Rio de Janeiro : PUC, Departamento
de Administração, 2006.

MABESOONE, J. M.; CAMPOS, E.; SILVA, A.; BEURLEN, K. Estratigrafia e origem do


Grupo Barreiras em Pernambuco, Paraíba e Rio Grande do Norte. Ver Bras Geoc., v. 2, p. 173-
190, 1972.

MILLÉO, Ida Agner de Faria. Análise de especificações de aterro e correlação entre CRB e
capacidade de carga em solos compactados. 2012. 175 f. Dissertação (Mestrado) –
Universidade Federal do Paraná. Curitiba.

MONTGOMERY, D. C.; PECK, E. A.; VINING, G. G. Introduction to Linear Regression


Analysis. 3. ed. [S.l.]: Wiley-Interscience, 2001. 641 p.

OKURA, R. I. S. Modelos de regressão para variáveis categóricas ordinais com aplicações ao


problema de classificação. 2008. 104 f. Dissertação (Mestrado) – Universidade de São Paulo.
São Paulo.

PORTER, O.J. Development of the original method for highway design. Development of CBR
flexible pavement design method for airfields. Transactions of American Society of Civil
Engineers, New York, v. 115, p. 461-7, 1950.
66

SANTOS, A. B. Material didático. – Profa. Dra. Adriana Barbosa Santos. Disponível em


http://www.ibilce.unesp.br/Home/Departamentos/CiencCompEstatistica/Adriana/medidas-de-
associacao-entre-var.-qualitativas.pdf. Acesso em 15/03/2017.

SILVA, Sandra Fernandes da; MACHADO, Marcely Ferreira. Geodiversidade do estado do


Espírito Santo: Mapa de Geodiversidade do estado do Espírito Santo. CPRM, 2010. Programa
Geologia do Brasil. Levantamento da Geodiversidade.

SOARES, J.M.D.; TAVARES, I. S.; PINHEIRO, R. J. B. Mecânica dos Solos. Universidade


Federal de Santa Maria. RS. 2006. Notas de aula.

TAMARA G. 1995. Contribuição ao Estudo do Grupo Barreiras na Região Metropolitana de


Vitória (ES). Universidade Federal do Rio de Janeiro, Instituto de Geociências 1995, 73p.

VIALI, L. Material didático – Série Estatística Multivariada. Disponível em


http://www.pucrs.br/famat/viali/especializa/realizadas/ceea/multivariada/texto/Introducao.pdf.
Acesso em 15/03/2017.

VILAS BOAS, G. S. Sedimentos terciários e quaternários do interior. In: TEXTO explicativo


para o mapa geológico do Estado da Bahia. Salvador: Secretaria da Indústria, Comércio e
Mineração: Superintendência de Geologia e Recursos Minerais, 1996.

VILAS BOAS, G. S.; SAMPAIO, F. J.; PEREIRA, A. M. S. The Barreiras Group in the
northeastern coast of the State of Bahia, Brasil: depositional mechanisms and processes. Anais
da Academia Brasileira de Ciências, v. 73, n. 3, p. 417-427, 2001.
67

ANEXO I – Abrangência geológica do grupo Barreiras no Estado do Espírito Santo


68

Fonte: Autor, 2017.


69

ANEXO II – Tabela de área municipal com afloramento de litotipos do grupo Barreiras


70

ÁREA MUNICIPAL COM AFLORAMENTOS DO GRUPO BARREIRAS

Município Área (km²) % da área estadual


Anchieta 44,91 0,10%
Aracruz 755,45 1,64%
Boa Esperança 253,45 0,55%
Colatina 21,75 0,05%
Conceição da Barra 904,55 1,96%
Ecoporanga 48,35 0,10%
Fundão 28,22 0,06%
Governador Lindenberg 3,70 0,01%
Guarapari 26,98 0,06%
Itapemirim 48,06 0,10%
Jaguaré 433,62 0,94%
Linhares 1173,43 2,55%
Marataízes 66,24 0,14%
Montanha 968,98 2,10%
Mucurici 484,42 1,05%
Nova Venécia 249,41 0,54%
Pedro Canário 433,10 0,94%
Pinheiros 603,38 1,31%
Ponto Belo 12,70 0,03%
Presidente Kennedy 109,47 0,24%
Rio Bananal 123,45 0,27%
São Domingos do Norte 4,62 0,01%
São Mateus 1328,96 2,88%
Serra 189,05 0,41%
Sooretama 505,88 1,10%
Vila Pavão 20,02 0,04%
Vila Valério 162,32 0,35%
Vila Velha 19,67 0,04%
Vitória 17,42 0,04%
TOTAIS 9041,57 19,62%
Fonte: Autor, 2017.
71

ANEXO III – Autorização para uso de dados


72
73

ANEXO IV – Planilha de ensaios compilados


74
75
76
77
78

Fonte: Autor, 2017.


79

ANEXO V – Histogramas e gráficos de dispersão – Nó de Auditoria


80

Histograma e gráfico de dispersão para o percentual passante na peneira 2”

Histograma e gráfico de dispersão para o percentual passante na peneira 1”

Histograma e gráfico de dispersão para o percentual passante na peneira 3/8”

Histograma e gráfico de dispersão para o percentual passante na peneira #4

Histograma e gráfico de dispersão para o percentual passante na peneira #10


Fonte: Autor, 2017.
81

Histograma e gráfico de dispersão para o percentual passante na peneira #40

Histograma e gráfico de dispersão para o percentual passante na peneira #200

Histograma e gráfico de dispersão para o LL

Histograma e gráfico de dispersão para o IP


Fonte: Autor, 2017.
82

ANEXO VI – TABELA DE RESULTADOS DO TESTE DO MODELO ESTATÍSTICO


SOBRE OS DADOS DA PARTIÇÃO 01
83
84

Fonte: Autor, 2017.


85

ANEXO VII – TABELA DE RESULTADOS DO TESTE DO MODELO


ESTATÍSTICO SOBRE OS DADOS DA PARTIÇÃO 02
86
87

Fonte: Autor, 2017.

Você também pode gostar