Você está na página 1de 129

UNIVERSIDADE DE LISBOA

FACULDADE DE CINCIAS
DEPARTAMENTO DE ESTATSTICA E INVESTIGAO OPERACIONAL

ANLISE ESTATSTICA MULTIVARIADA APLICADA A


DADOS HIDROGEOLGICOS

Vnia Sofia Pires Simes Gomes


Dissertao
Mestrado em Estatstica
2013
1

UNIVERSIDADE DE LISBOA
FACULDADE DE CINCIAS
DEPARTAMENTO DE ESTATSTICA E INVESTIGAO OPERACIONAL

ANLISE ESTATSTICA MULTIVARIADA APLICADA A


DADOS HIDROGEOLGICOS

Vnia Sofia Pires Simes Gomes


Dissertao orientada pela Prof. Doutora Fernanda Diamantino e
coorientada pela Prof. Doutora Catarina Silva
Mestrado em Estatstica
2013

ndice
ndice de Figuras ............................................................................................................. iii
ndice de Tabelas .............................................................................................................. v
ndice de Anexos ............................................................................................................. vi
Resumo ........................................................................................................................... vii
Abstract ............................................................................................................................ ix
Captulo 1: Introduo ...................................................................................................... 1
1.1.

Objetivos do estudo ........................................................................................... 1

1.2.

Enquadramento geolgico ................................................................................. 6

Captulo 2: Metodologia ................................................................................................... 9


2.1. Conceitos de lgebra matricial ............................................................................... 9
2.1.1. Conceito de matriz .......................................................................................... 9
2.1.2. Tipos de matrizes ............................................................................................ 9
2.1.3. Igualdade de matrizes .................................................................................... 10
2.1.4. Operaes com matrizes................................................................................ 11
2.1.5. Trao de uma matriz ...................................................................................... 11
2.1.6. Vetores linearmente dependentes e independentes ....................................... 11
2.1.7. Caracterstica de uma matriz ......................................................................... 12
2.1.8. Determinante ................................................................................................. 12
2.1.9. Matriz adjunta e matriz inversa ..................................................................... 13
2.1.10. Matriz ortogonal .......................................................................................... 13
2.1.11. Valores prprios e vetores prprios ............................................................ 13
2.1.12. Decomposio espetral ................................................................................ 14
2.2.

Caractersticas amostrais .................................................................................. 15

2.2.1.

Caractersticas amostrais univariadas ....................................................... 15

2.2.2.

Caractersticas amostrais bivariadas ......................................................... 16

2.3.

Tcnicas de Anlise Multivariada .................................................................... 18

2.3.1.

Anlise em Componentes Principais ........................................................ 19

2.3.1.1. Introduo ............................................................................................... 19


2.3.1.2. O modelo matemtico ............................................................................. 20
2.3.1.3. Nmero de componentes a reter ............................................................. 22

2.3.2.

Anlise Fatorial ........................................................................................ 23

2.3.2.1. Introduo ............................................................................................... 23


2.3.2.2. O modelo matemtico ............................................................................. 23
2.3.2.3. Nmero de fatores a reter ....................................................................... 24
2.3.2.4. Rotao dos fatores ................................................................................. 25
2.3.2.5. Mtodo de extrao dos fatores .............................................................. 26
2.3.2.6. Validao do modelo de anlise fatorial................................................. 27
2.3.2.7. Anlise em Componentes Principais versus Anlise Fatorial ................ 28
2.3.3.

Anlise de Clusters ................................................................................... 29

2.3.3.1.

Introduo.......................................................................................... 29

2.3.3.2.

Medidas de proximidade ................................................................... 30

2.3.3.3.

Mtodos de agregao ....................................................................... 32

2.3.3.4.

Critrios de agregao ....................................................................... 33

Captulo 3: Anlise de dados hidrogeolgicos ............................................................... 35


3.1.

Anlise Exploratria dos Dados ...................................................................... 39

3.1.1.

Caractersticas amostrais .......................................................................... 39

3.1.2.

Correlao linear de Pearson .................................................................... 45

3.1.3.

Representaes grficas ............................................................................ 47

3.2.

Anlise Multivariada ........................................................................................ 63

3.2.1.

Anlise em Componentes Principais ........................................................ 63

3.2.2.

Anlise Fatorial ........................................................................................ 71

3.2.3.

Anlise de Clusters ................................................................................... 78

Captulo 4: Concluses ................................................................................................... 89


Consideraes Finais ...................................................................................................... 95
Bibliografia ..................................................................................................................... 97
Anexos .......................................................................................................................... 101

ii

ndice de Figuras
Figura 1: Localizao geogrfica das amostras de gua e respetivas formaes
geolgicas .......................................................................................................4
Figura 2: Localizao geogrfica das amostras de gua ................................................ 36
Figura 3: Localizao geogrfica das amostras de gua e respetivas formaes
geolgicas .......................................................................................................37
Figura 4: Diagramas em caixa de bigodes paralelos de cada varivel comparando
cada formao geolgica ................................................................................. 48
Figura 5: Diagramas em caixa de bigodes paralelos de cada formao geolgica,
para cada io....................................................................................................51
Figura 6: Diagramas de disperso das observaes reorganizadas versus cada uma
das variveis em estudo .................................................................................. 54
Figura 7: Matriz de diagramas de disperso para cada formao geolgica com as
variveis condutividade eltrica, clcio, sdio e cloreto .................................58
Figura 8: Matriz de diagramas de disperso para cada formao geolgica com as
variveis bicarbonato, clcio e magnsio ........................................................ 60
Figura 9: Matriz de diagramas de disperso para cada formao geolgica com as
variveis bicarbonato, clcio e sulfato ............................................................ 61
Figura 10: Diagrama de disperso para cada formao geolgica com as variveis
nitrato e sulfato ............................................................................................... 62
Figura 11: Scree plot (nmero de componentes principais versus valores prprios) .....65
Figura 12: Representao grfica dos loadings das duas primeiras componentes
principais.......................................................................................................67
Figura 13: Representao grfica dos scores (observaes) das duas primeiras
componentes principais ................................................................................ 68
Figura 14: Representao grfica dos scores (formaes geolgicas) das duas
primeiras componentes principais ................................................................ 69
Figura 15: Representao grfica (biplot) dos loadings e dos scores (observaes)
das duas primeiras componentes principais .................................................. 70
Figura 16: Representao grfica (biplot) dos loadings e dos scores (formaes
geolgicas) das duas primeiras componentes principais .............................. 70
Figura 17: Representao grfica dos loadings dos 2 primeiros fatores ........................ 75

iii

Figura 18: Dendograma (variveis estandardizadas) para a amostra global


utilizando o mtodo de Ward ........................................................................79
Figura 19: Localizao geogrfica das amostras de gua que constituem os clusters
(cluster1, cluster2 e cluster3) obtidos quando se utiliza o mtodo de
Ward com as variveis estandardizadas ....................................................... 79
Figura 20: Dendograma (variveis estandardizadas) para a amostra global
utilizando o mtodo de Complete Linkage ................................................ 80
Figura 21: Localizao geogrfica das amostras de gua que constituem os clusters
(cluster1, cluster2 e cluster3) obtidos quando se utiliza o mtodo de
Complete Linkage com as variveis estandardizadas ...................................81
Figura 22: Dendograma (com os scores das 5 primeiras componentes principais)
para a amostra global usando o mtodo de Ward .........................................83
Figura 23: Localizao geogrfica das amostras de gua que constituem os clusters
(cluster1, cluster2 e cluster3) obtidos quando se utiliza o mtodo de
Ward com as 5 primeiras componentes principais .......................................84
Figura 24: Dendograma (com os scores das 5 primeiras componentes principais)
para a amostra global usando o mtodo de Complete Linkage .................... 85
Figura 25: Localizao geogrfica das amostras de gua que constituem os clusters
(cluster1, cluster2 e cluster3) obtidos quando se utiliza o mtodo de
Complete Linkage com os scores das 5 primeiras componentes
principais.......................................................................................................86
Figura 26: Dendogramas (observaes) para cada formao geolgica utilizando o
mtodo de Ward (variveis estandardizadas) ...............................................87

iv

ndice de Tabelas
Tabela 1: Escala de avaliao da anlise fatorial............................................................ 27
Tabela 2: Provenincia das amostras ..............................................................................38
Tabela 3: Caractersticas amostrais das variveis (amostra global) ............................... 39
Tabela 4: Caractersticas amostrais (mdia e desvio padro) das variveis em cada
grupo de formaes geolgica ........................................................................44
Tabela 5: Valores prprios da matriz de correlaes amostral .......................................63
Tabela 6: Proporo de varincia explicada por cada componente e proporo de
varincia acumulada explicada at componente j. .......................................64
Tabela 7: Matriz dos loadings das componentes principais ...........................................66
Tabela 8: Valores prprios da matriz de correlaes amostral .......................................71
Tabela 9: Proporo de varincia explicada por cada fator e proporo de varincia
acumulada pelo fator j ..................................................................................... 72
Tabela 10: Comunalidades iniciais e extradas atravs do mtodo das componentes
principais.......................................................................................................73
Tabela 11: Matriz dos loadings (sem rotao dos fatores) .............................................73
Tabela 12: Matriz da transformao ortogonal obtida pelo mtodo de rotao
varimax .......................................................................................................74
Tabela 13: Matriz dos loadings (aps rotao varimax) ................................................ 74
Tabela 14: Designao dos fatores ................................................................................. 75
Tabela 15: KMO e teste de esfericidade de Bartlett ....................................................... 76
Tabela 16: Medida de adequao amostral para cada varivel (MSA) .......................... 77
Tabela 17: Caracterizao dos grupos de formaes geolgicas....................................89
Tabela 18: Tabela resumo dos outliers por cada grupo de formao geolgica e por
cada varivel .................................................................................................90

ndice de Anexos
Anexo 1: Matriz dos dados............................................................................................ 104
Anexo 2: Caracterizao dos grupos de formaes geolgicas ....................................105
Anexo 3: Tabelas com os valores extremos (os 5 maiores e os 5 menores valores)
para cada varivel.......................................................................................... 107
Anexo 4: Matriz de correlaes de Peason - amostra gobal..........................................108
Anexo 5: Matriz de correlaes de Pearson - Aluvies ................................................ 109
Anexo 6: Matriz de correlaes de Pearson - Formao de Benfica............................. 110
Anexo 7: Matriz de correlaes de Pearson - Complexo Vulcnico de Lisboa ............111
Anexo 8: Matriz de correlaes de Pearson - Calcrios de Entrecampos ..................... 112
Anexo 9: Matriz de correlaes de Pearson - Areolas da Estefnia e Areias do Vale
de Chelas .......................................................................................................113
Anexo 10: Matriz de correlaes de Pearson - Argilas do Forno do Tijolo e Argilas
e Calcrios dos Prazeres ................................................................................ 114
Anexo 11: Scores das 5 primeiras componentes principais ..........................................116

vi

Resumo
Para o presente estudo utilizaram-se anlises qumicas de 48 amostras de gua
subterrnea da cidade de Lisboa das quais se selecionaram 13 variveis referentes a
espcies dissolvidas (anies e caties) e parmetros fsico-qumicos.

Este estudo teve como objetivo avaliar a existncia de relao entre a composio
qumica da gua subterrnea e as formaes geolgicas por onde esta circulou, ou seja,
pretendeu-se identificar as espcies dissolvidas que caracterizavam cada formao
geolgica, bem como, identificar o que distinguia cada uma das formaes geolgicas.

Deste modo, numa fase inicial procedeu-se a uma anlise exploratria com o intuito de
caracterizar a amostra global e as amostras parciais (correspondentes a cada formao
geolgica) e, numa fase final procedeu-se a uma anlise multivariada, onde se
utilizaram tcnicas de reduo de dimensionalidade (anlise em componentes principais
e anlise fatorial) e tcnicas de agrupamento de dados (anlise de clusters).

Concluiu-se que as amostras provenientes da Formao de Benfica e do Complexo


Vulcnico de Lisboa tinham composio qumica idntica. Relativamente s restantes
formaes geolgicas, no existia uma homogeneidade entre amostras provenientes da
mesma formao, nem entre amostras provenientes de formaes distintas, pelo que, a
caracterizao das formaes geolgicas tornou-se muito complexa.

Como os valores das correlaes de Pearson, entre as variveis, eram baixos, a


aplicao das tcnicas de reduo de dimensionalidade no surtiu o efeito desejado.

Palavras chave: gua subterrnea, anlise exploratria, anlise em componentes


principais, anlise fatorial, anlise de clusters.

vii

viii

Abstract
For the present study we used chemical analyzes of 48 groundwater samples of Lisbon
in which was selected 13 variables related to dissolved species (anions and cations) and
physico-chemical parameters.

This study aims to evaluate whether there is a relationship between the chemical
composition of the groundwater and the geological formations where it circulated, this
is, it was intended to identify the dissolved species that characterize each geological
formation, as well as to identify what distinguishes each geological formations.

Thus, initially we proceeded with an exploratory analysis in order to characterize the


sample and partial samples (corresponding to each geological formation), and in a final
stage, we applied a multivariate analysis, where techniques were used to reduce the
dimensionality (principal component analysis and factor analysis) and techniques to
data clustering (cluster analysis).

It was concluded that the samples from the Formao de Benfica and Complexo
Vulcnico de Lisboa had identical chemical composition. For the other geological
formations, there was no homogeneity among samples from the same formation, or
between samples from different formations. Therefore, the characterization of the
geologic

formations

has

become

very

complex.

Since the values of the Pearson correlations among the variables were low, the
application of reduce the dimensionality techniques do not have the desired effect.

Keywords: Groundwater, exploratory analysis, principal component analysis, factor


analysis, cluster analysis

ix

Captulo 1: Introduo
Este trabalho surge com o intuito de dar resposta a algumas questes relativas
caracterizao de guas subterrneas da cidade de Lisboa, tendo como ponto de partida
um conjunto de 48 anlises de guas subterrneas recolhidas no especificamente para
este trabalho. Este conjunto resultou de recolhas para a concretizao de unidades
curriculares do 1 ciclo de estudos em Geologia da FCUL (Caria et al, 2009, Manca et
al, 2008 e Sanches et a,l 2006) e 2 ciclo de estudos em Geologia Aplicada e do
Ambiente da FCUL (Oliveira, 2010) e em Engenharia do Ambiente do IST (Lopes,
2007). A localizao geogrfica de, cada amostra de gua encontra-se na figura 1, onde
se pode observar a que formao geolgica corresponde.

1.1.

Objetivos do estudo

Para a realizao deste trabalho foram definidos alguns objetivos, nomeadamente:

Calcular, analisar e interpretar as caractersticas amostrais;

Aferir sobre a qualidade das guas subterrneas para consumo humano;

Analisar e interpretar as representaes grficas (anlise exploratria);

Identificar as espcies dissolvidas que caracterizam cada formao geolgica;

Relacionar a composio qumica da gua subterrnea com a formao


geolgica aflorante no local de recolha;

Descrever a variabilidade dos dados com um menor nmero de variveis no


correlacionadas;

Explicar atravs de um menor nmero de fatores (no observados) as


correlaes entre as variveis;

Utilizar uma anlise de clusters para reagrupar as amostras de gua subterrnea


de acordo com a sua composio qumica;

Identificar caractersticas distintivas de cada uma das formaes geolgicas;

Identificar caractersticas comuns entre as formaes geolgicas.

Destaca-se como objetivo principal a caracterizao de cada grupo de formaes


geolgicas, atravs da anlise das concentraes das espcies qumicas dissolvidas nas
guas subterrneas, bem como de alguns parmetros fsico-qumicos.

O trabalho ser dividido em duas partes. A primeira parte ser constituda pelos
captulos 1 e 2 e corresponder ao desenvolvimento terico. A segunda parte ser
constituda pelos captulos 3 e 4 e corresponder ao desenvolvimento prtico.
No captulo 1 ser feito o enquadramento geolgico, no qual se far uma breve
introduo s caractersticas das formaes geolgicas.
No captulo 2 ser abordada a metodologia a desenvolver. Na primeira seco iro
definir-se alguns conceitos de lgebra matricial. Na segunda seco, com o intuito de se
efetuar uma anlise exploratria dos dados, iro definir-se algumas caractersticas
amostrais. Na terceira e ltima seco ser feita uma breve abordagem das tcnicas de
anlise multivariada a serem utilizadas, nomeadamente a anlise em componentes
principais, a anlise fatorial e a anlise de clusters.
No captulo 3 sero apresentados os resultados obtidos.
No captulo 4 sero apresentadas as concluses.

A anlise estatstica ser efetuada com a utilizao do software SPSS, verso 19.

Figura 1: Localizao geogrfica das amostras de gua e respetivas formaes geolgicas

1.2.

Enquadramento geolgico

A composio qumica da gua subterrnea da rea de Lisboa est intimamente


relacionada com as caractersticas do meio geolgico, das condies climticas e
tambm das atividades humanas que decorrem na cidade.
O Concelho de Lisboa situa-se na Orla mesocenozica, a qual constituda por espessas
sries de sedimentos, onde predominam os sedimentos carbonatados, os arenitos e os
argilitos (Almeida et al., 2000).
Na rea do concelho de Lisboa os terrenos mais antigos, cujos principais afloramentos
se encontram nas zonas de Monsanto, Ajuda e Vale de Alcntara, so
predominantemente constitudos por calcrios, calcrios margosos e margas. A geologia
de Lisboa, de elevada complexidade, pode ser descrita de um modo simplificado em trs
setores: Setor SW, Monsanto-Ajuda-Alcntara; Setor NW, Formao de Benfica e
Miocnico; Setor E, Srie Miocnica.

Setor SW: Monsanto-Ajuda-Alcntara


As formaes calcrias do Cenomaniano, que se apresentam dobradas e fraturadas
(Cabral, 2006), esto sobrepostas por formaes baslticas do Complexo Vulcnico de
Lisboa (1). Neste setor, as formaes cretcicas estendem-se desde a zona central e
mais elevada da Serra de Monsanto, seguindo pelo Vale de Alcntara at praticamente
ao Rio Tejo, prolongando-se para SW ao longo da encosta do Bairro da Ajuda,
aflorando no seio do Complexo Vulcnico de Lisboa (Pais et al., 2006).
Esta zona compreende formaes do Cretcico superior, como a Formao de Caneas
(C2 cn), constituda por calcrios margosos e dolomticos, datados do Albiano superior a
Cenomaniano mdio. Sobre a formao anterior, assenta a Formao de Bica (C2 Bi), do
Cenomaniano superior, representada por calcrios compactos e apinhoados, com
ndulos de slex e com rudistas. No topo do Cretcico superior aflora o Complexo
Vulcnico de Lisboa, constitudo por rochas eruptivas bsicas (Basaltos), sob a forma
de escoadas lvicas alternando com piroclastos e aglomerados vulcnicos, com idade
provvel do Cenomaniano (Pais et al., 2006).

Setor NW: Formao de Benfica e Miocnico


constitudo por formaes cenozicas correspondentes Formao de Benfica (

Bf)

e ao Miocnico. Este setor est na continuidade da estrutura de Monsanto e apresenta


uma sucesso de ondulaes suaves.
Sobre o Complexo Vulcnico de Lisboa, assenta, em discordncia, a Formao de
Benfica (

Bf),

constituda por depsitos continentais, onde se intercalam nveis mais

argilosos, detrticos e carbonatados.

Setor Este: Srie Miocnica


Compreende intercalaes de formaes detrticas e carbonatadas da Srie Miocnica.
Apresenta-se, de um modo geral, em monoclinal, inclinando suavemente para E-SE.
O Neognico abrange unidades miocnicas como as Camadas de Prazeres (Mpr), do
Aquitaniano a Burdigaliano inferior, constitudas por argilitos, argilitos siltosos e
margosos, margas e calcrios.
Sobrepostas a estas, esto as Areolas de Av. da Estefnia (MEs), datada do Burdigaliano
e constituda por areias finas, siltosas, micceas (areolas) argilas silto arenosas e
arenitos mais ou menos consolidados. De seguida, depositaram-se os Calcrios de
Entrecampos (MEC), formao representada por biocalcarenitos com frao detrtica
abundante, por vezes argilosa, ricos de moldes e/ou fragmentos de moluscos e calcrios
margosos, cinzento-esverdeado.
A formao anterior passa superiormente a areias muito finas argilosas, piritosas, e a
siltitos argilosos de cor cinzenta, com moluscos, peixes e abundantes microfsseis,
correspondente unidade de Argilas de Forno do Tijolo (MFT).
A formao Areias do Vale de Chelas (Mvb) constituda por areias feldspticas,
fluviais, incoerentes ou fracamente cimentadas, s vezes grosseiras e compactas; em
posio superior ocorrem areias dunares.
As aluvies (a) do Concelho de Lisboa incluem os depsitos diretamente associados ao
leito principal do Rio Tejo e a todas as ribeiras e linhas de gua que a este afluem, na
sua margem direita. As espessuras das aluvies do Tejo so muito variveis de local
para local. Estas so predominantemente lodosas, com abundante matria orgnica, ou
arenosas. As aluvies das ribeiras afluentes do Tejo tm composio em muitos casos
dependentes das litologias erodidas, contendo frequentemente, matria orgnica
(Almeida, 1991).

Captulo 2: Metodologia
Neste captulo procede-se ao desenvolvimento terico das metodologias aplicadas no
estudo a realizar.

2.1. Conceitos de lgebra matricial

Nesta seco relembram-se alguns conceitos cruciais de lgebra matricial que se


utilizam no desenvolvimento das tcnicas de anlise multivariada. Naturalmente
comea-se com o conceito de matriz (Monteiro, 2001, Searle, 1982 e Timm, 2002).

2.1.1. Conceito de matriz

Designa-se por matriz de ordem n

m, a tabela A =

, com n linhas e

m colunas.
Pode denotar-se a matriz A por [

] com i = 1,, n e j = 1,, m.

As entradas aij so os elementos de A, em que i indica a linha e j indica a coluna.

Quando uma matriz tem ordem n

1 ou ordem 1

n designa-se por vetor, ou seja, tem

n linhas e uma coluna ou tem 1 linha e n colunas, respetivamente. No primeiro caso


designa-se por vetor coluna e representa-se do seguinte modo: x =
caso designamos por vetor linha e representa-se do seguinte modo: xT =

Uma matriz de ordem 1

. No segundo
.

1 designa-se por escalar.

2.1.2. Tipos de matrizes

No que se segue definem-se alguns tipos de matizes, nomeadamente matriz quadrada,


diagonal, identidade, transposta e simtrica.

Uma matriz quadrada a matriz em que o nmero de linhas igual ao nmero de


colunas e diz-se que tem ordem n

n, ou simplesmente ordem n.

Caso contrrio, se o nmero de linhas for diferente do nmero de colunas, diz-se que a
matriz retangular de ordem n

m.

com i, j = 1, , n, designa-se

Uma matriz quadrada de ordem n, em que


por uma matriz diagonal, ou seja, a uma matriz da forma:

Em particular, se d11 = 1,, dnn = 1, tem-se a matriz Identidade, que se denota por In, e
representa-se da forma:
.

Para qualquer matriz A quadrada de ordem n, verifica-se a seguinte propriedade:


AI = IA = A.

Seja A uma matriz de ordem n

m. Designa-se por matriz transposta de A, e

representa-se por AT, matriz que se obtm trocando as linhas com as colunas, ou seja,
as linhas de A so as colunas de AT e as colunas de A so as linhas de AT.

Assim sendo, tem-se que:


se A =

de ordem n

m, ento AT =

de ordem m

n.

Seja A uma matriz quadrada de ordem n. Diz-se que A simtrica se e s se A = AT.

2.1.3. Igualdade de matrizes

Duas matrizes so iguais se os elementos de uma coincidirem com os elementos da


outra, tendo ambas, naturalmente, a mesma ordem.
10

Sejam A e B duas matrizes com a mesma ordem (n

m), tais que A =

Diz-se que as matrizes A e B so iguais se e s se

eB=

, para todo i = 1,, n e

j = 1,, m.

2.1.4. Operaes com matrizes

Por vezes torna-se necessrio efetuar algumas operaes entre matrizes, como o caso
da adio, da subtrao ou do produto de duas ou mais matrizes, bem como a
multiplicao de um escalar por uma matriz.

Sejam A e B duas matrizes com a mesma ordem (n

m), tais que A =

A sua soma (diferena), A + B (A B) igual a C, onde C =


(C =

eB=

), com i = 1, , n e j = 1, , m.

Seja A uma matriz de ordem n

m, tal que A =

um escalar. A multiplicao

da matriz A por um escalar

representa-se por A ou A

e igual a

, com

i = 1, , n e j = 1, , m.

Sejam A e B duas matrizes de ordem n


por B origina C de ordem n

mem

p, tal que AB = C =

p, respetivamente. O produto de A
, onde

2.1.5. Trao de uma matriz

Seja A uma matriz quadrada de ordem n

n, tal que os elementos da diagonal so da

forma aii, com i = 1,, n. Ento o trao de A igual soma dos elementos da diagonal,
ou seja, tr(A) =

2.1.6. Vetores linearmente dependentes e independentes

Os vetores

dizem-se linearmente dependentes se for possvel escrever o

vetor nulo como combinao linear de

sem que os escalares sejam todos


11

nulos. Se o vetor nulo s se puder escrever como combinao linear de


os escalares todos nulos, ento os vetores

sendo

so linearmente independentes.

2.1.7. Caracterstica de uma matriz

Designa-se por caracterstica de uma matriz A de ordem n

n o nmero de linhas (ou

colunas) linearmente independentes. Representa-se a caracterstica de A por r(A).

2.1.8. Determinante

determinante

de

uma

matriz

de

ordem

dado

onde K o nmero de inverses1 da

por
permutao (

quadrada

e p indica que a soma ocorre sobre todas as permutaes de

(1, 2, , n), ou seja, existem n! permutaes. O determinante de uma matriz A pode


denotar-se por detA ou |A|.

Designa-se por menor complemento de um elemento

de um determinante, ao

determinante que se obtm, suprimindo a linha e a coluna a que pertence esse elemento
(linha i e coluna j). Representa-se por

O complemento algbrico de um elemento igual ao menor complemento ou ao seu


simtrico e representa-se por

Pode-se calcular o determinante de outra forma.

Teorema de Laplace: Seja A uma matriz quadrada de ordem n, o seu determinante


igual soma dos produtos dos elementos de uma linha (ou coluna) pelos respetivos
complementos algbricos. Assim sendo,
, onde

o complemento algbrico de

Dada uma permutao dos inteiros 1, 2, , n, existe uma inverso quando um inteiro precede outro

menor do que ele.

12

2.1.9. Matriz adjunta e matriz inversa

matriz que se obtm calculando os respetivos complementos algbricos para cada


entrada

e fazendo a sua transposta, designa-se por matriz adjunta. Representa-se

por adj A.

Uma matriz A quadrada de ordem n invertvel se existir uma matriz B quadrada de


ordem n tal que AB = BA = In. Designamos B por matriz inversa de A e representa-se
por A-1.
Notas:
1)

Uma matriz invertvel se e s se o seu determinante for diferente de zero.

2)

A matriz inversa nica.

3)

Pode ser obtida por: A-1 =

2.1.10. Matriz ortogonal

Uma matriz A quadrada de ordem n, invertvel, diz-se ortogonal se a inversa e a


transposta coincidirem, ou seja, A-1 = AT.

2.1.11. Valores prprios e vetores prprios

Seja A uma matriz quadrada (n


Ax = x. Diz-se que

um escalar e x um vetor no nulo tal que

o valor prprio de A e x um vetor prprio associado.

Considere-se a equao |A
O polinmio |A

n),

I| = 0, cujas solues so os valores prprios da matriz A.

I| designa-se por polinmio caracterstico.

Observaes:

Uma vez que a matriz A tem ordem n, ento o polinmio caracterstico tem n
razes e deste modo tm-se n valores prprios, sejam

determinar os valores prprios determinam-se os vetores prprios,

. Aps a
,

, ,
13

, associados a cada valor prprio. Para esse efeito usa-se a igualdade


(A

I)x=0.

O vetor prprio obtido associado a cada valor prprio no nico, deste modo se
x for vetor prprio ento cx (c um escalar no nulo) tambm vetor prprio.

Notas:
1)

A soma dos valores prprios igual ao trao de A, ou seja, tr(A) =

2)

O produto dos valores prprios igual ao determinante de A, ou seja,


det(A) =

2.1.12. Decomposio espetral


Teorema da decomposio espetral: (Decomposio em valores prprios e vetores
prprios)
Seja A uma matriz simtrica e considere-se ainda os valores prprios de A e os vetores
prprios normalizados. Temos que AQ = Q
dos valores prprios,

com QTQ = I, onde

a matriz diagonal

e Q a matriz ortogonal dos vetores prprios. Se

QT = Q-1, ento A = Q QT.

14

2.2.

Caractersticas amostrais

Nesta seco definem-se algumas caractersticas amostrais a utilizar na anlise


exploratria dos dados.

2.2.1. Caractersticas amostrais univariadas


Para se caracterizar um conjunto de dados, comea-se por calcular algumas
caractersticas amostrais, de localizao e de disperso. No que se segue, definem-se
algumas dessas caractersticas amostrais. Mais precisamente, a mdia, o desvio padro,
os extremos, a mediana e os quartis (Murteira, 2007).

Dado um conjunto de observaes (x1, , xn), diz-se que


amostral e que

a mdia

a varincia amostral. O desvio padro

amostral dado pela raiz quadrada positiva da varincia, ou seja,

A mdia amostral uma medida de localizao, a varincia e o desvio padro amostrais


so medidas de disperso. Estas permitem medir a variabilidade dos em torno da mdia
amostral.

Um conjunto de observaes (x1, x2, , xn) pode ser ordenado ordenado de modo
ascendente, tal que x1:n

x2:n

xn:n, sendo x1:n o mnimo e xn:n o mximo.

Tendo um conjunto ordenado de observaes, pode-se calcular a mediana do seguinte


modo

15

Define-se quantil de ordem p por:

onde [np] designa a parte inteira de np.

Observaes:
1)

O quantil de ordem 0,5 designa-se por mediana.

2)

Os quantis de ordem 0,25 e 0,75 designam-se por primeiro quartil e terceiro


quartil respetivamente.

3)

Os quantis de ordem 0,1; ; 0,9 designam-se por decis.

4)

Os quantis de ordem 0,01; ; 0,99 designam-se por percentis.

Uma representao grfica usual para representar os extremos, os quartis e a mediana


o diagrama em caixa de bigodes.

2.2.2.

Caractersticas amostrais bivariadas

Na seco anterior definiram-se algumas caractersticas amostrais (no caso univariado).


Nesta seco definem-se as caractersticas amostrais para o caso bivariado, ou seja,
caractersticas que permitem comparar as variveis duas a duas, de forma a avaliar o
grau de associao entre as duas variveis. Neste caso, calculam-se as covarincias e
correlaes amostrais.
Considere-se um par de observaes (xi, yi), com i, j = 1, , n. Pode-se proceder sua
representao grfica num referencial cartesiano. Esse grfico designa-se por diagrama
de disperso.
Esta representao grfica permite avaliar o grau de associao entre duas variveis.

Para quantificar essa associao podem usar-se duas medidas: a covarincia amostral e /
ou coeficiente de correlao linear.
A covarincia amostral dada por cov(x,y) =
pode ser denotada por

. Tambm

.
16

A covarincia uma estatstica bivariada utilizada para quantificar a associao linear


entre duas variveis. Porm, influenciada pelas unidades de medida. Neste caso, teria
de se proceder estandardizao do conjunto de dados, ou por outro lado, calcular-se o
coeficiente de correlao amostral.

O coeficiente de correlao ou coeficiente de correlao de Pearson dado por


r=

, ou seja,

O coeficiente de correlao varia entre -1 e 1 e usado para variveis quantitativas.

Se as variveis no forem quantitativas, usa-se o coeficiente de correlao de


Spearman.
Para calcular o coeficiente de correlao de Spearman procede-se de igual modo, mas
substituem-se as observaes (qualitativas) pelas respetivas ordens.

17

2.3.

Tcnicas de Anlise Multivariada

Nesta seco procede-se ao desenvolvimento terico das tcnicas de anlise


multivariada a utilizar neste estudo, nomeadamente, a anlise em componentes
principais (ACP), a anlise fatorial (AF) e a anlise de clusters (AC).
Com estas tcnicas pretende-se resumir a informao contida nos dados, de forma a
tornar mais fcil a sua interpretao.
As duas primeiras tcnicas (ACP e AF) relacionam-se diretamente com as variveis,
designam-se por anlise modo-R, ao passo que a ltima tcnica (AC) relaciona-se com
os indivduos, designa-se por anlise modo-Q.
Mais claramente, a anlise-modo R permite identificar as variveis que mais contribuem
para a explicao da variabilidade dos dados, com a menor perda de informao. A
anlise modo-Q usada para agrupamento de indivduos em classes/grupos
homogneos, atravs de caractersticas comuns entre os indivduos.

18

2.3.1. Anlise em Componentes Principais

2.3.1.1. Introduo

A anlise em componentes principais uma tcnica de anlise multivariada introduzida


pelo estatstico Karl Pearson em 1901 e mais tarde desenvolvida por Hotelling em 1933
(Mardia et al, 1979).

A anlise em componentes principais um mtodo de anlise multivariada que consiste


em transformar um conjunto de variveis originais correlacionadas num conjunto de
novas variveis no correlacionadas: as componentes principais. As variveis originais e
as componentes principais tm a mesma dimenso.
O principal objetivo da ACP a reduo da dimensionalidade, ou seja, a diminuio do
nmero de componentes, de forma a explicar a variabilidade dos dados. Esta reduo
consegue-se uma vez que as variveis originais esto correlacionadas, sendo algumas
delas redundantes, ao passo que as componentes principais so no correlacionadas,
podendo explicar a informao dada pelas variveis originais com um menor nmero de
componentes. Caso as variveis originais estejam fracamente correlacionadas, as
componentes principais vo coincidir com as variveis originais.

Estas novas variveis (as componentes principais) so uma combinao linear das
variveis originais, com uma ordem decrescente de importncia. A primeira
componente principal a mais importante, uma vez que descreve a maior parte da
variabilidade dos dados.

Pretende-se que este nmero de componentes principais seja o menor possvel, ou seja,
parte-se de p variveis originais para k componentes principais, com k muito inferior a
p, de modo que a perda de informao seja a menor possvel.
Assim sendo, se as variveis originais estiverem muito correlacionadas, o nmero de
componentes principais que expliquem a variabilidade reduzido. Caso as variveis
originais estejam pouco correlacionadas essa reduo pouco significativa.

19

2.3.1.2. O modelo matemtico

Considere-se o modelo matemtico para as componentes principais


Yj = a1jX1 + a2jX2 + + apjXp
ou, Y = AX, em que X1, , Xp so as variveis originais, Y1, , Yp so as
componentes principais no correlacionadas e de varincia decrescente e aij o peso da
j-sima varivel com a i-sima componente principal, representados na matriz A de
ordem p (Chatfield, 1980).

Para a determinao das componentes principais tem de se utilizar a matriz de


covarincias amostral ou a matriz de correlaes amostral. Quando as escalas de medida
das variveis so diferentes usa-se a matriz de correlaes amostral. Desta forma tornase possvel a comparao.
De salientar que, pelo facto de no existir invarincia de escala na ACP, as componentes
obtidas so diferentes quando se usa a matriz de covarincias e quando se usa a matriz
de correlaes. As componentes principais obtidas tambm so diferentes quando a
unidade de medida das variveis originais alterada (Gnanadesikan,1997).

Para determinar as componentes principais, comea-se por calcular os valores prprios


da matriz de correlaes amostral, seguidamente determinam-se os vetores prprios
associados a cada valor prprio.
Desta forma, cada componente principal um vetor prprio associado a cada um dos
valores prprios. Mais precisamente, a primeira componente principal corresponde ao
vetor prprio associado ao maior valor prprio. A segunda componente principal
corresponde ao vetor prprio associado ao segundo maior valor prprio e, assim por
diante, de modo que as componentes principais sejam ortogonais entre si.
Designam-se os valores prprios da matriz de correlaes amostral por
tem-se que

0. Estes valores prprios representam a varincia das

componentes principais, ou seja, var(Yj) =

. A ordenao das componentes principais

feita atravs da ordenao dos valores prprios, de modo que i-sima componente
principal corresponda o i-simo maior valor prprio.

20

No modelo matemtico para as componentes principais

com j = 1, , p, os aij so estimados de modo que a primeira componente contenha a


maior varincia (maior valor prprio) e assim por diante. Esses pesos so dados pelos
vetores prprios associados a cada valor prprio. Tem-se que,
= 1 com i = 1, , p e,
ai1aj1 + + aipajp = 0 para todo o i diferente de j.
Os pesos das componentes principais (aij) representam a importncia relativa das
variveis originais em cada componente principal.
Os yj observados designam-se por scores das componentes principais.
A correlao entre as variveis originais e as componentes principais designa-se por
loading. Estes fornecem a indicao de como as variveis originais so importantes para
a formao das componentes principais. Assim sendo, loadings prximos de um
indicam que essa varivel importante na formao da componente principal, enquanto
loadings prximos de zero indicam que a varivel no importante na formao da
componente principal. Os loadings so significantes se forem maiores que 0,3 em valor
absoluto. O loading da j-sima varivel com a i-sima componente principal dado por
, em que aij o peso da j-sima varivel com a i-sima componente
principal,

o valor prprio da i-sima componente principal e sj o desvio padro da

j-sima varivel.
A comunalidade da j-sima varivel dada por

, que se refere proporo

de varincia das variveis que so explicadas pelas componentes principais.


Neste processo, a varincia preservada, uma vez que a soma das varincias das
variveis originais igual soma das varincias das componentes principais.

21

2.3.1.3. Nmero de componentes a reter

Ao usar esta tcnica de anlise multivariada tem de se decidir o nmero de componentes


a reter, ou seja, quantas componentes so necessrias para explicar a variabilidade dos
dados. Desta forma, existem algumas regras para decidir o nmero de componentes
principais a reter, de modo que estas expliquem a variabilidade dos dados e que a perda
de informao seja a menor possvel.
Um primeiro critrio reter o nmero de componentes principais que expliquem pelo
menos 80% da variabilidade total. Sendo
e

a varincia total, tem-se que

sima componente principal e

a varincia da j-sima componente principal


a proporo explicada pela j a proporo explicada pelas k primeiras

componentes principais. Este valor deve ser superior a 80%.


O segundo critrio (critrio de Kaiser, proposto em 1960) consiste em excluir as
componentes principais cujos valores prprios sejam inferiores sua mdia aritmtica
(quando usada a matriz de correlaes, a mdia dos valores prprios um).
O terceiro critrio consiste em utilizar uma representao grfica do nmero de
componentes principais versus os valores prprios. Este grfico designa-se por scree
plot, proposto por Cattell em 1966. O grfico tem a forma de um cotovelo. Deve-se
reter o nmero de componentes principais at o grfico se tornar praticamente paralelo
ao eixo Ox, uma vez que esses valores prprios so muito reduzidos e praticamente
iguais, pouco ou nada contribuem para a explicao da variabilidade dos dados
(Rencher, 1995).

22

2.3.2. Anlise Fatorial

2.3.2.1. Introduo

A Anlise Fatorial comeou a ser desenvolvida pelo psiclogo Charles Spearman em


1904, para testar os fatores de inteligncia e habilidade nos jovens, quando realizados

testes a diferentes reas do conhecimento (cincias e humanidades). Mais tarde foi


tambm desenvolvida por Thurstone em 1931 (Harman, 1976).

A Anlise Fatorial uma tcnica de anlise multivariada que consiste em escrever p


variveis y1, y2, , yp como combinao linear de novas variveis f1, f2, , fm, com m
menor que p. Estas novas variveis designam-se por fatores latentes, sendo no
observadas. As variveis y1, y2, , yp so moderadamente correlacionadas (Rencher,
1995).
O objetivo da anlise fatorial reduzir o nmero de fatores latentes, de forma a explicar
a maior correlao existente no conjunto de dados. Pretende-se exprimir o que de
comum existe nas variveis iniciais, de modo a perder-se a menor informao possvel.

2.3.2.2. O modelo matemtico

Considere-se o modelo matemtico para a anlise fatorial:

Ou, alternativamente, usando notao matricial, Y =

, onde

y = [y1, y2, , yp]T o vetor das variveis, f = [f1, f2, , fm]T o vetor dos fatores
comuns ,

o vetor dos fatores especficos e

a matriz dos pesos fatoriais, que no nica.


Assim sendo, cada varivel decomposta em duas: a parte comum e a parte especfica.
Os coeficientes

so designados por loadings ou pesos, que permitem mostrar de que

modo a varivel yi depende do fator fj. Estes loadings representam a covarincia entre
23

as variveis e os fatores, ou seja, cov(yi, fj) =

com i = 1, , p e j = 1, , m desde

que cov(y, f) = .
Tem-se que E(fj) = 0, var(fj) = 1, cov(fi, fj) = 0, i
O

j.

a parte residual de Yi, tendo-se E( ) = 0, var(

especfica, cov(

) = 0, i

Tem-se ainda que var(Yi) =

j e cov(
+

, que a varincia

fj) = 0 para todo i e j.


++

comunalidade, que se refere varincia comum e

, em que

a varincia especfica ou nica,

que se refere varincia residual (Rencher, 1995).

Se a matriz de correlaes tiver valores elevados significa que as variveis tm bastante


em comum, formando grupos homogneos. Se os valores das correlaes forem
reduzidos, significa que as variveis tm pouco ou nada em comum, formando grupos
heterogneos.

2.3.2.3. Nmero de fatores a reter

Na anlise em componentes principais tinha de se selecionar um nmero de


componentes mais reduzido, ou seja, era necessrio analisar o nmero de componentes a
reter de modo que estas explicassem a variabilidade dos dados, mas tambm que o seu
nmero fosse bastante reduzido. Teria de se encontrar uma relao parcimoniosa, no
sentido de no se usar um nmero excessivo de componentes, mas tambm de no se
perder informao preciosa. Na anlise fatorial pretende-se fazer algo semelhante,
decidir o nmero de fatores a reter de modo a explicar pelo menos 80% da variabilidade
total. Escolher um nmero de fatores igual ao nmero de valores prprios maiores que a
mdia dos valores prprios. Se for utilizada a matriz de correlaes (R), a mdia 1, se
for utilizada a matriz de covarincias (S), a mdia

, em que

o valor prprio

da matriz S. semelhana da anlise em componentes principais, pode-se usar o teste


do scree plot dos valores prprios de S ou R versus o nmero de fatores. O grfico
obtido apresenta inicialmente uma acentuada inclinao e no final uma reduzida
inclinao, pelo que os valores prprios sero praticamente iguais e reduzidos. Deve-se
ento reter o nmero de fatores (m) a partir dos quais o grfico fica uma reta paralela ao
eixo das abcissas, tendo este grfico a forma de um cotovelo (Rencher, 1995).

24

2.3.2.4. Rotao dos fatores

Para uma melhor interpretao dos fatores obtidos inicialmente, recorre-se rotao dos
eixos. Existem vrias tcnicas de rotao.
Este mtodo de rotao consiste na transformao da soluo inicial atravs da
multiplicao de uma matriz de rotao ortogonal pela matriz dos loadings, de modo
que a soluo seja interpretada de uma forma mais eficiente. Com esta rotao pretendese aumentar os valores absolutos dos grandes loadings e reduzir os valores absolutos
dos pequenos loadings, distinguindo assim loadings significantes de loadings
insignificantes.
As rotaes podem ser ortogonais ou oblquas. As mais utlizadas so as ortogonais,
destacando-se, a rotao varimax, a rotao quartimax e a rotao equimax.

Com o mtodo varimax pretende-se maximizar a varincia dos loadings de cada coluna
da matriz

, de forma a existirem alguns loadings significativos e todos os

outros prximos de zero. Pretende-se maximizar V, com a restrio das comunalidades


permanecerem inalteradas.
Para um dado fator j, tem-se
, onde
variveis no fator j,

a varincia da comunalidade das

o quadrado do loading da i-sima varivel no j-simo fator,

a mdia do quadrado dos loadings para o fator j, p o nmero de


variveis e k o nmero de fatores.
A varincia total V de todos os fatores dada por:

Este mtodo, desenvolvido por Kaiser em 1958, tornou-se muito popular.

Com o mtodo quartimax pretende-se simplificar as linhas da matriz de loadings, ou


seja, tornar os loadings de cada varivel elevados para um pequeno nmero de fatores e
prximos de zero para os restantes. Pretende-se maximizar Q, com a restrio das
comunalidades no se alterarem.

25

Para uma dada varivel i, tem-se


, onde
varivel i e

a varincia da comunalidade na

a mdia do quadrado dos loadings na varivel i.

A varincia total Q de todas as variveis dada por:

Com o mtodo equamax pretende-se fazer uma mistura dos dois anteriores mtodos
(Afifi, 1996, Harman, 1976, Rencher, 1995, Sharma, 1996 e Timm, 2002).

2.3.2.5. Mtodo de extrao dos fatores

Os mtodos de extrao dos fatores disponveis no SPSS so: mtodo das componentes
principais (principal components), mtodo da mxima verosimilhana (maximum
likelihood), mtodo dos mnimos quadrados (unweighted least squares and generalized
least squares), principal axis factoring, alpha factoring e image factoring.

Com estes mtodos procede-se extrao dos fatores e consequentemente estimao


dos loadings e das comunalidades.

O mtodo das componentes principais bastante usual. O SPSS utiliza-o por defeito.

26

2.3.2.6. Validao do modelo de anlise fatorial

Para avaliar a qualidade da anlise efetuada realizam-se alguns testes. A anlise fatorial
usada para descrever as correlaes entre as variveis. Deste modo, torna-se
necessrio que a matriz de correlaes seja significativamente diferente da matriz
identidade, efetuando-se o teste de esfericidade de Bartlett. Este teste usa-se para
testar H0: R = I versus H1: R

I, em que R a matriz de correlaes amostral e I a

matriz identidade.
A estatstica de teste (n 1

com distribuio qui-

quadrado com p (p - 1) graus de liberdade (Rencher, 1995).


Para avaliar se a anlise fatorial adequada aos dados usa-se a medida de adequao
de amostragem de Kaiser-Meyer-Olkin (KMO) ou measure of sampling adequacy
(MSA), proposta por Kaiser em 1970. Define-se por:
KMO / MSA =
onde R =

eQ=

= DR-1D, com D =

O KMO toma valores entre 0 e 1. Recomendam-se valores superiores a 0.8. Na tabela 1


encontra-se a escala de avaliao da anlise fatorial efetuada (Maroco, 2007, Reis, 2001
e Timm, 2002).

KMO / MSA

AF

0.9 1

Muito boa

0.8 0.9

Boa

0.7 0.8

Mdia

0.6 0.7

Medocre

0.5 -0.6

< 0.5

Inaceitvel

Tabela 1: Escala de avaliao da anlise fatorial

27

2.3.2.7. Anlise em Componentes Principais versus Anlise Fatorial

Na anlise fatorial escrevem-se as variveis como combinao linear dos fatores,


enquanto na anlise em componentes principais escrevem-se as componentes principais
como combinao linear das variveis, so procedimentos inversos. A anlise em
componentes principais permite explicar a maior parte da variabilidade total das
variveis, enquanto na anlise fatorial pretende-se explicar as correlaes entre as
variveis. No caso da ACP as componentes principais obtidas so nicas, no caso da AF
os fatores dependem da rotao efetuada. No caso da ACP a soluo obtida pode ser
diferente se usada uma escala de medio diferente, enquanto na AF, h invarincia de
escala, ou seja, as solues so invariantes com a mudana da escala de medio.
Quando se aumenta o nmero de componentes retidas, as primeiras componentes
principais mantm-se inalteradas, enquanto na anlise fatorial, os fatores podem tornarse bastante diferentes quando o nmero de fatores retidos modificado. (Everitt, 2011 e
Maroco, 2007).

28

2.3.3. Anlise de Clusters

2.3.3.1. Introduo

A anlise de clusters uma tcnica de anlise multivariada que tem como principal
objetivo o agrupamento de elementos. Este agrupamento efetuado de forma que
elementos pertencentes ao mesmo grupo tenham caractersticas semelhantes e
elementos de diferentes grupos tenham caractersticas dissemelhantes. Genericamente,
parte-se de um conjunto com n observaes e pretende-se formar k grupos com um
menor nmero de observaes.
Para a construo desses grupos usam-se mtodos hierrquicos ou mtodos no
hierrquicos. Entre os mtodos hierrquicos, estes podem ser aglomerativos ou
divisivos.

Considere-se um conjunto de n observaes e p variveis dispostos na seguinte matriz


de ordem n

p,
.

O elemento

representa o valor do objeto (indivduo) i na varivel j.

Seguidamente constri-se a matriz D de ordem n, dada por

, em

que dkl representa a distncia entre os objetos k e l, com k, l = 1, , n. Esta matriz


designa-se por matriz de proximidade.
Deste modo, o passo que se segue escolher a medida de proximidade entre os
indivduos (Everitt et al, 2001, Maroco, 2007 e Reis, 1997).

29

2.3.3.2. Medidas de proximidade

Para a construo da matriz de proximidade D, definida anteriormente, necessrio


selecionar uma medida de proximidade, podendo ser uma medida de distncia, de
dissemelhana ou de semelhana.
Segundo Everitt (2001), dois indivduos esto prximos se a dissemelhana ou a
distncia entre eles pequena ou, se a semelhana entre eles grande.

Uma medida de semelhana caracteriza-se pelas seguintes propriedades:


1) 0

2)

=1

3)

onde

denota a medida de semelhana entre os indivduos i e j.

Nos dados categricos habitual usar-se uma medida de semelhana.

Uma medida de dissemelhana caracteriza-se pelas seguintes propriedades:


1)

2)

=0

3)

onde

denota a medida de dissemelhana entre os indivduos i e j.

Uma medida de distncia caracteriza-se pelas seguintes propriedades:


1)

2)

=0

3)

4)
onde

(desigualdade triangular)
denota a medida de distncia entre os indivduos i e j.

30

Apresentam-se em seguida algumas medidas de distncia (Everitt et al, 2001 Maroco,


2007, Reis, 1997 e Timm, 2002).

1)

Distncia Euclidiana
=

2)

Quadrado da Distncia Euclidiana

3)

Distncia de Manhattan ou distncia absoluta ou City-Block Metric

4)

Distncia de Minkowski

uma generalizao da distncia Euclidiana e coincidem quando r = 2.

5)

Distncia de Mahalanobis

onde S denota a matriz de covarincias amostral.

A medida de distncia mais usada a euclidiana.

Em seguida, definem-se algumas medidas de dissemelhana.

1) Correlao de Pearson:
com

31

onde

2) Separao Angular
com

2.3.3.3. Mtodos de agregao

Um dos objetivos da anlise de clusters reduzir a distncia dentro dos grupos e


aumentar a distncia entre os grupos.

Aps selecionada a medida de proximidade e construda a respetiva matriz de


proximidade, pretende-se saber quantos clusters se obtm. Assim sendo, para a
determinao desses k grupos usam-se mtodos hierrquicos ou mtodos no
hierrquicos. Quanto aos mtodos hierrquicos, estes podem ser aglomerativos ou
divisivos. Um processo diz-se aglomerativo se no final do processo se obtm um nico
cluster com todos os elementos e diz-se divisivo se no fim do processo existirem n
clusters com um nico elemento cada.
Em qualquer dos mtodos tem-se como objetivo a escolha da soluo tima, ou seja,
nmero timo de clusters. Essa deciso fica a cargo do investigador.
As etapas resultantes deste processo hierrquico (aglomerativo ou divisivo) podem ser
representadas atravs de um grfico o dendograma (Everitt, 2001).
Os mtodos aglomerativos so os mais utilizados.

32

2.3.3.4. Critrios de agregao

Aps definidas as medidas de proximidade entre dois elementos, necessrio definir


medidas de proximidade entre os clusters, ou seja, definir critrios de agregao entre os
grupos (Everitt et al, 2001 Maroco, 2007, Reis, 1997 e Timm, 2002).

1)

Complete Linkage ou mtodo do vizinho mais afastado

A distncia entre dois grupos medida como sendo a distncia mxima entre um par de
objetos, entre todos os clusters. Utilizando este critrio os clusters obtidos so mais
compactos.

2)

Single Linkage ou mtodo do vizinho mais prximo

A distncia entre dois grupos medida como sendo a distncia mnima entre um par de
objetos, entre todos os clusters. Utilizando este critrio os clusters obtidos so
desequilibrados e desalinhados, em particular quando o nmero de dados elevado.

3)

Average Linkage

A distncia entre dois grupos medida como sendo a mdia da distncia entre todos os
pares de objetos dos dois grupos. Utilizando este critrio os clusters obtidos tm
pequenas varincias.
Este um critrio intermdio entre o Complete Linkage e o Single Linkage, sendo
relativamente robusto.

4)

Critrio do Centride

A distncia entre dois grupos medida como sendo a distncia entre os seus centrides.
Cada centride corresponde mdia ponderada dos elementos dos dois grupos.

33

5)

Critrio de Ward

Neste mtodo no so calculadas distncias, formam-se os clusters de modo a


minimizar a soma dos quadrados dos erros.

No que se segue, apresentam-se as etapas do mtodo hierrquico aglomerativo.

Agrupamento hierrquico (mtodo aglomerativo):


Dada a matriz de proximidades D = [dij] de ordem n

n, seguem-se os passos seguintes

(Timm, 2002):
1.

Comea-se com n clusters, cada um deles com um elemento.

2.

Usando a matriz D, escolhemos os elementos mais semelhantes, digamos i e j.

3.

Juntam-se esses dois elementos, i e j, formando um novo cluster (ij).


Recalculam-se as distncias entre o novo cluster (ij) e os elementos j existentes,
usando o critrio de agregao selecionado. Obtm-se uma nova matriz de
proximidade de ordem (n 1)

4.

(n 1).

Repetem-se os passos 2 e 3, (n 1) vezes.

Nota: O agrupamento no hierrquico no ser considerado neste trabalho.

34

Captulo 3: Anlise de dados hidrogeolgicos


O estudo baseia-se num conjunto de 48 amostras de gua subterrnea recolhidas em
furos, minas, nascentes e poos da cidade de Lisboa, conforme se pode visualizar na
figura 2. Utilizam-se as anlises qumicas dessas 48 amostras de gua e selecionam-se
13 variveis referentes a parmetros fsico-qumicos e espcies dissolvidas (anies e
caties). Mais precisamente:

Os parmetros fsico-qumicos: o pH, a condutividade eltrica (C.E.) e o


potencial redox (Eh);

), o clcio (Ca2+), o sdio (Na+), o

As espcies dissolvidas: o bicarbonato (

potssio (K+), o magnsio (Mg2+), o fluoreto (


(

), o nitrato (

) e o sulfato (

), o cloreto (

), o brometo

).

As amostras de guas subterrneas agora utilizadas no foram recolhidas


especificamente para este trabalho, resultaram de recolhas para a concretizao de
unidades curriculares do 1 ciclo de estudos em Geologia da FCUL (Caria et al, 2009,
Manca et al, 2008 e Sanches et al, 2006) e 2 ciclo de estudos em Geologia Aplicada e
do Ambiente da FCUL (Oliveira, 2010) e em Engenharia do Ambiente do IST (Lopes,
2007).

35

Figura 2: Localizao geogrfica das amostras de gua

Como j foi referido anteriormente, a geologia de Lisboa de grande complexidade,


pelo que, para facilitar a anlise estatstica das amostras de gua, as formaes
geolgicas foram agrupadas, tendo em conta as suas semelhanas litolgicas, da
seguinte forma: Aluvies (1); Formao de Benfica (2); Complexo Vulcnico de Lisboa
(CVL) (3); Calcrios de Entrecampos (4); Areolas da Estefnia e Areias do Vale de
Chelas (5) e Argilas do Forno do Tijolo e Argilas e Calcrios dos Prazeres (6).
Na figura 3 encontram-se as localizaes das amostras recolhidas e a respetiva formao
geolgica aflorante.

36

Figura 3: Localizao geogrfica das amostras de gua e respetivas formaes geolgicas

37

A partir da figura 3 pode construir-se a tabela 2 em que se indica a provenincia de cada


amostra.

Grupos de formaes geolgicas

Amostras recolhidas

(1) Aluvies

Lis10/ Lis11/ Lis12/ Lis13/ Lis16 / Lis37

(2) Formao de Benfica

Lis23/ Lis24/ Lis25/ Lis26/ Lis28/ Lis31/


Lis33/ Lis34/ Lis35/ Lis36/ Lis46

(3) CVL

Lis27/ Lis29/ Lis30/ Lis32/ Lis44/ Lis47/ Lis48

(4) Calcrios de Entrecampos

Lis1/ Lis2/ Lis5/ Lis14/ Lis17/ Lis19

(5) Areolas da Estefnia e Areias

Lis3/ Lis4/ Lis6/ Lis15/ Lis18/ Lis20/ Lis21/

do Vale de Chelas

Lis38/ Lis39/ Lis40/ Lis41/ Lis45

(6) Argilas do Forno do Tijolo e

Lis7/ Lis8/ Lis9/ Lis22/ Lis42/ Lis43

Argilas e Calcrios dos Prazeres


Tabela 2: Provenincia das amostras

38

3.1. Anlise Exploratria dos Dados

3.1.1. Caractersticas amostrais

Na tabela 3 encontram-se algumas caractersticas amostrais obtidas para as 48 amostras


de gua provenientes de 6 grupos de formaes geolgicas distintas:
Variveis

Mdia

pH
C.E.
Eh

7,53
1161,96
30,43
359,3
123,17
99,31
16,40
32,39
0,26
93,48
0,44
43,35
138,20

Ca2+
Na+
K+
Mg2+

Desvio
Mediana
Padro
0,80
7,460
364,27 1174,500
151,13
34,250
111,55 374,000
49,39 114,500
52,83
89,450
23,21
8,550
20,45
28,650
0,22
0,185
43,72
88,100
0,83
0,180
48,13
30,800
111,88 113,700

1 Quartil

3 Quartil Mnimo Mximo

6,985
8,030
6,13
10,45
953,500 1411,500 395,00 2220,00
-102,100 187,000 -258,10 248,00
291,120 426,500
43,00 575,00
82,000 152,500
40,00 245,60
67,650 132,000
9,70 275,40
3,035
17,200
0,00 109,00
17,650
42,300
0,00
91,40
0,132
0,335
0,00
1,01
58,950 118,900
18,50 195,00
0,000
0,385
0,00
3,40
5,785
52,250
0,00 206,00
71,800 160,750
6,10 653,00

Tabela 3: Caractersticas amostrais das variveis (amostra global)

Da anlise da tabela 3, podem-se observar algumas caractersticas amostrais para as 13


variveis em estudo. O pH das amostras recolhidas varia entre 6.13 e 10.45, as amostras
de gua Lis4, Lis13, Lis5, Lis6 e Lis9 tm valores de pH 6.13, 6.20, 6.25, 6.26 e 10.45,
respetivamente, que esto fora dos valores paramtricos, de acordo com o Decreto Lei
306-2007 da qualidade da gua para consumo humano (o pH deve estar compreendido
entre 6.5 e 9, inclusive). A condutividade eltrica varia entre 395 e 2220 S/cm e a sua
mediana (1174.5 S/cm) superior mdia (1161.96 S/cm). O Eh varia entre -258.1 e
248 mV e tem mediana (34.25 mV) superior mdia (30.43 mV). Como existem
valores Eh positivos e negativos a variabilidade em torno da mdia muito grande,
sendo o desvio padro elevado (151.13 mV) e a mdia relativamente baixa (30.43 mV).
As concentraes do io bicarbonato variam entre 43 e 575 mg/L, apresentando uma
mediana (374 mg/L) superior mdia (359.3 mg/L). As concentraes do io clcio
variam entre 40 e 245,6 mg/L, existindo um grande nmero de amostras de gua com
concentraes deste io superiores ao valor paramtrico (100 mg/L), mais precisamente
29 amostras de gua. As concentraes do io sdio variam entre 9.7 e 275.4 mg/L e
39

apresentam uma grande variabilidade em torno da mdia, sendo o desvio padro 52.83
mg/L. As amostras Lis21 e Lis31 apresentam concentraes, deste io, de 275.4 e 217
mg/L, respetivamente, acima do valor paramtrico (200 mg/L). As concentraes do io
potssio variam entre 0 e 109 mg/L. O desvio padro elevado (23.21 mg/L), em
comparao com a mdia (16.4 mg/L). Das 48 amostras, 19 apresentam concentraes
do io potssio acima do valor paramtrico (12 mg/L) e 20 amostras tm concentraes
inferiores a 6 mg/L. Deste modo, a variabilidade em torno da mdia muito grande. As
concentraes do io magnsio variam entre 0 e 91.4 mg/L. Nas amostras Lis22, Lis16,
Lis20, Lis48, Lis47, Lis43 e Lis30 as concentraes deste io so 91.4, 73.5, 69.5, 65.1,
65, 60.3 e 57.5 mg/L, respetivamente. Todas essas concentraes so superiores ao
valor paramtrico (50 mg/L). As concentraes do io fluoreto variam entre 0 e 1.01
mg/L. A variabilidade em torno da mdia muito elevada, sendo a mdia de 0.26 mg/L
e o desvio padro de 0.22 mg/L. As concentraes do io cloreto variam entre 18.5 e
195 mg/L. As concentraes do io brometo variam entre 0 e 3.4 mg/L. Das 48
amostras, 40 apresentam concentraes deste io inferior a 0.5 mg/L e em 17 dessas 40
amostras no se deteta a presena deste io (0 mg/L). Desta forma, a variabilidade em
torno da mdia muito grande, sendo o desvio padro de 0.83 mg/L e a mdia de
0.44mg/L. As concentraes do io nitrato variam entre 0 e 206 mg/L. Das 48 amostras,
12 apresentam uma concentrao superior ao valor paramtrico (50 mg/L). A
variabilidade em relao mdia elevada, sendo a mdia e o desvio padro 43.35 e
48.13 mg/L, respetivamente. As concentraes do io sulfato variam entre 6.1 e 653
mg/L. Nas amostras Lis21, Lis9, Lis42 e Lis37 as concentraes deste io so 653,
459.2, 329 e 271 mg/L, respetivamente, todas superiores ao valor paramtrico (250
mg/L). O desvio padro muito grande (111.88 mg/L) indicador de uma grande
variabilidade em torno da mdia.

Sobre a qualidade da gua para consumo humano pode-se aferir que, das 48 amostras de
gua, apenas 8 (Lis7, Lis12, Lis27, Lis29, Lis30, Lis33, Lis36 e Lis44) so
consideradas apropriadas para o consumo humano, embora fosse necessrio averiguar
se, do ponto de vista bacteriolgico, estariam de acordo com as recomendaes da
legislao que regula a qualidade das guas para o consumo humano.

Tal como sugere a tabela 2, a amostra global das 48 amostras de gua pode ser
subdividida em 6 amostrais parciais, correspondendo a cada grupo de formaes
40

geolgicas. Desta forma, na tabela 4 encontram-se as caractersticas amostrais (mdia e


desvio padro) das 48 amostras de gua separadas pelos grupos de formaes
geolgicas a que pertencem.

Por observao da tabela 4, pode afirmar-se que o pH mdio nas Aluvies e nas Areolas
da Estefnia e Areias do Vale de Chelas praticamente igual, 7.39 e 7.38,
respetivamente. A variabilidade em torno da mdia inferior nas Areolas da Estefnia e
Areias do Vale de Chelas. A maior mdia e o maior desvio padro surgem no grupo de
formaes geolgicas Argilas do Forno do Tijolo e Argilas e Calcrios dos Prazeres,
tomando os valores de 7.87 e de 1.49, respetivamente. Os Calcrios de Entrecampos
apresentam o menor pH mdio de valor 7.2. O menor desvio padro surge na Formao
de Benfica, cujo valor 0.32. Embora a mdia seja relativamente alta, cujo valor 7.71.
Quanto condutividade eltrica, na Formao de Benfica e no CVL as mdias so
inferiores a 950

S/cm, enquanto nas restantes formaes geolgicas as mdias

ultrapassam os 1200 S/cm. A menor variabilidade em torno da mdia verifica-se no


CVL, onde o desvio padro 131.79 S/cm e a maior variabilidade em torno da mdia
ocorre nas Aluvies, onde o desvio padro 466.19 S/cm.
Quanto ao Eh, a sua mdia positiva na Formao de Benfica e no CVL, sendo 192.34
e 143.71 mV, respetivamente; a mdia negativa nas restantes formaes.
Relativamente variabilidade em torno da mdia menor na Formao de Benfica e
nos Calcrios de Entrecampos, cujo desvio padro 42.34 mV e 41.59 mV,
respetivamente.
Quanto ao io bicarbonato, verifica-se a maior variabilidade em torno da mdia nas
Argilas e a menor no CVL, sendo o desvio padro de 189.99 e 48.72 mg/L,
respetivamente. A maior concentrao mdia encontra-se nos Calcrios de Entrecampos
(415.17 mg/L) e a menor na Formao de Benfica (278.61 mg/L).
Quanto ao io de clcio, observa-se que a maior concentrao mdia nas Aluvies
(172.97 mg/L), enquanto as menores concentraes mdias so na Formao de Benfica
e no CVL, cujos valores so 88.15 e 80.86 mg/L, respetivamente. Tambm estas duas
ltimas apresentam a menor variabilidade em torno da mdia, uma vez que os seus
desvios padro so os menores, 15.88 mg/L no CVL e 29.21 mg/L na Formao de
Benfica.
Quanto ao io sdio, a menor concentrao mdia no CVL (58.69 mg/L) e a maior
na Areolas da Estefnia e Areias do Vale de Chelas (123.58 mg/L). A menor
41

variabilidade em torno da mdia surge nos Calcrios de Entrecampos, onde o desvio


padro 21.72 mg/L.
Quanto ao io potssio, as suas concentraes mdias tomam valores bastante
diferentes, nomeadamente, as Aluvies e o CVL tm mdias mais reduzidas (5.7 e 3.7
mg/L, respetivamente), enquanto os Calcrios de Entrecampos e as Areolas da Estefnia
e Areias do Vale de Chelas tm mdias muito elevadas (27.35 e 33.54 mg/L,
respetivamente). Para este io, em todas as formaes geolgicas verifica-se uma
grande variabilidade em torno da mdia, visvel atravs do seu desvio padro elevado,
destacando as Areolas da Estefnia e Areias do Vale de Chelas com o maior desvio
padro (34.13 mg/L).
Quanto ao io magnsio, nas Aluvies a mdia no muito elevada (28.63 mg/L), mas
a variabilidade em torno da mdia muito elevada, uma vez que o seu desvio padro
23.61 mg/L. No CVL a concentrao mdia a mais elevada (53.63 mg/L), mas a
variabilidade em torno da mdia a menor, uma vez que o desvio padro 10.04 mg/L.
A menor mdia (21.20 mg/L) nos Calcrios de Entrecampos e a maior variabilidade
em torno da mdia nas Argilas do Forno do Tijolo e Argilas e Calcrios dos Prazeres,
cujo desvio padro 29.20 mg/L.
Quanto ao io fluoreto, a menor concentrao mdia (0.11 mg/L) surge no CVL,
enquanto a maior concentrao mdia (0.39 mg/L) surge nas Argilas. O mesmo se pode
afirmar quanto variabilidade em torno da mdia, pois o desvio padro no CVL 0.08
mg/L e nas Argilas 0.33 mg/L. Os Calcrios de Entrecampos e as Areolas da Estefnia
e Areias do Vale de Chelas apresentam a mesma concentrao mdia (0.31 mg/L), mas
a variabilidade em torno da mdia muito inferior nos Calcrios de Entrecampos, uma
vez que o desvio padro consideravelmente inferior, sendo 0.13 mg/L nos Calcrios
de Entrecampos e 0.30 mg/L nas Areolas da Estefnia e Areias do Vale de Chelas.
Quanto ao io cloreto, o CVL aparece como a formao geolgica com a menor
concentrao mdia deste io (61.16 mg/L). As Aluvies, as Areolas da Estefnia e
Areias do Vale de Chelas e as Argilas aparecem com as maiores concentraes mdias
deste io, em torno dos 100 mg/L, destacando as Aluvies cuja concentrao mdia a
mais elevada (105.13 mg/L). A maior variabilidade em torno da mdia ocorre nas
Aluvies e nas Argilas, onde os desvios padro so 61.65 e 70.93 mg/L, respetivamente,
em oposio menor variabilidade que ocorre nos Calcrios de Entrecampos, cujo
desvio padro 18.12 mg/L.

42

Quanto ao io brometo, a variabilidade em torno da mdia bastante elevada, em


particular nas Aluvies, nas Areolas da Estefnia e Areias do Vale de Chelas e nas
Argilas, onde os desvios padro tomam os valores de 1.23, de 1.06 e de 1.23 mg/L,
respetivamente. As concentraes mdias, deste io, tambm so elevadas nestas
formaes geolgicas, nas Aluvies 0.85 mg/L, nas Areolas 0.66 mg/L e nas Argilas
0.82 mg/L. Nos Calcrios de Entrecampos a concentrao mdia bem menor (0.14
mg/L), mas a variabilidade em torno da mdia muito elevada (0.17 mg/L). O CVL
aparece como a formao geolgica que tem a menor concentrao mdia deste io,
cujo valor 0.05 mg/L.
Quanto ao io nitrato, as Argilas apresentam a menor concentrao mdia (5.67 mg/L),
por sua vez a variabilidade em torno da mdia muito elevada (7.9 mg/L). A maior
concentrao mdia (79.72 mg/L) deste composto ocorre na Formao de Benfica. As
Aluvies e as Areolas da Estefnia e Areias do Vale de Chelas apresentam
concentraes mdias prximas dos 50 mg/L e desvios padro elevados.
Quanto ao io sulfato, a maior concentrao mdia (223.7 mg/L) deste composto ocorre
nas Argilas e a menor concentrao mdia (71.73 mg/L) no CVL. A formao de
Benfica e o CVL apresentam valores mdios e desvios padro semelhantes e baixos.

43

1
Mdia
pH
C.E.
Eh
Ca2+
Na+
K+
Mg2+

7,39
1266,33
-76,15
360,33
172,97
78,88
5,70
28,63
0,32
105,13
0,85
49,02
171,15

2
Desvio
Padro
0,95
466,19
109,83
95,85
60,00
36,76
4,70
23,61
0,16
61,65
1,23
43,92
95,55

Mdia
7,71
934,45
192,34
278,61
88,15
94,32
10,08
25,15
0,18
93,77
0,18
79,72
81,53

Desvio
Padro
0,32
298,32
42,35
108,39
29,21
53,33
7,12
11,90
0,09
38,08
0,12
68,93
24,97

Formaes geolgicas
3
4
5
Desvio
Desvio
Mdia
Mdia
Mdia
Padro
Padro
7,59
0,34
7,20
0,80
7,38
844,71 131,79 1226,33 194,72 1333,92
143,71 108,16 -113,18
41,59
-27,44
382,12
48,72 415,17 137,02 378,25
80,86
15,88 124,00
38,40 141,28
58,69
24,38 108,15
21,72 123,58
3,70
5,60
27,35
29,56
33,54
53,63
10,04
21,20
12,76
27,48
0,11
0,08
0,31
0,13
0,31
61,16
22,58
87,90
18,12 103,98
0,05
0,05
0,14
0,17
0,66
18,90
20,50
30,43
14,48
46,76
71,73
26,02 116,57
30,58 180,53

6
Desvio
Desvio
Mdia
Padro
Padro
0,83
7,87
1,49
343,64 1436,50 314,94
133,30 -32,62 131,83
52,49 385,83 189,99
42,07 149,87
46,15
62,02 118,87
68,66
34,13
8,27
9,40
18,71
45,67
29,20
0,30
0,39
,33
38,40 103,57
70,93
1,06
0,82
1,23
41,81
5,67
7,90
152,99 223,70 160,79

Tabela 4: Caractersticas amostrais (mdia e desvio padro) das variveis em cada grupo de formaes geolgica

44

3.1.2. Correlao linear de Pearson

Na amostra global as correlaes apresentam valores baixos, inferiores a 0.8 em


mdulo, veja-se o anexo 4.
As tabelas da matriz de correlaes entre as variveis, em cada um dos grupos de
formaes geolgicas, encontram-se em anexo (anexo 5 a 10).
Nas Aluvies, apenas 7 pares de variveis tm valores de correlao superiores a 0.8,
salientando a condutividade eltrica com o sdio e o sdio com o cloreto que
apresentam valores de correlaes muito elevados. Deste modo, pode afirmar-se que
amostras com menores concentraes de sdio tm menor condutividade eltrica e
menores concentraes de cloreto, assim como amostras com maiores concentraes de
sdio tm maior condutividade eltrica e maiores concentraes de cloreto.
Na Formao de Benfica, apenas 4 pares de variveis apresentam valores de correlao
linear superior a 0.8. Existem 10 pares de variveis cujos valores das correlaes so
inferiores a 0.8, em mdulo, porm, significantes2. O cloreto com o sdio, com a
condutividade eltrica e o com brometo e o magnsio com a condutividade eltrica.
Assim sendo, nestas amostras, quanto maior for a concentrao de cloreto, maior a
concentrao de sdio e de brometo, bem como os nveis de condutividade eltrica.
No Complexo Vulcnico de Lisboa existem 5 pares de variveis com valores de
correlao superiores a 0.8, em mdulo, dos quais dois pares tm valores de correlao
negativos. O Eh correlaciona-se negativamente com o clcio e com o magnsio, ou seja,
medida que os valores de Eh aumentam as concentraes de clcio e de magnsio
diminuem. O sdio correlaciona-se positivamente com o bicarbonato e com o nitrato.
Deste modo, amostras com pequenas (ou grandes) concentraes de sdio tm pequenas
(ou grandes) concentraes de bicarbonato e de nitrato. Existe um par de variveis com
valor de correlao abaixo de 0.8, mas significante.
Nos Calcrios de Entrecampos existem 8 pares de variveis com valores de correlao
superiores a 0.8, em mdulo. Desses valores, dois so negativos. O fluoreto
correlaciona-se negativamente com a condutividade eltrica e com o magnsio. A

Uma correlao diz-se significante, se ao nvel de significncia 0.05 se rejeitar a hiptese nula no teste

45

condutividade eltrica e o magnsio correlacionam-se positivamente, tal como o nitrato


com o sulfato, com o Eh, com o bicarbonato e com o clcio.
Nas Areolas da Estefnia e Areias do Vale de Chelas existem 4 pares de variveis com
valores de correlao maiores que 0.8. A condutividade eltrica correlaciona-se
positivamente com o sdio e com o sulfato. Tambm existem 8 pares de variveis com
valores de correlaes inferiores a 0.8, mas significantes.
Nas Argilas do Forno do Tijolo e Argilas e Calcrios dos Prazeres existem 8 pares de
variveis que tm valores de correlao superiores a 0.8, em mdulo. Desses valores,
quatro so negativos, nomeadamente, o pH e o bicarbonato, o bicarbonato com o
potssio e com o nitrato e este ltimo com o sdio, e quatro so positivos; o pH com o
potssio e com o nitrato, a condutividade eltrica com o magnsio e o nitrato com o
potssio.

Mais frente, na seco 3.1.3 (representaes grficas) ser efetuada uma anlise dos
diagramas de disperso para alguns pares de variveis.

46

3.1.3. Representaes grficas

Nas figuras que se seguem podem observar-se os diagramas em caixa de bigodes


paralelos e os diagramas de disperso. Na figura 4 encontram-se os diagramas em caixa
de bigodes paralelos para cada varivel (comparando por formao geolgica) e na
figura 5 encontram-se os diagramas em caixa de bigodes paralelos para cada formao
geolgica (comparando por variveis).

47

Figura 4: Diagramas em caixa de bigodes paralelos de cada varivel comparando cada formao
geolgica

Para o pH, a amostra de gua Lis30 considerada outlier severo superior do CVL,
apesar de no ser o mximo da amostra global. Excluindo essa observao os valores do
pH no CVL so muito prximos, como visvel no respetivo diagrama em caixa de
bigodes. Em relao s Aluvies, Calcrios de Entrecampos e Areolas da Estefnia e
Areias do Vale de Chelas a variao dos valores do pH muito similar. Nas Argilas, se
excluir a amostra de gua Lis9, cujo valor de pH 10.45, tambm se encontra uma
distribuio idntica s anteriores.
Para a condutividade eltrica, a amostra de gua Lis21 outlier moderado superior das
Areolas da Estefnia e Areias do Vale de Chelas e tambm o maior valor da amostra
global. As amostras de gua do CVL so caracterizadas por apresentar baixa
condutividade eltrica.

48

Para o Eh, a amostra de gua Lis37 outlier moderado superior das Aluvies e a
amostra de gua Lis46 outlier severo inferior na Formao de Benfica, no sendo o
mximo nem o mnimo da amostra global, respetivamente. As amostras de gua
recolhidas nas Aluvies caracterizam-se pelos valores de Eh negativos, com exceo da
amostra de gua Lis37 que apresenta valor positivo. Nas amostras da Formao de
Benfica, se excluir o outlier, o Eh apresenta valores muito prximos e elevados, em
relao s outras formaes geolgicas. Nas amostras do CVL os valores de Eh so
maioritariamente positivos. Nas amostras dos Calcrios de Entrecampos os valores de
Eh so negativos. Nas amostras das Areolas e das Argilas o Eh apresenta valores, quer
positivos, quer negativos.
Quanto ao io bicarbonato, as amostras de gua Lis24 e Lis46 surgem como outliers da
Formao de Benfica, o primeiro severo superior e o segundo moderado inferior. As
amostras Lis44 e Lis47 aparecem como outliers do CVL, o primeiro severo inferior e
o segundo moderado superior. Nas amostras de gua do CVL, excluindo os outliers,
as concentraes deste io apresentam valores muito prximos. Nas amostras de gua
recolhidas nas outras formaes geolgicas a concentrao deste io apresenta uma
maior disparidade de valores, destacando as Argilas pela elevada variabilidade.
Quanto ao io de clcio, as amostras Lis24 e Lis47 so outliers moderados superiores da
Formao de Benfica e do CVL, respetivamente. As amostras de guas do CVL
caracterizam-se por baixas concentraes deste io e pela pequena variabilidade
relativamente s outras formaes geolgicas, enquanto as amostras das Aluvies
caracterizam-se por concentraes mais elevadas deste io.
Quanto ao io sdio, a amostra Lis31 representa um outlier moderado superior da
Formao de Benfica e a amostra Lis21 um outlier moderado superior das Argilas. As
amostras do CVL caracterizam-se por menores concentraes deste io, em relao s
outras formaes geolgicas.
Quanto ao io potssio, as amostras Lis32, Lis14 e Lis9 representam outliers para as
formaes CVL, Calcrios de Entrecampos e Argilas, respetivamente, sendo os dois
primeiros severos superiores e o ltimo moderado superior. Por observao do diagrama
em caixa de bigodes constata-se que nenhum destes outliers mximo na amostra
global. nas Areolas da Estefnia e Areias do Vale de Chelas que a concentrao e a
variabilidade so maiores. Sem considerar os outliers, as amostras do CVL e das
Argilas apresentam concentraes deste io muito baixas, bem como pequenas
variabilidades.
49

Quanto ao io magnsio, a amostra Lis16 outlier moderado superior das Aluvies. As


amostras de gua das Areolas e das Argilas apresentam grande variabilidade. As
amostras de gua provenientes do CVL caracterizam-se por valores mais altos do io
magnsio.
Quanto ao io fluoreto, as amostras do CVL apresentam baixas concentraes deste io,
relativamente s restantes formaes geolgicas. As amostras de gua das Areolas e das
Argilas apresentam uma grande variabilidade e diagramas em caixa de bigodes
idnticos.
Quanto ao io cloreto, a amostra Lis48 outlier severo superior do CVL. As amostras
do CVL caracterizam-se por baixas concentraes e pequena variabilidade. Nas
amostras das Aluvies e das Argilas as concentraes deste io e a variabilidade so
grandes. Os diagramas em caixa de bigodes relativos s amostras de gua da Formao
de Benfica e dos Calcrios de Entrecampos so idnticos.
Quanto ao io brometo, as amostras Lis13, Lis3 e Lis7 so outliers, respetivamente, das
Aluvies, Areolas e Argilas, o primeiro severo superior e os dois ltimos so
moderados superiores. As amostras do CVL, da Formao de Benfica e dos Calcrios
de Entrecampos apresentam baixas concentraes deste io.
Quanto ao io nitrato, as amostras Lis45 e Lis9 so outliers nas Areolas e nas Argilas,
respetivamente, o primeiro moderado superior e o segundo severo superior. As
Argilas caracterizam-se por reduzidas concentraes deste io. As amostras do CVL e
dos Calcrios de Entrecampos tm pequenas concentraes deste io. As amostras da
Formao de Benfica apresentam concentraes muito elevadas deste io, bem como
uma grande variabilidade.
Quanto ao io sulfato, as amostras Lis2 e Lis5 so outliers dos Calcrios de
Entrecampos, sendo o primeiro severo inferior e o segundo moderado superior. A
amostra Lis21 outlier severo superior das Areolas. As amostras da Formao de
Benfica e do CVL caracterizam-se por baixas concentraes deste io, enquanto as
amostras das Argilas tm concentraes muito elevadas deste io e com uma grande
variabilidade. Nas amostras dos Calcrios de Entrecampos, se excluir os outliers, a
variabilidade reduzida.

50

Figura 5: Diagramas em caixa de bigodes paralelos de cada formao geolgica, para cada io

51

A anlise dos diagramas em caixa de bigodes paralelos da figura 5 permite comparar as


concentraes dos ies dissolvidos nas diferentes amostras de gua, por cada formao
geolgica, para se compreender quais os ies que apresentam maiores concentraes e
quais os ies que apresentam menores concentraes. unnime afirmar que o io
bicarbonato apresenta as maiores concentraes, relativamente s concentraes dos
outros ies, qualquer que seja a formao geolgica, enquanto os ies fluoreto e
brometo apresentam concentraes mais reduzidas, comparando com as concentraes
dos demais ies dissolvidos nas amostras de gua. As concentraes dos ies clcio,
sdio e cloreto tambm so altas, comparando com os restantes ies. Particularmente,
em cada formao geolgica, pode ser efetuada uma comparao de concentraes dos
diferentes ies, para alm do referido.
Nas Aluvies os ies sulfato e nitrato apresentam altas concentraes, em oposio aos
ies potssio e magnsio, cujas concentraes so inferiores.
Na Formao de Benfica o io nitrato apresenta elevadas concentraes, em oposio as
concentraes dos ies potssio e magnsio so menores.
No CVL o io potssio apresenta baixas concentraes e o io magnsio,
comparativamente aos demais ies, apresenta concentraes mais altas, muito
semelhantes s concentraes dos ies clcio, sdio e cloreto. Ainda se pode observar a
existncia de reduzida variabilidade.
Nos Calcrios de Entrecampos as concentraes dos ies no so muito elevadas.
Nas Areolas da Estefnia e Areias do Vale de Chelas os ies potssio e nitrato
apresentam concentraes altas.
Nas Argilas do Forno do Tijolo e Argilas e Calcrios dos Prazeres as concentraes do
io sulfato so elevadas, em oposio s concentraes dos ies potssio e nitrato, que
so menores.

Nas representaes grficas seguintes pode observar-se a distribuio das amostras de


gua em cada formao geolgica e para cada varivel em estudo. Desta forma, a figura
6 contempla os diagramas de disperso das observaes reorganizadas (por formao
geolgica) versus cada uma das variveis em estudo.

52

Argilas e
Calcrios dos
Prazeres

Argilas
do Forno
do Tijolo

53

Figura 6: Diagramas de disperso das observaes reorganizadas versus cada uma das variveis em
estudo

partida seria espectvel que amostras de gua provenientes da mesma formao


geolgica teriam idntica composio qumica e amostras de gua provenientes de
diferentes formaes geolgicas teriam diferente composio qumica, permitindo a
natural separao das amostras por cada um dos grupos de formaes geolgicas, ou por
outras palavras, o natural agrupamento das amostras de gua provenientes do mesmo
grupo de formaes geolgicas.
Ao analisar-se os 13 diagramas de disperso, pode concluir-se que na maioria das
variveis observadas no existe esse agrupamento natural, ou essa separao natural,
como seria esperado. Na figura 6, tm-se as distribuies das concentraes dos ies e
54

das caractersticas fsico-qumicas em cada amostra de gua, para cada formao


geolgica, donde se pode observar a grande ou pequena disperso, bem como formao
ou no de grupos. Esta visualizao pode trazer muitas informaes, mas todas do ponto
de vista univariado. Na seco seguinte (3.2.), procede-se anlise multivariada.
Quanto ao pH, as amostras de gua provenientes das Aluvies, dos Calcrios de
Entrecampos, das Areolas e das Argilas apresentam grande variabilidade, enquanto na
Formao de Benfica e no CVL a variabilidade inferior. Desta forma, o pH caracteriza
estas duas ltimas formaes. Tambm evidente a inexistncia de grupos.
Quanto condutividade eltrica, as amostras de gua apresentam grande variabilidade,
exceto as provenientes do CVL e dos Calcrios de Entrecampos. No visvel uma
natural separao dos elementos pelas formaes geolgicas.
Quanto ao Eh, existem dois grupos, um com amostras de Eh positivo e outro com
amostras de Eh negativo. O Eh permite caracterizar a Formao de Benfica e os
Calcrios de Entrecampos, uma vez que, nas amostras provenientes da Formao de
Benfica o Eh sempre positivo e nas amostras dos Calcrios de Entrecampos sempre
negativo. Nas Argilas tambm existe uma separao. As amostras provenientes das
Argilas do Forno do Tijolo tm Eh negativo e as amostras provenientes das Argilas e
Calcrios dos Prazeres tm Eh positivo, como se pode observar na figura 6 (diagrama
relativo ao Eh). Nas Aluvies apenas a amostra Lis37 tem valor de Eh positivo (132.2
mV). No CVL todas as amostras apresentam valor positivo, com exceo das amostras
Lis47 e Lis48 que apresentam os valores -19 mV e 0 mV, respetivamente.
Quanto ao io bicarbonato, a disperso elevada. As concentraes deste io so
normalmente altas, embora existam duas amostras com reduzidas concentraes deste
io, uma proveniente da Formao de Benfica e outra das Argilas. Para cada formao
geolgica a variabilidade grande, o que no permite a caracterizao das formaes
geolgicas com este io. No evidente a existncia de grupos.
Quanto ao io clcio, existe uma grande disperso e a maioria das amostras de gua
tm concentraes elevadas deste io. Ao observar a figura 6 (diagrama relativo ao
clcio) visvel o elevado nmero de amostras que tm concentrao deste io acima do
valor paramtrico assinalado na representao grfica. Apenas na Formao de Benfica
e no CVL a maioria das amostras tem concentraes abaixo do valor paramtrico. Ainda
de notar que no CVL a variabilidade reduzida. Este io no permite caracterizar as
formaes geolgicas.

55

Quanto ao io sdio, existe uma grande disperso, mas apenas duas amostras tm
concentraes elevadas. As amostras provenientes do CVL tm menores concentraes
deste io, comparativamente s amostras dos Calcrios de Entrecampos. Tambm as
amostras provenientes destas ltimas formaes geolgicas tm menor variabilidade.
Quanto ao io potssio, existe uma grande disperso e um grande nmero de amostras
de gua com concentraes superiores ao valor paramtrico (12 mg/L) assinalado na
representao grfica da figura 6 (diagrama relativo ao potssio). As concentraes do
io potssio nas amostras de gua provenientes do CVL e das Aluvies so reduzidas e
idnticas. Se excluir a amostra de gua dos Calcrios de Entrecampos com elevada
concentrao e considerar as restantes amostras dos Calcrios de Entrecampos, as
amostras da Formao de Benfica e as amostras das Argilas, estas tm disperso
idntica. Nas Areolas da Estefnia e Areias do Vale de Chelas as concentraes e a
variabilidade deste io so elevadas.
Quanto ao io magnsio, existe grande disperso, com exceo das amostras
provenientes do CVL. Este io no permite a caracterizao das formaes geolgicas.
Quanto ao io fluoreto, as amostras de gua apresentam grande variabilidade. As
concentraes deste io nas amostras provenientes do CVL so reduzidas. Nas Aluvies
e nos Calcrios de Entrecampos a distribuio idntica. As amostras provenientes das
Areolas e Argilas apresentam grande variabilidade, onde duas amostras, uma das
Areolas e outras das Argilas, tm elevadas concentraes deste io.
Quanto ao io cloreto, a disperso grande, com exceo das amostras provenientes do
CVL. Se excluir a amostra do CVL assinalada na figura 6 (diagrama relativo ao
cloreto), a variabilidade no CVL muito reduzida. Nas Aluvies e nas Argilas a
variabilidade muito grande e a distribuio idntica, o mesmo sucede com a
Formao de Benfica e as Areolas, onde a variabilidade grande e a distribuio
idntica.
Quanto ao io brometo, a variabilidade muito grande, resultado de trs amostras (uma
das Aluvies, uma das Areolas e uma das Argilas) com concentraes muito elevadas.
No CVL a variabilidade muito reduzida, bem como as concentraes deste io. Na
Formao de Benfica e nos Calcrios de Entrecampos as concentraes deste io e a
variabilidade so baixas.
Quanto ao io nitrato, existe uma grande disperso e um nmero considervel de
amostras com concentrao superior a 50 mg/L, como se pode observar na figura 6
(diagrama relativo ao nitrato). As amostras provenientes das Argilas apresentam
56

concentraes e variabilidade reduzidas. As amostras de gua provenientes do CVL e


dos Calcrios de Entrecampos apresentam baixas concentraes deste io (sempre
abaixo dos 50 mg/L). Nas amostras das Aluvies, da Formao de Benfica e das
Areolas a variabilidade muito grande, deste modo existem amostras com baixas
concentraes deste io e outras com elevadas concentraes, o que no permite a
caracterizao destas amostras a partir deste io.
Quanto ao io sulfato, a variabilidade muito acentuada, mas este comportamento no
sempre o mesmo nas diferentes formaes geolgicas. Nas amostras da Formao de
Benfica, do CVL e dos Calcrios de Entrecampos a variabilidade menor e as
concentraes deste io esto abaixo de 200 mg/L. Nas amostras provenientes das
Areolas, se excluir a amostra assinalada na figura 6 (diagrama relativo ao sulfato), com
concentrao muito elevada (superior a 600 mg/L), as restantes amostras tm
concentraes abaixo dos 200 mg/L. Nas Argilas a variabilidade mais acentuada, as
amostras, ora tm concentraes baixas, ora elevadas.

Nas representaes grficas que se seguem esto as matrizes de diagramas de disperso


para alguns pares de variveis, para cada formao geolgica. Mais precisamente, na
figura 7 encontram-se os diagramas de disperso em matriz para as variveis
condutividade eltrica, clcio, sdio e cloreto (consideradas duas a duas). Na figura 8,
esto os diagramas de disperso em matriz para as variveis bicarbonato, clcio e
magnsio. Na figura 9, esto os diagramas de disperso em matriz para as variveis
bicarbonato, clcio e sulfato. Por ltimo, na figura 10 encontram-se os diagramas de
disperso das variveis nitrato e sulfato.

Aluvies (1)

Formao de Benfica (2)


57

CVL (3)

Calcrios de Entrecampos (4)

Areolas da Estefnia e Areias do Vale

Argilas do Forno do Tijolo e Argilas e

de Chelas (5)

Calcrios dos Prazeres (6)

Figura 7: Matriz de diagramas de disperso para cada formao geolgica com as variveis condutividade
eltrica, clcio, sdio e cloreto

Ao observar-se a figura 7 para as variveis consideradas, nas Aluvies visvel atravs


dos diagramas de disperso em matriz uma associao linear positiva entre os pares de
variveis. Essa associao mais significativa para os pares condutividade eltrica /
sdio, condutividade eltrica / cloreto e sdio / cloreto, onde os valores dos coeficientes
de correlao de Pearson so 0.912, 0.814 e 0.910, respetivamente. No caso do clcio /
cloreto e clcio / sdio essa associao seria mais significativa, se as observaes
assinaladas fossem excludas. Na Formao de Benfica, pode observar-se, na figura 7,
que a correlao mais significativa para os pares condutividade eltrica / sdio,
condutividade eltrica / cloreto e sdio / cloreto, onde os coeficientes de correlao de
58

Pearson tomam os valores 0.753, 0.809 e 0.884, respetivamente. Quanto ao par


condutividade eltrica / clcio essa associao fraca, (0.522 o valor do coeficiente de
correlao de Pearson). Para os restantes pares de variveis no existe uma associao
linear. No CVL as associaes entre pares de variveis so mais significativos para os
pares condutividade eltrica / clcio e clcio / sdio, cujos valores dos coeficientes de
correlao de Pearson so 0.804 e 0.767, respetivamente. Para os restantes pares de
variveis a correlao fraca e pouco significativa. Nos Calcrios de Entrecampos pode
observar-se, atravs da matriz dos diagramas de disperso da figura 7 para as variveis
indicadas, que no existe qualquer associao linear entre as variveis, uma vez que os
pontos no esto alinhados sobre uma reta. Nas Areolas da Estefnia e Areias do Vale
de Chelas as correlaes so mais significantes para os pares de variveis condutividade
eltrica / clcio, condutividade eltrica / sdio e condutividade eltrica / cloreto, cujos
valores dos coeficientes de correlao de Pearson so 0.613, 0.927 e 0.649,
respetivamente. Nos restantes pares de variveis a associao fraca. Nas Argilas do
Forno do Tijolo e Argilas e Calcrios dos Prazeres no existem correlaes
significantes.

Aluvies

Formao de Benfica

CVL

59

Calcrios de Entrecampos

Areolas e Areias

Argilas

Figura 8: Matriz de diagramas de disperso para cada formao geolgica com as variveis bicarbonato,
clcio e magnsio

Na figura 8 apresentam-se os diagramas de disperso em matriz, para cada formao


geolgica e para as variveis bicarbonato, clcio e magnsio. Nas Aluvies no visvel
a existncia de uma associao linear entre esses pares de variveis, mas se excluir a
observao assinalada (amostra Lis12), o valor do coeficiente de correlao de Pearson
entre o bicarbonato / clcio igual a - 0.966. Neste caso, passa a existir uma forte
associao linear negativa entre o bicarbonato e o clcio, ou seja, medida que as
concentraes de bicarbonato aumentam, as concentraes de clcio diminuem. Na
Formao de Benfica visvel a existncia de associao linear forte entre os pares de
variveis bicarbonato / clcio e bicarbonato / magnsio, cujos valores dos coeficientes
de correlao de Pearson so 0.758 e 0.743, respetivamente. No CVL no existe
claramente associao linear entre os pares de variveis, porm se excluir a observao
assinalada (amostra Lis44) no diagrama de disperso do par bicarbonato / clcio a
correlao passa a ser significativa, sendo o valor do coeficiente de correlao de
Pearson 0.859. Nos Calcrios de Entrecampos no existe uma associao linear entre os
pares de variveis. Nas Areolas da Estefnia e Areias do Vale de Chelas no existe uma
associao linear entre os pares de variveis, mas se eliminar a observao assinalada
(amostra Lis20) no diagrama de disperso para o par de variveis clcio / magnsio, o
valor do coeficiente de correlao linear passa a ser 0.663. Nas Argilas do Forno do
Tijolo e Argilas e Calcrios dos Prazeres a associao linear entre as variveis nula.

60

Aluvies

Formao de Benfica

CVL

Calcrios de Entrecampos

Areolas e Areias

Argilas

Figura 9: Matriz de diagramas de disperso para cada formao geolgica com as variveis bicarbonato,
clcio e sulfato

Na figura 9 apresentam-se os diagramas de disperso em matriz, para as variveis


bicarbonato, clcio e sulfato. Nas Aluvies existe apenas uma forte associao linear
entre o par clcio / sulfato, onde o valor do coeficiente de correlao de Pearson
0.815, mas se excluir a observao assinalada (amostra Lis13), o valor do coeficiente de
correlao de Pearson entre o bicarbonato e o sulfato passa a 0.907. Na Formao de
Benfica apenas existe forte associao linear entre o bicarbonato e o clcio, cujo valor
do coeficiente de correlao de Pearson 0.798. No CVL no existe associao linear
entre os pares de variveis considerados, mas se excluir a observao assinalada
(amostra Lis44), o valor do coeficiente de correlao de Pearson entre o bicarbonato e o
clcio passa a ser 0.859. Nos Calcrios de Entrecampos existe uma forte associao
linear entre o bicarbonato e o sulfato, onde o valor do coeficiente de correlao de
Pearson 0.886. Nas Areolas da Estefnia e Areias do Vale de Chelas apenas existe
associao linear entre as variveis clcio e sulfato, cujo valor do coeficiente de
correlao de Pearson 0.786. Nas Argilas do Forno do Tijolo e Argilas e Calcrios dos
Prazeres no h associao linear entre as variveis consideradas.
61

Aluvies

Formao de Benfica

CVL

Calcrios de Entrecampos

Areolas e Areias

Argilas

Figura 10: Diagrama de disperso para cada formao geolgica com as variveis nitrato e sulfato

Na figura 10 esto representados os diagramas de disperso para o par nitrato / sulfato,


em cada formao geolgica. A existncia de associao linear significativa para este
par de variveis ocorre apenas nos Calcrios de Entrecampos, onde o valor do
coeficiente de correlao linear 0.851.

62

3.2.

Anlise Multivariada

3.2.1. Anlise em Componentes Principais

Como j referido anteriormente, este estudo tem por base 48 amostras de gua
subterrnea e 13 variveis correspondentes a espcies dissolvidas e caractersticas
fsico-qumicas.
Nesta etapa comea-se por efetuar uma anlise em componentes principais com o
objetivo principal: a reduo da dimensionalidade. Mais precisamente, parte-se de um
conjunto com 13 variveis correlacionadas (moderadamente) e pretende-se encontrar
um novo conjunto de variveis no correlacionadas, as componentes principais. Estas
so uma combinao linear das variveis originais. Deste modo, um menor nmero
destas variveis poder explicar uma percentagem significativa da variabilidade dos
dados. Caso a explicao fosse total, teramos de usar as 13 componentes principais e o
estudo seria desnecessrio.
Em primeiro lugar so determinados os valores prprios da matriz de correlaes
amostral, como se pode observar na tabela 5.
Componentes Valores prprios
1

4,095

2,024

1,706

1,328

1,256

0,648

0,548

0,476

0,299

10

0,245

11

0,176

12

0,152

13

0,048

Tabela 5: Valores prprios da matriz de correlaes amostral

63

Em seguida, tem de se decidir o nmero de componentes a reter. Deste modo, usam-se


trs critrios (apresentados anteriormente).

Critrio 1: Proporo da varincia explicada por cada componente principal

Componentes

Proporo de
varincia explicada

Proporo de varincia
explicada acumulada

1
2
3
4
5

31,5
15,6
13,1
10,2
9,7

31,5
47,1
60,2
70,4
80,1

6
7
8
9
10
11
12
13

5,0
4,2
3,7
2,3
1,9
1,4
1,2
0,4

85,1
89,3
92,9
95,2
97,1
98,5
99,6
100,0

Tabela 6: Proporo de varincia explicada por cada componente e proporo de varincia acumulada
explicada at componente j.

Na tabela 6 encontra-se calculada a proporo de varincia explicada por cada uma das
13 componentes principais e a proporo de varincia explicada acumulada at jsima componente principal. A componente 1 explica 31.5% da variabilidade total. A
componente 2 explica 15.6% da variabilidade total ainda no explicada pela
componente1 e, assim por diante. Para a proporo de varincia explicada ser superior a
80%, tm de se reter as 5 primeiras componentes principais.

Critrio 2: Critrio de Kaiser

Este critrio, proposto por Kaiser em 1960, sugere que se devem reter as componentes
principais cujos valores prprios sejam superiores a um. Na tabela 5 pode observar-se
que os 5 primeiros valores prprios so maiores do que um. Deste modo, devem reter-se
as 5 primeiras componentes principais.
64

Critrio 3: Scree plot

Este critrio, proposto por Cattell em 1966, sugere que o nmero de componentes a
reter deve ser aquele que antecede o momento em que o declive atenua, ou seja, quando
os valores prprios forem prximos entre si e de zero.

Scree plot
4,5

Valores prprios

4
3,5
3
2,5
2
1,5
1
0,5
0
0

10

11

12

13

Nmero de componentes principais


Figura 11: Scree plot (nmero de componentes principais versus valores prprios)

Analisando a figura 11, o nmero de componentes a reter dever ser 5, uma vez que a
partir desse momento os valores prprios esto muito prximos de zero.

Com base nos critrios, devem reter-se as 5 primeiras componentes principais, a


reduo de dimensionalidade de 13 para 5.

65

Soma dos
quadrados
das linhas

-0,140
0,926
-0,499
0,447
0,706
0,730
-0,056
0,261
0,565
0,680
0,624
-0,063
0,700

0,691
0,184
0,653
0,155
0,151
0,180
-0,032
0,304
-0,562
0,470
-0,311
0,514
0,126

-0,101
0,010
0,052
0,480
-0,043
-0,042
-0,596
0,785
-0,145
-0,138
-0,141
-0,611
-0,235

0,266
-0,006
-0,256
0,128
0,594
-0,499
-0,014
-0,188
-0,158
-0,291
-0,364
-0,207
0,503

-0,449
0,108
-0,097
0,612
0,087
0,045
0,643
0,024
-0,286
-0,095
-0,234
0,179
-0,237

0,780
0,904
0,753
0,846
0,883
0,818
0,773
0,813
0,762
0,796
0,694
0,717
0,870

Componentes Principais

pH
C.E.
Eh
Ca2+
Na+
K+
Mg2+

Soma dos
quadrados
das colunas

4,095

2,024

1,706

1,328

1,256

Tabela 7: Matriz dos loadings das componentes principais

Na tabela 7 encontram-se os loadings das componentes principais para cada uma das 13
variveis. Para cada varivel selecionou-se o maior loading, em valor absoluto, para
compreender qual ou quais as variveis mais importantes na formao de cada uma das
5 primeiras componentes (ver na tabela o sombreado mais escuro). Deste modo, para a
primeira componente as variveis que mais contriburam para a sua formao foram: a
condutividade eltrica, o clcio, o sdio, o fluoreto, o cloreto, o brometo e o sulfato.
Para a segunda componente principal foram o pH e o Eh. Para a terceira componente
foram o magnsio e o nitrato. Para a quarta componente principal nenhum teve
contribuio importante e para a quinta componente principal foram o bicarbonato e o
potssio. Ainda se podem observar na tabela 7 (sombreado mais claro) os loadings
maiores que 0.3 em valor absoluto. Assim sendo, todas as variveis originais, exceto o
potssio, so determinantes na formao das duas primeiras componentes.
Na ltima linha da tabela 7 constam as somas dos quadrados dos elementos de cada
coluna, que coincidem sempre com os valores prprios. Na ltima coluna da tabela 7
constam as somas dos quadrados dos elementos de cada linha, que representam as
comunalidades, ou seja, a proporo de varincia das variveis originais que explicada
66

pelas componentes retidas. O valor das comunalidades superior a 0.694. Caso se


considerassem todas as componentes principais a comunalidade de cada varivel seria
igual a 1, mas no se estaria a reduzir a dimensionalidade.
Na figura 12 encontra-se a representao grfica dos loadings das duas primeiras
componentes.

Figura 12: Representao grfica dos loadings das duas primeiras componentes principais

Analisando a figura 12, pode visualizar-se quais as variveis que mais contriburam para
as duas primeiras componentes principais. Na tabela 7 essa anlise tinha sido efetuada
para as cinco primeiras componentes. O potssio no contribuiu para a formao das
duas primeiras componentes. O bicarbonato e o magnsio tm uma pequena
contribuio. Relativamente componente 2, o fluoreto e o brometo esto em oposio
condutividade eltrica, clcio, sdio, sulfato e cloreto. Em relao componente 1, o
Eh, o pH e o nitrato esto em oposio condutividade eltrica, clcio, sdio, sulfato e
cloreto.

Nas figuras 13 e 14 podem observar-se as representaes grficas dos scores para as


duas primeiras componentes principais. No primeiro caso, a legenda refere-se o nmero
da amostra a que pertencem, ou seja, 23 representa a amostra Lis23, por exemplo. No
67

segundo caso os indivduos esto representados pela formao geolgica a que


pertencem.

Figura 13: Representao grfica dos scores (observaes) das duas primeiras componentes principais

Constata-se que as amostras Lis12 e Lis21 esto afastadas da nuvem de pontos. De um


modo geral, a amostra Lis12 tem reduzidas concentraes na maioria dos ies, em
oposio, a amostra Lis21 tem altas concentraes na maioria dos ies.
visvel um grande grupo de elementos, essencialmente provenientes da Formao de
Benfica, do CVL, das Areolas e das Argilas, como se pode observar na figura 14.
Observam-se uns grupos mais pequenos (com menos elementos), essencialmente
provenientes das Aluvies, dos Calcrios, das Areolas e das Argilas.

68

Figura 14: Representao grfica dos scores (formaes geolgicas) das duas primeiras componentes
principais

Nas figuras 15 e 16 esto representados os biplots3 dos loadings e dos scores das duas
primeiras componentes principais. No primeiro caso, a legenda corresponde ao nmero
da amostra e no segundo caso, a legenda corresponde s formaes geolgicas. Deste
modo, pretende-se compreender qual ou quais os ies que caracterizam uma
determinada formao geolgica. Devido complexa litologia de Lisboa no existe uma
separao evidente e natural dos elementos (amostras) pelas seis formaes geolgicas.
Existe uma separao em termos de localizao geogrfica, ou seja, amostras
localmente mais prximas aparentam caractersticas semelhantes. Nas amostras de
gua provenientes da Formao de Benfica e do CVL, a proximidade no apenas
geogrfica. Nas figuras 15 e 16 pode observar-se a proximidade destas amostras e
tambm que, na componente 2 estas amostras so caracterizadas pelo pH, Eh e nitratos.
As amostras das Aluvies so caracterizadas na componente 1 pelo fluoreto e pelo

Biplot uma dupla representao grfica, em que constam os loadings das variveis, representados

atravs dos vetores e os scores de cada observao, representados atravs de pontos.

69

cloreto. Quanto s restantes formaes geolgicas no visvel a caracterizao, uma


vez que existe uma maior disperso.

Figura 15: Representao grfica (biplot) dos loadings e dos scores (observaes) das duas primeiras
componentes principais

Figura 16: Representao grfica (biplot) dos loadings e dos scores (formaes geolgicas) das duas
primeiras componentes principais

70

3.2.2. Anlise Fatorial

Nesta seco ir efetuar-se uma anlise fatorial que permita explicar as correlaes
existentes entre as variveis, ou seja, parte-se de um conjunto de 13 variveis e
pretende-se encontrar um menor nmero de fatores que expliquem essas correlaes.
Por um lado pretende-se que a perda de informao seja a menor possvel, por outro o
nmero de fatores no pode ser muito elevado.

Utiliza-se o mtodo das componentes principais para a extrao dos fatores e a rotao
varimax para a rotao dos fatores.

Comea-se pela determinao dos valores prprios da matriz de correlaes. Esses


valores prprios encontram-se na tabela 8.

Fatores
1
2
3
4
5
6
7
8
9
10
11
12
13

Valores Prprios
4,039
1,885
1,692
1,528
1,078
0,776
0,533
0,498
0,417
0,248
0,176
0,100
0,030

Tabela 8: Valores prprios da matriz de correlaes amostral

Note-se que a matriz de correlaes amostral usada a mesma, tanto na anlise em


componentes principais, como na anlise fatorial. O modelo matemtico da anlise em
componentes principais Y = AX (Y as componentes principais e X as variveis
originais), enquanto o modelo matemtico da anlise fatorial Y =

, ou seja,

71

(Y as variveis originais e f os fatores). Deste modo, h uma pequena

diferena nos valores prprios.


Na tabela 9 encontra-se a proporo de varincia explicada pelos fatores.

Fatores

Proporo de
varincia explicada

Proporo de varincia
explicada acumulada

1
2
3
4
5
6
7
8
9
10
11
12
13

31,1
14,5
13,0
11,8
8,3
6,0
4,1
3,8
3,2
1,9
1,4
0,8
0,2

31,1
45,6
58,6
70,3
78,6
84,6
88,7
92,5
95,7
97,6
99,0
99,8
100,0

Tabela 9: Proporo de varincia explicada por cada fator e proporo de varincia acumulada pelo fator j

Pela anlise das tabelas 8 e 9, os 5 primeiros fatores tm valores prprios superiores a


um e a varincia explicada 78.6%. Deste modo, deve prosseguir-se a anlise com os
cinco fatores.

Na tabela 10 encontram-se as comunalidades iniciais (com todos os fatores) e as


extradas (com 5 fatores). Observa-se que todas as comunalidades tm um valor alto.
Deste modo, as variveis so bem explicadas pelos fatores da anlise fatorial.

72

Comunalidades
Iniciais Extradas
pH
1,000
0,828
C.E.
1,000
0,933
Eh
1,000
0,734
1,000
0,860
2+
Ca
1,000
0,807
+
Na
1,000
0,797
+
K
1,000
0,677
2+
Mg
1,000
0,763
1,000
0,752
1,000
0,785
1,000
0,698
1,000
0,727
1,000
0,861
Tabela 10: Comunalidades iniciais e extradas atravs do mtodo das componentes principais

Na tabela 11 encontram-se os loadings que permitem avaliar a correlao entre as


variveis e os fatores, assinalando os que tm um valor superior a 0.7, em mdulo.

pH
C.E.
Eh
Ca2+
Na+
K+
Mg2+

1
-0,146
0,932
-0,469
0,444
0,722
0,763
-0,002
0,307
0,626
0,642
0,509
-0,117
0,679

2
0,539
0,219
0,632
0,151
0,057
0,201
0,056
0,355
-0,532
0,540
-0,405
0,456
0,069

Fatores
3
0,466
0,008
-0,125
-0,628
0,252
-0,078
0,322
-0,664
0,179
-0,016
-0,059
0,409
0,498

4
-0,546
0,065
0,081
0,205
-0,149
0,226
0,669
-0,318
-0,050
0,126
0,235
0,579
-0,383

5
0,012
-0,111
0,304
-0,452
-0,445
0,344
-0,350
0,017
0,208
0,257
0,465
0,057
-0,033

Tabela 11: Matriz dos loadings (sem rotao dos fatores)

73

Por observao da tabela 11, apenas 3 loadings verificam essa condio. Logo,
necessrio proceder rotao dos fatores, atravs da rotao varimax.
1
0,644
-0,132
0,459
-0,354
-0,482

1
2
3
4
5

2
0,610
0,602
-0,047
0,160
0,488

3
0,381
-0,771
-0,120
0,352
0,348

4
0,248
0,090
-0,736
0,245
-0,573

5
-0,080
0,131
0,481
0,816
-0,283

Tabela 12: Matriz da transformao ortogonal obtida pelo mtodo de rotao varimax

Na tabela 12 encontra-se a matriz ortogonal obtida pelo mtodo varimax, que utilizada
para obter a matriz dos loadings aps rotao, que se pode visualizar na tabela 13. A
matriz da tabela 13 obtida pelo produto das matrizes das tabelas 11 e 12. A matriz dos
loadings da tabela 13 permite uma melhor interpretao, uma vez que existe um maior
nmero de loadings significativos (maiores que 0.7 em mdulo).

pH
C.E.
Eh
Ca2+
Na+
K+
Mg2+

1
0,236
0,605
-0,618
0,123
0,840
0,183
0,071
-0,050
0,473
0,166
0,047
-0,180
0,808

2
0,132
0,656
0,262
0,204
0,222
0,794
-0,046
0,389
0,146
0,862
0,333
0,304
0,354

Fatores
3
-0,716
0,170
-0,517
0,042
-0,006
0,344
0,031
-0,184
0,682
-0,036
0,758
-0,222
0,000

4
-0,471
0,325
-0,122
0,895
0,218
0,123
0,131
0,509
-0,156
0,103
-0,076
-0,180
-0,266

5
-0,143
0,043
0,040
-0,022
0,076
0,015
0,807
-0,562
-0,133
0,041
-0,062
0,721
-0,109

Tabela 13: Matriz dos loadings (aps rotao varimax)

Deste modo, o fator 1 est associado ao io clcio e o io sulfato, o fator 2 est


associado ao io sdio e ao io cloreto, o fator 3 est associado ao pH e ao io brometo,

74

o fator 4 est associado ao io bicarbonato e o fator 5 est associado ao potssio e ao io


nitrato (tabela 14).
Fatores

Variveis

Clcio e sulfato

Sdio e cloreto

pH e brometo

Bicarbonato

Potssio e nitrato

Tabela 14: Designao dos fatores

Figura 17: Representao grfica dos loadings dos 2 primeiros fatores

Na figura 17 tem-se a representao grfica dos loadings do fator 1 versus fator 2,


quando se extraem 2 fatores. Estes dois fatores explicam apenas 45.6% da variao, o
que muito reduzido.

75

Na tabela 15 esto indicados o valor do KMO e o resultado do teste de esfericidade de


Bartlett.

Kaiser-Meyer-Olkin Measure of
Sampling Adequacy
Teste de
esfericidade
de Bartlett

0,478

Estatstica de teste

348,578

Graus de liberdade

78

Valor p

0,000

Tabela 15: KMO e teste de esfericidade de Bartlett

Deste modo, o valor do KMO inferior a 0.5, pelo que a anlise fatorial no aplicvel
aos dados. O KMO uma medida de adequao de amostragem e este baixo valor pode
estar relacionado com a reduzida dimenso da amostra face ao nmero de variveis. O
teste de esfericidade de Bartlett permite rejeitar a hiptese da matriz de correlaes ser
igual matriz identidade, uma vez que o valor p reduzido, significa que as variveis
esto correlacionadas.

O KMO uma medida de adequao amostral global, enquanto o MSA uma medida
de adequao amostral individual, que permite avaliar a adequao de cada uma das
variveis para a anlise fatorial. Para a anlise fatorial ser boa ou muito boa, o MSA de
cada varivel deve ser superior a 0.8. Observando a tabela 16, nenhum superior a 0.8,
embora alguns se considerem aceitveis (superiores a 0.5), nomeadamente, para a
condutividade eltrica, o Eh, o fluoreto, o cloreto, o brometo e o sulfato. Se fossem
utilizadas apenas essas variveis o KMO aumentaria, mas muita informao era perdida.
Deste modo, no se refaz a anlise fatorial com essas variveis.

76

Variveis
pH
C.E.
Eh
Ca2+
Na+
K+
Mg2+

MSA
0,404
0,544
0,562
0,423
0,381
0,480
0,124
0,267
0,729
0,785
0,690
0,357
0,540

Tabela 16: Medida de adequao amostral para cada varivel (MSA)

77

3.2.3. Anlise de Clusters

Nesta seco pretende-se reagrupar o conjunto de dados (amostras de gua) de acordo


com a sua composio qumica.
O conjunto de dados, inicialmente, est subdividido em seis grupos (cada um dos
grupos de formaes geolgicas) e pretende-se efetuar um novo agrupamento.
Para determinar a distncia entre dois indivduos usa-se o quadrado da distncia
euclidiana e os critrios de agregao usados so: critrio de Ward e critrio do
Complete Linkage. Numa primeira fase usam-se todas as variveis e numa segunda fase
usam-se as cinco primeiras componentes principais (os scores).

Como as variveis tm varincias muito diferentes, usam-se as variveis


estandardizadas. Na figura 18 encontra-se o dendograma referente anlise de clusters
para a amostra global, usando o critrio de agregao de Ward. A amostra Lis21
encontra-se afastada das restantes no sendo includa em nenhum cluster. Assim sendo,
so visveis 3 clusters: cluster1, cluster2 e cluster3. No cluster1 encontram-se,
maioritariamente, amostras provenientes da Formao de Benfica e do CVL. A amostra
Lis 24 da Formao de Benfica e Lis47 e Lis48 do CVL no pertencem a este cluster.
Neste cluster no aparecem amostras provenientes dos Calcrios de Entrecampos. No
cluster2 apenas no existem amostras provenientes dos Calcrios de Entrecampos. No
cluster3 no existem amostras provenientes da Formao de Benfica e do CVL.
Desta forma, pode afirmar-se que as amostras provenientes da Formao de Benfica e
do CVL apresentam caractersticas distintas das outras formaes geolgicas, em
particular dos Calcrios de Entrecampos, pois no existem clusters que tenham
simultaneamente amostras dessas formaes. As amostras de gua provenientes da
Formao de Benfica e do CVL apresentam, entre si, caractersticas idnticas. Quanto
s amostras provenientes das Aluvies, das Areolas e das Argilas esto presentes em
todos os clusters. Observando a figura 19 pode dizer-se que as amostras que constituem
o cluster3 esto geograficamente prximas, donde as suas caractersticas podero ser
idnticas.

78

cluster1

cluster2

cluster3

Figura 18: Dendograma (variveis estandardizadas) para a amostra global utilizando o mtodo de Ward

Figura 19: Localizao geogrfica das amostras de gua que constituem os clusters (cluster1, cluster2 e
cluster3) obtidos quando se utiliza o mtodo de Ward com as variveis estandardizadas

79

Na figura 20 encontra-se o dendograma relativo anlise de clusters para a amostra


global usando o critrio de Complete Linkage (ou vizinho mais afastado). As amostras
Lis9 e Lis21 no se inserem em nenhum dos clusters, uma vez que se encontram muito
afastadas, o mesmo se tinha verificado anteriormente para a amostra Lis21. So visveis
3 clusters: cluster1, cluster2 e cluster3. No cluster1 encontram-se as amostras
provenientes da Formao de Benfica e do CVL, na sua maioria. De salientar que,
apenas, as amostras Lis24 e Lis31 provenientes da Formao de Benfica no constam
neste cluster. Este cluster, tambm no tem amostras provenientes dos Calcrios de
Entrecampos nem das Argilas. Nos cluster2 e cluster3 encontram-se amostras
provenientes das restantes formaes geolgicas. Note-se que as amostras provenientes
do CVL apenas se encontram no cluster1. As amostras provenientes dos Calcrios de
Entrecampos no pertencem ao mesmo cluster das amostras provenientes do CVL.

cluster1

cluster2

cluster3

Figura 20: Dendograma (variveis estandardizadas) para a amostra global utilizando o mtodo de
Complete Linkage

Na figura 21 encontra-se o mapa com a localizao geogrfica das amostras de gua que
constituem os clusters (cluster1, cluster2 e cluster 3) obtidos, quando se utiliza o mtodo
Complete Linkage com as variveis estandardizadas.
80

Figura 21: Localizao geogrfica das amostras de gua que constituem os clusters (cluster1, cluster2 e
cluster3) obtidos quando se utiliza o mtodo de Complete Linkage com as variveis
estandardizadas

Analisando as figuras 18 e 20 pode concluir-se que em ambos os casos o cluster1 mais


uniforme, ou seja, constitudo por amostras provenientes de duas formaes
geolgicas, que na sua maioria no tem representatividade nos outros dois clusters
(cluster2 e cluster3). Comparando os mapas geolgicos das figuras 19 e 21 conclui-se
que no primeiro caso, os cluster2 e cluster3 no apresentam uma uniformidade de
formaes geolgicas, mas apresentam uma uniformidade geogrfica, contrariamente,
no segundo caso, os cluster2 e cluster3 no apresentam uniformidade geogrfica nem a
nvel das formaes geolgicas.
Nestes dois primeiros casos, os clusters tm praticamente a mesma dimenso, variando
entre 11 e 19 elementos.

Numa segunda fase, usam-se os scores das cinco primeiras componentes principais em
vez das treze variveis. As 5 primeiras componentes principais retidas explicam 80.1%
da variabilidade total, pelo que alguma informao ser perdida.
81

Na figura 22 encontra-se o dendograma obtido da anlise de clusters efetuada, quando


se utilizam os scores das cinco primeiras componentes principais e o critrio de Ward.
Fazendo uma primeira anlise poderia considerar-se a existncia de 5 ou 6 clusters, mas
observando a constituio de cada um deles, rapidamente se constata que no existe
uniformidade quanto provenincia das amostras. Deste modo, considera-se a diviso
em 3 clusters: cluster1, cluster2 e cluster3, indicados na figura 22. O cluster1 tem na sua
maioria, amostras provenientes do CVL, da Formao de Benfica e das Areolas,
enquanto os cluster2 e cluster3 no apresentam essa homogeneidade de provenincia.
Assim sendo, observa-se, mais uma vez que, o cluster1 tem maioritariamente amostras
provenientes da Formao de Benfica e do CVL, no tendo amostras provenientes das
Aluvies. No cluster1 existem 5 amostras provenientes das Areolas e uma dos Calcrios
de Entrecampos. Os cluster2 no apresenta amostras provenientes do CVL e cluster3
no apresenta amostras provenientes da Formao de Benfica nem do CVL. As
amostras Lis 36 e Lis 46 da Formao de Benfica encontram-se no cluster2 e amostras
Lis9 e Lis21 encontram-se no cluster3.
Neste caso, a separao por formao geolgica no to evidente.
Os clusters obtidos no tm igual dimenso. O cluster1 tem 23 elementos e os clusters2
e cluster3 tm 12 e 13 elementos, respetivamente.

82

cluster1

cluster2

cluster3

Figura 22: Dendograma (com os scores das 5 primeiras componentes principais) para a amostra global
usando o mtodo de Ward

Na figura 23 encontra-se o mapa com a localizao geogrfica das amostras de gua que
constituem os clusters (cluster1, cluster2 e cluster 3) obtidos, quando se utiliza o mtodo
de Ward com as com os scores das 5 primeiras componentes principais.

83

Figura 23: Localizao geogrfica das amostras de gua que constituem os clusters (cluster1, cluster2 e
cluster3) obtidos quando se utiliza o mtodo de Ward com as 5 primeiras componentes
principais

Na figura 24 encontra-se o dendograma obtido para a anlise de clusters efetuada,


quando se utilizam os scores das 5 primeiras componentes principais e o critrio de
Complete Linkage. Observando o dendograma so visveis 3 clusters: cluster1, cluster2
e cluster3. O nmero de elementos que constituem os clusters muito diferente. O
cluster1 tem 30 elementos, o cluster2 tem 5 elementos e o cluster3 tem 13 elementos. O
cluster2 o mais homogneo, contendo maioritariamente amostras provenientes das
Areolas, embora seja constitudo apenas por cinco elementos. Os elementos do cluster3
provm das Aluvies, dos Calcrios de Entrecampos, das Areolas e das Argilas. As
amostras provenientes da Formao de Benfica e do CVL pertencem todas ao cluster1,
mas existem muitos elementos das outras formaes geolgicas.

84

cluster1

cluster2

cluster3

Figura 24: Dendograma (com os scores das 5 primeiras componentes principais) para a amostra global
usando o mtodo de Complete Linkage

Na figura 25 encontra-se o mapa com a localizao geogrfica das amostras de gua que
constituem os clusters (cluster1, cluster2 e cluster 3) obtidos, quando se utiliza o mtodo
de Complete Linkage com os scores das com as 5 primeiras componentes principais.
Assim sendo, a separao dos elementos, quer pelas formaes geolgicas, quer pela
localizao geogrfica no evidente.

Analisando os clusters obtidos nestes dois ltimos casos, verifica-se que o cluster3 em
ambos os casos constitudo pelos mesmos elementos. Os cluster1 e cluster2 diferem
um pouco.

85

Figura 25: Localizao geogrfica das amostras de gua que constituem os clusters (cluster1, cluster2 e
cluster3) obtidos quando se utiliza o mtodo de Complete Linkage com os scores das 5
primeiras componentes principais

Aps se terem analisado os 4 dendogramas, pode concluir-se que no existe uma clara
separao por formao geolgica, porm existe uma separao geogrfica (visvel
quando se utiliza o mtodo de Ward e as variveis estandardizadas). Tambm ponto
comum a separao da Formao de Benfica e do CVL das restantes formaes
geolgicas, o que refora a proximidade destas duas formaes geolgicas. Em
particular estas duas formaes geolgicas distanciam-se dos Calcrios de Entrecampos.

Existindo esta heterogeneidade dentro de cada formao geolgica, realizou-se uma


anlise de clusters para as amostras provenientes de cada formao geolgica. Os
dendogramas obtidos usando o critrio de Ward e as variveis estandardizadas
encontram-se na figura 26.

86

Aluvies (1)

Formao de Benfica (2)

CVL (3)

Calcrios (4)

Areolas e Areias (5)

Argilas (6)

Figura 26: Dendogramas (observaes) para cada formao geolgica utilizando o mtodo de Ward
(variveis estandardizadas)

Observando cada um dos seis dendogramas existe uma clara formao de grupos dentro
de cada formao geolgica, o que permite concluir que existe alguma heterogeneidade
dentro das formaes geolgicas. Nas Aluvies so visveis dois grupos, em que o
87

primeiro contm as amostras Lis11, Lis16, Lis37 e Lis10 e o segundo contm as


amostras Lis12 e Lis13. Na Formao de Benfica tambm existe alguma
heterogeneidade, salientando a separao das amostras Lis36 e Lis46 das restantes. Essa
separao tambm geogrfica (figura 1). No CVL as amostras Lis47 e Lis48 afastamse das restantes e curiosamente, quando se realizou a anlise de clusters com a amostra
global, usando as treze variveis estandardizadas e o critrio de Ward (ver figura 18)
estas duas amostras no pertenciam ao cluster1, ou seja, apresentam uma menor
proximidade em relao s restantes amostras dessa formao geolgica. Nos Calcrios
de Entrecampos as amostras Lis1 e Lis2 afastam-se das restantes. Nas Areolas destacase o enorme afastamento da amostra Lis21 em relao s restantes. Esta amostra
apresenta caractersticas bastante diferenciadas, quer em relao s restantes amostras
das Areolas, quer em relao amostra global. Em anlises anteriores j tinha sido
referida como outlier (ver diagrama em caixa de bigodes da figura 4), porm as
restantes observaes das Areolas apresentam algumas diferenas, sendo possvel
separar em dois grupos, um com as amostras Lis 39, Lis41, Lis45, Lis38, Lis40 e Lis20
e o outro com as amostras Lis3, Lis15, Lis4, Lis6 e Lis18. Nas Argilas a amostra Lis9
apresenta-se bastante afastada das demais amostras desta formao. As restantes
amostras revelam alguma proximidade, em particular as amostras Lis22, Lis43 e Lis42.

88

Captulo 4: Concluses
As amostras de gua provenientes das Aluvies caracterizam-se por elevadas
concentraes dos ies clcio, cloreto e brometo, em relao aos restantes grupos de
formaes geolgicas. As amostras de gua provenientes da Formao de Benfica
caracterizam-se por baixas concentraes do io bicarbonato, elevadas concentraes do
io nitrato e elevado pH e Eh, em relao aos restantes grupos de formaes geolgicas.
As amostras de gua provenientes do CVL caracterizam-se por baixa condutividade
eltrica, baixas concentraes dos ies clcio, sdio, potssio, fluoreto, brometo e
sulfato e elevadas concentraes do io magnsio, em relao aos restantes grupos de
formaes geolgicas. As amostras de gua provenientes dos Calcrios de Entrecampos
caracterizam-se por baixo pH e Eh, baixas concentraes do io magnsio e elevadas
concentraes do io bicarbonato, em relao aos restantes grupos de formaes
geolgicas. As amostras de gua provenientes das Areolas da Estefnia e Areias do Vale
de Chelas caracterizam-se por elevadas concentraes dos ies sdio e potssio, em
relao aos restantes grupos de formaes geolgicas. As amostras de gua provenientes
das Argilas do Forno do Tijolo e Argilas e Calcrios dos Prazeres caracterizam-se por
baixas concentraes do io nitrato, elevada condutividade eltrica e elevadas
concentraes dos ies sulfato e fluoreto, em relao aos restantes grupos de formaes
geolgicas. Na tabela 17, encontra-se sintetizada toda a informao descrita
anteriormente.

pH C.E.

Eh

HCO3 Ca Na

Mg

Cl

Br

---

---

---

---

---

---

---

---

---

---

NO3 SO4

---

---

---

---

---

---

---

---

---

E
---

---

---

E
---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

---

1 Aluvies, 2 Formao de Benfica, 3 CVL, 4 Calcrios de Entrecampos, 5 Areolas da Estefnia


e Areias do Vale de Chelas e 6 Argilas do Forno do Tijolo e Argilas e Calcrios dos Prazeres
B baixa concentrao (ou baixo valor) e E elevada concentrao (ou elevado valor)

Tabela 17: Caracterizao dos grupos de formaes geolgicas

89

De um modo geral, pode concluir-se que as amostras provenientes do CVL e da


Formao de Benfica caracterizam-se por baixas concentraes da maioria das espcies
dissolvidas em relao aos restantes grupos de formaes geolgicas, embora no CVL
essas concentraes sejam na sua maioria inferiores. Nestas duas formaes geolgicas
existe um grande nmero de variveis, cuja variabilidade em torno da mdia reduzida
quando comparada com a variabilidade das variveis nos outros grupos de formaes
geolgicas. Nas Argilas do Forno do Tijolo e Argilas e Calcrios dos Prazeres, em
oposio, a maioria das variveis apresenta uma grande variabilidade.

Na tabela 18 encontram-se indicados os outliers severos e moderados, por cada grupo


de formaes geolgicas e para cada varivel em estudo. Existem 25 outliers, mas
apenas, 4 desses outliers so mximos (ou mnimos) na amostra global.

1
pH
C.E.
Eh

Lis21
Lis37

2+

Ca
Na+
K+
Mg2+

Formaes Geolgicas
3
4
Lis30

Lis46
Lis24/Lis46
Lis24
Lis31

Lis44/Lis47
Lis47
Lis21
Lis32

Lis14

Lis9

Lis16
Lis48
Lis13
Lis2/Lis5

Lis3
Lis45
Lis21

Lis7
Lis9

Legenda:
Outlier severo superior
Outlier severo inferior
Outlier moderado superior
Outlier moderado inferior
Tabela 18: Tabela resumo dos outliers por cada grupo de formao geolgica e por cada varivel

90

Pode concluir-se que as amostras de gua provenientes do CVL tm um maior nmero


de outliers, em particular outliers severos, enquanto nos outros grupos de formaes
geolgicas o nmero de outliers menor. As amostras de gua Lis9 e Lis21 aparecem
algumas vezes como outliers. A amostra Lis21 caracteriza-se por valores elevados em
algumas variveis, nomeadamente na condutividade eltrica, clcio, sdio, fluoreto,
brometo e sulfato. A amostra Lis12 caracteriza-se por baixos valores em algumas
variveis, nomeadamente, na condutividade eltrica, Eh, bicarbonato, sdio, cloreto,
nitrato e sulfato. A amostra Lis9, numas vezes surge com valores elevados (pH e
sulfato) e, noutras vezes com valores baixos (bicarbonato, sdio, magnsio e cloreto),
com se pode ver na tabela do anexo 3.

Sobre a qualidade da gua para consumo humano pode-se aferir que, das 48 amostras de
gua, apenas 8 (Lis7, Lis12, Lis27, Lis29, Lis30, Lis33, Lis36 e Lis44) so
consideradas apropriadas para o consumo humano, embora fosse necessrio averiguar
se, do ponto de vista bacteriolgico, estariam de acordo com as recomendaes da
legislao que regula a qualidade das guas para o consumo humano.

Com o intuito de reduzir a dimensionalidade foi efetuada uma anlise em componentes


principais. Nesta anlise transformou-se um conjunto de 13 variveis correlacionadas
num conjunto de 5 variveis no correlacionadas: as componentes principais. Estas
permitiram descrever a variabilidade dos dados, usando um menor nmero de variveis
e perdendo a menor informao possvel. Para que a proporo de varincia explicada
fosse superior 80% eram necessrias 5 componentes principais. A primeira componente
principal explicava 31.5% da variabilidade total e a segunda componente principal
explicava 15.6% da variabilidade total, ainda no explicada. Assim sendo, as duas
primeiras componentes principais explicavam menos de 50% da variabilidade total.
As variveis em estudo so bem descritas pelas 5 componentes retidas, com exceo das
variveis brometo e nitrato, uma vez que as suas comunalidades so inferiores a 0.75.

Quanto anlise fatorial, procedeu-se validao do modelo obtido e concluiu-se que,


apesar da matriz de correlaes ser diferente da matriz identidade, a anlise fatorial foi
considerada no aplicvel aos dados

91

Com o objetivo de reagrupar as amostras de gua de acordo com a sua composio


qumica, efetuou-se uma anlise de clusters. Com esta anlise pretendia-se formar novos
grupos (os clusters), de modo que elementos do mesmo cluster tivessem caractersticas
idnticas e elementos de clusters diferentes tivessem caractersticas diferentes.
Deste modo, a anlise foi dividida em duas partes: na primeira parte utilizaram-se todas
as variveis (estandardizadas) em estudo e na segunda parte utilizaram-se os scores das
5 primeiras componentes principais. Em ambas as situaes foram obtidos 3 clusters,
que se designaram por: cluster1, cluster2 e cluster3.
Analisando os dendogramas e os mapas das localizaes geogrficas, concluiu-se que as
amostras de gua provenientes da Formao de Benfica e do CVL pertenciam,
maioritariamente, ao cluster1 e no tinham representatividade nos outros dois clusters.
Tambm se observou que as amostras provenientes dos Calcrios de Entrecampos no
pertenciam ao cluster1. Assim sendo, concluiu-se que as amostras de gua provenientes
da Formao de Benfica e do CVL, tinham caractersticas idnticas entre si, ou seja,
tinham idntica composio qumica. Quando comparadas as amostras, provenientes da
Formao de Benfica e do CVL com os restantes grupos de formaes geolgicas era
notria uma diferenciao. Em particular, as amostras de gua provenientes dos
Calcrios de Entrecampos tinham composio qumica bastante diferente. Quando se
observou a constituio dos clusters, de um modo geral, os clusters que continham as
amostras de gua provenientes da Formao de Benfica e do CVL no tinham amostras
de gua provenientes dos Calcrios de Entrecampos. Os outros dois clusters eram
constitudos, maioritariamente, por amostras de gua provenientes das Aluvies, dos
Calcrios de Entrecampos, das Areolas da Estefnia e Areias do Vale de Chelas e das
Argilas do Forno do Tijolo e Argilas e Calcrios dos Prazeres. Quando se analisou o
mapa das formaes geolgicas era visvel uma proximidade geogrfica das amostras de
gua que constituam o cluster3.
Foi efetuada uma anlise de clusters para cada grupo de formaes geolgicas, obtendose os seis dendogramas respetivos. Nas Aluvies, as amostras Lis12 e Lis13
apresentavam uma diferenciao das restantes amostras dessa formao. A amostra
Lis12 era caracterizada por baixas concentraes de espcies dissolvidas. Na Formao
de Benfica as amostras Lis36 e Lis46 apresentavam caractersticas que as separavam
das restantes amostras. Essa separao tambm geogrfica. No CVL as amostras Lis47
e Lis48 apresentavam diferente composio qumica das restantes amostras do CVL.
Nos Calcrios de Entrecampos as amostras Lis1 e Lis2 tambm tinham uma
92

diferenciao. Nas Areolas da Estefnia e Areias do Vale de Chelas, a amostra Lis21


apresentava caractersticas muito diferentes, mais precisamente, era uma amostra cujas
concentraes dos ies eram bastante elevadas. Nas Argilas do Forno do Tijolo e
Argilas e Calcrios dos Prazeres, a amostra Lis9 tambm apresentava uma diferenciao
em relao s restantes amostras deste grupo.

De um modo geral, e ao contrrio do que se poderia esperar, as amostras de gua


provenientes do mesmo grupo de formaes geolgicas no tinham idntica composio
qumica. Desta forma, a sua caracterizao era muito complexa. Quando se separou o
estudo por formao geolgica foi visvel essa heterogeneidade. Ao realizar a anlise
exploratria verificou-se que existia, para a maioria das variveis, uma grande
variabilidade, com exceo da Formao de Benfica e do CVL, onde as variveis
apresentavam menor variabilidade e, consequentemente, maior homogeneidade na
composio qumica.

93

94

Consideraes Finais
O principal objetivo do estudo no foi conseguido, nomeadamente, a caracterizao de
cada grupo de formaes geolgicas atravs da anlise das concentraes das espcies
qumicas dissolvidas nas guas subterrneas e dos parmetros fsico-qumicos
considerados.
Pretendia-se efetuar uma anlise fatorial com o intuito de encontrar um conjunto de
novas variveis, no correlacionadas, no observadas e em menor nmero, que
explicassem as correlaes existentes entre as variveis, o que no se verificou. A
reduzida dimenso da amostra impediu a realizao de uma anlise fatorial com os
dados de cada formao geolgica. Segundo (Everitt, 2011), a dimenso da amostra
deveria ser, no mnimo, na proporo de 5 para 1 (5 observaes para cada varivel
considerada), o que no se verificou nos dados analisados.

Tal como j foi referido anteriormente, a amostra no foi recolhida especificamente para
este trabalho, resultou de um conjunto de amostras que tinham sido recolhidas para a
elaborao de outros trabalhos. Em termos temporais, tambm no foram recolhidas no
mesmo perodo. A recolha decorreu entre os anos de 2006 e 2009.

Sendo a gua um recurso natural e vital para a sobrevivncia da espcie humana, todos
os estudos que se realizem sero de extrema importncia. Para que as concluses
obtidas sejam mais relevantes, o primeiro aspeto a ter em considerao ser a seleo da
amostra. Sendo a litologia da cidade de Lisboa to complexa, a amostra global dever
ter uma dimenso elevada, bem como cada uma das amostras parciais (por formao
geolgica).

95

96

Bibliografia
[1]

Afifi, A. e Clark, V., (1996), Computer Aided Multivariate Analysis,


Chapman e Hall, Londres, 3 edio.

[2]

Almeida, C.; Mendona, J.J.L.; Jesus, M.R.; Gomes, A.J., (2000), Sistemas
Aquferos de Portugal Continental. Instituto da gua. pp 661.

[3]

Almeida, I.M. (1991), Caractersticas geotcnicas dos solos de Lisboa.


Dissertao apresentada Universidade de Lisboa para obteno do grau de
doutor em Geologia, na especialidade de Geotecnia. FCUL, Lisboa. pp 485.

[4]

Anderson, T., (2003), An introduction to multivariate statistical analysis,


Wiley, Nova Jrsia.

[5]

Arabie, P. e Hubert, LJ., (1995), Clustering from the perspective of


combinatorial data analysis. In Recent Advances in Descriptive Multivariate
Analysis, p.1 13, Oxford Science Publications, Nova Iorque.

[6]

Bargmann, R., (1969), Exploratory techniques involving artificial variables.


In Multivariate Analysis Volume II, p.567 580, Academia Press, Nova
Iorque.

[7]

Caria, C., Oliveira, J., Henriques, J., Vasconcelos, M., Gonalves, V., (2009),
Introduo ao Estudo Hidrogeolgico da Sub-Bacia Hidrogrfica de
Alcntara Lisboa. Relatrio de Projecto da Licenciatura em Geologia
Aplicada e do Ambiente. FCUL. Lisboa. 110 pp.

[8]

Cattell, R., (1966), The scree test for the number of factos, Multivariate
Behavioral Research, p. 245-276 in http://dx.doi.org/10.1207/s15327906mbr
0102_10 consultado a 27 de julho de 2011.

[9]

Chatfield, C. e Collins, A. J., (1980), Introduction to Multivariate Analysis,


Science Paperbacks, Londres.

[10] David, J., (1973), Statistics and data analysis in Geology, Wiley, Canada.
[11] Everitt, B. e Hothorn, T, (2011), An Introduction to Applied Multivariate
Analysis with R, Springer, Nova Iorque.
[12] Everitt, B., Landau, S. e Leese, M., (2001), Cluster Analysis, Arnold,
Londres.
[13] Flury, B.D., (1995), Developments in principal component analysis. In
Recent Advances in Descriptive Multivariate Analysis, p.14 33, Oxford
Science Publications, Nova Iorque.
97

[14] Flury, B.D., (1997), A first course in Multivariate Analysis, Springer, Nova
Iorque.
[15] Gnanadesikan, R. e Wilk, M.B., (1969), Data Analysis Methods in
Multivariate Statistical Analysis. In Multivariate Analysis Volume II, p.593
638, Academia Press, Nova Iorque.
[16] Gnanadesikan, R., (1997), Methods for Statistical Data Analysis of
Multivariate Observations, Wiley, 2 edio, Nova Iorque.
[17] Gnanadesikan, R., (2000), Cluster Analysis: an overview of aims, aids and
challenges. In A Estatstica em Movimento Actas do VIII Congresso Anual
da Sociedade Portuguesa da Estatstica, p. 39 57, Edies SPE, Lisboa.
[18] Harman, H., (1976), Modern Factor Analysis, The University of Chicago
Press, 3edio, Chicago.
[19] Hotelling, H., (1933), Simplified Calculation of Principal Components,
Psychometrika, vol. 1, No 1, p.27-35.
[20] http://www.encorewiki.org/display/~nzhao/The+Minimum+Sample+Size+in
+Factor+Analysis, consultado em 25 de setembro de 2013
[21] Jackson, J., (2003), A Users Guide to Principal Components, Wiley, Nova
Jrsia.
[22] Jobson, J., (1992), Applied Multivariate Data Analysis, Volume II
Categorical and Multivariate methods, Springer, Nova Iorque.
[23] Johnson, D., (1998), Applied Multivariate Methods for Data Analysts,
Duxbury Press, California.
[24] Jolliffe, I.T., (1986), Principal Component Analysis, Springer, Nova Iorque.
[25] Kendall, M., (1980), Multivariate Analysis, Charles Griffin, Londres.
[26] Krzanowski, W.J., (2003), Principles of Multivariate Analysis, Oxford, Nova
Iorque.
[27] Lopes, P., (2007), Avaliao Quantitativa e Qualitativa das guas
Subterrneas da rea Urbana do Lumiar. Dissertao apresentada
Universidade Tcnica de Lisboa para obteno do grau de Mestre em
Engenharia do Ambiente. Universidade Tcnica de Lisboa, Instituto Superior
Tcnico. Lisboa, 98 pp.
[28] Manca, F., Ferreira, H., Silva, J., Francisco, L., Gonzalez, V., (2008), Estudo
Hidrogeolgico das freguesias de So Domingues de Benfica e Nossa

98

Senhora de Ftima Lisboa. Relatrio de Projeto da Licenciatura em


Geologia Aplicada e do Ambiente. FCUL. Lisboa. 153 pp e anexos.
[29] Mardia, K., Kent, J. e Bibby, J., (1979), Multivariate Analysis, Academia
Press, Londres.
[30] Maroco, J., (2007), Anlise Estatstica com utilizao do SPSS, Edies
Slabo, Lisboa.
[31] Maxwell, A.E., (1977), Multivariate Analysis in Behavioural Research,
Chapman e Hall, Nova Iorque.
[32] McGarigal, K., Cushman, S. e Stafford, S., (2000), Multivariate Statistics for
Wildlife and Ecology Research, Springer, Nova Iorque.
[33] Mckillup, S. e Dyar, M., (2010), Geostatistics Explained An Introduction
guide for Earth Scientists, Cambridge, Cambridge.
[34]

Monteiro, A., (2001), lgebra Linear e Geometria Analtica, McGraw-Hill,


Amadora.

[35] Morrison, D., (1990), Multivariate Statistical Methods, McGraw-Hill,


3edio, Singapura.
[36] Murteira, B et al, (2007), Introduo Estatstica, 2 edio, McGraw-Hill,
Lisboa.
[37] Okamoto, M., (1969), Optimality of Principal Components. In Multivariate
Analysis Volume II, p.673 685, Academia Press, Nova Iorque.
[38] Oliveira, M., (2010), Estudo Hidrogeolgico da Sub Bacia Hidrogrfica de
Alcntara-Lisboa. Dissertao para obteno do grau de Mestre em Geologia
Aplicada, na especialidade de Hidrogeologia. Faculdade de Cincias da
Universidade de Lisboa, Lisboa, 209 p.
[39] Pais, J., Moniz, C., Cabral, J., Cardoso, J. L., Legoinha, P., Machado, S.,
Morais, M.A., Loureno C., Ribeiro, M.L., Henriques, P., Fal, P., (2006),
Carta Geolgica de Portugal na escala 1: 50.000. Notcia Explicativa da Folha
34-D (Lisboa). Serv. Geol. Portugal, Lisboa. pp 74.
[40] Pestana, D. e Velosa, F., (2002), Introduo Probabilidade e Estatstica
Volume I, Fundao Calouste Gulbenkian, Lisboa.
[41] Reis, E., (1997), Estatstica Multivariada Aplicada, Edies Slabo, Lisboa.
[42] Rencher, A.,(1995), Methods of Multivariate Analysis, Wiley, Canada.
[43] Sanches, F., Marques, J., Latas P., Cardoso S., (2006), Breve estudo
hidrogeolgico da zona de Telheiras-Lisboa. Relatrio de Projeto da
99

Licenciatura em Geologia Aplicada e do Ambiente. FCUL. Lisboa. 88 pp. e


anexos.
[44] Searle, S., (1982), Matrix Algebra useful for Statistics, Wiley, Nova Iorque.
[45] Sharma, S., (1996), Applied Multivariate Techniques, Wiley, Nova Iorque.
[46] Srivastava, M.S. & Carter, E.M., (1983), An Introduction to Applied
Multivariate Statistics, North Holland, Nova Iorque.
[47] Srivastava, M.S., (2002), Methods of Multivariate Statistics, Wiley, Nova
Iorque.
[48] Stone, J., (2004), Independent Component Analysis A tutorial introduction,
Londres.
[49] Timm, N. H.,(2002), Applied Multivariate Analysis, Springer, Nova Iorque.
[50] Wackernagel, H., (1995), Multivariate Geostatistics, Springer, Nova Iorque.
[51] Dirio da Repblica n 164, srie I - Decreto-Lei n306/2007 de 27 de Agosto
de 2007, p.5747-5765.

100

Anexos

101

102

Nova
Ref
Lis1
Lis2
Lis3
Lis4
Lis5
Lis6
Lis7
Lis8
Lis9
Lis10
Lis11
Lis12
Lis13
Lis14
Lis15
Lis16
Lis17
Lis18
Lis19
Lis20
Lis21
Lis22
Lis23
Lis24
Lis25

Formao pH
C.E.
Eh
Geolgica
mic.zim mV
4
poo
6,85
982 -112
4
poo
7,11
1025 -174
5
poo
6,50
1273 -115
5
poo
6,13
1543 -127
4
poo
6,25
1356
-86
5
poo
6,26
1067 -258
6
poo
6,70
1353
-84
6
poo
6,61
1403 -170
6
poo
10,45
930 -125
1
mina
7,17
1580 -135
1
poo
8,52
1100
-92
1
poo
6,60
447 -183
1
poo
6,20
1236 -116
4
poo
6,65
1492 -153
5
poo
6,59
1452 -146
1
poo
8,44
1762 -62,9
4
mina
8,31
1270 -74,7
5
nascente
8,16
1165 -58,9
4
nascente
8,00
1233 -79,4
5
poo
8,16
1436 -91,7
5
poo
8,31
2220 -90,2
6
poo
8,59
1871
-81
1028
172
2
poo
7,87
1184 188
2
poo
7,19
2
poo
8,05
1154 197
Tipo

mg/L
298
210
316
384
575
322
372
472
43
283
401
214
482
470
376
401
426
334
512
427
318
333
233
529,5
219,6

Ca2+
mg/L
85,6
74,4
104
151
126
126
75,2
204
140
246
192
79,2
129
130
131
179
154
165
174
96
240
144
106
150
84

Na+
mg/L
100
138
167
178
133
98,2
140
60,5
9,7
74,9
62
19,4
84
99
123
122
89,6
78,7
89,3
114,7
275,4
147
72,9
71,3
132

K+ Mg2+
mg/L mg/L mg/L mg/L
25,2
0,0
0,44 64,5
12,2 14,3 0,47 108,4
25,9 15,2 0,62 90,2
8,2
33,9 0,19 87,2
13,5 27,4 0,33 94,6
5,6
16,0 0,17 52,6
9,4
43,3 0,53 123,4
1,1
42,3 1,00 25,7
26
3,4
0,11 32,4
1,6
9,1
0,57 100
2,9
17,0 0,15 90,3
8,9
13,6 0,42 18,5
13,8 33,2 0,34 72,7
85,8 37,4 0,14
89
76,6 37,7 0,53
96
3,7
73,5 0,25 158,3
4,9
24,5 0,21 103
8,4
18,3 0,49 86,4
22,5 23,6 0,28 67,9
2,7
69,5 0,27 128,5
9,6
41,3 1,01 157
8,7
91,4 0,21 170,2
16,6 25,5 0,15 71,8
3,17 42,2 0,12 81,1
23,3 19,9 0,27 117,8

mg/L mg/L mg/L


0,00 21,4 115,4
0,00
6,9
57,8
3,40 44,9 162
0,45 13,9 158
0,40 39,6 147
0,17 29,3 82,9
3,20
1,6
37,7
0,27
5,2
243
0,00 21,4 459,2
0,20
78
176
0,44 56,7 225,4
0,00 0,44
6,1
3,30 19,4 122
0,00 29,8 127
1,40
55
142
0,32 21,6 226,4
0,23
38 127,3
0,74 42,7 175,3
0,19 46,9 124,9
0,00 4,45 159,5
1,81 6,05 653
0,37 2,49 216
0,08 206 52,9
0,21 38,5
70
0,22 119,5 123

103

Lis26
Lis27
Lis28
Lis29
Lis30
Lis31
Lis32
Lis33
Lis34
Lis35
Lis36
Lis37
Lis38
Lis39
Lis40
Lis41
Lis42
Lis43
Lis44
Lis45
Lis46
Lis47
Lis48

poo
poo
poo
furo
mina
poo
poo
poo
poo
poo
poo
poo
poo
mina
poo
poo
poo
poo
nascente
poo
poo
nascente
nascente

2
3
2
3
3
2
3
2
2
2
2
1
5
5
5
5
6
6
3
5
2
3
3

7,92
7,43
7,86
7,44
8,30
7,98
7,58
7,35
7,39
7,88
7,32
7,38
7,31
8,19
7,32
8,20
6,86
8,01
7,51
7,48
7,98
7,25
7,60

1289
944
730
734
728
1244
802
834
963
975
483
1473
1273
892
1225
996
1420
1642
707
1465
395
993
1005

202
200
227
226
165
203
248
204
230
222
195,1
132,2
101,9
163,5
98,2
125,5
131
133,7
186
68,5
75,6
-19
0

300,1
401,4
251,3
367,2
386,7
361,1
396,5
284,3
295,2
274,5
234
381
447
358
477
383
536
559
287
397
82
448
388

96
84
67,5
73,3
67
63,5
70,3
89
116
77,6
80
213
181
108
169
120
194
142
72
104
40
113
86,4

132
51,4
65,3
46,3
48,5
217
71,2
86,1
73,9
121
32
111
86
48
93
70
175
181
23
151
34
99,7
70,7

3,83
3,61
16,2
2,2
0
6,13
16,1
9,15
17,8
6,9
5
3,3
12,9
58,9
28,1
56,6
1,7
2,7
2,3
109
2,8
0,6
1,1

41,2
55,5
29,9
49,9
57,5
36,8
40,1
20,2
18,5
27,0
6,3
25,4
24,2
0,9
44,1
9,7
33,3
60,3
42,3
18,9
9,2
65,0
65,1

0,31 153,7 0,40


0,20 53,9 0,07
0,14 71,1 0,11
0,15
45
0,10
0,12
49
0,10
0,15 149 0,26
0,14 57,1 0,09
0,10 116,7 0,28
0,11
85
0,23
0,35 101,7 0,24
0,24 36,6 0,00
0,17 191 0,83
0,11 171 0,00
0,00 55,6 0,00
0,12 120 0,00
0,00 68,3 0,00
0,31 195 1,10
0,18 74,7 0,00
0,00 51,3 0,00
0,15 135 0,00
0,06
47
0,00
0,00 60,8 0,00
0,14 111 0,00

152
13,93
40,1
4,53
5,52
39
47,1
31,8
155,6
88
3,8
118
6,5
48,1
71,3
91,9
0
3,3
1,4
147
2,6
49,5
10,3

70,9
98,3
90,1
97,6
96,4
110
55,5
78,3
74
112
42,9
271
197
87,8
123
95,8
329
57,3
31,8
130
72,7
61,6
60,9

Anexo 1: Matriz dos dados

104

C.E.

Eh

HCO3

Ca

Na

Mg

Cl

Br

NO3

SO4

FormGeol

Mdia 7,39
Mnimo 6,20

1266,33
447,00

-76,15
-183,00

360,33
214,00

172,97
79,20

78,88
19,40

5,70
1,60

28,63
9,10

,32
,15

105,13
18,50

,85
,00

49,02
,44

171,15
6,10

Aluvies

Mximo 8,52

1762,00

132,20

482,00

245,60 122,00

13,80

73,50

,57

191,00 3,30 118,00 271,00

Mdia
Mnimo
Mximo
Mdia
Mnimo
Mximo
Mdia
Mnimo
Mximo
Mdia
Mnimo
Mximo
Mdia
Mnimo
Mximo

934,45
395,00
1289,00
844,71
707,00
1005,00
1226,33
982,00
1492,00
1333,92
892,00
2220,00
1436,50
930,00
1871,00

192,34
75,60
230,00
143,71
-19,00
248,00
-113,18
-174,00
-74,70
-27,44
-258,10
163,50
-32,62
-170,00
133,70

278,61
82,00
529,48
382,12
287,00
448,00
415,17
210,00
575,00
378,25
316,00
477,00
385,83
43,00
559,00

88,15
40,00
150,00
80,86
67,00
113,00
124,00
74,40
174,00
141,28
96,00
240,00
149,87
75,20
204,00

94,32 10,08 25,15


32,00
2,80
6,30
217,00 23,30 42,20
58,69
3,70 53,63
23,00
,00
40,10
99,70 16,10 65,10
108,15 27,35 21,20
89,30
4,90
,00
138,00 85,80 37,40
123,58 33,54 27,48
48,00
2,70
,90
275,40 109,00 69,50
118,87 8,27 45,67
9,70
1,10
3,40
181,00 26,00 91,40

,18
,06
,35
,11
,00
,20
,31
,14
,47
,31
,00
1,01
,39
,11
1,00

93,77 ,18 79,72 81,53


36,60 ,00
2,60
42,90
153,70 ,40 206,00 123,00
61,16 ,05 18,90 71,73
45,00 ,00
1,40
31,80
111,00 ,10 49,50 98,30
87,90 ,14 30,43 116,57
64,50 ,00
6,90
57,80
108,40 ,40 46,90 147,00
103,98 ,66 46,76 180,53
52,60 ,00
4,45
82,90
171,00 3,40 147,00 653,00
103,57 ,82
5,67 223,70
25,70 ,00
,00
37,70
195,00 3,20 21,40 459,20

pH

7,71
7,19
8,05
7,59
7,25
8,30
7,20
6,25
8,31
7,38
6,13
8,31
7,87
6,61
10,45

Formao de
Benfica

CVL

Calcrios de
Entrecampos
Areolas da
Estefnia e Areias
do Vale de Chelas
Argilas do Forno
do Tijolo e Arg. e
Calc. Prazeres

Baixo
Mdio
Elevado
Anexo 2: Caracterizao dos grupos de formaes geolgicas

105

pH

Eh

Ca

1
2
Maiores
3
valores
4
5
1
2
Menores
3
valores
4
5

Amostra
9
22
11
16
17
4
13
5
6
3

Valor
10,45
8,59
8,52
8,44
8,31
6,13
6,20
6,25
6,26
6,50

1
2
Maiores
3
valores
4
5
1
2
Menores
3
valores
4
5

Amostra
32
34
28
29
35
6
12
2
8
14

Valor
248,0
230,0
227,0
226,0
222,0
-258,1
-183,0
-174,0
-170,0
-153,0

1
2
Maiores
3
valores
4
5
1
2
Menores
3
valores
4
5

Amostra
10
21
37
8
42
46
31
30
28
32

Valor
245,6
240,0
213,0
204,0
194,0
40,0
63,5
67,0
67,5
70,3

1
2
3
4
5

Amostra
45
14
15
39
41

Valor
109,0
85,8
76,6
58,9
56,6

Maiores
valores

1
2
Maiores
3
valores
4
5
1
2
Menores
3
valores
4
5

Amostra
21
22
16
43
10
46
12
36
44
30

Valor
2220
1871
1762
1642
1580
395
447
483
707
728

1
2
Maiores
3
valores
4
5
HCO3
1
2
Menores
3
valores
4
5

Amostra
5
43
42
24
19
9
46
2
12
25

Valor
575,00
559,00
536,00
529,48
512,00
43,00
82,00
210,00
214,00
219,60

1
2
Maiores
3
valores
4
5
1
2
Menores
3
valores
4
5

Amostra
21
31
43
4
42
9
12
44
36
46

Valor
275,4
217,0
181,0
178,0
175,0
9,7
19,4
23,0
32,0
34,0

1
2
3
4
5

Amostra
22
16
20
48
47

Valor
91,4
73,5
69,5
65,1
65,0

C.E.

Na

Mg

Maiores
valores

106

Br

SO4

1
2
Menores
3
valores
4
5

30
47
48
8
10

,0
,6
1,1
1,1
1,6

1
2
Maiores
3
valores
4
5
1
2
Menores
3
valores
4
5

Amostra
21
8
3
10
7
47
44
41
39
46

Valor
1,01
1,00
,62
,57
,53
,00
,00
,00
,00
,06

1
2
Maiores
3
valores
4
5
1
2
Menores
3
valores
4
5

Amostra
3
13
7
21
15
48
47
46
45
44

Valor
3,40
3,30
3,20
1,81
1,40
,00
,00
,00
,00
,00

1
2
Maiores
3
valores
4
5
1
2
Menores
3
valores
4
5

Amostra
21
9
42
37
8
12
44
7
36
23

Valor
653,0
459,2
329,0
271,0
243,0
6,1
31,8
37,7
42,9
52,9

Mg

Cl

NO3

1
2
Menores
3
valores
4
5

1
39
9
36
10

,0
,9
3,4
6,3
9,1

1
2
Maiores
3
valores
4
5
1
2
Menores
3
valores
4
5

Amostra
42
37
38
22
16
12
8
9
36
29

Valor
195,0
191,0
171,0
170,2
158,3
18,5
25,7
32,4
36,6
45,0

1
2
Maiores
3
valores
4
5
1
2
Menores
3
valores
4
5

Amostra
23
34
26
45
25
42
12
44
7
22

Valor
206,00
155,60
152,00
147,00
119,50
,00
,44
1,40
1,60
2,49

Anexo 3: Tabelas com os valores extremos (os 5 maiores e os 5 menores valores) para cada varivel

107

pH
pH
C.E.
Eh
2+

Ca
Na+
K+
Mg2+

C.E.

Ca2+

Eh

Na+

K+

Mg2+

-,023

,254

-,355*

,026

-,144

-,065

,074

-,266

,060

-,337*

,102 ,344*

-,023

-,378**

,453**

,691**

,752**

,121

,390**

,450**

,656**

,326*

,040 ,583**

,254

-,378**

-,043

-,375**

-,145

-,092

,055

-,499**

,063

-,285*

,336* -,288*

-,355*

,453**

-,043

,384**

,288*

,047

,441**

,009

,242

,121

,026

**

**

**

,263

-,055

,021

,385

**

**

,136

,037 ,666**
,033 ,395**

,691

-,375

,384

,377

-,134 -,022

-,144

,752**

-,145

,288*

,263

,060

,248

,398**

,664**

,384**

-,065

,121

-,092

,047

-,055

,060

-,275

-,096

-,004

-,005

,325* -,019

,074

,390**

,055

,441**

,021

,248

-,275

-,038

,285*

,010

-,261 ,015

-,266

**

**

,009

,385

**

**

-,096

-,038

,091

**

-,166 ,453**
,173 ,379**

,450

-,499

,398

,491

,060

,656**

,063

,242

,377**

,664**

-,004

,285*

,091

,215

-,337*

,326*

-,285*

,121

,136

,384**

-,005

,010

,491**

,215

,102

,040

,336

-,261

-,166

,173

-,100

**

-,288

,015

**

**

,228

,344

,583

-,134

,037

,033

-,022

**

**

,666

,395

,325

-,019

,453

,379

-,100 ,228
1 -,130
-,130 1

*. Correlation is significant at the 0.05 level (2-tailed).


**. Correlation is significant at the 0.01 level (2-tailed).

Anexo 4: Matriz de correlaes de Peason - amostra gobal

108

pH
pH
C.E.
Eh
2+

Ca
Na+
K+
Mg2+

C.E.
1

,429

Ca2+

Eh

,429
1

,267
,479

,168
,491

Na+

K+

,486

,389

,780

,912

Mg2+

-,744
-,473

,401
,537

-,556

,502

-,536

,224

,678

-,111

,814

,076

,480

,796

,877

,040

,769

,762

,267

,479

,371

,474

,690

-,351

,207

-,631

,168

,491

,371

,160

,645

,262

,491

-,576

,422

,735

,090

,531

,486

,780

,474

,160

,570

-,792

-,041

-,037

,684

-,235

,812*

,815*

,389

,912*

,690

,645

,570

-,288

,697

-,400

,910*

,217

,437

,810

-,744

-,473

-,351

,262

-,792

-,288

,035

,115

-,546

,762

-,627

-,646

,401

,537

,207

,491

-,041

,697

,035

-,368

,486

,122

-,292

,327

-,556

-,111

-,631

-,576

-,037

-,400

,115

-,368

-,498

-,090

-,225

-,578

,502

,422

,684

-,546

,486

-,498

-,069

,692

,902*

,040

,735

-,235

,217

,762

,122

-,090

-,069

-,148

-,062

,437

-,627

-,292

-,225

,692

-,148

,734

,810

-,646

,327

-,578

,902*

-,062

,734

-,536

,814

,076

,877

,224

,480

,769

,090

,812

,678

,796

,762

,531

,815*

,910

*. Correlation is significant at the 0.05 level (2-tailed).

Anexo 5: Matriz de correlaes de Pearson - Aluvies

109

pH
pH
C.E.
Eh
2+

Ca
Na+
K+
Mg2+

C.E.
1

Ca2+

Eh

,158

K+

Mg2+

-,634*

,466

,219

,102

,291

,334

,044

,255

,543

,522

**

,165

**

,338

**

**

,557

,408

,503

,387

,362

,362

,376

,415

,401

,538

,275

,268

,503

**

,326

-,213

**

,018

,353

,498

,005

,039

,387

**

-,099

,094

,442

-,008

,064

,332

,410

-,295

**

,192

,692*

-,243

-,512

,158

,479

-,243

,479

-,512

,650

Na+

,650

,758

,753

,816

,743

,809

,795

,522

,466

**

,362

,326

-,099

,037

,577

,340

,219

,165

,362

-,213

,094

,037

-,169

,000

,017

-,014

,541

,313

,102

**

,376

**

,442

,577

-,169

,174

,249

,259

,291

,338

,415

,018

-,008

,340

,000

,174

,346

,363

,287

,306

,334

,809

**

,064

**

,017

,647

,346

**

,302

,565

,795

**

,538

,498

,332

,669

,363

**

,354

,422

,557

,275

,005

-,634

,044
,255
,543

,753

,816

,408

,401

,268

,758

,743

,353

,039

,884

,884

,647

,674

,669

,909

-,014

,410

,192

,541

,249

,287

,302

,354

-,018

-,295

,313

,259

,306

,565

,422

-,018

,674

,692

,909

*. Correlation is significant at the 0.05 level (2-tailed).


**. Correlation is significant at the 0.01 level (2-tailed).

Anexo 6: Matriz de correlaes de Pearson - Formao de Benfica

110

pH
pH
C.E.
Eh
2+

Ca
Na+
K+
Mg2+

C.E.
1

-,451
,199

Ca2+

Eh

-,451
1
-,742

,199
-,742
1

Na+

K+

Mg2+

-,127

-,603

-,312

-,122

,015

,198

-,079

,447

-,386

,307

,681

,738

-,141

,732

,109

,669

-,508

,433

-,007

,410

-,678

,739

-,247

,235

-,447

-,648

,524

,635

**

,058

,616

,227

,181

,106

,683

,404

-,319

,682

-,380

,308

-,609

,549

-,127

-,023

-,800

,681

-,447

-,603

,635

**

,127

,567

-,090

,382

-,238

-,800

,767

,767

-,312

,738

-,648

-,122

-,141

,524

,058

-,319

,127

-,670

,279

-,125

,331

,542

-,250

,015

,732

,616

,682

,567

-,670

-,006

,540

-,351

,047

,307

,198

,109

,410

,227

-,380

-,090

,279

-,006

,109

,649

-,196

,681

-,079

,669

-,678

,181

,308

,382

-,125

,540

,109

-,561

,018

-,280

,447

-,508

,739

,106

-,609

-,238

,331

-,351

,649

-,561

-,118

,727

,542

,047

-,196

,018

-,118

-,253

-,250

,307

,681

-,280

,727

-,253

-,845

,890

,890

-,845

-,127

,804

,804

-,386

,433

-,247

,683

,549

,827

,307

-,007

,235

,404

-,127

-,023

,827

*. Correlation is significant at the 0.05 level (2-tailed).


**. Correlation is significant at the 0.01 level (2-tailed).

Anexo 7: Matriz de correlaes de Pearson - Complexo Vulcnico de Lisboa

111

pH
pH
C.E.
Eh
Ca2+
Na+
K+
Mg2+

C.E.
1

-,143

-,143
,426

Ca2+

Eh
1

,168

,426
,168
1

-,060
,797
,638

Na+

,559
,612
,705

K+

-,622
-,197
-,473

Mg2+

-,386

-,023

-,234

,002

,047

,319

-,085

,566

**

,186

,392

,596

,650

,760

,844

,736

,886*

-,458

,953

,048

-,887

-,267

-,327

-,060

,797

,638

,779

-,250

,180

,692

-,660

-,170

,748

,907

,559

,612

,705

,779

-,641

,042

,606

-,745

-,185

,541

,928**

,651

-,622

-,197

-,473

-,250

-,641

-,251

-,097

,586

,537

,116

-,538

-,434

-,386

,566

-,458

,180

,042

-,251

,490

-,554

-,198

-,475

-,018

,177

-,023

,953

**

,048

,692

,606

-,097

,490

,360

,350

,503

,432

-,234

-,887*

-,267

-,660

-,745

,586

-,554

-,840*

-,062

-,207

-,634

-,613

,002

,186

-,327

-,170

-,185

,537

-,198

,360

-,062

,157

-,324

-,349

,047

,392

,760

,748

,541

,116

-,475

,350

-,207

,157

,712

,641

,319

,596

**

-,538

-,018

,503

-,634

-,324

,712

,851*

-,085

,650

,651

-,434

,177

,432

-,613

-,349

,641

,851*

,844

,736

,907

,886*

,928

-,840

**. Correlation is significant at the 0.01 level (2-tailed).


*. Correlation is significant at the 0.05 level (2-tailed).

Anexo 8: Matriz de correlaes de Pearson - Calcrios de Entrecampos

112

pH
pH
C.E.
Eh
2+

Ca
Na+
K+
Mg2+

C.E.
1

Ca2+

Eh

,050

,567

Na+

K+

,080

,176

-,134

**

-,435

,050

-,337

-,133

,613

,567

-,337

,521

-,027

,927

Mg2+

,059

,048

,045

,229

-,271

,081

,325

-,152

,558

**

,372

-,277

,871**

,421

-,305

,183

-,442

,433

-,168

,132

-,302

,755

-,516

,649

,080

-,133

,521

-,026

-,345

,097

,440

-,549

,452

,176

,613

-,027

-,026

,485

-,422

,201

,517

,519

,116

-,410

,786**

-,134

,927**

-,435

-,345

,485

-,146

,359

,769**

,451

,567

-,213

,804**

,059

-,152

,421

,097

-,422

-,146

-,350

-,247

-,079

-,110

,854**

-,294

,048

,558

-,305

,440

,201

,359

-,350

,294

,531

-,038

-,391

,314

,045

**

-,516

-,549

,517

**

-,247

,294

,321

**

-,339

,797**

,649*

,183

,452

,519

,451

-,079

,531

,321

,019

-,146

,568

-,442

**

,019

-,184

,398

,229
-,271

,755

,372

,081

-,277

,325

**

,871

,433
-,168

-,596

,116

,769

-,110

-,038

**

-,391

-,339

-,146

-,184

-,387

,314

**

,568

,398

-,387

-,410

-,213

-,302

**

**

,786

,779

,567

,132

,804

,854

-,294

,779

-,596

,797

*. Correlation is significant at the 0.05 level (2-tailed).


**. Correlation is significant at the 0.01 level (2-tailed).

Anexo 9: Matriz de correlaes de Pearson - Areolas da Estefnia e Areias do Vale de Chelas

113

pH
pH
C.E.
Eh
2+

Ca
Na+
K+
Mg2+

C.E.
1

Ca2+

Eh

-,344

-,186

-,805

Na+

-,163

K+

-,508

Mg2+

,849*

-,250

-,697

-,296

-,535

,831*

,554

**

-,020

,524

-,069

-,755

-,567

,140

-,476

,497

-,049

-,452

-,236

-,583

-,344

,320

,609

,062

,736

-,655

-,186

,320

,612

,115

,778

-,442

-,805

,609

,612

,334

-,163

,062

,115

,334

-,508

,341

,336

,106

-,413

-,077

,319

-,069

-,626

-,049

,502

,293

-,641

,537

-,655

-,442

**

-,413

-,681

-,517

-,484

-,328

-,093

,880

**

,140

,450

-,077

,625

-,517

-,018

,456

-,029

-,662

-,582

-,697

-,020

-,476

,341

,319

-,216

-,484

-,018

-,323

,224

-,284

-,196

-,296

,524

,497

,336

-,069

,737

-,328

,456

-,323

,384

-,652

-,141

-,535

-,069

-,049

,106

-,626

,293

-,093

-,029

,224

,384

-,422

-,481

-,049

-,662

-,284

-,652

-,422

,673

-,583

,502

,537

-,582

-,196

-,141

-,481

,673

-,250

,974

-,755

-,452

,554

-,567

-,236

,831

-,973

-,862

-,859

-,641

-,681

,880

,625

-,216

,737

-,862

,764

,849

-,116

,450

,778

,736

**

,764 -,973
-,116

,974

-,859

*. Correlation is significant at the 0.05 level (2-tailed).


**. Correlation is significant at the 0.01 level (2-tailed).

Anexo 10: Matriz de correlaes de Pearson - Argilas do Forno do Tijolo e Argilas e Calcrios dos Prazeres

114

Amostra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38

1
-,249
-,099
1,046
,811
,769
-,377
,722
1,205
-,560
,767
,245
-1,438
,766
,384
1,007
1,388
,328
,559
,263
,520
2,759
1,504
-1,087
-,312
-,187
,027
-,842
-1,303
-1,293
-1,302
,244
-,973
-,609
-,694
-,272
-1,620
1,091
,561

Scores
Componentes
2
3
-1,386
-,846
-1,359
-,811
-1,916
-1,252
-,811
,515
-,613
,427
-1,418
,296
-1,666
,895
-1,500
,795
-,246
-1,533
-,722
-1,082
,496
-,127
-2,528
,187
-1,962
,398
-,575
-,131
-1,432
-1,181
1,076
1,138
,301
-,074
-,552
-,512
,125
-,015
,556
1,454
,171
-,494
1,213
,900
,959
-1,268
,472
1,196
,925
-1,658
1,511
-,523
,007
1,560
,376
-,173
-,038
1,147
,526
1,363
1,223
,085
,411
,732
,404
-,167
,821
-1,175
,661
-,620
-,696
-,187
1,293
-1,083
,884
-,118

4
,293
-,962
-1,796
-,254
-,346
,466
-2,473
1,785
3,266
1,503
1,714
,123
-,360
,449
-,999
,581
,788
,751
1,347
-,309
,062
-,149
-,380
,313
-1,068
-1,734
,176
-,396
,020
,203
-1,621
-,433
-,861
-,549
-1,296
,082
,594
,874

5
,255
-,587
-,270
,682
1,437
,347
-,600
,202
-1,469
-,427
-,465
-,551
,796
2,759
1,259
-,572
-,452
-1,225
,761
-,170
-2,327
-,937
-,250
,976
-,443
-,655
,030
-,662
-,236
-,715
-,647
,592
-,668
,144
-1,114
-1,152
-,484
,313
115

39
40
41
42
43
44
45
46
47
48

-1,391
,304
-,945
1,693
,491
-1,612
,361
-2,004
-,288
-,356

,328
1,135
,787
,425
1,008
-,132
1,237
-,370
,207
,383

-1,099
,078
-1,723
,488
1,801
1,396
-1,832
-,297
1,605
1,526

,639
,484
,402
,394
,018
-,155
-,994
,172
-,029
-,334

1,446
1,515
1,744
-,316
,950
-,353
2,160
-1,409
,916
-,129

Anexo 11: Scores das 5 primeiras componentes principais

116

Você também pode gostar