Você está na página 1de 17

Traduzido do Inglês para o Português - www.onlinedoctranslator.

com

Pesquisa de Poluição Atmosférica 11 (2020) 40–56

HOSPEDADO POR Listas de conteúdos disponíveis emScience Direct

Pesquisa de Poluição Atmosférica

Página inicial do jornal:www.elsevier.com/locate/apr

artigo de revisão

Aplicação dek- meios e técnicas de agrupamento hierárquico para análise da


poluição do ar: uma revisão (1980–2019)
P. Govender∗, V. Sivakumar
Universidade de KwaZulu-Natal, Escola de Química e Física, Durban, 4000, África do Sul

ARTIGOINFO ABSTRATO

Palavras-chave: Clustering é uma técnica de análise exploratória de dados usada para investigar a estrutura subjacente nos dados. É descrito como o
hierárquico ek-significa agrupamento agrupamento de objetos, onde os objetos compartilham características semelhantes. Nos últimos 50 anos, o agrupamento foi
Poluição do ar amplamente aplicado a dados científicos atmosféricos, em particular, dados climáticos e meteorológicos. Desde a década de 1980, os
Trajetórias de massa de ar
estudos de poluição do ar começaram a empregar técnicas de agrupamento, e desde então têm sido bem sucedidos, e o objetivo deste
assunto particular
artigo é fornecer uma revisão de tais estudos. Em particular, dois métodos de agrupamento bem conhecidos e comumente usados, ou
seja,k- revistos meios e aglomerativos hierárquicos, que têm sido aplicados em estudos de poluição do ar. Foram incluídos dados de
poluição do ar de duas fontes, ou seja, estações de monitoramento terrestres e trajetórias de massas de ar que descrevem os caminhos
dos poluentes. Trabalhos de pesquisa que se concentraram nas características espaço-temporais dos poluentes atmosféricos,
comportamento dos poluentes em termos de fonte, vias de transporte, distribuição e links para condições meteorológicas,
compreendem grande parte dos trabalhos de pesquisa revisados. Um total de 100 artigos de pesquisa foram incluídos durante o período
de 1980 a 2019. O objetivo da abordagem de agrupamento, a técnica específica utilizada e os dados aos quais foi aplicada constituem
grande parte da discussão apresentada nesta revisão. No geral, okA técnica de -means foi amplamente utilizada entre os estudos,
enquanto as ligações de média e Ward foram as técnicas de agrupamento hierárquico mais frequentemente aplicadas. Atualmente,
faltam revisões de técnicas de agrupamento aplicadas em estudos de poluição do ar e este artigo visa preencher essa lacuna. Além disso,
e de acordo com o conhecimento dos autores, esta é a primeira revisão dedicada a aplicações de agrupamento em estudos de poluição
do ar e a primeira que cobre o período de tempo mais longo (1980-2019).

1. Introdução ferramenta eficaz para a análise de poluentes atmosféricos.


A análise de cluster, ou mais comumente chamada de “clustering”, é uma
Nos últimos cinquenta anos, a qualidade do ar global apresentou um declínio, técnica usada para agrupar observações semelhantes, pontos de dados ou
um efeito direto das atividades humanas, como queima de biomassa, operações vetores de recursos com base em suas características semelhantes (Jain e outros,
industriais e emissões de veículos (Adame e outros, 2012). A presença de aerossóis 1999). De acordo comKaufman e Rousseeuw (1990), é “a arte de encontrar grupos
ou material particulado (MP) em suspensão no ar tornou-se uma grande em dados”. Em geral, o objetivo da análise de cluster é identificar grupos de
preocupação por muito tempo, devido aos efeitos adversos à saúde humana. De objetos semelhantes, onde os objetos em um cluster são mais semelhantes entre
acordo comFullerton e outros. (2008), a poluição do ar é uma causa significativa de si do que objetos em clusters diferentes. O agrupamento pode ser usado para a
morbidade e mortalidade. Além disso, vários estudos (Zhang e Smith, 2007; identificação de padrões e distribuições interessantes e produzir possíveis insights
Harinath e Murthy, 2012;Laumbach e Kipen, 2012;Bergstra e outros, 2018) sobre a estrutura subjacente dos dados (Halkidi et al., 2001). Portanto, a análise de
demonstraram a associação entre material particulado e doenças respiratórias e cluster é uma técnica útil para descobrir e extrair informações que podem ter
cardiovasculares agudas, entre muitas outras. Devido a isso, muitos trabalhos de passado despercebidas. A análise de clusters foi proposta já em 1930, porém sua
pesquisa foram realizados relacionados ao monitoramento da poluição do ar e da aplicação ganhou popularidade apenas muito mais tarde, na década de 1960. As
qualidade do ar, identificação de fontes, rotas de transporte de poluentes de técnicas de agrupamento encontraram aplicação em uma ampla variedade de
longo alcance e desenvolvimento e implementação de estratégias eficazes de disciplinas, como biologia, ciências sociais, medicina e geografia durante a década
controle e mitigação. Dentro de muitos desses estudos, a análise de cluster de 1970, e na ciência atmosférica na década de 1980 (Gong e Richman, 1995).
tornou-se uma

Revisão por pares sob a responsabilidade do Comitê Nacional Turco para Pesquisa e Controle da Poluição do Ar.
∗Autor correspondente.
Endereço de e-mail:paulenegovender@gmail.com,GovenderP5@ukzn.ac.za (P. Govender).

https://doi.org/10.1016/j.apr.2019.09.009
Recebido em 9 de maio de 2019; Recebido em forma revisada em 16 de setembro de 2019; Aceito em 16 de setembro de 2019
disponível online 19 de setembro de 2019
1309-1042/ © 2019 Comitê Nacional Turco para Pesquisa e Controle da Poluição do Ar. Produção e hospedagem por Elsevier BV Todos os direitos reservados.
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

Aplicação de agrupamento, em particulark-meios e técnicas de aglomeração trajetórias” e “comportamento da poluição do ar”. Além disso, os estudos também
hierárquica, para dados de poluição do ar tem sido conduzido desde a década de foram obtidos por meio de referências cruzadas. Com base nos assuntos de
1980, e desde então tem ganhado atenção considerável. interesse e juntamente com as palavras-chave, foram selecionados para
Revisões anteriores sobre aplicativos de clustering, como as deGong e consideração estudos durante os anos de 1980 a 2019. Após a avaliação dos
Richman (1995)eJolliffe e Philipp (2010), concentraram-se principalmente no clima resumos, apenas aqueles que se enquadram em uma das quatro categorias
e na precipitação e, em menor grau, na poluição do ar. Dado que os efeitos da listadas acima e que utilizam um dos dois métodos de agrupamento foram retidos
exposição ao PM são perigosos para a saúde humana, certamente é necessário para revisão posterior. Artigos de pesquisa originais disponíveis em periódicos
obter uma compreensão mais profunda do comportamento temporal e espacial e revisados por pares foram considerados elegíveis para inclusão. A literatura
da dinâmica dos poluentes atmosféricos. Aghabozorgi et ai. (2014)apresentou também foi selecionada para artigos de revisão anteriores relevantes para o
uma revisão sobre o agrupamento espacial e temporal da poluição do ar, no presente tópico. Juntamente com as palavras-chave, os critérios de inclusão foram
entanto, este estudo foi restrito à Malásia e não forneceu uma visão geral em estudos de poluição do ar que empregaram agrupamento de dados de poluentes
escala global. Esta revisão visa apresentar uma visão geral de duas técnicas de obtidos por meio de medições terrestres (categoria 1), e aqueles que empregaram
agrupamento comumente usadas, ou seja,k-meios e hierárquicos, que têm sido o agrupamento de trajetórias de massas de ar usadas para representar as vias de
aplicados em estudos de poluição do ar, particularmente naqueles estudos que se transporte de poluentes atmosféricos (categoria 2). A busca da literatura para
concentram em encontrar padrões e investigar a estrutura subjacente dos dados, inclusão nesta revisão foi realizada até abril de 2019. Um total de 103 (57 e 46 na
que é o objetivo fundamental da análise de cluster. Principalmente aqueles categoria 1 e 2, respectivamente) artigos de pesquisa foram revisados.
estudos envolvendo o uso de medições baseadas no solo e trajetórias de massa A revisão foi organizada de forma a começar com uma visão geral e uma
de ar foram incluídos. Mais especificamente, as contribuições significativas que breve discussão das duas técnicas de agrupamento comumente usadas, ou
apresentam aplicações de clustering em estudos de poluição do ar aqui revisados seja, hierárquica aglomerativa (incluindo Ward, simples, média, centróide e
são categorizadas como um ou mais dos seguintes assuntos de interesse: ligações completas) ek-significa. Posteriormente, o objetivo da abordagem
de agrupamento, a técnica específica usada e os dados aos quais foi
aplicada constituem grande parte da discussão. O artigo está estruturado da
(1) Identificação de padrões espaciais e temporais de poluentes atmosféricos seguinte forma: Seção2dá uma descrição dok-means e métodos de
(2) Exposição a poluentes atmosféricos e gestão da qualidade do ar agrupamento hierárquico. Seção3discute a escolha do número ideal de
(3) Relacionar o comportamento dos poluentes atmosféricos com a meteorologia sinótica local clusters, um problema comum no procedimento de agrupamento. Alguns
(4) Vias de transporte e distribuição de fontes métodos adicionais de agrupamento bem conhecidos são discutidos na
Seção4. Seção5apresenta uma discussão sobre a aplicação dos métodos de
Foi realizada uma revisão da literatura, maioritariamente artigos de agrupamento em duas categorias, ou seja, dados de poluição do ar a partir
investigação publicados e onde a seleção dos artigos foi orientada pelos temas de medições terrestres e trajetórias de massa de ar, ambas relacionadas a
acima definidos. O Google acadêmico foi o principal buscador utilizado. As estudos de poluição do ar. Seção6contém um resumo, seguido por uma
seguintes palavras-chave em diferentes combinações foram usadas na pesquisa: breve lista de recomendações na Seção7e algumas considerações finais na
“análise de cluster”, “k-meios”, “hierárquico”, “agrupamento”, “poluição do ar”, Seção8.
“poluentes do ar”, “espacial”, “temporal”, “variação”, “massa de ar

Figura 1.Diagrama esquemático descrevendo três objetivos principais da análise de cluster e o resultado de cada objetivo.

41
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

2. Descrição das técnicas de análise de cluster

De acordo comJain (2010), a análise de agrupamento pode ser categorizada


em três objetivos principais. Um esquema desses objetivos com uma descrição
dos resultados é apresentado emFigura 1. As técnicas de análise de cluster podem
ser amplamente classificadas como hierárquicas e não hierárquicas, sendo a
última frequentemente referida como particional. Embora existam várias técnicas
de análise de cluster, esta revisão é restrita a duas que são bem conhecidas e mais
comumente usadas, ou seja, agrupamento hierárquico aglomerativo e
agrupamento particional iterativo. Em particular, ligações únicas, médias,
completas, centróides e Ward para hierárquica, e ok-means técnica para clustering
particional são discutidos.

2.1. Agrupamento hierárquico: ligações simples, médias, completas, centróides e


Ward

As técnicas de agrupamento hierárquico encontram recursivamente


agrupamentos aninhados de maneira aglomerativa ou divisiva. O clustering
aglomerativo é aquele em que cada ponto de dados começa em seu próprio
cluster e, posteriormente, mescla o par semelhante de clusters sucessivamente,
resultando em uma hierarquia. Como alternativa, o clustering divisivo começa
Figura 2.Ilustração de um dendrograma, ou seja, uma estrutura bidimensional
com todos os pontos de dados em um cluster e divide repetidamente cada cluster
mostrando divisões ou fusões em diferentes estágios. (Adaptado de Finding
em outros menores. Uma vez que as divisões ou fusões são feitas, elas não podem
Groups in Data, Kaufman e Rousseeuw, 1990, com permissão do editor, John Wiley
ser revertidas e, portanto, o reajuste não é possível com agrupamento hierárquico
& Sons, Inc.).
(Lião, 2005). Um algoritmo de agrupamento hierárquico aglomerativo é
geralmente implementado da seguinte forma:
Passo 1: Cada observação é considerada um cluster inicial. Passo cada objeto no primeiro cluster e cada objeto no segundo cluster são
2: As distâncias entre os clusters são calculadas. determinados. A partir daí, a média dessas distâncias entre todos os
Etapa 3: Dois clusters com distância mínima são combinados e pares de objetos é calculada. A ligação média é superior à das ligações
substituídos por um único cluster. A matriz de distância é então recalculada simples e completas, pois permite a minimização da variância dentro
para refletir esse processo de fusão. do cluster e a maximização da variância entre os clusters (Kalkstein e
Etapa 4: Repita as etapas 2 e 3 até que haja apenas um único cluster outros, 1987).
contendo todas as observações.
A medida de distância ou proximidade é necessária para quantificar a 2.1.4. Centróide
semelhança entre os objetos. A mais comum é a distância euclidiana. Outros Ligação centróide é definida como a distância entre os centros de gravidade
incluem as distâncias de Manhattan, Minkowski e Hamming. A saída de um (centróides) de dois aglomerados. Após a adição ou remoção de um objeto, o
algoritmo de agrupamento hierárquico é um dendrograma, que é uma estrutura centróide é recalculado. Esse método de ligação é mais robusto para outliers e
bidimensional semelhante a uma árvore que descreve a sequência de tende a ter um desempenho melhor do que outros ao lidar com clusters de
agrupamentos aninhados (Dubes e Jain, 1976). A distância de cada fusão (ou tamanhos diferentes (Everitt et al., 2011).
divisão) também é representada na estrutura. Cortar o dendrograma em um nível
desejado resulta em um conjunto de grupos disjuntos (ou clusters).Figura 2mostra 2.1.5. Ala
uma ilustração de um dendrograma mostrando divisões ou fusões em diferentes Ligação de Ward (ou método de variância mínima de Ward) (Ward,
estágios. Existem diferentes medidas de proximidade usadas para combinar 1963), é definido como o menor aumento na soma dos quadrados
clusters em algoritmos hierárquicos. Os mais comuns incluem ligação única, dentro do cluster devido à fusão de dois clusters. A distância do Ward
completa, média, centróide e Ward. Esses métodos de ligação são descritos entre dois clustersAeBtendo centrosaebe frequênciasnAenB, É dado por
abaixo.

d(a,b)2
2.1.1. Solteiro (A,B)= ,
nA1+ n1 B (1)
A ligação única calcula a menor dissimilaridade entre dois objetos. A
proximidade de dois clusters é definida pela distância mínima entre ondeaebsão os centróides dos clustersAeB, respectivamente (Tuffery, 2011).
quaisquer dois objetos pertencentes aos diferentes clusters. A ligação De acordo comTuffery (2011), Ward linkage é aquele que mais se aproxima
simples também é conhecida como vizinho mais próximo. Esse tipo de do objetivo do agrupamento e, portanto, é o mais eficaz. De acordo com
método de ligação é apropriado para lidar com formas não elípticas, mas Jolliffe e Philipp (2010), a ligação Ward é um método hierárquico
tende a ser sensível a valores discrepantes. frequentemente usado. Uma representação de ligações simples, completas
e médias é apresentada emFig. 3. Para mais detalhes sobre os diferentes
2.1.2. Completo métodos de ligação, o leitor deve consultarAnderberg (1973).
A ligação completa, o oposto da ligação simples, calcula a maior
dissimilaridade entre dois objetos. A proximidade de dois clusters é definida
pela distância máxima entre quaisquer dois objetos pertencentes aos 2.2. Agrupamento particional: k-means
diferentes clusters. A ligação completa também é conhecida como vizinho
mais distante. Este tipo de método de ligação tende a produzir clusters Os métodos de clustering não hierárquicos ou particionais criam todos
compactos e é menos sensível a outliers. os clusters simultaneamente, particionando os dados. A descoberta dok-
significa algoritmo de agrupamento há mais de 50 anos porSteinhaus (1956)
2.1.3. Média , (e mais tarde porBall and Hall, 1965;MacQueen, 1967), levou à sua
A ligação média é o intermediário entre os métodos de distância aplicação em diversos campos, como psicologia, pesquisa de marketing,
máxima e mínima. Mais especificamente, as distâncias entre medicina e biologia. Embora vários outros agrupamentos

42
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

Figura 3.Representação de ligações únicas, completas e médias (adaptado da análise de cluster,Everitt et al., 2011, com permissão do editor, John Wiley & Sons, Inc.).

algoritmos foram desenvolvidos desde então,k-means continua sendo um dos no segundo. Mais especificamente, o agrupamento hierárquico é o primeiro
métodos mais amplamente utilizados devido à sua simplicidade, facilidade de estágio ek-means é o segundo. O motivo da combinação desses dois
implementação e eficiência (Jain, 2010). métodos e nessa ordem é usar o dendrograma para escolher o número de
De acordo comHartigan e Wong (1979), o objetivo dok-significa que o clusters a serem usados como “sementes” nok-significa algoritmo. Essa
algoritmo é dividirmobjetos emndimensões emk(ondek≤n) partições (ou clusters) abordagem combina os pontos fortes de ambos os métodos, onde nenhuma
de modo que a soma dos quadrados dentro do cluster seja minimizada. Ao especificação a priori do número de clusters é necessária na primeira etapa
contrário das técnicas hierárquicas,k-means produz uma estrutura de e a velocidade da segunda etapa. As ligações Ward, Average e Centróide
agrupamento plana. A similaridade entre um par de objetos é definida por sua geralmente precedem ok-significa algoritmo, e geralmente é o caso em que
distância e, entre as disponíveis, a distância euclidiana é frequentemente usada a ligação de Ward é comumente usada (Tuffery, 2011).
como medida de distância. A partição divide os dados emkgrupos de modo que
cada grupo contenha pelo menos um objeto. Dado um conjunto de objetos, o 2.4. Outros métodos de agrupamento
objetivo principal dak-significa que o agrupamento é para
otimizar a seguinte função objetivo: Além dos métodos de agrupamento discutidos acima, alguns dos outros
k métodos bem conhecidos incluem particionamento em torno de medoids (PAM)
J= ||xeu cj||2, ouk-medóides, modelo de Markov oculto (HMM), modelos de mistura e fuzzy c
j=1eu Cj (2) -meios que são brevemente descritos.tabela 1fornece uma comparação das
vantagens e desvantagens dos diferentes métodos de agrupamento.
ondeJé a função critério,xeué oeuª observação, jé ojº

centro de cluster,jé o conjunto de objetos dojo cluster ekrepresenta o


2.4.1. Particionando em torno de medoids
número de clusters. Qualquer norma representando a distância entre o
Em vez de usar o valor médio dos objetos em um cluster como ponto de
objeto de dados e o centro do cluster é denotada por | || (Chu e outros,
referência, um objeto real pode ser usado. O objetivo é encontrar o objeto
2012). A função de critério tenta minimizar a distância de cada ponto do
localizado mais centralmente dentro do cluster, que é chamado de medoid,
centro do cluster ao qual o ponto pertence (Halkidi et al., 2001). Em geral, ok
e os objetos mais próximos são atribuídos ao medoid para criar clusters (
-significa que o método de agrupamento iterativo é implementado da
Madulatha, 2012;Omran et al., 2007). De acordo com Han et ai. (2012), o
seguinte maneira:
critério de erro absoluto é definido como
Passo 1: Escolha umkvalor. Use-os como o conjunto inicial dekcentróides.
k
Etapa 2: atribua cada um dos objetos ao cluster com o centróide mais
próximo.
E= dist.(p,oeu)
eu=1pCi (3)
Passo 3: Determine os novos centróides dokclusters, calculando a
média dos membros do cluster. ondeEé a soma do erro absoluto para todos os objetospno conjunto de
Passo 4: Repita os passos 3 e 4 até que não haja mudança na função de dados eeué o objeto representativo deeu. Esta é a base para okmétodo
critério após uma iteração (Chu e outros, 2012). -medoids, que agrupanobjetos emkclusters minimizando o erro
Não há garantia de quek-means encontra o mínimo global, mas absoluto.
encontra um mínimo local para uma dada escolha inicial de centróides. Para
verificar a variação no agrupamento devido a diferentes centróides iniciais,k 2.4.2. Modelos ocultos de Markov
-means é executado várias vezes. Além disso, okO algoritmo -means Os modelos ocultos de Markov pertencem ao grupo de agrupamento baseado em
pertence à família de algoritmos de agrupamento que requerem a modelo e são úteis para dados de séries temporais. Usando um modelo oculto de
especificação a priori de um número desejado de agrupamentos. Markov, cada ponto de dados representa o valor observado de uma série temporal no
tempot. O modelo consiste em duas partes: (i) a observação da série temporal e (ii) as
2.3. Agrupamento em dois estágios variáveis de estado não observadas através das quais as observações da série temporal
são geradas.
O agrupamento em dois estágios, nesta revisão, refere-se ao uso combinado de dois O modelo é caracterizado por um conjunto de estados, uma distribuição de probabilidade
métodos de agrupamento, onde a saída do primeiro é usada como entrada inicial para o primeiro estado, uma matriz de probabilidade de transição que liga

43
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

tabela 1
Comparação das vantagens e desvantagens dos métodos de agrupamento (Bhagat e outros, 2016;Namratha e Prajwala, 2012,Omran et al., 2007).

método de agrupamento Vantagens Desvantagens

k-significa
• •
• •
Baixa complexidade O número de clusters precisa ser especificado com antecedência

• •
Computacionalmente rápido Sensível a valores discrepantes

• •
Capacidade de lidar com grandes conjuntos de dados A Incapacidade de lidar com clusters não convexos de tamanhos e densidades variáveis
Sensível à escala do conjunto de dados


associação do cluster pode ser ajustada

• •
Centróides iniciais diferentes produzem resultados diferentes
k-medoides Outliers menos sensíveis

• •
O número de clusters precisa ser especificado com antecedência
A associação do cluster pode ser ajustada

• •
Centróides iniciais diferentes produzem resultados diferentes
Hierárquico (único, completo, médio, Não requer que o número de clusters seja alta complexidade
centróide e ligação Ward) •
• •
especificado com antecedência Computacionalmente lento
O dendrograma fornece representação gráfica Capacidade de

• •
Depois que os clusters são formados, nenhum ajuste pode ser feito
detectar grupos de formas e tamanhos variados O nível de corte do dendrograma pode ser difícil de decidir
• Clusters dependentes da métrica de distância usada
Modelo oculto de Markov
• Flexibilidade no tratamento de vários tipos de dados


Requer muitos parâmetros Requer

• •
grandes conjuntos de dados
modelos de mistura Clusters podem ser caracterizados por um pequeno número de Computacionalmente caro se o número de distribuições for grande ou


parâmetros o conjunto de dados contém muito poucos pontos de dados observados.


Requer grandes conjuntos de dados

Difícil estimar o número de clusters


Difusoc-significa
• Permite flexibilidade de atribuição de cluster Mais • alta complexidade

• realista em termos de poder dar a probabilidade de •



O número de clusters precisa ser especificado com antecedência
pertencer a um cluster Pode convergir para um ótimo local

Nvocêm
estados sucessivos e distribuições de probabilidade dependentes do estado
eu=1 eu jxeu
responsáveis por gerar os dados da série temporal. Apenas as observações j= ,
N
eu=1 eu j
vocêm (6)
da série temporal são visíveis para o observador enquanto as variáveis de
estado estão ocultas. O modelo oculto de Markov fornece estatísticas como
ondeNé o número de observações,mé qualquer número real maior que
média, desvio padrão e valores de peso para um cluster, de acordo com as
1, conhecido como coeficiente de imprecisão eeu jrepresenta o grau de
observações que compõem o cluster (Gómez-Losada et al., 2014; Gómez-
adesão dexeuemjo cluster (Chu e outros, 2012).
Losada et al., 2018).

3. Escolha do número ideal de clusters e validade do cluster


2.4.3. modelos de mistura
Em alguns casos, é insuficiente descrever um conjunto de dados usando uma
Uma das principais dificuldades com a aplicação de algoritmos de
distribuição. Isso é particularmente comum quando o conjunto de dados é
agrupamento para a extração de informações e padrões significativos dos
derivado de duas ou mais subpopulações. Portanto, torna-se necessário ajustar
dados é a escolha do número ideal de agrupamentos. Este tem sido um
uma composição de distribuições ao conjunto de dados subjacente, onde tais
tópico de muito debate e ainda é considerado um aspecto importante, ainda
distribuições são chamadas de modelos de mistura. Os modelos de mistura são
não resolvido, da análise de agrupamento. A primeira investigação
definidos pelos parâmetros específicos de cada componente e a proporção em
abrangente de vários procedimentos para determinar o número de clusters
que ocorrem os componentes misturados. O agrupamento de objetos de dados é
foi porMilligan e Cooper (1985), onde 30 critérios de avaliação diferentes
obtido através da determinação dos parâmetros dos componentes e, assim,
foram testados em conjuntos de dados artificiais.
classificando cada objeto de dados pelo respectivo componente. Variáveis como
Para técnicas de agrupamento hierárquico e particional, existem vários
média e variância são usadas para caracterizar esses modelos. Várias técnicas
critérios que podem auxiliar o pesquisador na escolha e validação do número
podem ser usadas para ajustar as distribuições do modelo de mistura, por
ideal de agrupamentos. Estes incluem índice de silhueta, índice de Dunn, Calinski-
exemplo, métodos gráficos, o método dos momentos, estimativa de máxima
Harabz (CH), Davies-Bouldin (DB), índice de Rand, Bayes Information Criterion
verossimilhança (MLE) e abordagens bayesianas. A abordagem mais amplamente
(BIC), Akiake Information Criterion (AIC) e estatísticas de lacunas, soma de
utilizada é o algoritmo Expectation-Maximization (EM) para o MLE da distribuição
quadrados dentro do cluster (WCSS ), soma dos quadrados entre clusters (BCSS) e
do modelo de mistura (Gómez-Losada et al., 2014).
semi-R2, para nomear alguns. Nos estudos de poluição do ar por Beddows et ai.
(2009),Wegner e outros. (2012)evon Bismarck-Osten e Weber (2014), o índice de
2.4.4. C-meios difusos silhueta e o índice de Dunn foram os mais aplicados. O índice de silhueta é uma
Abordagens tradicionais de clustering criam partições, onde dentro da medida da compactação e separação do cluster. Os valores do índice de silhueta
partição um objeto pertence a um e apenas um cluster. Estes são, portanto, variam de -1 a 1, indicando observações não bem agrupadas e bem agrupadas,
clusters “difíceis”. O clustering fuzzy foi criado para aliviar esse problema, respectivamente. Observações com valor 0 indicam aquelas na borda de dois
fornecendo um objeto para ser associado a um cluster usando uma função clusters. O índice de Dunn é definido como a razão entre a distância mínima entre
de pertinência. O clustering fuzzy pode ser convertido em clustering rígido, duas observações pertencentes a diferentes clusters, dividida pela distância
atribuindo cada objeto ao cluster com o maior valor de associação (Jain e máxima entre duas observações pertencentes a um cluster. Um valor de índice de
outros, 1999). o confusoc-means é o algoritmo de agrupamento difuso mais Dunn mais alto indica uma solução de clustering mais ideal (Wegner e outros,
conhecido. O algoritmo tenta minimizar a função objetivo, chamada dec 2012;von Bismarck-Osten e Weber, 2014). Mais detalhes sobre validação de cluster
-significa a função definida como: podem ser encontrados emHalkidi et ai. (2001),Kaufman e Rousseeuw (1990) e
k N Tuffery (2011). Apesar dos diversos critérios disponíveis para auxiliar o
Jm= eu
vocêm ||xeu
j cj||2
j=1eu=1 (4) usuário na seleção do número apropriado de clusters, a escolha do
número de cluster ideal também depende da aplicação e do número
1
k que produzirá os clusters mais significativos. Portanto, cabe ao
eu j= (||xeu cj||/||xeu ceu||)
2/(m1)
, pesquisador avaliar mais de um método para encontrar qual é o
eu=1 (5) melhor para os dados em questão.

44
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

4. Exposição ao material particulado e risco associado à saúde entender os níveis e o comportamento de cada espécie, de modo que
humana estratégias apropriadas de controle e mitigação possam ser implementadas.
A clusterização tem sido uma ferramenta útil para esse fim, onde métodos
Produtos químicos perigosos expelidos no meio ambiente por meio de hierárquicos têm sido amplamente utilizados (Kalkstein e Corrigan, 1986;
uma variedade de atividades naturais e antropogênicas resultam em efeitos Cheng e outros, 1992;McGregor e Bamzelis, 1995;Greene e outros, 1999;
adversos à saúde humana e ao meio ambiente. Os vários poluentes Saksena et al., 2003;Flemming e outros, 2005;Beaver e Palazoglu, 2006;Giri
comumente encontrados, como monóxido de carbono (CO), dióxido de et al., 2007;Grivas e outros, 2008;Pires e outros, 2008a;Pires e outros, 2008b;
enxofre (SO2), óxidos de nitrogênio (NOx), compostos orgânicos voláteis Contini et al., 2010;Gao et al., 2011;Lu et al., 2011;Unal e outros, 2011;
(VOCs), ozônio (O3), PM2.5e PM10, mostram diferenças em sua composição Dominick e outros, 2012;Latif et al., 2014;Pandey e outros, 2014;Iizuka et al.,
química, propriedades de reação e capacidade de se difundir em distâncias 2014;Solazzo e Galamarini, 2015;Kahya et al., 2017;Kwon et al., 2018;Cakmak
longas ou curtas. et al., 2018;Qiao et al., 2018;Soares e outros, 2018), juntamente com ok
A exposição a poluentes tem efeitos agudos e crônicos na saúde método -means (Crecelius et al., 1980;Gorham e outros, 1984;Sausy e outros,
humana, incluindo doenças respiratórias, pulmonares e cardiovasculares. 1987;Sanchez e outros, 1990;Comrie, 1996;Omar e outros, 2005;Kim e
Além disso, a mortalidade prematura e a expectativa de vida reduzida outros, 2008;Jin e outros, 2011;Adame e outros, 2012;Shi e outros, 2014;
também têm sido associadas a exposições a poluentes de curto e longo Munir e outros, 2015;Lyapina et al., 2016;Zhao et ai. 2016, 2018;Davuliene et
prazo.Kampa e Castanas, 2008). al., 2019). Nesta revisão, também houve estudos (Kalkstein e outros, 1987;
Por muitos anos, os efeitos na saúde associados à exposição ao PM foram Cheng e outros, 1992;McGregor e Bamzelis, 1995;Greene at al. 1999;Cakmak
amplamente reconhecidos. Suspensas no ar, essas partículas variam em tamanho et al., 2018) investigando a relação entre o comportamento do aerossol
e composição e consistem em misturas complexas e variáveis. Processos poluente e o clima, em particular, para identificar eventos sinópticos locais
industriais, operações de fábricas e usinas de energia, veículos motorizados, associados a altos (ou baixos) níveis de poluentes. O agrupamento em dois
atividades de construção, incêndios e poeira constituem alguns dos principais estágios e o uso de vários métodos são significativamente menores (Davis e
contribuintes para as fontes de MP. PM pode ser classificado em três categorias Kalkstein, 1990;Davis e Gay, 1993;Eder e outros, 1994;Davis e outros, 1998;
com base em seu tamanho em termos de diâmetro aerodinâmico: (1) partículas Lu e outros, 2006; Beddows e outros, 2009;Austin e outros, 2012;Hsu e
ultrafinas (menores que 0,1 μm), (2) partículas finas (menores que 1 μm) e (3) Cheng, 2016,2019). mesa 2apresenta um resumo da literatura que tem
partículas grossas (maiores que 1 m). A deposição da partícula PM no trato aplicado métodos hierárquicos ek- significa técnicas para medições
respiratório depende de seu tamanho. PM10 terrestres para estudos de poluição do ar. Cada autor é listado junto com os
as partículas se acumulam principalmente na região do trato respiratório dados/variáveis agrupados, método e, se mais de um método de
superior, enquanto as partículas finas e ultrafinas têm a capacidade de agrupamento foi aplicado, o método que apresentou o melhor desempenho
penetrar na região do pulmão. Além disso, partículas ultrafinas e finas têm foi indicado.
efeitos piores do que partículas grossas, em termos de mortalidade, efeitos
cardiovasculares e respiratórios.Kampa e Castanas, 2008). Apesar do
tamanho, a presença de PM no ar é, no entanto, uma preocupação 5.1.1. Técnicas de agrupamento para análise da variação espacial e temporal de
significativa para a saúde pública. poluentes
O monitoramento ambiental dos níveis de poluentes atmosféricos é, portanto, Uma análise da qualidade do ar em Delhi, na Índia, foi realizada porSaksena et
importante para entender o comportamento dos poluentes. Além disso, os ai. (2003), onde a abordagem de agrupamento de ligação média foi usada para
esforços para reduzir os níveis de poluição devem ser fortemente intensificados, o classificação de dióxido de enxofre (SO2), dióxido de nitrogênio (NO2) e poluentes
que inclui a análise e compreensão dos padrões temporais e espaciais do critérios de material particulado em suspensão (SPM), usando dados de 9
comportamento dos poluentes e a implementação de estratégias adequadas e estações. Clusters representam padrões espaciais dos poluentes. Todos os
eficazes de controle e mitigação de curto e longo prazos. Esses fatores são cruciais poluentes foram classificados em 2 clusters. Em geral, os resultados não
para garantir que os riscos à saúde humana sejam minimizados. A análise de mostraram diferenças estatisticamente significativas existentes na concentração
agrupamento pode ser usada como uma ferramenta na análise de muitos dos média de todos os poluentes entre estações pertencentes a diferentes tipos de
aspectos acima. Esta revisão destaca muitos dos estudos em que isso foi uso da terra (residencial e industrial).Giri et al. (2007)usou o agrupamento de
alcançado com sucesso. Ward para obter uma compreensão da poluição do ar espacial, em particular PM10
, no vale de Katmandu, no Nepal. Tipos de cluster individuais foram baseados em
5. Aplicativos de cluster PM10concentrações de 6 locais de monitoramento da qualidade do ar, durante as
estações de pré-monção, monção, pós-monção e inverno. Dois clusters
Esta seção apresenta as aplicações de ligações hierárquicas (Ward, simples, sazonalmente independentes de PM semelhantes10características de
médias, centróides e completas) e particionais (k- significa) técnicas de concentração foram identificadas. Esses dois grupos representam fundos de vale
agrupamento em estudos de poluição do ar que abrangem quase 40 anos. Em e urbanos e a principal área da cidade associada a alta atividade comercial e
particular, são apresentadas as investigações com foco em padrões espaciais e veicular. As características dos aglomerados durante as estações de monção, pós-
temporais, exposição e gerenciamento da qualidade do ar, distribuição de fontes, monção e inverno foram analisadas. Por exemplo, uma redução no PM10era
rotas de transporte e relação de poluentes atmosféricos à meteorologia sinótica. A esperada concentração durante a monção, porém esta redução só foi observada
discussão é dividida em duas categorias, ou seja, (1) medições de poluição do ar em algumas áreas, indicando assim o limitado efeito decrescente da monção.Kim
baseadas no solo e (2) trajetórias de massa de ar. Geralmente, as técnicas de e outros. (2008)examinou o PM temporal2.5padrões nos EUA para a caracterização
agrupamento são referidas como hierárquicas (incluindo ligações de Ward, de regiões espacialmente homogêneas. Um total de 522 locais de monitoramento
simples, médias, centróides e completas),k- significa agrupamento em dois durante um período de 5 anos foi usado na análise. Os tipos dek- significa que os
estágios (hierárquico seguido pork-means) e métodos múltiplos (o uso de mais de clusters identificados foram temporais (resolução anual) e tendências sazonais de
um método de agrupamento). PM2.5concentração. O agrupamento produziu 6 regiões que exibem PM temporal
homogêneo2.5padrões de concentração que foram: regiões Central, Flórida/Costa
5.1. Medições de poluição do ar terrestre do Golfo, Centro-Oeste, Nordeste, Sudeste e Oeste. Dentro de cada região
espacialmente homogênea, padrões temporais distintos foram observados.
Várias obras (Zhang e Smith, 2007;Fullerton e outros, 2008; Harinath e Verificou-se que maior PM2.5as concentrações ocorrem no inverno na parte oeste
Murthy, 2012;Laumbach e Kipen, 2012;Bergstra e outros, 2018) destacaram dos EUA, mas no verão nas regiões nordeste e sudeste. Um estudo investigando a
o impacto dos poluentes do aerossol em várias doenças relacionadas às vias poluição do ar na China foi realizado porGao et al. (2011). Este estudo focou
respiratórias. Portanto, a identificação e análise dos padrões espaciais e
temporais dos poluentes são aspectos importantes para

45
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

mesa 2
Resumo da literatura que aplicou métodos hierárquicos,k-métodos e técnicas de agrupamento em dois estágios para medições de poluentes terrestres em estudos de poluição do ar.

Ano Autor Dados/variáveis Abordagem/método de agrupamento Método de melhor desempenho se


mais de um usado

1980 Crecelius et al. elementos particulados k-significa


1984 Gorham et ai. Vários íons relacionados à poluição do ar, agricultura e k-significa
maresia
1986 Kalkstein e Corrigan Temperatura do ar e do ponto de orvalho, pressão, velocidade do vento, cobertura de hierárquico
nuvens, visibilidade, SO2

1987 Sausy et ai. Elementos de partícula k-significa


1990 Davis e Kalkstein Temperatura do ar e do ponto de orvalho, pressão, componentes do vento, cobertura de Dois estágios: ligação média ek-
nuvens significa
1990 Sanchez et ai. Concentrações de PM e diversas variáveis meteorológicas. O3 k-significa
1992 Cheng et ai. , TSP hierárquico
1993 Davis e Gay Temperatura do ar e ponto de orvalho, altura geopotencial, velocidade Dois estágios: ligação média ek-
e direção do vento, dados de aerossóis significa
1994 Eder et ai. O3, temperatura do ar e do ponto de orvalho, pressão, nebulosidade, Dois estágios: ligação média ek-
velocidade do vento significa
1995 McGregor e Bamzelis ENTÃO2,NÃO2, ó3, NÃO, CO, PM10, hierárquico
1996 Comrie 850 mb de altura geopotencial k-significa
1998 Davis et ai. Temperatura, pressão, umidade, cobertura de nuvens, velocidade do vento, O3. Dois estágios: Ligação média e
kmeans
1999 Greene et ai. Temperatura do ar e do ponto de orvalho, cobertura de nuvens, pressão e hierárquico
velocidade e direção do vento
2003 Saksena et ai. ENTÃO2, NÃO2, PM PM10, hierárquico
2005 Fleming et ai. ENTÃO2, NÃO2,O3 hierárquico
2005 Osmar et ai. Propriedades microfísicas e ópticas de aerossóis k-significa
2006 Gramsch et ai. PM10, ó3, hierárquico
2006 Lu et ai. PM10 hierárquico,k-significa, mapas auto- k-significa, mapas auto-organizados
organizados
2007 Giri et al. PM10 hierárquico
2008 Beaver et ai. Vento, ó3 hierárquico
2008 Grivas et al. PM10 hierárquico
2008 Kim e outros. PM2.5 k-significa
2008a Pires e cols. ENTÃO2, PM10 hierárquico
2008b Pires e cols. CO, NÃO2, NÃOx, ó3 hierárquico
2009 Beddows et ai. Tamanho da partícula k-significa,k- clusterização mediana, difusa e k-significa
baseada em modelo
2010 Contini et al. Vários PM10espécies iônicas hierárquico
2011 Jin et ai. O3 k-significa
2011 Gao et al. PM10, ENTÃO2, NÃO2 hierárquico
2011 Lu et ai. ENTÃO2, NÃO2, RSP hierárquico
2011 Unal et ai. PM10, velocidade e direção do vento, precipitação, pressão O3, hierárquico
2012 Adame et ai. NÃO2e assim2 k-significa
2012 Dominick e outros. O3, CO, NÃO, NÃO2, ENTÃO2, PM10, temperatura, humidade, velocidade do hierárquico
vento
2012 Wegner e outros. Dados de tamanho de aerossol k-significa
2013 Austin e outros. Um conjunto de 20h2.5componentes Dados de Dois estágios: Ward linkage ek-significa k
2014 Hussein e outros. tamanho de partícula -significa
2014 Iizuka et al. NÃOxOx, PM, NmHC hierárquico
2014 Latif et ai. O3, CO, NÃO, NÃO2, NOx, SO2, PM10, CH4, THC, NmHC PM10, hierárquico
2014 Pandey et ai. PM2.5, PM1,0, ENTÃO2, NÃO2 hierárquico
2014 Shi et ai. NÃO2, ENTÃO2 k-significa
2014 von Bismarck-Osten e Dados de tamanho de número de partícula k-significa
Weber
2015 Huang e outros. PM2.5 hierárquico
2015 Munir e outros. O3 k-significa
2015 Solazzo e Galamarini O3 hierárquico
2016 Cakmak et ai. O3, PM2.5,temperaturas do ar e do ponto de orvalho, pressão, velocidade do hierárquico
vento, cobertura de nuvens
2016 Hsu e Cheng Velocidade e direção do vento, PM2.5 Agrupamento em dois estágios: ligação não
especificada ek-significa método de
2016 Wang et ai. Trajetórias, PM2.5,ENTÃO2, NÃO2, temperatura, umidade, agrupamento não especificado
velocidade e direção do vento
2016 Lyapina et al. O3 k-significa
2016 Zhao et ai. PM2.5,PM10, ENTÃO2, NÃO2, CO, O3 k-significa
2017 Kahya et al. PM2.5 hierárquico
2018 Cakmak et ai. Ozônio, PM2.5,temperaturas do ar e do ponto de orvalho, pressão, velocidade hierárquico
do vento, cobertura de nuvens
2018 Kwon et ai. GEE hierárquico
2018 Qiao et ai. PM2.5 hierárquico
2018 Soares e outros. ENTÃO2, NÃO2 hierárquico
2018 Zhao et ai. PM2.5, ó3 k-significa
2019 Davuliene et al. BC k-significa
2019 Hsu e Cheng Velocidade e direção do vento, pressão ao nível do mar, PM2.5,PM10, Agrupamento em dois estágios: ligação não
O3 especificada ek-significa método de
2019 Zhang et ai. Trajetórias a 500 m, Pb, CO, O3, ENTÃO2, NÃOx agrupamento não especificado

46
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

sobre a poluição do ar em escala regional e onde foram estudados os índices No entanto, os resultados de agrupamento produzidos fornecem informações
diários de poluição do ar (DAPI) de 81 cidades. O DAPI foi analisado, usando úteis sobre regimes de qualidade do ar e níveis de poluição em Xiamen.
agrupamento de ligação média, para produzir cidades com uma distribuição Características da distribuição regional de PM2.5em Xi'an, na China, foram
semelhante de níveis de poluição. No primeiro nível, os clusters representavam investigados por Huang e outros. (2015), usando um método hierárquico. Tipos de
dois regimes, ou seja, norte e sul, que consistiam em cidades com DAPI cluster individuais foram baseados em PM2.5concentrações de 13 locais de
semelhantes. A partir daí, os dois regimes DAPI foram divididos em 7 clusters monitoramento que foram divididos em 3 clusters. Algumas das principais
onde os clusters representavam a frequência do DAPI para as cidades contidas descobertas incluem distribuição temporal de PM2.5concentração é maior no
neles.Jin et ai. (2011)demonstrou o uso dek-significa agrupamento para identificar inverno, seguido do outono, primavera e verão. Em termos de características de
regimes espaciais de poluição por ozônio sobre San Joaquin Valley (SJV) da distribuição espacial, a maior concentração localizou-se em 3 dos 13 locais de
Califórnia. Clusters (ou regimes) identificados através do kA abordagem de médias monitoramento. Além disso, constatou-se que a distribuição de PM2.5não teve
representa locais de distribuição espacial de ozônio semelhante. Dos seis regimes relação com as localizações geográficas, e variação na concentração de PM2.5foi
identificados, dois correspondem a clusters de ozônio baixo, três a moderado e principalmente resultado de atividades industriais.Munir e outros. (2015)
um a alto. Medições meteorológicas foram usadas para explicar as distribuições estudaram as variações temporais de O3em Makkah, Arábia Saudita. Clusters de 4
espaciais do ozônio e sua correlação com aquelas da Bacia do São Francisco (SFB). e 12 ciclos diurnos foram produzidos. Essas soluções de agrupamento
Atualmente, os locais de medição existentes foram capazes de capturar padrões correspondem a ciclos sazonais e mensais, respectivamente.Zhao et ai. (2016)
espaciais de ozônio dentro do SFB e do Vale do Scaremento, embora esses locais realizou uma avaliação da qualidade do ar em 31 cidades chinesas, por meio da
ao longo da parte oeste do SJV estivessem sub-representados. Investigar variações análise de 6 critérios poluentes (PM2.5, PM10, CO, NÃO2, ENTÃO2e O3) no que diz
espaço-temporais em PM10concentrações e identificar locais de monitoramento respeito à sua variação anual e diurna, a fim de compreender melhor a situação
com comportamento poluente semelhante na Turquia, Istambul,Unal et ai. (2011) da poluição na China. Tipos de aglomerados de variação anual, sazonal e diurna
aplicou o agrupamento de Ward aos dados registrados em 10 locais durante um foram estabelecidos separadamente para cada um dos 6 poluentes. Em termos de
período de 5 anos. Os clusters identificados foram representativos da variações anuais, o agrupamento de PM2.5e assim2as concentrações dividiram as
variabilidade temporal do PM diário10concentrações. O agrupamento de inverno, cidades em 3 e 5 grupos, respectivamente, e com base no PM10, CO, NÃO2e O3
verão e anual revelou 5 PM distintos10regiões, com variação significativa em toda a
cidade. Seis dias da semana apresentaram maiores concentrações, e as estações cidades divididas em 4 grupos. Com exceção de O.3, CO e SO2, as concentrações
de inverno e verão são caracterizadas por altas e baixas concentrações, de poluentes nos meses de inverno foram significativamente maiores do que nos
respectivamente. Além disso, PM10as concentrações foram maiores para baixas outros meses. As cidades mais poluídas estavam localizadas principalmente na
velocidades de vento e ventos originários das direções SW e ENE.Dominick e planície do norte da China e no nordeste da China durante abril de 2014 a março
outros. (2012)poluente atmosférico investigado (O, O3, PM10, ENTÃO2, NÃO2,NO) de 2015 devido ao rápido crescimento econômico e mais emissões industriais nas
fontes e padrões espaciais na Malásia, usando a técnica de agrupamento de Ward. regiões. As cidades pouco poluídas estavam principalmente na região sul e
Clusters representam estações de monitoramento para identificar padrões aquelas cidades com altitude elevada. Variação diurna de O3
espaciais de qualidade do ar. Medições de espécies poluentes juntamente com as concentrações mostraram tendências opostas às de outros poluentes.
umidade de temperatura e velocidade do vento de 8 estações terrestres foram Kahya et al. (2017)aplicou o agrupamento de Ward para investigar o PM
analisadas. As estações foram classificadas em 3 clusters, que compreendem os espacial e temporal2.5distribuições na Turquia. Os tipos de cluster
principais centros das cidades (cluster 1), áreas residenciais e comerciais (cluster 2) consistiram em 13 estações de monitoramento que foram agrupadas em 5.
e áreas industriais (cluster 3). De todos os poluentes analisados, constatou-se que Dois locais exibiram o maior PM2.5concentrações que foram atribuídas
o PM10contribuíram com os maiores níveis de poluição em todas as estações. Um principalmente ao aquecimento de combustível fóssil. Quatro estações
estudo que investigou o agrupamento de poluentes na escala da cidade foi feito urbanas excederam o limite padrão durante o período de estudo.Qiao et ai.
porAustin e outros. (2013), onde PM2.5os dados de 109 locais de monitoramento (2018)usou agrupamento de ligação média para investigar PM2.5distribuição
foram agrupados usando a abordagem de dois estágios, ou seja, Ward linkage de fontes e contribuições de 25 cidades chinesas, derivadas de um modelo
seguido pork-significa. Os tipos de cluster da abordagem de dois estágios foram de Qualidade do Ar Multiescala Comunitária (CMAQ). Nove clusters
compostos de diferentes regiões geográficas que mostraram proporções representaram grupos de cidades com contribuições semelhantes. Os
semelhantes de uma variedade de PM2.5elementos. Os grupos resultantes resultados mostraram o maior e o menor PM anual2.5concentrações para as
representam grandes diferenças nas emissões. Igual aDominick e outros. (2012), cidades do norte e do litoral sul e leste, respectivamente. As incertezas do
Latif et ai. (2014)também realizou uma análise do comportamento dos poluentes modelo na repartição da fonte e nas estimativas de contribuição podem ser
atmosféricos na Malásia usando o método de Ward. No entanto, o estudo incluiu atribuídas aos inventários de emissões não padronizados disponíveis para a
poluentes orgânicos adicionais, como metano (CH4), hidrocarboneto total (THC) e China.Zhao et ai. (2018)identificou as potenciais regiões de origem de PM2.5e
hidrocarboneto não metânico (NMHC) durante um período significativamente O3atingindo a Bacia de Sichuan na China, aplicandok-significa agrupamento
mais longo (15 anos) e foi restrito à península da Malásia. Quatro agrupamentos de dados de 22 locais. Tipos de cluster compostos por PM por hora2.5
de padrão de variação temporal foram identificados a partir de dados de e O3dados agrupados em 4 e 5 clusters, respectivamente. Maior concentração de
resolução horária de várias variáveis de qualidade do ar. Avaliação das variações PM2.5estavam localizados principalmente nas regiões oeste e sul da bacia de
espaciais e sazonais no PM10, PM2.5, PM1,0, ENTÃO2 Sichuan. para O3, foram observadas grandes diferenças nas variações entre as
cidades, com níveis elevados nas partes sul e leste da bacia. Além disso, as
e não2em uma jazida de carvão de Jharkhand na Índia, foi conduzido porPandey et ai. trajetórias chegando a 500 m foram atribuídas a clusters usando o método de
(2014), usando agrupamento de ligação média. Os tipos de cluster foram compostos por Ward. Principais vias de transporte resultando em aumento de PM2.5e O3as
locais de monitoramento que retratam comportamento semelhante em termos de concentrações no inverno e no verão, respectivamente, foram identificadas
dispersão de poluentes e variações espaciais. Cinco locais de monitoramento da combinando trajetórias com concentrações de poluentes. O planalto tibetano foi
qualidade do ar foram usados e os resultados mostraram que, para todos os locais, as considerado uma importante região fonte de alto teor de O3, principalmente para
concentrações de todos os tipos de PM foram as mais altas durante o inverno, seguido a região oeste. Outros estudos recentes envolvendo agrupamento para avaliação
pelo verão e pelas estações chuvosas.Shi et ai. (2014)conduziu um estudo semelhante em de poluentes na China incluem o deZhang et ai. (2019).Davuliene et al. (2019)
Xiamen, na China, usando ok-significa abordagem, porém, apenas para NÃO2e assim2, e apresentou uma análise da variação do carbono negro (BC) em Preila, Lituânia,
em uma localização costeira urbana. Os tipos de cluster consistiram em variações diurnas durante um período de 8 anos, usando o esquema de agrupamento de trajetória
de poluentes, que foram classificados em 3 e 4 clusters para NO2e assim2, reversa desenvolvido porBycenkiene et al. (2014)(discutido mais tarde). As
respectivamente. Embora muitas soluções parakforam testados, o presente estudo não concentrações mais baixas e mais altas de black carbon foram observadas durante
conseguiu fornecer novos padrões diurnos em comparação com classificações feitas com as estações de inverno e verão, respectivamente.
valores menores dek.

47
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

5.1.2. Técnicas de agrupamento para monitoramento da qualidade do ar e otimização de redes os poluentes individuais.
de monitoramento
Fleming et ai. (2005)produziu um esquema de classificação da qualidade do ar 5.1.3. Técnicas de agrupamento para correlacionar concentrações de poluentes com
para PM10, ó3, ENTÃO2e não2poluentes na Alemanha, usando Ward linkage. Os condições sinóticas específicas
clusters representaram os ciclos diários, semanais e anuais dos 4 poluentes. Três Kalkstein e Corrigan (1986)usou o método de agrupamento de Ward
técnicas de agrupamento, o método de Ward,k-meios, e uma combinação de para investigar a relação entre SO2concentrações e meteorologia para
mapas auto-organizados (SOMs) ek-meios, foram usados porLu et ai. (2006)para Wilmington, Delaware. Dez clusters foram identificados descrevendo as
PM de inverno10concentrações em Taiwan. A comparação das três técnicas categorias sinóticas ligadas aos diferentes SO2níveis de concentração. A
sugeriu que 71 estações que compõem a rede de monitoramento da qualidade do regressão linear foi usada para examinar a relação entre variáveis
ar podem ser classificadas em 5 classes (ou regiões) de qualidade do ar, com a climáticas individuais e SO2concentrações, no entanto, as relações foram
abordagem combinada produzindo os melhores resultados. Clusters individuais consideradas bastante fracas. Estudos que envolveram o uso de técnicas de
representavam as diferentes regiões do país, com base no PM10distribuição. Das 5 agrupamento para relacionar parâmetros de qualidade do ar, como O3,
regiões, PM10os níveis de poluição foram os mais altos e os mais baixos nas à meteorologia foi conduzido porEder et ai. (1994)eDavis et ai. (1998).
regiões sul e leste de Taiwan, respectivamente. A utilização de clustering para a Agrupamento em dois estágios, ou seja, ligação média seguida pork-means foi a
gestão de estações de monitorização da qualidade do ar na área metropolitana do abordagem preferida, pois mostrou ter o melhor desempenho em termos de
Porto, em Portugal, foi examinada porPires e cols. (2008a). Focando no enxofre SO coesão do cluster. Além disso, foi aplicado com sucesso em estudos anteriores (
2e PM10concentrações, os objetivos eram identificar áreas exibindo tendências de Davis, 1991; Davis e Walker, 1992;Davis e Gay, 1993) que visam vincular a poluição
poluição semelhantes e encontrar a fonte dessas emissões. De um conjunto de 10 do ar e a qualidade do ar com a meteorologia. O clustering de ligação média foi
locais de monitoramento, o agrupamento pelo método de ligação média foi usado empregado porCheng et ai. (1992)para investigar as concentrações de poluição O3
para criar 6 agrupamentos, não mais que 2 agrupamentos para SO2e PM10, e partículas suspensas totais (TSP)) na Filadélfia durante o verão. O Temporal
respectivamente. Os tipos de cluster consistiam em SO2e PM10concentrações dos Synoptic Index (TSI) desenvolvido anteriormente porKalkstein et ai. (1987)foi
vários locais de monitoramento. Os resultados mostraram que muitas áreas são usado novamente como a variável de agrupamento para estabelecer 10 tipos de
caracterizadas pelos mesmos padrões de poluição do ar, mas são cobertas por agrupamento das principais categorias sinóticas de verão. As concentrações de
mais de uma estação de monitoramento, sugerindo uma gestão ineficaz do poluentes associadas a cada categoria mostraram a maior concentração de massa
número de estações dentro da rede. As estações adicionais possivelmente de ar continental, caracterizada por baixas quantidades de cobertura de nuvens,
poderiam ser movidas para áreas que atualmente carecem de cobertura, alta temperatura e pressão do ar, uma grande depressão do ponto de orvalho e
expandindo assim a cobertura geral da rede. Uma fonte principal de emissão foi ventos moderados de sudoeste. Alternativamente, o polar continental,
encontrada para SO2 relacionado à condição de baixa pressão do ar e temperatura do ponto de orvalho,
apresentou a menor concentração de poluição.Comrie (1996)identificou 6 padrões
enquanto três fontes foram encontradas para PM10. Usando a mesma abordagem de circulação atmosférica na região da fronteira EUA-México, com o objetivo de
de agrupamento,Pires e cols. (2008b)estenderam seus trabalhos anteriores relacionar os padrões climáticos com a poluição por ozônio na região. Aplicação
considerando as concentrações de monóxido de carbono CO, NO2, e O3para o dek-significa o agrupamento de dados de altura geopotencial de 850 mb durante
mesmo local. O agrupamento revelou 3 grupos diferentes para CO e para NO2e 2 um período de 32 anos, produziu 6 principais padrões de circulação. Os tipos de
grupos para O3. Os tipos de cluster foram semelhantes aos apresentados emPires aglomerados representam os 6 padrões de circulação atmosférica
e cols. (2008a), mas para diferentes poluentes. Dois dos locais de monitoramento climatologicamente característicos, consistindo em fluxo ciclônico e anticiclônico.
mostraram diferenças no comportamento dos poluentes devido à localização das Verificou-se que os períodos de alta poluição por ozônio ocorrem durante a
fontes de emissão dominantes e à topografia do local. Usando agrupamento de presença de sistemas de alta pressão e, portanto, durante o verão. Uma avaliação
ligação média,Lu et ai. (2011)realizou um estudo semelhante paraPires e cols. dos padrões climáticos sinópticos nas concentrações de poluentes registradas no
(2008a,2008b), para a avaliação de uma rede de monitoramento da qualidade do verão para quatro cidades dos EUA com condições climáticas variadas foi
ar em Hong Kong. No entanto, a análise foi restrita a SO2, NÃO2e partículas conduzida porGreene et ai. (1999). Usando uma série de variáveis
suspensas respiráveis (RSP). Igual aPires e cols. (2008a,2008b), clusters meteorológicas, incluindo temperatura do ar e do ponto de orvalho, cobertura de
representam poluentes (SO2, NÃO2, RSP) dos locais de monitoramento. Os nuvens, pressão e velocidade e direção do vento, o objetivo foi desenvolver uma
resultados deste estudo foram destinados a serem utilizados para otimização do ETI que possa ser usada para identificar eventos sinóticos associados a episódios
número de estações de monitoramento na região. Isso ocorreu porque específicos de poluição. Foi aplicado agrupamento de ligação média, produzindo
atualmente existem estações de monitoramento redundantes que contribuem entre 8 e 10 categorias sinóticas para todas as cidades. Esses tipos de
para o gerenciamento ineficaz da qualidade do ar, o que exigiu realocação.Iizuka aglomerados representavam categorias sinóticas que descrevem as diferentes
et al. (2014)adotou o uso do agrupamento de Ward para quatro poluentes (NOx, ó condições atmosféricas que normalmente ocorrem em um determinado local e
x, PM e NMCH) na região de Kanto no Japão. Usando medições de poluição do ar que foram associadas a características meteorológicas específicas. No geral,
por 2 anos não consecutivos, um total de 476 estações de monitoramento foram verificou-se que as quatro cidades diferem em suas cargas de poluição sob os
agrupadas em 8. As estações de monitoramento com base na similaridade do diferentes padrões sinóticos. No entanto, este estudo tem mais implicações para a
comportamento do poluente individual compreendiam os diferentes tipos de relação entre clima e poluição e seu efeito na mortalidade humana.Gramsch et ai.
cluster. Foi também explorada a redução do número de estações de (2006)aplicou agrupamento hierárquico a O3e PM10concentrações para Santiago,
monitorização, onde foram propostos 3 critérios simples. Com a aplicação desse Chile, e demonstrou que esses dois poluentes tinham características de
critério, uma parcela significativa das estações de monitoramento poderia ser agrupamento semelhantes, sugerindo que as concentrações desses poluentes
removida, mas os detalhes desse método de remoção não foram discutidos. O eram controladas por fatores meteorológicos e topográficos. Os quatro clusters
agrupamento por ligação completa foi empregado porKwon et ai. (2018)para a estabelecidos representam similaridade espacial entre as estações baseadas no O
análise de informações de emissões de gases de efeito estufa (GEE) de 24 países 3e PM10padrões poluentes. Além disso, a redução da poluição para essa região em
asiáticos registradas por uma década. Seis grupos de GEE (AF) foram particular deve incorporar toda a cidade, pois os resultados mostram que os níveis
estabelecidos, fornecendo assim um agrupamento de países com características locais de poluição não dependem apenas das fontes locais de emissão.Adame et
semelhantes de emissões principais e secundárias de GEE. Os resultados do ai. (2012)aplicadok-significa agrupamento de padrões diários de O3, NÃO2e assim2,
estudo têm implicações para o desenvolvimento de outras estratégias de onde a região de estudo era de forte atividade industrializada na Espanha, e onde
mitigação climática na Ásia. Igual aShi et ai. (2014),Soares e outros. (2018)também poderiam ser definidos quatro regimes. Os quatro tipos de regime (ou cluster)
investigou NÃO2e assim2poluentes, mas por agrupamento de ligação média. Um descrevem a variação diurna para cada poluente na resolução temporal horária.
dos objetivos era analisar e otimizar as redes de monitoramento da qualidade do Análise do diário
ar no Canadá. Os tipos de cluster foram baseados em distribuições espaciais de

48
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

variação de parâmetros meteorológicos associados, como temperatura e examinado.Wegner e outros. (2012)analisou as distribuições de tamanho do
velocidade do vento, foram utilizadas para caracterizar as condições que estão número de aerossóis. Os resultados mostraram 7 distribuições de tamanho
ligadas à ocorrência desses regimes. Para a variação diária do ozônio, um dos características. Distribuições de tamanho agrupadas foram analisadas em termos
aglomerados apresentou pico nas primeiras horas da manhã. As possíveis razões de propriedades físicas e associação com condições meteorológicas locais. Igual a
para isso podem ser a influência de emissões industriais, formação de camada Beddows et ai. (2009),Hussein e outros. (2014)aplicadok- significa agrupar para
residual durante a noite e intensos mecanismos de mistura durante o dia. No entender as impressões digitais de partículas de aerossol urbano em Helsinque,
entanto, essas razões exigiram verificação possivelmente com o auxílio de Finlândia. Sete impressões digitais de aerossóis foram identificadas, algumas das
modelos meteorológicos de mesoescala.Hsu e Cheng (2016)demonstrou o uso da quais originárias de fontes locais, como o setor de transporte e outras atividades
abordagem de agrupamento em dois estágios para a classificação de padrões antrópicas.von Bismarck-Osten e Weber (2014)demonstrou a aplicação de doisk
sinóticos de tempo com o objetivo de investigar a influência de características -significa abordagens de agrupamento para analisar a distribuição do tamanho do
meteorológicas no PM2.5em Yunlin, Taiwan. As principais condições número de partículas de 9 locais na Europa Central. Uma assinatura específica foi
meteorológicas sinóticas compreendiam os diferentes tipos de aglomerados para, atribuída a cada tipo de aglomerado com base na ocorrência temporal e sazonal e
por exemplo, anticiclone continental, fluxo de monções e sistema de alta pressão nas condições meteorológicas predominantes.
subtropical do Pacífico.Wang et ai. (2016)PM investigado2.5características de
poluição por um período de 3 anos em Xangai, China. Variações sazonais no PM2.5 5.2. Trajetórias de massa de ar
concentração de massa foram analisados juntamente com os principais padrões
de transporte regionais gerados através do modelo HYSPLIT. Trajetórias de Uma trajetória descrita porDorling e Davies (1995)é a “história” de uma
retorno sobre a região de Xangai foram agrupadas e 4 tipos de massa de ar foram encomenda aérea.Hafner e outros. (2007)explica que as trajetórias são uma
identificados. Geralmente, a massa de ar da região oeste resultou na maior aproximação do caminho percorrido por uma partícula de ar antes de chegar a
poluição, enquanto a massa de ar do mar da China Oriental teve a menor poluição um determinado local. A aplicação da análise de cluster às trajetórias resultará em
devido ao ar marítimo. PM moderado2.5a poluição foi associada à massa de ar do grupos com velocidades e direções de transporte semelhantes e que são
norte da China. Usando agrupamento hierárquico com exposição e dados considerados representativos de padrões sinóticos específicos. Dentro de cada
meteorológicos,Cakmak et ai. (2018)realizou uma avaliação dos efeitos do PM a cluster, as trajetórias individuais podem ser calculadas para produzir uma
longo prazo2.5 trajetória média que representa o padrão geral do cluster. Uma fonte comum de
e exposição ao ozônio, estabelecendo zonas climáticas sinóticas no Canadá. Com trajetórias inclui a Trajetória Integrada Lagrangiana de Partícula Única Híbrida,
base em 5 parâmetros, 6 categorias/zonas meteorológicas foram estabelecidas (HYSPLIT) modelo do Laboratório de Recursos Aéreos (ARL) da Administração
(aqui e no estudo anterior porCakmak et al., 2016). Os tipos de aglomerados eram Oceânica e Atmosférica Nacional (NOAA). HYSPLIT é o modelo de trajetória de ar
zonas de tipo climático espacialmente diferenciadas. PM alto2.5e descobriu-se que mais amplamente aplicado empregado para estabelecer relações fonte-receptor
as exposições ao ozônio estão correlacionadas com diferentes categorias em longas distâncias (Wang e outros, 2010). A aplicação do agrupamento de
climáticas, fornecendo informações úteis sobre como os padrões climáticos trajetórias de massas de ar para a análise de padrões de circulação atmosférica,
influenciam o impacto dos poluentes atmosféricos na saúde e na mortalidade relacionando massas de ar a condições sinóticas/meteorológicas e investigando o
humanas. Além disso, a exposição ocupacional à poluição do ar também foi um comportamento de poluentes em termos de sua fonte, rotas de transporte,
aspecto investigado e contribuiu para o câncer de pulmão. No entanto, algumas distribuição de fontes e monitoramento da qualidade do ar, foram os objetivos
ocupações foram consideradas de maior risco do que outras, mas isso não pode comuns em muitos dos os estudos revisados aqui.
ser totalmente explicado pela presente análise. Semelhante ao seu trabalho
anterior,Hsu e Cheng (2019)realizou uma classificação dos padrões sinóticos do Nos últimos anos, o agrupamento de trajetórias de massas de ar tem
tempo para avaliar os efeitos das condições meteorológicas no PM10, PM2.5e O3 sido amplamente utilizado para identificar grupos homogêneos de padrões
poluentes. Os tipos de cluster compreendiam tipos de clima de inverno associados de transporte. Em particular, o k- significa que as técnicas foram
a altas concentrações de poluentes. Seis padrões climáticos e o comportamento extensivamente aplicadas (Brankov e outros, 1988; Legras e outros, 1988;Mo
poluente associado foram identificados para a região. e Gil, 1988;Dorling e outros, 1992;Dorling e Davies, 1995;Mahura e outros,
1999;Jorba e outros, 2004;Abdalmogith e Harrison, 2005;Borge e outros,
5.1.4. Técnicas de agrupamento para outros tipos de agrupamento 2007;Hafner e outros, 2007;Pongkiatkul e Oanh, 2007;Toledano e outros,
Crecelius et al. (1980)realizou um dos primeiros estudos sobre aerossóis onde 2009;Padeiro, 2010;Markou e Kassomenos, 2010;Rozwadowska e outros,
kO agrupamento de meios foi usado para examinar os tipos de aerossóis e seu 2010;Wang e outros, 2010;Wong e outros, 2010;Cheng et ai. 2011,2013;
processo de formação associado. Os tipos de cluster consistiram em grupos de Makra et al., 2011;Valenzuela e outros, 2012;Bycenkiene et al., 2014;Yu et al.,
elementos que têm um processo de formação semelhante. Classificação das 2014;Donnelly e outros, 2015;Lv et al., 2015;Luo e Chen, 2015;Terrouche et
propriedades microfísicas e ópticas de aerossóis de 250 estações da Aerosol al., 2015;Fang e outros, 2017;Ding e outros, 2017;Wu e outros, 2018;Skiles e
Robotic Network usandok-significa agrupamento, foi feito porOsmar et ai. (2005). outros, 2018;Liu e outros, 2019;Zhan e outros, 2019). Outros trabalhos (
Um conjunto de 6 grupos principais de tipos de aerossóis foi classificado como Moody e Galloway, 1988;Moody e Samson, 1989;Cheng e Wallace, 1993;Cape
poeira do deserto, queima de biomassa, poluição industrial urbana, fundo rural, et al., 2000;Wang e outros, 2004;Taubman e outros, 2006;Tshela e Djolov,
poluição marinha poluída e poluição suja (ou seja, poluição contendo quantidades 2018) empregaram vínculos Ward e average, enquanto menos estudos (
significativas de espécies absorventes). O exame da climatologia das medições in Fernau e Samson, 1990a; b;Harris e Kahl, 1990;Ele e outros, 2003;
situ em locais individuais foi proposto como uma validação apropriada dos Kassomenos et al., 2010;Li e outros, 2012) contaram com vários métodos e
resultados do agrupamento. No entanto, a disponibilidade de tais dados estava abordagens em dois estágios.Tabela 3apresenta um resumo da literatura
atualmente restrita a poucos locais e, além disso, as medições in situ dos tipos de que tem aplicado métodos hierárquicos ek- significa técnicas para trajetórias
aerossóis nas estações AERONET eram bastante limitadas.Beddows et ai. (2009) de massas de ar para estudos de poluição do ar. Cada autor é listado junto
investigou o uso de quatro, ou seja, difuso,k- significa,k-técnicas de agrupamento com os dados/variáveis agrupados, método e, se mais de um método de
baseadas em modelos e medianas, para a caracterização de dados de tamanho de agrupamento foi aplicado, o método que apresentou o melhor desempenho
partícula de 4 estações de monitoramento no Reino Unido. Após a aplicação de foi indicado.
um índice de validade de cluster apropriado,k-means foi encontrado para produzir
o melhor agrupamento. Os tipos de aglomerados mostram tendências diurnas e 5.2.1. Técnicas de agrupamento para vincular trajetórias de massas de ar com
noturnas distintas nos dados de tamanho de partícula e revelaram informações meteorologia sinótica
relacionadas sobre sua formação e processos dinâmicos que foram essenciais Usando o agrupamento de Ward,Moody e Galloway (1988)
para entender seu efeito na saúde humana. Uma extensão desta análise, incluindo investigou a relação entre o transporte atmosférico e a composição da
dados de fontes de partículas adicionais em toda a cidade, seria necessária se a precipitação nas Bermudas. Trajetórias para níveis de 850 mb e 700 mb
distribuição da fonte fosse foram calculadas usando o Gridded Atmospheric Multilevel Backward

49
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

Tabela 3
Resumo da literatura que aplicou métodos hierárquicos,k-métodos e técnicas de agrupamento em dois estágios para trajetórias de massas de ar em estudos de poluição do ar.

Ano Autor Dados/variáveis Abordagem/método de agrupamento Método de melhor desempenho


se mais de um usado

1988 Legras et ai. Alturas geopotenciais de 500 hPa Alturas k-significa


1988 Mo e Gil geopotenciais de 500 mb Trajetórias a 850 mb, k-significa
1988 Moody e Galloway 700 mb Rawinsonde e dados químicos de hierárquico
1989 Moody e Sansão precipitação Trajetórias a 300 m acima do nível do hierárquico
1990a Fernau e Sansão solo Trajetórias a 300 m acima do nível do solo hierárquico ligação de ala
1990b Fernau e Sansão Trajetórias a 700 hPa e 500 hPa hierárquico ligação de ala
1990 Harris e Kahl Agrupamento hierárquico em dois Dois estágios
estágios: ligação de Wards ek- significa

1992 Dorling e outros. Trajetórias a 1000 hPa k-significa


1993 Cheng e Wallace Campos de altura de 500 hierárquico
1995 Dorling e Davies hPa Trajetórias a 1000 hPa k-significa
1998 Brankov e outros. Trajetórias a 200 m acima do nível do solo k-significa
1999 Mahura et ai. Trajetórias k-significa
2000 Cabo et al. Trajetórias para 900 hPa hierárquico
2003 Ele e outros. Trajetórias a 200 m, 500 m, 1000 m, 1500 m, 2000 me 3000 m acima do Agrupamento em dois estágios:
nível do solo, PM2,5 ligação média ek-significa k-significa
2004 Jorba et ai. Dados meteorológicos, trajetórias a 5500 m, 3000 m, 1500 m acima do nível médio do
mar
2004 Wang et ai. Trajetórias a 1100 m acima do nível do solo hierárquico
2005 Abdalmogith e Trajetórias a 900 hPa, PM10 k-significa
Harrison
2006 Taubman et ai. Trajetórias a 1000 m, 2000 m, 3000 m acima do nível do solo hierárquico
2007 Hafner e outros. Trajetórias, PM2.5 k-significa
2007 Borges et ai. Trajetórias a 750 m, 1.500 m e 3.000 m acima do nível médio do mar Trajetórias a 1.000 m k-significa
2007 Pongkiatkul e Oanh acima do nível do solo, altura média de mistura, altura máxima de mistura, nebulosidade k-significa
total, temperatura de bulbo seco e úmido, pressão de superfície, precipitação diária,
umidade, velocidade do vento e direção Trajetórias a 500 m, 1500 m, 3000 m acima do
2009 Toledano et ai. nível médio do mar Trajetórias a 10 m, 400 m, 800 m acima do nível do solo k-significa
2010 padeiro k-significa
2010 Kassomenos et al. Trajetórias a 10 m, 100 m e 500 m acima do nível do solo hierárquico,k-meios e mapas Nenhum indicado
auto-organizados
2010 Markou e Trajetórias a 750 m, 1500 m, 3000 k-significa
Kassomenos m acima do nível médio do mar
2010 Rozwadowska et ai. Trajetórias 1000 m 2500 m e 5000 m acima do nível médio do mar, AOT k-significa
2010 Wang et ai. Trajetórias a 300 m acima do nível do solo k-significa
2010 Wong e outros. Trajetórias a 500 m, 1.000 m, 2.000 m e 4.000 m, dados de aerossol Dois estágios: Ward ek-significa k
2011 Cheng et ai. Trajetórias a 50 m acima do nível do solo, PM2.5 -significa
2011 Makra et al. Trajetórias a 500, 1500 e 3000 m acima do nível do mar, PM10,e dados k-significa
2012 Li et ai. meteorológicos Dados meteorológicos, PM10,trajetórias a 200 m Agrupamento em dois estágios:
ligação média ek-significa k-significa
2012 Valenzuela et ai. AOD, AE, Trajetórias a 1500 m, 3000 m acima do nível do solo
2013 Cheng et ai. Trajetórias a 30 m acima do nível médio do mar, PM10 k-significa
2014 Bycenkiene et al. Trajetórias a 100 m acima do nível médio do mar, BC k-significa
2014 Yu et ai. Trajetórias a 100 m acima do nível do solo, PM2.5, PM10, ó3, NÃO2, CO, SO2 k-significa
2015 Donelly et ai. Trajetórias, NÃO2, PM10 k-significa
2015 Lv et al. Trajetórias a 200 m acima do nível do solo, PM2.5 k-significa
2015 Luo e Chen Trajetórias, PM2.5 k-significa
2015 Terrouche et ai. Trajetórias a 750 m k-significa
2017 Fang et ai. Trajetórias a 10 m acima do nível do solo, PM10, PM2.5 k-significa
2017 Ding et ai. Trajetórias a 100 m acima do nível do solo, PM2.5 k-significa
2018 Skiles et ai. Trajetórias a 100 m, PM2.5 k-significa
2018 Tshela e Djolov Trajetórias a 500 m acima do nível do solo Trajetórias hierárquico
2018 Wu e outros. a 100 m acima do nível do solo, PM2.5 k-significa
2019 Liu et ai. Trajetórias, AOD, velocidade do vento e alturas geopotenciais de 850 hPa e k-significa
500 hPa
2019 Zhan et ai. Trajetórias a 1000 m, PM2.5, PM10, CO, NÃO2, ENTÃO2, ó3,e dados meteorológicos k-significa

Modelo de Trajetória Isobárica (GAMBIT). Padrões de fluxo dominante por estação sob padrões de transporte semelhantes no centro-oeste dos Estados Unidos. Os
foram identificados onde havia 7 e 9 clusters encontrados para as estações resultados do agrupamento forneceram informações sobre as características de
quentes e frias, respectivamente. As concentrações de sulfato e nitrato foram precipitação para a região. Por exemplo, descobriu-se que certos padrões de
maiores na estação quente em comparação com a estação fria. Embora este transporte estavam fortemente correlacionados com concentrações de íons mais
estudo tenha abordado a influência do transporte atmosférico na composição da altas. Outros resultados também mostraram que diferenças nos padrões de
precipitação, também existem outros fatores de influência, como deposição úmida transporte podem ser responsáveis pela variabilidade na composição da
e seca. Ignorar esses fatores limita a quantidade de variabilidade química que precipitação. Havia também vários outros possíveis fatores que poderiam ter
pode ser explicada considerando apenas o caminho de transporte em resultado em diferenças na composição mesmo em condições de transporte
consideração. Igual aMoody e Galloway (1988),Moody e Sansão (1989)analisou as semelhantes, mas não foram abordados. O agrupamento hierárquico por ligação
trajetórias de volta através do agrupamento hierárquico de Ward para identificar de Ward aplicado ao vetor de transporte derivado de trajetórias de retorno foi
os episódios de precipitação que ocorreram investigado porFernau e Sansão (1990a). O objetivo era

50
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

caracterizar movimentos de massa de ar e identificar períodos de meteorologia e trajetórias chegando a 1500, 3000 e 5500 m acima do nível do mar para a área de
química de precipitação semelhantes para a região leste da América do Norte. A Barcelona, usando 4 anos de dados de trajetória. Os principais padrões de
análise de agrupamento de trajetórias amostradas em 10 locais produziu 7 transporte foram identificados a 5500 m, que consistiam em fluxos de oeste,
agrupamentos, com campos de transporte médios distintos correspondentes a noroeste, sudoeste e recirculações regionais. Alguma da variabilidade interanual
sistemas de alta e baixa pressão observados em mapas meteorológicos. Além de observada nos padrões de agrupamento pode ser atribuída à Oscilação do
Ward, foram testadas ligações médias, centróides e medianas, mas os resultados Atlântico Norte (NAO), embora a inversão da NAO (2000/01) não tenha sido
mostraram-se insatisfatórios, uma vez que um grande cluster e clusters menores claramente captada pelos padrões médios anuais de transporte. Em vez disso,
referidos como “clusters outliers” foram produzidos. Isso contrasta com a esse recurso foi observado entre os padrões de inverno. Investigando a poluição
configuração de agrupamento produzida pelo método de Ward, que resultou em do ar no verão no meio do Atlântico dos EUA porTaubman et ai. (2006)foi feito
agrupamentos de tamanho igual.Fernau e Sansão (1990b)estenderam seus usando o método de ligação média. Foram identificados oito clusters que
trabalhos anteriores investigando a precipitação espacial e os padrões de descrevem as densidades de trajetória, padrões de transporte e regiões de origem
poluentes para a mesma região. O agrupamento de Ward foi novamente usado e dos clusters. Os resultados mostram que as áreas de máxima densidade de
identificou padrões climáticos correlacionados com grandes quantidades de trajetória combinadas com a velocidade do vento são preditores eficazes de
deposição de poluição. A análise revelou alguns clusters associados a condições carregamentos regionais de poluentes. Igual aJorba et ai. (2004),Toledano et ai.
muito secas na região, enquanto alguns com níveis de precipitação muito altos. (2009)também seguiu a abordagem de agrupamento deDorling e outros. (1992)
Além disso, alguns aglomerados foram associados a altos níveis de deposição de para a classificação das massas de ar que chegam a El Arenosillo, localizada na
poluentes. Verificou-se que as maiores deposições de poluentes nas áreas mais costa sudoeste da Espanha. Os aerossóis que chegaram ao local foram
amplas foram resultado de padrões médios de transporte, com grandes áreas de caracterizados quantitativamente por Aerosol Optical Depth (AOD) e Angstrom
movimento lento de massa de ar sobre as regiões de altas emissões de enxofre. Expoente (AE). As trajetórias das massas de ar a 1500 m podem ser agrupadas em
Harris e Kahl (1990)realizou classificação de trajetória para Mauna Loa, Havaí. A 7 grupos. O estudo identificou três aerossóis principais, ou seja, poeira marinha
análise de 8 anos de trajetórias isobáricas de 700 hPa e 500 hPa foi realizada costeira, continental e desértica, observados na região.Padeiro (2010)conduzidok
usando o agrupamento de Ward, após o linkage médio e k-significa métodos. -significa agrupamento para a análise de rotas de transporte aéreo de longo
Ward foi combinado com ok-means procedimento, que revelou 6 clusters com alcance e concentrações de poluentes associadas em Birmingham, Reino Unido.
características distintas, como fluxo de leste no verão associado a ventos alísios e Seis aglomerados de trajetórias principais foram identificados como Ártico, forte-
forte fluxo de oeste durante o inverno. O clustering de ligação média foi oeste, lento-leste, oeste, sudoeste e lento-sul. Os resultados mostraram que as
eliminado, pois produziu clusters outliers contendo poucos membros do cluster. maiores concentrações de poluentes foram associadas ao aglomerado de massa
Dorling e outros. (1992) fez uso dek-significa o agrupamento de trajetórias de ar de leste lento, enquanto as menores foram associadas aos aglomerados de
isobáricas de 1000 hPa chegando a Eskdalemuir, na Escócia, para investigar a massa de ar sudoeste e oeste forte.Kassomenos et al. (2010)realizou uma
relação entre a meteorologia sinótica e as concentrações de poluentes. Foram comparação de hierarquia,k-médios e métodos de agrupamento de mapas auto-
encontrados oito clusters que descrevem fluxos de ar distintos com regiões de organizados, para a classificação de trajetórias de massas de ar chegando a
fonte de poluição significativamente diferentes que foram identificadas.Cheng e Atenas, Grécia, para alturas de chegada de 10 m, 100 m e 500 m. Todos os
Wallace (1993)aplicou o agrupamento de Ward aos padrões de circulação no métodos mostraram-se dependentes da altura de chegada, mas com vários graus
inverno no Hemisfério Norte. Vários regimes foram estabelecidos por meio do de dependência. De todos os métodos,k-means foi o menos dependente da altura
agrupamento, três dos quais foram considerados os mais reprodutíveis em de chegada da trajetória. Fontes de MP10em Xangai foram investigados porLi et ai.
subconjuntos de dados. A reprodutibilidade dos clusters maiores foi comparada (2012), onde o agrupamento em dois estágios formou um dos três métodos para
observando quão bem vários deles foram replicados quando o procedimento foi o estudo. Isso produziu 7 clusters que foram encontrados para produzir a melhor
repetido em metades escolhidas aleatoriamente do conjunto de dados em um solução para a classificação da massa de ar. Três aglomerados associados à
conjunto de 50 execuções. No entanto, apesar desta tentativa de verificar a monção de inverno foram responsáveis pelo transporte de uma alta
reprodutibilidade, observou-se que a adesão mesmo dos clusters mais concentração de PM10. O cluster restante corresponde ao período de transição das
reprodutíveis mudou substancialmente.Dorling e Davies (1995) foi uma extensão monções e apresentou uma contribuição insignificante para PM10níveis de
do trabalho deDorling e outros. (1992), em que foi aplicada a mesma técnica de concentração em Xangai. A investigação sobre os eventos de poeira do deserto
agrupamento e onde foram incluídas cinco estações de monitorização adicionais sobre Granada, na Espanha, foi realizada porValenzuela et ai. (2012). O
no noroeste da Europa.McGregor e Bamzelis (1995)empregou o procedimento de agrupamento foi aplicado a um conjunto de 183 trajetórias de retorno que
agrupamento hierárquico de Ward para categorizar uma variedade de variáveis chegam à região de Granada. As propriedades ópticas e microfísicas do aerossol
meteorológicas com o objetivo de identificar dias de condições climáticas também foram incluídas na análise. Uma das descobertas incluiu que o transporte
semelhantes e diferentes tipos de massa de ar para Birmingham, Reino Unido. de massas de ar do norte da África em direção à região sudeste da Península
Usando o índice sinótico multivariado, foram encontrados 6 tipos principais de Ibérica mostrou seguir três caminhos principais. Seis poluentes, como foi usado
massas de ar e as características meteorológicas associadas foram delineadas. A por Zhao et ai. (2016)de 22 cidades, foram analisados dados meteorológicos e
categoria de massa de ar anticiclônica continental marítima mista foi a que trajetórias de massas de ar chegando a 1000 m. Foram identificados três padrões
ocorreu com mais frequência. Características dos poluentes, em particular do SO2, climáticos poluídos e cinco limpos, que geralmente ocorreram no inverno e no
NÃO2, ó3, NÃO, CO, PM10, associados aos principais tipos de massa de ar também verão, respectivamente. Estudos mais recentes que empregaramk-significa
foram apresentados. Uma das descobertas foi que a atividade anticiclônica está agrupamento de trajetórias de massa de ar na China para a análise do transporte
ligada a uma maior frequência de eventos de poluição severa em comparação de poluentes foram os deFang et ai. (2017),Ding et ai. (2017)eWu e outros. (2018).
com a atividade ciclônica. Devido à variação espacial das relações meteorológicas Ding et ai. (2017)investigou as características espaciais e temporais do PM2.5
de poluição do ar, qualquer índice sinótico derivado de dados específicos da poluição em Hong Kong. PM mais alto e mais baixo2.5níveis foram encontrados
estação pode não ser aplicável além da região para a qual foi desenvolvido. A durante as estações de inverno e verão, respectivamente. Além disso, seis
aplicação do agrupamento de ligações médias para trajetórias de retorno principais regiões de origem foram identificadas como responsáveis pela PM2.5
chegando a Mace Head, na Irlanda, foi conduzida porCabo et al. (2000). Os 5 tipos poluição.Fang et ai. (2017) realizadak-significa agrupamento em trajetórias que
de aglomerados produzidos podem ser descritos como norte, noroeste, oeste, chegam a Haikou, uma cidade costeira chinesa, para a identificação de PM10e PM
sudoeste e leste. Uma das principais descobertas incluiu a diferença significativa 2.5fontes durante as estações de inverno e primavera. Os resultados mostraram
nas concentrações de ozônio dos aglomerados. Embora o estudo tenha sido que as concentrações de poluentes foram maiores no inverno do que na
baseado em um conjunto de dados muito limitado, diferentes concentrações de primavera. Além disso, a análise das trajetórias mostra que os poluentes foram
ozônio foram adequadamente capturadas por agrupamento.Jorba et ai. (2004) significativamente afetados por fontes regionais durante o inverno em
agrupado de volta comparação com a primavera

51
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

temporada.Tshela e Djolov (2018)usou a ligação Ward para identificar 5 padrões aulas para cada nível. Os resultados do agrupamento podem ser usados em
principais em trajetórias de ar chegando a seis locais em Limpopo, África do Sul. investigações posteriores, como a identificação de massas de ar sobre a área e a
Estes correspondiam a padrões de norte a nordeste, de leste a sudeste e de análise da influência dos padrões de transporte atmosférico nas concentrações de
sudoeste a noroeste.Wu e outros. (2018)identificou várias cidades chinesas poluentes. Análise de trajetórias de massas de ar para investigar o transporte de
(províncias de Pequim, Tianjin e Shandong, Henan e Hebei) com o maior PM2.5 poluentes atmosféricos, particularmente PM10, sobre Pequim foi conduzido por
poluição por agrupamento de trajetórias. PM alto2.5os níveis de poluição durante o Wang et ai. (2010). aplicandok-agrupamento de meios para trajetórias, o estudo
inverno podem ser resultado das emissões diretas e formação secundária de PM teve como objetivo encontrar uma relação entre padrões de transporte
2.5, e pela queima de biomassa e combustíveis fósseis para aquecimento atmosférico e PM10níveis que afetam a qualidade do ar. Igual aWang et ai. (2010),
residencial. Liu et ai. (2019)analisou a distribuição, origem e transporte de Cheng et ai. (2011) ter aplicado ok-meios técnica para a análise de várias fontes de
aerossóis na Ásia Central durante um período de 8 anos. Em particular, eventos de poluentes e respectivas vias de transporte na China, o que foi conseguido através
poeira e fumaça sobre a área foram o foco principal da investigação. O da combinação de medições de poluentes atmosféricos com agrupamento de
agrupamento de trajetórias revelou que, durante a primavera e o verão, os trajetória de massa de ar.Cheng et ai. (2013)realizou uma investigação semelhante
eventos de poeira foram transportados principalmente das regiões do norte da à de Wang et ai. (2010)eCheng et ai. (2011), para a análise de fontes poluentes e
Península Arábica e do norte da África, enquanto os eventos de fumaça foram vias de transporte na China.Bycenkiene et al. (2014)aplicado k- significa agrupar-se
transportados principalmente da Rússia e da Europa. Durante as estações de em trajetórias que chegam a Preila, Lituânia, com o objetivo de avaliar os padrões
outono e inverno, a maioria dos eventos de aerossol foi produzida localmente. de transporte de carbono negro na região sudeste do Báltico. Seis clusters foram
Também para a Bacia de Sichuan, e semelhante aoZhao et ai. (2016)eZhao et ai. identificados e os níveis de carbono associados a cada um deles foram analisados.
(2018),Zhan et ai. (2019)estudou a poluição do ar na região por meio da análise de Dias com altas concentrações de black carbon foram associados a massas de ar
padrões climáticos sinópticos e sua associação e impacto à poluição por partículas. que se originaram e passaram pelas regiões do sul da Europa antes de sua
chegada a Preila no inverno. Outros estudos na China semelhantes aosWang et ai.
(2010),Cheng et ai. (2011)e Cheng et ai. (2013)incluir aqueles porYu et ai. (2014),Lv
5.2.2. Técnicas de agrupamento para vincular trajetórias de massa de ar com padrões de et al. (2015)e Luo e Chen (2015). Igual aJin et ai. (2011),Skiles et ai. (2018)
poluentes apresentou uma análise de rateio de origem usandok-significa agrupamento de
Ele e outros. (2003)ligação média usada comk- significa agrupamento para trajetórias de massa de ar no vale de San Joaquin, no entanto, neste caso, para PM
investigar a relação fonte-receptor entre as concentrações de poluentes e o 2.5

transporte de PM de massas de ar de longo alcance2.5chegando em Taean, Coreia poluentes de carbono orgânico.


do Sul. Foram identificados cinco grupos de trajetórias que continham 98% dos
dados, fazendo com que os outros três grupos fossem substancialmente menos 5.2.3. Técnicas de agrupamento para outros tipos de agrupamento

significativos.Hafner e outros. (2007)realizou uma análise de agrupamento em Wong e outros. (2010)estudou vias de transporte em Hong Kong para
chuva e aerossol fino (PM2.5) para três locais do oeste dos EUA, usando o métodok- investigar fontes potenciais de diferentes aerossóis. Ward combinado comk- o
significa algoritmo. Usando um período de 7 anos de trajetórias diárias, o objetivo agrupamento de meios foi aplicado às propriedades do aerossol, como espessura
foi atribuir quantidades de chuva e concentrações de poluentes ao tempo de óptica do aerossol (AOT), albedo de dispersão única (SSA) e expoente de Angstrom
chegada de cada trajetória, a fim de entender os padrões sinóticos e as rotas de (AE), para produzir uma classificação de 4 tipos de aerossol, ou seja, urbano misto,
contaminação atmosférica, respectivamente. Os resultados mostraram que as urbano poluído, poeira e poluição pesada. Os aerossóis urbanos mistos foram os
trajetórias podem ser agrupadas em 6 padrões principais para cada site. Para mais prevalentes. Os 4 tipos foram associados a trajetórias (500, 1000, 2000 e
cada trajetória de local, clusters de 1, 5 e 10 dias foram computados para denotar 4000m) para identificar as fontes poluentes e os caminhos que chegam a Hong
padrões de fluxo de curto, médio e longo alcance, respectivamente. Verificou-se Kong.Terrouche et ai. (2015)usou o agrupamento de trajetórias para a
que o PM mais alto2.5concentrações foram associadas com aglomerados de identificação de potenciais fontes distantes que contribuem para a poluição
movimento lento e menor PM2.5concentrações com aglomerados de movimento particulada e elementos metálicos em Constantine, Argélia. Trajetórias chegando
rápido. No geral, os clusters gerados usando trajetórias de um dia tiveram melhor a 750m foram agrupadas pelok-significa algoritmo, mostrando que o deserto do
desempenho na diferenciação dos clusters por chuva e concentração de aerossóis Saara foi uma fonte importante que contribuiu para o PM10
e, portanto, são um melhor preditor de chuva e PM2.5concentrações. Isso foi e Fé. O transporte de massas de ar de longa distância originárias das regiões
seguido por trajetórias de 5 dias como o segundo melhor. Clusters incapazes de norte e sul, em particular do mar Mediterrâneo, foram os principais
reconhecer PM de alta concentração e curto prazo2.5eventos, por exemplo, um contribuintes para Na, Mg, K e Ca. Elementos como Zn, Cu e Pb são de
incêndio florestal ou plumas distantes, foram destacados como uma desvantagem origem antropogênica, ou seja, tráfego e atividades industriais.
do método.Borges et ai. (2007)analisaram as influências do transporte de longa
distância na PM urbana10poluentes por agrupamento de trajetórias com alturas 6. Resumo
de chegada de 750, 1500 e 3000m, para Atenas, Madrid e Birmingham. Os
resultados sugerem que o transporte de longa distância das regiões do norte da O objetivo deste artigo foi fornecer uma revisão das aplicações da
África e da Europa continental tem um impacto significativo no PM10níveis em análise de cluster para estudos de poluição do ar, em particular usando
Madrid e Birmingham, enquanto um efeito moderado para Atenas. Em vez disso, medições de poluição baseadas no solo e trajetórias de massa de ar
as fontes de emissão locais desempenham um papel maior para o PM10níveis em representando rotas de transporte de poluentes. Esta revisão enfocou o uso
Atenas. Além disso, dois índices baseados em PM10excedências foram propostas de ligações hierárquicas (Ward, simples, médias, centróides e completas) e
para a avaliação de PM10em cada cluster e pode ser usado para associar particionais (k-means) técnicas de agrupamento. Com base na discussão
excedências futuras com padrões de circulação específicos.Pongkiatkul e Oanh apresentada na Seção5, pode-se concluir o seguinte:
(2007)também avaliou o transporte de poluentes de longo alcance, na região
metropolitana de Bangkok, onde o agrupamento de trajetórias HYSPLIT produziu • Aplicação de hierarquia ekOs métodos de agrupamento de meios têm sido
6 grupos principais associados ao PM10e PM2.5níveis. Para avaliar a contribuição do aplicados em estudos de poluição do ar por mais de três décadas, com um dos
transporte de longo alcance em poluentes e tirar conclusões definitivas, são primeiros trabalhos de pesquisa aparecendo em 1980. Desde então, um
necessários locais de monitoramento adicionais e mais dados de composição de grande número de trabalhos de pesquisa contribuiu para este tópico. Os
MP. Caracterização do PM10concentração em Leece, Itália foi estudada por Contini estudos de poluição do ar têm se mostrado especialmente importantes para
et al. (2010), onde Ward linkage compreendeu um dos três métodos usados na os locais com altos níveis de concentração de poluentes, principalmente de
análise.Markou e Kassomenos (2010)demonstraram o uso de agrupamento para a atividades humanas, como operações industriais, emissões de veículos e
classificação de trajetórias de retorno chegando a Atenas na Grécia. Cinco anos de queima de biomassa. Muitos dos estudos revisados neste artigo mostraram
trajetórias chegando a três alturas, 750, 1500 e 3000m foram agrupados que o agrupamento de medições de poluição do ar pode permitir o
separadamente, produzindo 12 trajetórias monitoramento eficiente da poluição,

52
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

Figura 4.A porcentagem de estudos usados pelok-meios e métodos hierárquicos em cada categoria. Para ambas as categorias,k-meios teve a maior proporção. Para a categoria 1, as
ligações Ward e average são os segundos métodos mais usados. Para a categoria 2, a ligação de Ward é usada principalmente apósk-significa.

identificação de fontes e desenvolvimento e implementação de 70% dos estudos revisados, seguido pelo agrupamento de Ward que responde
estratégias efetivas de controle e mitigação. Pesquisas envolvendo esses por cerca de 11%. Métodos múltiplos foram usados em 9%, enquanto
aspectos são e continuarão sendo importantes devido ao aumento agrupamento em dois estágios foi usado em 7% dos estudos. O average
contínuo das emissões de poluentes dessas atividades em andamento. linkage foi o método menos utilizado, respondendo por 4%.

• No geral, a partir desta revisão, três técnicas, ou seja,k-means, Ward e average


• Muitos dos estudos se concentraram na análise das características espaço- linkage clustering mostraram ser os mais usados para ambas as categorias,
temporais dos poluentes, origens e caminhos das massas de ar, padrões de respondendo por cerca de 77% de todos os estudos. Além disso, de todos os
transporte associados a vários poluentes atmosféricos que chegam a estudos que utilizaram agrupamento hierárquico, apenas o método
diferentes localizações geográficas e estabelecem ligações entre tipos de clima aglomerativo foi empregado, com pouca atenção aos métodos divisivos. Isso
e poluentes atmosféricos, todos importantes para fins ambientais. . Um pode ser devido aos pesquisadores serem guiados pela literatura onde o
exemplo de tal finalidade é o monitoramento da qualidade do ar, que método aglomerativo é amplamente aplicado. Individualmente,k-significa que
atualmente é de grande importância devido aos efeitos adversos que os métodos de Ward e média constituem 48%, 16% e 13%, de todos os
representa para a saúde humana. estudos, respectivamente. As ligações Ward e Average foram escolhas

• Como mostrado emFig. 4, para o agrupamento de medições de poluição do ar populares, enquanto outras ligações não foram.
terrestre (categoria 1), okO método -means foi usado em 30% dos estudos • Fig. 5mostra a proporção de estudos em termos de localização geográfica.
nesta revisão e, portanto, considerado o mais comum. Isso é seguido por Mais especificamente, o local onde o estudo foi realizado. A China e os EUA
Ward e agrupamento de ligação média, para os quais cada um foi de 19%. O apresentaram a maior porcentagem de estudos (cada um com 24%)
agrupamento em dois estágios e o uso de métodos múltiplos individualmente empregando hierarquia ek-significa agrupamento para estudos de poluição
representam 13% e 5% dos estudos, respectivamente. Alguns estudos (4%) do ar. Isso foi seguido pelos estudos que se concentraram em vários locais
não especificaram o método de agrupamento, enquanto outros estudos (9%) (13%). O Reino Unido e a Espanha foram semelhantes com 7% e 6%,
afirmaram o uso de um método hierárquico, mas não especificaram o tipo de respectivamente. Todos os outros países representaram individualmente
ligação. Para o agrupamento de trajetórias de massas de ar (categoria 2), ok- menos de 5% de todos os estudos.
significa que o método tem sido empregado em • Dado que a abordagem em dois estágios deve ajudar na

Figura 5. frequência encia of estudos b y país ( c aqui o es estudo foi conduzido cted) com base na revisão atual.

53
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

desenvolvendo os agrupamentos de cluster iniciais para a seleção termos de sua fonte, vias de transporte, repartição e links para
do 'k' nok-means, seria de se esperar que muito mais estudos condições meteorológicas, foram apresentados nesta revisão.
empregassem esse método, uma vez que a seleção do número de Atualmente, faltam revisões de técnicas de agrupamento aplicadas a
clusters é um dos problemas mais conhecidos na análise de estudos de poluição do ar e este estudo visa preencher essa lacuna. O
clusters, conforme apontado porJain (2010). No entanto, foi uso de dois métodos de agrupamento foi revisado, particularmente
observado na literatura apresentada aqui que a maioria dos para estudos envolvendo medições terrestres de poluentes e
pesquisadores continua a gravitar em torno do uso de técnicas de trajetórias de massas de ar que descrevem fontes e caminhos de
abordagem única, comok-means, média e Ward clustering. poluentes. Para todos os estudos envolvendo medições terrestres de
• Não há consenso sobre um único critério para validar o número de clusters. poluentes, okO método -means foi empregado em 28% deles, seguido
Em vez disso, os critérios de validação de cluster variaram entre os autores. pela média (20%) e Ward linkages (20%). Métodos de dois estágios
Portanto, seria melhor que o usuário realizasse uma comparação usando dois foram usados em 13% dos estudos, enquanto todos os outros
ou mais critérios de validação, a fim de decidir o mais adequado para os dados métodos individualmente compreendem menos de 10%. Para estudos
em questão. envolvendo trajetórias de massas de ar descrevendo fontes e caminhos
• Muitos dos estudos revisados aqui aplicaram técnicas de agrupamento de poluentes, okO método -means compreendeu 70% deles, seguido
para registros de dados de longo prazo, em alguns casos superiores a 10 por Ward linkage (11%), métodos múltiplos (9%) e agrupamento em
anos. Portanto, isso destaca e fala sobre a importância de estabelecer e dois estágios (6%). Dos vários métodos de ligação hierárquica, média e
manter estações de medição de alta qualidade a longo prazo para Ward foram os mais comumente aplicados. Em termos de localização
registrar vários tipos de dados de poluição do ar, para a identificação e geográfica, a maioria dos estudos (48%) revisados foi realizada na
monitoramento de padrões, tendências e anomalias. China e nos EUA. Cada técnica de agrupamento tem suas próprias
• A partir da revisão, o principal software que foi usado para realizar o vantagens e desvantagens e não existe um método “melhor”. Portanto,
clustering foi o SPSS. Outros softwares incluíam MATLAB, SAS, cabe ao pesquisador explorar os diferentes métodos de agrupamento
XLSTAT (um add-in para Excel) e R. Para agrupamento de trajetórias, para encontrar o que melhor se adapta aos dados ou à aplicação em
o software TrajStat era freqüentemente usado. questão. No geral, esta revisão pretende fornecer aos pesquisadores
um guia para escolher o método de análise de cluster mais apropriado
No geral, cada um dos dois métodos de agrupamento tem suas próprias para aplicação a alguns dos dados comumente encontrados em
vantagens e desvantagens. Além disso, a literatura sobre estudos de estudos de poluição do ar. Além disso,
poluição do ar aqui apresentada não oferece um consenso claro sobre o
melhor método. Portanto, cabe ao pesquisador explorar e testar diferentes Declarações de interesse
métodos com o objetivo de encontrar o mais adequado para os dados.
Tabelas 2 e 3pode ser usado para facilitar a comparação entre os dados ou Nenhum.

variáveis usadas e os diferentes métodos de agrupamento, bem como para


auxiliar o pesquisador a selecionar o método mais adequado em cada uma Reconhecimentos
das duas categorias.
P. Govender gostaria de agradecer ao National Astrophysics
7. Recomendações e Programa de Ciência Espacial (NASSP) na Universidade de KwaZulu-Natal,
África do Sul, pelo apoio financeiro.
As seguintes sugestões/recomendações são propostas com base na
revisão atual: Referências

• As ligações médias e de Ward foram as mais comumente usadas entre Abdalmogith, SS, Harrison, RM, 2005. O uso da análise de cluster de trajetória para examinar
o transporte de longo alcance de aerossol inorgânico secundário no Reino Unido. Atmos. Ambiente.
os estudos, enquanto outras ligações foram menos comuns. Devem ser
39, 6686–6695.
realizados estudos para analisar e comparar diferentes métodos de Adame, JA, Notario, A., Villanueva, F., Albaladejo, J., 2012. Aplicação de cluster
ligação e seu desempenho quando aplicados a dados de poluição do ar e análise para ozônio de superfície, NÃO2e assim2padrões diários em uma área industrial no
trajetórias de massa de ar. Centro-Sul da Espanha medidos com um sistema DOAS. ciência Ambiente Total. 429, 281–

• A maioria dos estudos analisou o comportamento de poluentes


291. Aghabozorgi, S., Shirkhorshidi, AS, Wah, TY, Soltanian, H., Herawan, T., 2014. Espacial
e agrupamento temporal da poluição do ar na Malásia: uma revisão. In: Conferência
provenientes de atividades industriais e aerossóis urbanos. Seria Internacional sobre Agricultura, Meio Ambiente e Ciências Biológicas (ICFAE 14),
interessante investigar os níveis de poluição e as vias de transporte em Antalya, Turquia.
Anderberg, MR, 1973. Análise de cluster para aplicativos. Imprensa Acadêmica, Nova York. Austin,
locais onde existem várias usinas de grande porte.

E., Coull, B., Thomas, D., Koutrakis, P., 2012. Uma estrutura para identificar distintos
Atualmente, a China e os EUA realizam a maioria das pesquisas sobre perfis multipoluentes em dados de poluição do ar. Ambiente. Int. 45, 112–121. Baker, J., 2010. Uma
poluição do ar, enquanto em outros países isso tem sido análise de cluster de vias de transporte aéreo de longo alcance e associados
concentrações de poluentes no Reino Unido. Atmos. Ambiente. 44, 563–571.
significativamente menor, especialmente em regiões como África e Índia,
Ball, GH, Hall, DJ, 1965. Uma técnica de agrupamento para resumir dados multivariados.
onde a queima de biomassa é predominante. Portanto, mais estudos em Behav. ciência 12, 153–155.
locais com altos níveis de poluição precisam ser realizados. Beaver, S., Palazoglu, A., 2006. Análise de cluster de medições horárias de vento para revelar

• Tendo em vista que o uso da análise de cluster tem sido bem-sucedido no estudo do
regimes sinóticos que afetam a qualidade do ar. J. Appl. Meteorol. Climatol. 45, 1710–1726. Beddows,
DCS, Dall'osto, M., Harrison, RM, 2009. Análise de agrupamento de áreas rurais, urbanas e
comportamento dos poluentes atmosféricos, em particular para a análise de dados de tamanho de partícula atmosférica curbside. Ambiente. ciência Tecnol. 43, 4694–4700.
características espaciais e temporais, os resultados devem ser incorporados em Bergstra, AD, Brunekreef, B., Burdorf, A., 2018. O efeito da poluição aérea relacionada à indústria

pesquisas voltadas para o desenvolvimento de modelos de previsão de poluentes lução sobre a função pulmonar e sintomas respiratórios em escolares. Ambiente. Saúde 17
(30), 1–9.
atmosféricos.
Bhagat, A., Kshirsagar, N., Khodke, P., Dongre, K., Ali, S., 2016. Seção de parâmetros de penalidade
leção para agrupamento hierárquico de fluxo de dados. Procedia Comput. ciência 79, 24–31.
8. Conclusões Borge, R., Lumbreras, J., Vardoulakis, S., Kassomenos, P., Rodríguez, E., 2007. Análise de
influências do transporte de longa distância no PM urbano10usando clusters de trajetória atmosférica
de dois estágios. Atmos. Ambiente. 41 (21), 4434–4450.
O objetivo deste artigo foi fornecer uma revisão das aplicações de agrupamento, em Brankov, E., Rao, ST, Porter, PS, 1988. Uma metodologia de correlação de agrupamento de trajetória
particular pelo uso de aglomeração hierárquica e k-significa métodos, que têm sido para examinar o transporte de longo alcance de poluentes atmosféricos. Atmos. Ambiente. 32 (9),
1525–1534.
aplicados em estudos de poluição do ar realizados nos últimos 40 anos. Mais
Bycenkiene, S., Dudoitis, V., Ulevicius, V., 2014. O uso da análise de cluster de trajetória para
especificamente, estudos que enfocaram as características espaço-temporais dos avaliar o transporte de longo alcance do aerossol de carbono negro na região sudeste do
poluentes atmosféricos, o comportamento dos poluentes em Báltico. Adv. Meteorol. ID do artigo 137694, 1–11.

54
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

Cakmak, S., Hebbern, C., Vanos, J., Crouse, DL, Burnett, R., 2016. Exposição ao ozônio e dados de concentração atmosférica de PM₁₀ para determinação de fontes e padrões
mortalidade relacionada a doenças cardiovasculares na Coorte de Saúde e Meio Ambiente do espaciais na qualidade do ar ambiente do vale de Kathmandu. atual ciência 93 (5), 684–688.
Censo Canadense (CANCHEC) por zona de classificação sinótica espacial. Ambiente. Poluir. 214, Gómez-Losada, A., Lozano-García, A., Pino-Mejías, R., Contreras-González, J., 2014.
598–599. Modelos de misturas finitas para caracterizar e refinar redes de monitoramento da qualidade do ar.
Cakmak, S., Hebbern, C., Pinault, L., Lavigne, E., Vanos, J., Crouse, DL, Tjepkema, M., ciência Ambiente Total. 485–486, 292–299.
2018. Associações entre PM de longo prazo2.5e exposição ao ozônio e mortalidade na Coorte Gómez-Losada, A., Pires, JCM, Pino-Mejías, R., 2018. Modelagem de poluição aérea de fundo
de Saúde e Meio Ambiente do Censo Canadense (CANCHEC), por zona de classificação exposição à poluição em ambientes urbanos: implicações para a pesquisa epidemiológica.
sinótica espacial. Ambiente. Int. 111, 200–211. Ambiente. Modelo. Software 106, 13–21.
Cape, JN, Methven, J., Hudson, LE, 2000. O uso da análise de cluster de trajetória para Gong, X., Richman, MB, 1995. Sobre a aplicação da análise de cluster à estação de crescimento
interpretar medições de gás traço em Mace Head, Irlanda. Atmos. Ambiente. 34, dados de precipitação na América do Norte a leste das Montanhas Rochosas. J. Clim. 8, 897–
3651–3663. 931. Gorham, E., Martin, FB, Litzau, JT, 1984. Chuva ácida: correlações iônicas no leste
Cheng, S., Ye, H., Kalkstein, LS, 1992. Uma avaliação das concentrações de poluição em Estados Unidos. Ciência 225, 407–409.
Filadélfia usando uma abordagem sinótica automatizada. Geógrafo dos Estados do Meio 25, 45–51. Gramsch, E., Cereceda-Balic, F., Oyola, P., von Baer, D., 2006. Exame de poluição
tendências em Santiago do Chile com análise de cluster de PM10e dados de ozônio. Atmos.
Cheng, X., Wallace, JM, 1993. Análise de cluster do inverno do hemisfério norte Ambiente. 40, 5464–5475.
Campo de altura de 500 hPa: padrões espaciais. J. Atmos. ciência 50 (16), 2674–2696. Greene, JS, Kalkstein, LS, Ye, H., Smoyer, K., 1999. Relações entre sinóticos
Cheng, S., Yang, L., Zhou, X., Wang, Z., Zhou, Y., Gao, X., Nie, W., Wang, X., Xua, P., climatologia e poluição atmosférica em 4 cidades dos EUA. Teor. Appl. Climatol. 62, 163–
Wang, W., 2011. J. Environ. Monit. 13, 1662–1671. 174.
Cheng, S., Wang, F., Li, J., Chen, D., Li, M., Zhou1, Y., Ren, Z., 2013. Aplicação de Grivas, G., Chaloulakou, A., Kassomenos, P., 2008. Uma visão geral do PM10poluição
métodos de agrupamento de trajetória e distribuição de fontes para investigar PM problema, na área metropolitana de Atenas, na Grécia. Avaliação de fatores de controle e
atmosférico transfronteiriço10poluição. Qual. de ar aerossol. Res. 13, 333–342. Chu, impacto potencial do transporte de longa distância. ciência Ambiente Total. 389, 165–177.
HJ, Liau, CJ, Lin, CH, Su, BS, 2012. Integração de análise de cluster fuzzy e Hafner, WD, Solorzano, NN, Jaffe, DA, 2007. Análise de chuva e dados de aerossóis finos
estimativa de densidade do kernel para rastrear trajetórias de tufões na região de Taiwan. usando análise de trajetória agrupada para sites de Parques Nacionais no oeste dos EUA. Atmos.
Especialista Sist. Appl. 39, 9451–9457. Ambiente. 41, 3071–3081.
Comrie, AC, 1996. Uma climatologia sinóptica de todas as estações da poluição do ar nos EUA-México Halkidi, M., Batistakis, Y., Vazirgiannis, M., 2001. Sobre técnicas de validação de agrupamento. j.
região de fronteira. Prof. Geogr. 48, 237–251. Intel. Inf. Sist. 17, 107–145.
Contini, D., Genga, A., Cesari, D., Siciliano, M., Donateo, A., Bove, MC, Guascito, MR, Harinath, S., Murthy, ONU, 2012. Efeito da poluição do ar na saúde humana em indústrias
2010. Caracterização e repartição de fontes de PM10em um local de fundo urbano áreas - um estudo de caso. J. Ind. Poluição. Controle 28 (1), 9–11.
em Lecce. Atmos. Res. 95, 40–54. Harris, JM, Kahl, JD, 1990. Uma climatologia descritiva do transporte atmosférico para o
Crecelius, EA, Lepel, EA, Laul, JC, Rancitelli, LA, McKeever, RL, 1980. Histórico Observatório Mauna Loa, usando trajetórias agrupadas. J. Geophys. Res. 95 (D9)
química de partículas do ar perto de Colstrip, Montana. Ambiente. ciência Tecnol. 14 (4), 13.651-13.667A.
422–428. Han, J., Kamber, M., Pei, J., 2012. Conceitos e técnicas de mineração de dados. Elsevier, EUA.
Davis, RE, Kalkstein, LS, 1990. Usando uma classificação climatológica sinóptica espacial para Hartigan, JA, Wong, MA, 1979. Algoritmo AS 136: ak-significa algoritmo de agrupamento.
avaliar as mudanças nas concentrações de poluição atmosférica. Física geogr. 11 (4), Appl. Estado. 28, 100–108.
320–342. He, Z., Kim, YJ, Ogunjobi, KO, Hong, CS, 2003. Características do PM2.5espécies e
Davis, RE, Gay, DA, 1993. Uma análise climatológica sinóptica da qualidade do ar no Grand transporte de massas de ar de longo alcance na estação de fundo de Taean, Coreia do Sul. Atmos.
Parque Nacional do Cânion. Atmos. Ambiente. 27A, 713–727. Ambiente. 37, 219–230.
Davis, RE, 1991. Uma análise climatológica sinóptica das tendências de visibilidade do inverno no Hsu, CH, Cheng, FY, 2016. Classificação de padrões climáticos para estudar a influência de
meio-leste dos Estados Unidos. Atmos. Ambiente. B Ambientes Urbanos. 25 (2), 165–175. Características meteorológicas no PM2.5concentrações no Condado de Yunlin, Taiwan.
Davis, JM, Eder, BK, Nychka, D., Yang, Q., 1998. Modelando os efeitos da meteorologia Atmos. Ambiente. 144, 397–408.
no ozônio em Houston usando análise de cluster e modelos aditivos generalizados. Atmos. Hsu, CH, Cheng, FY, 2019. Padrões climáticos sinópticos e poluição do ar associada em
Ambiente. 32 (14), 2505–2520. Taiwan. Qual. de ar aerossol. Res. 19, 1139–1151.
Davis, RE, Walker, DR, 1992. Uma climatologia sinótica do ar superior do oeste dos Estados Unidos Huang, P., Zhang, J., Tang, Y., Liu, L., 2015. Distribuição espacial e temporal de PM2.5
Estados. J. Clim. 5 (12), 1449–1467. poluição na cidade de Xi'an, China. Int. J. Environ. Res. Saúde Pública 12, 6608–
Davuliene, L., Sakalys, J., Dudoitisa, V., Reklaite, A., Ulevicius, V., 2019. Preto de longa data 6625. Hussein, T., Mølgaard, B., Hannuniemi, H., Martikainen, J., Järvi, L., Wegner, T.,
variação de carbono na região sudeste do Báltico em 2008-2015. Atmos. Poluir. Res. Ripamonti, G., Weber, S., Timo Vesala, T., Hämeri, K., 2014. Impressões digitais da
10, 123–133. distribuição de tamanho de partícula urbana em Helsinki, Finlândia: características locais
Ding, H., Liu, Y., Yu, Z., Cheung, C., Zhan, J., 2017. Características espaciais e temporais versus regionais. Ambiente Boreal. Res. 19, 1–20.
e principais regiões contribuintes de alta PM2.5poluição em Hong Kong. Qual. de ar Iizuka, A., Shirato, S., Mizukoshi, A., Noguchi, M., Yamasaki, A., Yanagisawa, Y., 2014. A
aerossol. Res. 17, 2955–2965. análise de cluster de dados de monitoramento de ar ambiente constante da região de
Dominick, D., Juahir, H., Talib, LM, Zain, SM, Aris, AZ, 2012. Avaliação espacial do ar Kanto, no Japão. Int. J. Environ. Res. Saúde Pública 11, 6844–6855.
padrões de qualidade na Malásia usando análise multivariada. Atmos. Ambiente. 60, Jain, AK, Murty, MN, Flynn, PJ, 1999. Agrupamento de dados: uma revisão. Computação ACM. Sobreviver
172–181. 31 (3), 264–323.
Donnelly, AA, Broderick, BM, Misstear, BD, 2015. O efeito da massa de ar de longo alcance Jain, AK, 2010. Agrupamento de dados: 50 anos depoisk-significa. Reconhecimento de padrão. Deixe 31,
vias de transporte na PM10e não2concentrações em locais urbanos e rurais na 651–666.
Irlanda: quantificação usando técnicas de agrupamento. J. Environ. ciência Saúde, Jin, L., Harley, RA, Brown, NJ, 2011. Regimes de poluição por ozônio modelados para um verão
Parte A 50 (7), 647–658. temporada no vale de San Joaquin, na Califórnia: uma análise de cluster. Atmos. Ambiente. 45,
Dorling, SR, Davies, TD, Pierce, CE, 1992. Análise de agrupamento: uma técnica para estimar 4707–4718.
os controles meteorológicos sinópticos na química do ar e da precipitação – método e Jolliffe, IT, Philipp, A., 2010. Alguns desenvolvimentos recentes na análise de agrupamentos. Física Chem.
aplicações. Atmos. Ambiente. 26A (14), 2575–2581. Terra 35, 309–315.
Dorling, SR, Davies, TD, 1995. Estendendo links de meteorologia sinóptica de análise de cluster para Jorba, O., Perez, C., Rocadenbosch, F., Baldasano, JM, 2004. Análise de cluster de 4 dias
caracterizar climas químicos em seis estações de monitoramento do noroeste da Europa. Atmos. trajetórias anteriores chegando à região de Barcelona, Espanha, de 1997 a 2002. J. Appl.
Ambiente. 29 (2), 145–167. Meteorol. 43, 887–901.
Dubes, R., Jain, AK, 1976. Técnicas de agrupamento: o dilema do usuário. Reconhecimento de padrão. Kahya, C., Balcik, FB, Oztaner, YB, Ozcomak, D., Seker, DZ, 2017. Espaço-temporal
8, 247–260. análise de PM2.5sobre a região de Mármara. Peru. Fren. Ambiente. Touro. 26 (1), 310–
Eder, BK, Davis, JM, Bloomfield, P., 1994. Um esquema de classificação automatizado 317.
assinado para melhor elucidar a dependência do ozônio na meteorologia. J. Appl. Kalkstein, LS, Corrigan, P., 1986. Uma abordagem climatológica sinóptica para
Meteorol. 33, 1182–1199. análise: avaliação das concentrações de dióxido de enxofre. Ana. Associado Sou. geogr. 76
Everitt, BS, Landau, S., Leese, M., Stahl, D., 2011. Análise de Cluster. Wiley, Londres. Fang, (3), 381–395.
X., Bi, X., Xu, H., Wu, J., Zhang, Y., Feng, Y., 2017. Distribuição da fonte de am- Kalkstein, LS, Tan, G., Skindlov, JA, 1987. Uma avaliação de três procedimentos de agrupamento
PM biente10e PM2.5em Haikou, China. Atmos. Res. 190, 1–9. para uso na classificação climatológica sinóptica. J. Clim. Appl. Meteorol. 26, 717–730. Kampa,
Fernau, ME, Samson, PJ, 1990a. Uso de análise de cluster para definir períodos de similar M., Castanas, E., 2008. Efeitos da poluição do ar na saúde humana. Ambiente. Poluir.
meteorologia e química da precipitação no leste da América do Norte. Parte I: padrões de 151, 362–367.
transporte. J. Appl. Meteorol. 29, 735–750. Kaufman, L., Rousseeuw, PJ, 1990. Encontrando Grupos em Dados: uma Introdução ao Cluster
Fernau, ME, Samson, PJ, 1990b. Uso de análise de cluster para definir períodos de similar Análise. Wiley, Nova Jersey.
meteorologia e química da precipitação no leste da América do Norte. Parte II: Padrões de Kassomenos, P., Vardoulakis, S., Borge, R., Lumbreras, J., Papaloukas, C., Karakitsios, S.,
precipitação e deposição de poluentes. J. Appl. Meteorol. 29, 751–761. Flemming, J., Stern, 2010. Comparação de técnicas estatísticas de agrupamento para a classificação de
R., Yamartino, RJ, 2005. Uma nova classificação do regime de qualidade do ar trajetórias atmosféricas modeladas. Teor. Appl. Climatol. 102, 1–12.
esquema para O3, NÃO2, ENTÃO2e PM10locais de observação. Atmos. Ambiente. 39, Kim, SB, Temiyasathit, C., Chen, VCP, Park, SK, Sattler, M., Russell, AG, 2008.
6121–6129. Caracterização de regiões espacialmente homogêneas com base em padrões temporais de material
Fullerton, DG, Brucec, N., Gordon, SB, 2008. Poluição do ar interior por combustível de biomassa particulado fino nos Estados Unidos continentais. J. Air Waste Manag. Associado 58 (7), 965–975.
o fumo é um grande problema de saúde no mundo em desenvolvimento. Trans. Royal Soc. Trop.
Med. Hyg. 102, 843–885. Kwon, Y., Lee, H., Lee, H., 2018. Implicações da análise de agrupamento usando estufa
Gao, H., Chen, J., Wang, B., Tan, SC, Lee, CM, Yao, X., Yan, H., Shi, J., 2011. Um estudo de emissões de gases de países asiáticos para a mitigação das mudanças climáticas. Mitig. Adaptar. Estratégias
poluição do ar de aglomerados de cidades. Atmos. Ambiente. 45, 3069–3077. Glob. Mudança 23, 1225–1249.
Giri, D., Murthy, VK, Adhikary, PR, Khanal, SN, 2007. Análise de agrupamento aplicada a Latif, MT, Dominick, D., Ahamad, F., Khan, MF, Juneng, L., Hamzah, FM, Nadzir,

55
P. Govender e V. Sivakumar Pesquisa de Poluição Atmosférica 11 (2020) 40–56

MSM, 2014. Avaliação de longo prazo da qualidade do ar de uma estação de fundo na Sanchez, ML, Ramos, MC, Pascual, D., Perez, I., 1990. Aplicação da análise de cluster para
Península da Malásia. ciência Ambiente Total. 482–483, 336–348. identificar fontes de partículas transportadas pelo ar. Atmos. Ambiente. 21, 1521–1527.
Laumbach, RJ, Kipen, HM, 2012. Efeitos da poluição do ar na saúde respiratória: atualização sobre Sausy, D., Anderson, JR, Buseck, PR, 1987. Amostras de análise de agrupamento do
fumaça de biomassa e poluição do tráfego. Clínica de Alergia. imunol. 129 (1), 3–13. Legras, Ártico norueguês. Atmos. Ambiente. 21, 1649–1657.
B., Desponts, T., Piguet, B., 1988. Análise de cluster e regimes meteorológicos. Proc. de Shi, P., Xie, PH, Qin, M., Si, FQ, Dou, K., Du, K., 2014. Análise de agrupamento para padrões diários
o Workshop sobre a Natureza e Previsão de Sistemas Meteorológicos Extratropicais 2. ECMWF, termos de SO2e não2medida pelo Sistema DOAS em Xiamen. Qual. de ar aerossol.
Reading, Shinfield Park, Reino Unido, pp. 123–149. Res. 14 (5), 1455–1465.
Li, M., Huang, X., Zhu, L., Li, J., Song, Y., Cai, X., Xie, S., 2012. Análise do transporte Skiles, MJ, Lai, AM, Olson, MR, Schauer, JJ, Foy, BD, 2018. Distribuição da fonte
caminhos e fontes potenciais de PM10em Xangai com base em três métodos. ciência de carbono orgânico PM2.5 no vale de San Joaquin usando observações mensais e diárias e
Ambiente Total. 414, 525–534. agrupamento meteorológico. Ambiente. Poluir. 237, 366–376. Soares, J., Makar, PA, Aklilu, Y.,
Liao, TW, 2005. Agrupamento de dados de séries temporais - uma pesquisa. Reconhecimento de padrão. 38, Akingunola, A., 2018. O uso de agrupamento hierárquico
1857–1874. para o projeto de redes de monitoramento otimizadas. Atmos. Chem. Física 18,
Liu, Y., Zhu, Q., Wang, R., Xiao, K., Cha, P., 2019. Distribuição, origem e transporte de 6543–6566.
os aerossóis sobre a Ásia central. Atmos. Ambiente. 210, 120–131. Solazzo, E., Galamarini, S., 2015. Comparando maçãs com maçãs: usando espacialmente dis-
Lu, HC, Chang, CL, Hsieh, JC, 2006. Classificação de PM10distribuições em Taiwan. séries temporais tributadas de dados de monitoramento para avaliação do modelo. Atmos. Ambiente. 112, 234–
Atmos. Ambiente. 40, 1452–1463. 245.
Lu, WZ, He, HD, Dong, LY, 2011. Avaliação do desempenho do monitoramento da qualidade do ar Steinhaus, H., 1956. Sur la division des corp materiels en parties. Touro. Acad. Polonês. ciência
redes usando análise de componentes principais e análise de cluster. Construir. Ambiente. 46, 577– IV (C1.III), 801–804.
583. Taubman, BF, Hains, JC, Thompson, AM, Marufu, LT, Doddridge, BG, Stehr, JW,
Luo, M., Chen, C., 2015. Fontes potenciais e vias de transporte de PM2.5em Xangai, Piety, CA, Dickerson, RR, 2006. Perfis verticais de aeronaves de poluição por gases residuais e
China. In: Proceedings of the 2nd IEEE International Conference on Spatial Data aerossóis sobre o meio do Atlântico nos Estados Unidos: estatísticas e análise meteorológica de
Mining and Geographical Knowledge Services (ICSDM), Fuzhou, China. aglomerados. J. Geophys. Res. 111, 1–14 D10S07.
Lv, B., Liu, Y., Yu, P., Zhang, B., Bai, Y., 2015. Caracterizações da poluição PM2.5 Terrouche, A., Ali-Khodja, H., Kemmouche, A., Bouziane, M., Derradji, A., Charron, A.,
análise de caminhos e fontes em quatro grandes cidades da China. Qual. de ar aerossol. Res. 15, 2015. Identificação de fontes de material particulado atmosférico e traços de metais em
1836–1843. Constantine, Argélia. Qualidade do Ar Atmos. Saúde. 9 (1), 69–82.
Lyapina, O., Schultz, MG, Hense, A., 2016. Análise de agrupamento do ozônio superficial europeu Toledano, C., Cachorro, VE, Frutos, ME, Torres, B., Berjon, A., Sorribas, M., Stone, RS,
observações para avaliação dos dados de reanálise do MACC. Atmos. Chem. Física 16, 2009. Classificação de massa de ar e análise de tipos de aerossóis em El Arenosillo (Espanha).
6863–6881. J. Appl. Meteorol. Climatol. 48, 962–981.
MacQueen, JB, 1967. Alguns métodos para classificação e análise de ob- Tshela, C., Djolov, G., 2018. Criação de perfil de origem, distribuição de origem e transporte de cluster
servições. Proc. do 5º Simpósio de Berkeley em Estatística Matemática e Probabilidade, vol. 1. análise para identificar as fontes de PM e a origem das massas de ar para uma área rural
University of California Press, Berkeley, pp. 281–297. Madulatha, TS, 2012. Uma visão geral industrializada no Limpopo. Ar Limpo J. 28 (2), 54–66.
sobre métodos de agrupamento. IOSR J. Eng. 2 (4), 719–725. Mahura, AG, Jaffe, DA, Andres, RJ, Tuffery, S., 2011. Data Mining e Estatística para Tomada de Decisão. Wiley, Sussex. Unal,
Merrill, JT, 1999. Trajeto de transporte atmosférico YS, Toros, H., Deniz, A., Incecik, S., 2011. Influência de fatores meteorológicos e
caminhos desde a usina nuclear de Bilibino até o Alasca. Atmos. Ambiente. 33, fontes de emissão em variações espaciais e temporais de PM10concentrações na área
5115–5122. metropolitana de Istambul. Atmos. Ambiente. 45, 5504–5513.
Makra, L., Matyasovszky, I., Guba, Z., Karatzas, K., Anttila, P., 2011. Valenzuela, A., Olmo, FJ, Lyamani, H., Antón, M., Quirantes, A., Alados-Arboledas, L.,
efeitos de transporte de alcance no PM urbano10níveis usando clusters 3D de trajetórias 2012. Classificação das propriedades radiativas do aerossol durante as invasões de poeira do deserto
para trás. Atmos. Ambiente. 45, 2630–2641. africano no sudeste da Espanha por origens setoriais e análise de cluster. J. Geophys. Res. 117, 1–18.
Markou, MT, Kassomenos, P., 2010. Análise de cluster de cinco anos de trajetórias anteriores
chegando em Atenas, na Grécia. Atmos. Res. 98, 438–457. von Bismarck-Osten, C., Weber, S., 2014. Uma classificação uniforme do tamanho da assinatura do aerossol
McGregor, GR, Bamzelis, D., 1995. Tipagem sinóptica e sua aplicação ao in- distribuições baseadas em análise de agrupamento observacional e guiada por regressão. Atmos.
investigação das relações entre a poluição do ar e o clima, Birmingham, Reino Unido. Ambiente. 89, 346–357.
Teor. Appl. Climatol. 51, 223–236. Wang, YQ, Zhang, XY, Arimoto, R., Cao, JJ, Shen, ZX, 2004. As vias de transporte
Milligan, GW, Cooper, MC, 1985. Um exame dos procedimentos para determinar o e fontes de poluição PM10 em Pequim durante a primavera de 2001, 2002 e 2003.
número de clusters em um conjunto de dados. Psychometrika 50 (2), 159–179. Geophys. Res. Deixe 31 (L14110), 1–4.
Mo, K., Ghil, M., 1988. Análise de cluster de múltiplos regimes de fluxo planetário. J. Geophys. Wang, F., Chen, DS, Cheng, SY, Li, JB, Li, MJ, Ren, ZH, 2010. Identificação de
Res. 93, 10927–10952. PM atmosférico regional10vias de transporte usando HYSPLIT, MM5-CMAQ e análise
Moody, JL, Galloway, JN, 1988. Quantificar a relação entre a atmosfera de padrão de pressão sinóptica. Ambiente. Modelo. Softw 25 (8), 927–934. Wang, HL,
transporte e a composição química da precipitação nas Bermudas. Tellus B Chem. Qiao, LP, Lou, SR, Zhou, M., Ding, AJ, Huang, HY, Chen, JM, Wang, Q.,
Física Meteorol. 40 (5), 463–479. Tao, SK, Chen, CH, Li, L., Huang, C., 2016. Composição química do PM2.5e impacto
Moody, JL, Samson, PJ, 1989. A influência do transporte atmosférico na precipitação meteorológico entre três anos na área urbana de Xangai, China. J. Limpo. Prod. 112,
química em dois locais no meio-oeste dos Estados Unidos. Atmos. Ambiente. 23, 1302–1311.
2117–2132. Ward, JH, 1963. Agrupamento hierárquico para otimizar uma função objetivo. Geléia. Estado.
Munir, S., Habeebullah, TM, Mohammed, AMF, Morsy, EA, 2015. Uma análise sobre o Associado 58, 236–244.
variações temporais do ozônio ao nível do solo no clima árido de Meca aplicandok- significa Wegner, T., Hussein, T., Hämeri, K., Vesala, T., Kulmala, M., Weber, S., 2012. Propriedades
algoritmos. Ambiente. Ásia 8 (1), 53–60. de distribuições de tamanho de assinatura de aerossol no ambiente urbano, derivadas por análise de
Namratha, M., Prajwala, TR, 2012. Uma visão abrangente dos algoritmos de agrupamento cluster. Atmos. Ambiente. 61, 350–360.
no reconhecimento de padrões. IOSR J. Comput. Eng. 4 (6), 23–30. Wong, MA, Nichol, JE, Lee, KH, 2010. Sensoriamento remoto da atmosfera e nuvens
Omar, AH, Won, JG, Winker, DM, Yoon, SC, Dubovik, O., McCormick, MP, 2005. III. Proc. SPIE 7859, 78590E.
Desenvolvimento de modelos globais de aerossóis usando análise de cluster de medições Wu, X., Ding, Y., Zhou, S., Tan, Y., 2018. Característica temporal e análise de fonte de
Aerosol Robotic Network (AERONET). J. Geophys. Res. 110 (D10S14), 1–14. Omran, MGH, PM2.5na aglomeração urbana mais poluída da China. Atmos. Poluir. Res. 9 (6), 1221–
Engelbrecht, AP, Salman, A., 2007. Uma visão geral dos métodos de agrupamento. 1230.
Intel. Análise de Dados. 11, 583–605. Yu, S., Zhang, Q., Yan, R., Wang, S., Li, P., Chen, B., Liu, W., Zhang, X., 2014. Origem do ar
Pandey, B., Agrawal, M., Singh, S., 2014. Avaliação da poluição do ar em torno da mineração de carvão poluição durante um episódio semanal de forte neblina em Hangzhou, China. Ambiente. Chem. Deixe
área: enfatizando distribuições espaciais, variações sazonais e metais pesados, 12, 543–550.
usando cluster e análise de componentes principais. Atmos. Poluir. Res. 5, 79–86. Zhan, CC, Xie, M., Fang, DX, Wang, TJ, Wu, Z., Lu, H., Li, MM, Chen, PL, Zhuang,
Pires, JCM, Sousa, SIV, Pereira, MC, Alvim-Ferraz, MCM, Martins, FG, 2008a. BL, Li, S., Zhang, ZQ, Gao, D., Reng, JY, Zhao, M., 2019. Padrões climáticos sinópticos e seus
Gerenciamento do monitoramento da qualidade do ar usando componente principal e análise de impactos na poluição regional por partículas no aglomerado de cidades da Bacia de Sichuan,
cluster - parte I: SO2e PM10. Atmos. Ambiente. Times 42, 1249–1260. China, Atmos. Ambiente. Vezes 208, 34–47.
Pires, JCM, Sousa, SIV, Pereira, MC, Alvim-Ferraz, MCM, Martins, FG, 2008b. Zhang, J., Huang, X., Chen, Y., Luo, B., Luo, J., Zhang, W., Rao, Z., Yang, F., 2019.
Gestão do monitoramento da qualidade do ar usando componente principal e análise de Caracterização de partículas atmosféricas contendo chumbo em uma cidade típica da bacia da
cluster - parte II: CO, NO2e O3. Atmos. Ambiente. 42, 1261–1274. Pongkiatkul, P., Oanh, China: variações sazonais, áreas de origem potencial e respostas a fogos de artifício. ciência
NTK, 2007. Avaliação do potencial de transporte de longo alcance de Ambiente Total. 661, 354–363.
poluição do ar particulada usando modelagem de trajetória e dados de monitoramento. Atmos. Res. Zhang, JJ, Smith, KR, 2007. Poluição do ar doméstico causada por combustíveis de carvão e biomassa em
85, 3–17. China: medições, impactos na saúde e intervenções. Ambiente. Perspectiva de Saúde. 115
Qiao, X., Ying, Q., Li, X., Zhang, H., Hu, J., Tang, Y., Chen, X., 2018. Fonte distribuída- (6), 848–855.
mento de PM2,5 para 25 capitais provinciais chinesas e municípios usando um modelo de Zhao, S., Yu, Y., Yin, D., He, J., Liu, N., Qu, J., Xiao, J., 2016. Variáveis anuais e diurnas
qualidade do ar multiescala comunitário orientado à fonte. ciência Ambiente Total. 612, 462– emissões de poluentes gasosos e particulados em 31 capitais provinciais com base em dados de
471. Rozwadowska, A., Zielinski, T., Petelski, T., Sobolewski, P., 2010. Análise de cluster do monitoramento in situ da qualidade do ar do Centro Nacional de Monitoramento Ambiental da China.
impacto das trajetórias de retorno do ar nas propriedades ópticas do aerossol em Hornsund, Ambiente. Int. 86, 92–106.
Spitsbergen. Atmos. Chem. Física 10, 877–893. Zhao, S., Yu, Y., Qin, D., Yin, D., Dong, L., He, J., 2018. Análises de poluição regional e
Saksena, S., Joshib, V., Patilc, RS, 2003. Análise de cluster da qualidade do ar ambiente de Delhi transporte de PM2.5e ozônio nos aglomerados de cidades da Bacia de Sichuan, China. Atmos.
dados. J. Environ. Monit. 5, 491–499. Poluir. Res. 10 (2), 374–385.

56

Você também pode gostar