Você está na página 1de 22

Machine Translated by Google

Grandes Dados da Terra

ISSN: (Impresso) (Online) Página inicial do jornal: https://www.tandfonline.com/loi/tbed20

RockSL: uma biblioteca espectral de rocha integrada para melhores


serviços compartilhados globais

BS Xie, SY Zhou, LX Wu, WF Mao e W. Wang

Para citar este artigo: BS Xie, SY Zhou, LX Wu, WF Mao & W. Wang (2023) RockSL: uma
biblioteca espectral de rocha integrada para melhores serviços compartilhados globais, Big Earth Data,
7:1, 191-211, DOI: 10.1080/20964471.2021.2017111

Para acessar este artigo: https://doi.org/10.1080/20964471.2021.2017111

© 2022 O(s) autor(es). Publicado pelo Taylor & Francis


Group e Science Press em nome da International Society
for Digital Earth, apoiado pelo CASEarth Strategic Priority
Research Programme.

Publicado online: 31 de janeiro de 2022.

Envie seu artigo para esta revista

Visualizações do artigo: 1126

Ver artigos relacionados

Exibir dados de marca cruzada

Artigos de citação: 2 Ver artigos de citação

Os Termos e Condições completos de acesso e uso podem ser encontrados em

https://www.tandfonline.com/action/journalInformation?journalCode=tbed20
Machine Translated by Google

BIG EARTH DATA


2023, VOL. 7, Nº. 1, 191–211
https://doi.org/10.1080/20964471.2021.2017111

ARTIGO DE DADOS

RockSL: uma biblioteca espectral de rocha integrada para melhores


serviços compartilhados globais

BS Xiea,b, SY Zhoua,b, LX Wua,b, WF Maoa, be W. Wanga,b

um Departamento de Ciência de Topografia, Mapeamento e Sensoriamento Remoto, Escola de Geociências e Info-Física,


b
Universidade Central Sul, Changsha, China; Laboratório de Percepção, Cognição e
Predicação, Central South University, Changsha, China

ABSTRATO HISTORIA DO ARTIGO


Dados espectrais de diferentes rochas e minerais geralmente mostram diferentes Recebido em 3 de agosto de 2021

formas de onda e características de absorção nos comprimentos de onda do visível Aceito em 6 de dezembro de 2021

e do infravermelho, o que permite a identificação de espécies e composições PALAVRAS-CHAVE


minerais. No entanto, espectros maciços de rocha/mineral na superfície terrestre Rochas e minerais;
foram espalhados por uma variedade de bibliotecas espectrais em todo o mundo, interoperabilidade de dados;
exibindo estruturas de dados inconsistentes e condições de medição. Para avançar biblioteca integrada;
na interoperabilidade e na usabilidade dos dados, coletamos dados e informações discriminação geológica; conjuntos
de seis bibliotecas compartilhadas com diferentes formatos e amostras de campo de dados característicos

medidas em laboratório para estabelecer uma biblioteca espectral de rocha


integrada (RockSL).
Tanto a qualidade dos dados das curvas espectrais quanto a integridade dos
metadados descritivos são considerados no RockSL integrado a ser publicado no
repositório de código aberto GitHub. O RockSL contém não apenas o grande
conjunto de dados espectrais de rochas e minerais para serviço de dados (ou seja,
compartilhamento e recuperação de dados) e discriminação geológica, mas também
o conjunto de dados de características de parâmetros/metadados-chave (por
exemplo, tamanho de partícula, composição mineral e assinatura de banda
completa, etc. .) para exploração de mineração de dados e descoberta de
conhecimento. Esperamos que mais pesquisadores se juntem para melhorar a
disponibilidade e o valor prático do RockSL para a comunidade de sensoriamento
remoto. Este artigo apresenta a estrutura do banco de dados e o fluxo de trabalho
de processamento de dados e demonstra um serviço de correspondência e vários
exemplos de conjuntos de dados característicos do RockSL.

1. Introdução

Os dados espectrais são medidos usando sensores espectrais, que registram a radiação solar ou fornecida artificialmente refletida

na superfície dos materiais. Uma vez que muitos materiais absorvem radiação em comprimentos de onda específicos, é possível

identificar espécies de materiais pelas características de absorção características, que aparecem como vales em uma curva
espectral (Kruse, 1994 ).

As faixas de comprimento de onda mais adequadas para a discriminação de materiais geológicos incluem o visível e infravermelho

próximo (VNIR, 0,3–1,1 ÿm), infravermelho de comprimento de onda curto (SWIR, 1,1– 2,5 ÿm) e infravermelho médio (MIR, 3–25
ÿm). , enquanto a fluorescência característica dos hidrocarbonetos ocorre na região espectral ultravioleta (UV) (van der Meer et

al., 2012).

CONTATE LX Wu wulx66@csu.edu.cn; awulixin@263.net University, Lushan Escola de Geociências e Infofísica, Centro-Sul


South Road 932, Changsha, Hunan, PR China © 2022 O(s) autor(es). Publicado
pelo Taylor & Francis Group e Science Press em nome da International Society for Digital Earth, apoiado pelo CASEarth Strategic Priority
Research Programme.
Este é um artigo de Acesso Aberto distribuído sob os termos da Creative Commons Attribution License (http://creativecommons.org/
licenses/by/4.0/), que permite uso, distribuição e reprodução irrestritos em qualquer meio, desde que o trabalho original está devidamente
citado.
Machine Translated by Google

192 BS XIE ET AL.

A geologia espectral lida com a medição e análise de porções do espectro eletromagnético para identificar
características espectralmente distintas e fisicamente significativas de diferentes tipos de rochas, o que pode ser uma
ajuda útil para a interpretação de imagens de sensoriamento remoto e discriminação de composições minerais.

Dados espectrais geológicos obtidos de sensores de laboratório, de campo, aerotransportados e orbitais, juntamente
com metadados relacionados, formam uma biblioteca espectral, que fornece padrões de composição importantes para
programas de pesquisa geológica (Kokaly et al., 2017) . As bibliotecas espectrais existentes em todo o mundo podem
ser divididas em bibliotecas espectrais universais que enfatizam a coleta de espectros de vários materiais (por exemplo,
rocha, mineral, vegetal, solo, neve, etc.) em um campo específico e preste mais atenção à influência de diferentes
variáveis (por exemplo, tamanho de partícula, banda de onda, rugosidade, ângulo de observação, porosidade e
composição química, etc.) nas características espectrais (Zhang, Xiao, & Wen et al., 2017 ; Zhou & Zhou., 2009). Neste
artigo, descrevemos e integramos as bibliotecas universais representativas (por exemplo, USGS, JHU, ASTER,
biblioteca espectral Gospel, etc.) biblioteca, etc.), que são mostrados na Tabela 1.

A biblioteca espectral do Serviço Geológico dos Estados Unidos (USGS) como uma biblioteca amplamente
reconhecida foi montada de espectros medidos com campo de laboratório e espectrômetros aerotransportados,
cobrindo vários materiais naturais e artificiais. A biblioteca espectral do USGS produziu formatos genéricos dos
espectros e metadados em arquivo ASCII para disseminação de dados e fornece padrões de composição significativos
para programas de pesquisa executados pelo US Geological Survey (Kokaly et al., 2017, Clark, Swayze, & Gallagher
et al., 1993; Clark et al., 2007). A biblioteca espectral da Universidade Johns Hopkins (JHU) incluía dados de refletância
bicônica (biconical) de minerais/meteoritos e refletância hemisférica direcional de rochas, que prestam mais atenção à
qualidade dos dados para fornecer espectros padrão (Meerdink, Hook, Roberts e Abbott, 2019 ). Para apoiar as
pesquisas do Advanced Spaceborne Thermal Emission Reflection Radiometer (ASTER), fornecendo observações no
visível e no infravermelho próximo, no infravermelho de ondas curtas e na banda do infravermelho termal, a biblioteca
espectral ASTER foi compilada com 2400 espectros de materiais naturais e artificiais , que foram adquiridos pela
ASTER e contribuíram da biblioteca espectral do Jet Propulsion Laboratory (JPL), da biblioteca JHU e da biblioteca
espectral USGS

Tabela 1. As características das bibliotecas espectrais compartilhadas integradas no RockSL.


Faixa de comprimento

Tipos de amostra de ondab

biblioteca Rocha/ Outros Materiais Formato

espectral mineral materiaisa planetários VNIR MIR FIR compartilhado Recurso de dados

USGS ÿ ÿ ÿ ÿ ÿ ÿ ASCII https://www.usgs.gov/labs/spec-lab/cap


skills/spectral-library
JHU ÿ ÿ ÿ ÿÿ ASCII http://speclib.jpl.nasa.gov
JPL ÿ ÿ http://speclib.jpl.nasa.gov
PDS ÿ ÿ ASCII ÿ ÿ https://speclib. rsl.wustl.edu/search.aspx
ASU ÿ ÿ ASCII ÿ ÿ ASCII / https://speclib.asu.edu/
HDF
MASSA ÿ ÿÿ Imagem http://www.organchem.csdb.cn/scdb/
a
Outros materiais incluem solo, vegetais, neve, gelo, água, materiais artificiais.
b
VNIR (0,3–2,5 ÿm), MIR (3–25 ÿm), FIR (25–1000 ÿm).
Machine Translated by Google

GRANDES DADOS DA TERRA 193

biblioteca (Baldridge, Hook, Grove e Rivera, 2009). A biblioteca espectral de fundo de objetos terrestres
(Gospel) era a biblioteca espectral mais abrangente da China, abrangendo vários materiais (ou seja,
rocha/mineral, vegetal, água, gelo/neve e alvo artificial) e conjuntos de dados espectrais com
características de banda completa, multiescala , multiângulo e séries temporais (Su, Li, Wang, & Tang,
2003; Zhong & Xiao et al., 2020). Em contraste com a biblioteca espectral universal, as bibliotecas
especializadas concentram-se na validação do efeito de propriedades físicas, composições químicas e
parâmetros de medição no espectro da amostra. O JPL estabeleceu três bibliotecas espectrais na
refletância do objeto terrestre de acordo com três tamanhos de partícula (ou seja, 125–500 nm, 45–125
nm e menos de 45 nm) para refletir a influência do tamanho da partícula na refletância espectral
(Grove, Hook, & Paylor, 1992; Kahle & Goetz, 1981). Mineral Infrared Spectral Atlas (MISA) foi medido
e estabelecido pela Academia Chinesa de Ciências, contendo dados VIS/SWIR/MIR (0,3–5 ÿm) para
mineração profunda de informações infravermelhas (Peng & Liu, 1982), enquanto o Estado do Arizona
A biblioteca espectral infravermelha térmica da University (ASU) coletou a emissividade de materiais
terrestres na janela atmosférica de 8–14 ÿm para explorar a função da temperatura cinética e da
emissividade espectral (Christensen et al., 2000) . O Planetary Data System (PDS) foi uma compilação
de espectros de laboratório da Terra, da Lua e de alguns meteoritos nas faixas do visível, infravermelho
próximo e infravermelho médio, que foi submetido por vários provedores de dados (por exemplo,

RELAB, Janice Bishop, JMUSTARD, RVMORRIS e TLROUSH Spectral Library) por fornecer uma
plataforma de dados básicos para pesquisadores relacionados no campo geológico planetário (Pelkey,
Mustard, & Murchie et al., 2007) .
No entanto, os espectros de rochas/minerais armazenados em diferentes bibliotecas exibiram
estrutura de dados inconsistente e formato compartilhado. As bibliotecas espectrais acessíveis foram
organizadas em sistema de pastas (por exemplo, USGS, JPL) ou banco de dados relacional (por
exemplo, SPECCHIO), que fornecem dados espectrais e metadados associados em ASCII ou formato
de imagem, o que dificulta a comparação e análise dos dados pelos usuários, resultando em baixa
interoperabilidade de dados e utilização difícil (Xie, Zhou e Wu, 2020). É importante notar que as
bibliotecas espectrais estabelecidas por diversas organizações eram geralmente baseadas em
espectros locais, mas não em escala global. As assinaturas espectrais de minerais obtidas de
bibliotecas espectrais compartilhadas, como USGS, JPL e JHU, são amostradas na América,
negligenciando a aplicabilidade geral para pesquisas globais como geológicas (Shanshan, Kefa,
Nannan, & Wang, 2014; Stelle, Ariza- López , & Ureña-Cámara, 2018; Vignesh & Kiran, 2020). Além
disso, as respectivas bibliotecas espectrais mencionadas acima organizaram os dados de maneiras
diferentes, faltando um modelo comum de metadados, o que fez menos esforço na interoperabilidade
e interpretação dos dados auxiliares (Hueni, Nieke, Schopfer, Kneubühler, & Itten, 2009; Stelle et al .,
2018). Para melhorar os dados espectrais de minerais/rochas para serem FAIR (Encontráveis, Acessíveis, Interoperáve
(Rybkina et al., 2018), unificamos a estrutura de dados e fornecemos um quadro homogêneo de
metadados para produzir uma biblioteca espectral integrada de forma abrangente em escala global.

Geralmente, RockSL realizou globalmente a unificação semântica e estabeleceu o espaço de


metadados padronizados dos dados espectrais de rochas/minerais, que fornece o repositório de dados
para mapeamento geológico global ou regional e levantamento de campo e conjuntos de dados
característicos de parâmetros-chave (por exemplo, tamanho de partícula, comprimento de onda
alcance, etc.) para análise e comparação espectral. Esperamos que o RockSL como um espectro integrado
Machine Translated by Google

194 BS XIE ET AL.

A biblioteca pode fornecer um acesso de dados unificado para pesquisadores com melhor consistência de
dados para evitar medições redundantes desnecessárias ou trabalhos de consulta complicados e enriquece
o conteúdo dos produtos de serviços de recursos de informações geográficas globais.

2. Métodos
2.1. Fontes de dados

Os dados espectrais compartilhados adquiridos de bibliotecas universais e especializadas e os dados de


amostragem de campo foram integrados e realizados em sistemas de gerenciamento de banco de dados
relacional (ou seja, software SQL Server). A linguagem de consulta (SQL) permite manipular e consultar
os dados espectrais no RockSL. Os dados compartilhados foram baixados principalmente de USGS, JHU,
JPL, PDS, biblioteca espectral ASU e MISA, que existiam como ASCII, HDF ou arquivos de imagem (Tabela 1).
Os dados constituintes foram distribuídos e armazenados em chinês ou inglês, comportando-se em
diferentes formatos e parâmetros relacionados (Xie et al., 2020). Além disso, os dados de amostragem
medidos em laboratório também são a parte importante do RockSL, que consiste na assinatura espectral
e metadados relacionados (por exemplo, atributos físicos e químicos de amostras de rocha/mineral,
condições de medição, informações espaço/temporais do processo de amostragem).
Os espécimes, incluindo rochas magmáticas, metamórficas, sedimentares, minerais de ferro e carvão
foram coletados na região central e norte da China. O fluxo de trabalho de processamento de espectroscopia
de campo inclui análise de composição mineral, preparação de amostra, medição espectral e
armazenamento de dados. A composição mineral e o conteúdo dos espécimes foram analisados através
da identificação de lâminas delgadas por microscópio Axioskop40.
Após trituração e moagem, as amostras com diferentes tamanhos de partícula foram testadas pelo
espectrorradiômetro de campo SVC HR-1024i (0,35–2,5 ÿm) e espectrorradiômetro de infravermelho por
transformada de Fourier (FTIR) 102F (0,4–20 ÿm) (Song, Liu, Yu, Mao, & Wu, 2017; Wang, Liu, Mao,
Wang e Tian-Zi, 2018). Por meio da integração de dados, o RockSL fornece dados espectrais digitalizados
em um formato uniforme, bem como dados no formato original baixados de cada biblioteca espectral para
pesquisas e aplicações posteriores.

2.2. Esquema de colocação de dados

2.2.1. Metadados de coleções de espectros O


espectro de reflexão de rocha/mineral é afetado principalmente por sua composição química, pureza
mineral e estrutura cristalina. Além dos fatores intrínsecos, os dados espectrais são afetados por muitos
fatores de variação, como granularidade da amostra, rugosidade, método de observação e composições
da amostra, que foram expressos como metadados de dados espectrais. Os metadados, como um
componente central na qualidade e confiabilidade dos dados espectrais, contêm mais informações sobre o
ambiente de amostragem e as condições de medição, o que é importante para apoiar a explicação dos
dados científicos e garantir a usabilidade e troca de dados a longo prazo (Michener & Brunt, 2009 ;
Rasaiah, Malthus, Jones e Bellman, 2012). Verificou-se que houve menos esforço em fornecer um modelo
de metadados padrão para facilitar a interoperabilidade dos dados espectrais. A fim de melhorar a
universalidade e precisão dos metadados, nos referimos aos principais documentos da Organização
Internacional de Padronização (ISO) e da Estrutura de Garantia de Qualidade para Observação da Terra
(QA4EO).
O trabalho de alguns pares, incluindo a proposta geral endossada pelo Comitê de
Machine Translated by Google

GRANDES DADOS DA TERRA 195

Satélites de Observação da Terra (CEOS) e protocolos investigados para registrar metadados em


espectroscopia de campo foram identificados em um experimento internacional (Rasaiah, Jones, Bellman,
Malthus e Hueni, 2015; Stelle et al., 2018). Os metadados de um recurso espectral podem ser categorizados
em quatro tipos de variáveis: quantitativas (por exemplo, posição de amostragem, ângulo de medição,
tamanho de partícula), categóricas/qualitativas (por exemplo, espécie de espécime), sequência alfanumérica
(por exemplo, descrição do espécime) e tipos pictóricos (por exemplo, as imagens alvo) (Hueni et al.,
2009). Com base nas características dos dados compartilhados e dados amostrados, estabelecemos os
espaços de metadados personalizados do RockSL (Tabela 2), que ajudam os usuários a recuperar os
dados do alvo rapidamente e analisar as leis intrínsecas dos dados espectrais. Note-se que o registro de
dados foi classificado de acordo com a integridade dos metadados relacionados. Dados com maior integridade (ou seja, mai

Tabela 2. As variáveis de metadados do modelo de dados no RockSL.


Tipo de

Grupo Variável Explicação metadados

Informações Código do mineral/rocha Código do mineral/rocha com base no esquema de classificação Categórico
básicas comuns Código da amostra Código de cada espécime Nome Categórico
chinês Nome do espécime em chinês Nome em inglês Nome do Categórico
espécime em inglês Código do tipo Código do tipo de espécime Categórico
(por exemplo, haletos) Categórico
Localidade Posição de amostragem espacial (longitude/latitude/altitude) quantitativo
Química Composição química Química ideal Fórmula alfanumérico
química Tamanho da partícula Tamanho da alfanumérico
partícula da amostra medida Imagens Imagem representando a amostra/ quantitativo
ambiente de amostragem Coordenada espectral Dados espectrais Faixa de comprimento de Pictórico
Propriedades do sinal onda Faixa de comprimento de onda quantitativo
Intervalo de comprimento de onda Tipo de dados quantitativo
Detalhes de dados compartilhados Nome do banco quantitativo
de dados
Todas as Tipo de dados (refletância, radiância...) Categórico
informações URL Descrição Tempo de Nome do banco de dados Categórico
amostragem Tipo compartilhado Informações originais baixadas das bibliotecas alfanumérico
de Link de URL da biblioteca de alfanumérico
medição destino Informações descritivas da biblioteca de alfanumérico
Informações de Direcional - destino Data e hora da amostragem em UTC quantitativo
medição hemisférico, bidirecional, hemisférico Categórico
refletância direcional
Instrumento/ instrumento específico Categórico
espectrômetro
Temperatura de Temperatura do ar em graus quantitativo
medição
Medição Pressão do ar em hPa quantitativo
pressão
ambiente Campo ou laboratório Categórico
medido
Contribuinte Nome do colaborador alfanumérico
Distância medida Distância do sensor ao alvo quantitativo
Ângulo medido Ângulo zenital entre o sensor e a amostra quantitativo
referência branca Plano de referência branco usado Categórico
Número de Número de espectros calculados internamente pelo instrumento Espectros médios
quantitativos

Informações do arquivo Nome do arquivo Nome do arquivo do arquivo espectral alfanumérico


Formato de arquivo Formato de arquivo do arquivo espectral alfanumérico
ID da imagem Código da imagem da curva através da vetorização da extração da Categórico
coordenada digital
Avaliação de dados nível de dados Classificação da qualidade dos dados com base na integridade do Categórico
parâmetro (grau caracterizado)
Recurso de dados O tipo de dados espectrais com base em um classificador personalizado Quantitativo
Machine Translated by Google

196 BS XIE ET AL.

Pré-armazenamento de dados espectrais Dados espectrais de minerais/rochas

*Registro de dados
1 1
*Registro de dados
m m
Código de mineral/rocha Código de mineral/rocha
Informações básicas comuns Informações básicas comuns
m Informações comuns de Informações comuns de
Código de mineral/rocha
medição medição
Detalhes de dados compartilhados Detalhes de dados compartilhados
1 *Código de mineral/rocha
1
Detalhes dos dados medidos Detalhes dos dados medidos Nome do mineral/rocha em
Informações do arquivo Informações do arquivo chinês
Avaliação de dados Nome do mineral/rocha em
Informações do instrumento
Inglês
Atributo mineral/rocha
m
Código do tipo mineral/rocha
*Nome do espectrômetro
1 Faixa de comprimento de onda *Código de mineral/rocha
resolução de amostragem Características químicas
m Tipo de mineral/rocha
País de fabricação
Características ópticas
*Código do tipo de mineral/rocha
empresa de fabricação Características físicas
Nome do tipo de mineral/rocha 1
Descrição do instrumento Características do cristal

*Chave primária Chave estrangeira

Figura 1. Estrutura de dados do esquema de banco de dados projetado. A tabela relacional de código mineral/
rocha e tipo mineral/rocha registra as informações de classificação. A tabela de atributos minerais/rochosos
registra as propriedades físicas e químicas, enquanto as informações de dados espectrais registram dados
espectrais e metadados relacionados. A tabela de informações do instrumento registra as informações do
espectrômetro. Os números (ou seja, 1 em) representam o número de registros em cada tabela, indicando que
um registro na tabela (por exemplo, código do tipo de mineral/rocha) corresponde a vários registros em outra
tabela (por exemplo, código de mineral/rocha).

nível de dados) pode fornecer uma referência mais confiável para os usuários discriminarem com
precisão objetos desconhecidos e pode ser aplicado para uma análise mais profunda para explorar a
relação interna entre parâmetros e dados.

2.2.2. Estrutura de dados


O modelo de dados RockSL usado no núcleo e na base do sistema de banco de dados consiste em
estrutura de dados, manipulação de dados e restrição de integridade, que se refere às características
estáticas (por exemplo, tipo de dados, conteúdo e relacionamento), comportamento dinâmico (por
exemplo, recuperação de dados, modificação) e condições de restrição de tabelas de dados relacionais.
Consideramos o desempenho da estrutura de dados para reduzir a redundância de dados e projetamos
restrições apropriadas para garantir a consistência e correção do armazenamento de dados. O modelo
relacional é a estrutura de banco de dados dominante no momento, que foi aplicada ao RockSL. A
estrutura de dados do RockSL (mostrada na Figura 1) continha várias tabelas de dados relacionais
usadas principalmente para salvar dados espectrais de referência com parâmetros relacionados, dados
de atributos, código de classificação de rochas e minerais e informações específicas de espectrômetros.
A tabela relacional de código rocha/mineral como tabela relacional principal foi projetada para
armazenar conteúdos semáticos e de classificação para consolidação de dados de diversas regiões e
para facilitar a recuperação rápida. A estrutura do banco de dados do RockSL está na terceira forma
normal (3NF), que não contém redundâncias de dados (Mcfadden & Hoffer, 1988). Além disso, a
integridade referencial entre tabelas foi estabelecida pela chave primária e chave estrangeira, que
garantem a consistência dos dados das tabelas associadas. É importante observar que os dados
espectrais foram armazenados na tabela relacional de pré-armazenamento de dados antes da limpeza, transformação e
Machine Translated by Google

GRANDES DADOS DA TERRA 197

Figura 2. O fluxo de trabalho de processamento do RockSL. Os números de sequência à esquerda representam


a tabela de dados correspondente na biblioteca espectral, que foi operada nas etapas correspondentes.

2.3. Processamento de dados

O fluxo de trabalho de processamento do RockSL incluindo aquisição de dados, transformação, controle de


qualidade, armazenamento de dados é descrito na Figura 2. As bibliotecas compartilhadas distribuem dados
espectrais com formatos variados (por exemplo, ASCII, arquivo de imagem, etc.). Os dados espectrais e metadados
relacionados no formato ASCII podem ser extraídos e importados diretamente para o RockSL. No entanto, algumas
bibliotecas espectrais (por exemplo, MISA) armazenam dados espectrais na forma de imagens de curvas em vez
de fornecer curvas espectrais diretamente digitais. Os algoritmos de afinamento e não afinamento ilustrados em
nosso trabalho anterior (Xie et al., 2020) podem efetivamente realizar a extração de curvas digitais de arquivos de imagem (Figura 3).
Os métodos de aquisição de dados permitem estabelecer um conjunto de dados mais digital e consistente. Antes
de importar as curvas espectrais e seus parâmetros descritivos para o RockSL, as informações relevantes dos
dados do alvo nas tabelas relacionais (ou seja, código mineral/rocha, tipo mineral/rocha e informações do
instrumento) do RockSL devem ser preenchidas. Em seguida, a curva alvo de diferentes unidades de medição (por
exemplo, refletância, emissividade) e unidade de comprimento de onda (por exemplo, nanômetro, micrômetro e
número de onda) foi transformada em um formato unificado baseado na conversão da unidade de comprimento de
onda e na Lei de radiação térmica de Kirchhoff (Refletividade = 1 – Emissividade). A curva espectral de reflectância
com unidade nanométrica foi usada como formato padrão para o RockSL. Os dados espectrais armazenados na
tabela relacional de pré-armazenamento de dados foram rastreados por meio de diferentes métodos de verificação
de qualidade de dados e avaliados quanto à integridade dos metadados em comparação com o espaço de
metadados (Tabela 2). Após a limpeza e avaliação dos dados explicados na Seção 4, os dados do padrão foram
importados para a tabela final de dados espectrais da tabela de pré-armazenamento.

3. Registro e aplicação de dados


Todos os minerais são classificados e codificados com base em sua composição química e estrutura cristalina (ou
seja, princípio cristaloquímico), o que é lógico e amplamente aceito. De acordo com o princípio, os minerais/rochas
no RockSL são primeiro divididos em diversos nós pais de acordo com
Machine Translated by Google

198 BS XIE ET AL.

Figura 3. A imagem original da curva espectral (painel esquerdo) e sua correspondente curva digital
vetorizada (painel direito). As imagens originais de moscovita e quartzo como exemplos foram baixadas
das bibliotecas espectrais USGS e MISA, respectivamente (Kokaly et al., 2017; Peng & Liu, 1982).

ao seu ânion dominante ou grupo aniônico, que inclui elementos, sulfetos, óxidos e hidróxidos, haletos,
silicatos, outros sais minerais contendo oxigênio, minerais mistos (por exemplo, rochas ígneas,
sedimentares e metamórficas) e recursos energéticos (por exemplo, carvão). Os nós pais são
subdivididos em parte com base em suas composições, mas principalmente de acordo com a estrutura
intrínseca (por exemplo, os nós filhos de silicatos incluem estrutura, cadeia, anel, ilha e folha de
silicatos). O RockSL seguindo o princípio de classificação mencionado acima contém mais de 130
grupos de rochas/minerais, cerca de 200 tipos de amostras e 3000 registros de dados espectrais. Os
principais componentes do RockSL são silicato (mais de 1800 registros), outros sais oxigenados (cerca
de 400 registros), óxidos e hidróxidos (mais de 200 registros) e amostras de rochas (mais de 200
registros). Os dados espectrais maciços do RockSL cobrindo vários tipos e dados auxiliares completos
fornecem grande suporte para correspondência espectral e fácil comparação para discriminação de
rocha/mineral desconhecido. Mais tipos de dados espectrais serão coletados de outras fontes disponíveis
e medições laboratoriais posteriormente para melhorar a aplicabilidade na identificação mineral. O
conjunto de dados espectrais de características foi extraído do grande conjunto de dados com base na
seleção de metadados. Geralmente, o RockSL forneceu não apenas um grande conjunto de dados para
o serviço de correspondência de dados, mas também vários conjuntos de dados espectrais de características para desco

3.1. Serviço correspondente

Correspondência espectral significa comparar o espectro de amostras desconhecidas com espectros de


referência para identificar a categoria da amostra, que enfatiza algoritmos matemáticos e biblioteca
espectral de referência. Os algoritmos são projetados para reduzir o ruído de dados e melhorar
Machine Translated by Google

GRANDES DADOS DA TERRA 199

eficiência de correspondência, que consiste em algoritmos de pré-processamento e métodos de


correspondência espectral. Alguns pesquisadores estudaram vários métodos de pré-processamento
espectral (por exemplo, diferenciação espectral, remoção contínua, etc.) para melhorar efetivamente
as características do vale de absorção e melhorar a precisão da previsão do modelo de correspondência
espectral (van der Meer, 2004; Whitaker & Pigford, 1960 ) . Como o RockSL contém espectros com
diferentes informações de medição (ou seja, faixa espectral e resolução espectral), é necessário
reamostrar automaticamente o espectro de referência de acordo com as informações espectrais do
alvo no processo de correspondência. Os algoritmos de correspondência são executados calculando a
semelhança entre o espectro desconhecido e o espectro de referência com base em formas de onda
completas ou algumas características espectrais, que incluem Codificação Binária (BE), Correspondência
de Ângulo Espectral (SAM), Ajuste de Correlação Espectral (SCF), Divergência de Informação Espectral
(SID), e assim por diante (Goetz, Vane, Solomon, & Rock, 1985; Kruse et al., 1993; Mcglone & Shufelt,
1994; Noronha & Nevatia, 2001). Note-se que consideramos também a proporção da faixa de
correspondência para a faixa espectral alvo como um ponto chave para avaliar a confiabilidade de
correspondência.
O serviço de correspondência espectral foi incorporado ao sistema operacional do RockSL, que
continha métodos de pré-processamento (ou seja, diferenciação de primeira e segunda ordem e
remoção contínua) e algoritmos de correspondência (ou seja, BE, SAM, SCF, SID e SID_SA). O
espécime de quartzo foi observado por espectrorradiômetro portátil FTIR variando de 0,2 a 20 µm em
laboratório. Os dados de amostragem na faixa de infravermelho termal (8–14 ÿm) de melhor qualidade
foram selecionados para comparação com os espectros de referência no RockSL. Aplicamos vários
algoritmos de pré-processamento e correspondência para realizar o serviço de correspondência e
listamos três espectros de referência com alta similaridade de correspondência (Tabela 3). O algoritmo
personalizado (BC_SA_SID_SCF) calculando a pontuação total (por exemplo, soma dos coeficientes
de similaridade) por meio de quatro métodos de correspondência (BE, SAM, SID e SCF) foi aplicado
no módulo operacional para obter a discriminação de objetos desconhecidos (Figura 4 ) . Os resultados
correspondentes demonstram que o RockSL pode ser usado para identificar minerais desconhecidos
com precisão e eficácia. O espectro alvo tem alta similaridade de correspondência com os espectros
de referência (quartzo) de diferentes bibliotecas (ou seja, biblioteca espectral ASU e PDS) com
diferentes parâmetros de medição, o que sem dúvida melhora a confiabilidade do resultado do reconhecimento.

3.2. Conjuntos de dados espectrais

Os espectros de minerais e rochas são afetados pela composição química, geometria de observação
(por exemplo, ângulo observado, distância, etc.) e morfologia da superfície (por exemplo, tamanho de
partícula, rugosidade, etc.). A composição química das amostras não só causa a mudança da
intensidade de reflexão espectral, posição da banda e profundidade de absorção, mas também causa
o surgimento de novas bandas características devido à geração de novos íons em rochas e minerais.
Além disso, o espectro de reflexão também é alterado com o ambiente externo e as características da
superfície, que se manifestam como a alteração do valor de refletância, largura de absorção,
profundidade de absorção e a forma da curva espectral.
Os fatores afetados mencionados acima foram registrados no espaço de metadados (Tabela 2), que
suportam a recuperação dos dados do alvo e a análise espectral das características. O RockSL de
dados compartilhados e dados de amostragem foi refinado para obter coleções de dados de
características projetando o espaço de metadados para um subespaço (Figura 5). Esses conjuntos de
dados característicos de minerais e metadados relacionados podem ser estabelecidos usando a consulta de estrutura
Notas:
Padrão
(sem
pré-
processamento),
FD
(diferenciação
de
primeira
ordem),
CR
(remoção
contínua). Tabela
3.
Resultados
correspondentes
de
dados
espectrais
de
espécimes
quartzo
e
espectros
de
referência
no
RockSL.
#4440
#3290
#3289 espectro
de
referência
Quartzo
(PDS) Quartzo
(PDS) Quartzo
(ASU) categoria
de
amostra
Pontuação
total
7.951
7.379
8.015
Padrão
0,891
0,982
0,807
BC
FD
111
0,925
0,919
0,839
CR
Padrão
0,987
0,98
0,961
ELE
MESMO
0,354
0,431
0,334
FD
0,044
0,043
0,035
CR
Padrão
0,976
0,963
0,913
0,988
0,728
0,798 SID
FD
0,473
0,465
0,381
CR
Padrão
0,987
0,975
0,957
0,354
0,431
0,334 SCF
FD
0,036
0,034
0,02
CR
BS XIE ET AL. 200
Machine Translated by Google
Machine Translated by Google

GRANDES DADOS DA TERRA 201

Figura 4. O resultado correspondente da amostra de quartzo. (a) O módulo correspondente com três espectros de referência
(no. 3289, no. 3290 e no. 4440) de amostra de quartzo da biblioteca espectral PDS Geoscience e da biblioteca espectral ASU.
(b) Comparação da curva espectral desconhecida e curvas espectrais de referência do quartzo.

Language (SQL), que são ilustrados na Tabela 4. Três conjuntos de dados refinados foram selecionados como
exemplos com base nos principais parâmetros (ou seja, tamanho da partícula, faixa de comprimento de onda,
composição química), que são elaborados em detalhes abaixo.

3.2.1. Tamanho da
partícula O tamanho da partícula é uma variável importante da morfologia da superfície que afeta as
características de reflexão espectral de rochas e minerais, e a influência do tamanho da partícula nas
características espectrais depende do tipo de amostra. Yang (1987) descobriu que o reflexo

Tamanho
partícula
da

mineral
mistura

grosso
médio
fino
me

comprimento
Faixa
onda
de

PARA
VNIR
ME

dolomita
clorita
ta
lc

bibliotecas espectrais bibliotecas espectrais bibliotecas espectrais

Figura 5. Exemplos de visualização de uma projeção de subespaço em um cubo de metadados 3D: modelo abstrato de
estabelecimento de conjunto de dados característicos do RockSL. O artigo elaborou vários conjuntos de dados de tamanho de
partícula, faixa de comprimento de onda e componente mineral.

Tabela 4. A seleção de metadados para estabelecer o conjunto de dados característicos.

Tipo de fator Variável Explicação do conjunto de dados

Composição química Mistura Mesmo mineral misturado com materiais diferentes

Tipo de mineral Diferentes amostras do mesmo tipo de mineral


Contente Amostras com conteúdo mineral diferente
condição de observação Faixa de comprimento de onda Dados espectrais de diferentes faixas de comprimento de onda
Observe o ângulo Dados espectrais observados de diferentes ângulos
Observar distância Dados espectrais medidos por diferentes distâncias
Temperatura de medição Dados espectrais medidos em diferentes condições ambientais
Morfologia da superfície Tamanho da partícula Mesma amostra com tamanho de partícula diferente
Machine Translated by Google

202 BS XIE ET AL.

as características do espectro da rocha/mineral estão relacionadas aos estados da superfície e algumas


bandas são mais sensíveis à influência de diferentes tamanhos de partícula. Okin e Painter (2004)
estudaram a relação entre os espectros de refletância e tamanho de partícula de montmorilonita e
quartzo, e descobriram que a refletância aumentou gradualmente com a diminuição do tamanho de
partícula na faixa de tamanho de partícula (50-750 ÿm). Ma e Sheng et al. (2015) propuseram que o
espectro da amostra é menos afetado pelo tamanho da partícula quando o tamanho da partícula é maior
que 1 mm (valor limite). Na região VNIR-SWIR, a refletividade da maioria das rochas aumenta com a
diminuição do tamanho das partículas, enquanto a refletividade das rochas pretas (escuras) diminui
com o tamanho das partículas mais finas. Na região térmica, a reflectância diminui com a diminuição do
tamanho da partícula, de acordo com o fato de que o contraste espectral das bandas de vibração
molecular fundamental parece diminuir com a diminuição do tamanho da partícula (Salisbury & Eastes,
1985) . O tamanho de partícula menor da amostra reduz a porosidade e aumenta o número de partículas
no campo de visão, o que leva à alteração do valor de reflexão ou valor de absorção. Uma vez que a
relação entre o tamanho da partícula e a assinatura espectral é altamente dependente da composição
mineral da rocha e da região espectral, é necessário que os pesquisadores usem conjuntos de dados
abrangentes para explorar suas leis universais.
Neste artigo, escolhemos os dados espectrais de amostras minerais de ferro com diferentes
tamanhos de partícula no RockSL como exemplo de demonstração, que foi atribuído pela equipe
colaborativa da Northeastern University (Wang et al., 2018 ). O resultado da comparação mostra que o
efeito do tamanho da partícula no espectro de reflexão da hematita se comporta significativamente
diferente (Figura 6). A refletância espectral diminui com o aumento do tamanho da partícula (varia de
0,03 mm a 1 mm), o que mostra uma correlação negativa significativa entre o valor da refletância e o
tamanho da partícula (Wang et al., 2018) . Quando o tamanho de partícula da amostra é maior que 1
mm, a influência do tamanho de partícula no espectro de reflexão é muito fraca. Além disso, o efeito do
tamanho da partícula em diferentes bandas de onda pode ser dividido em banda estável (ou seja, 350–
950 nm) e banda sensível (ou seja, 950–1250 nm). Os espectros de reflexão da hematita se sobrepõem
quando o tamanho da partícula da amostra de hematita é maior que 1 mm, o que indica que o efeito do
tamanho da partícula é significativamente enfraquecido.

3.2.2. Bandas
completas Diferentes bandas têm diferentes mecanismos de resposta aos grupos e íons de minerais.
A banda do visível e do infravermelho próximo (0,3–1,1 ÿm) é usada principalmente para detectar os
processos eletrônicos de alguns íons metálicos, enquanto a banda do infravermelho de ondas curtas
(0,3–1,1 ÿm) e o infravermelho médio (2,5–14 ÿm) A região é usada principalmente para detectar a
vibração molecular de minerais hidroxila contendo água e minerais livres de hidroxila (por exemplo,
carbonatos, silicatos), respectivamente (van der Meer et al., 2012) .
Tanto as bibliotecas espectrais universais quanto as bibliotecas espectrais especializadas focaram
na informação espectral de bandas diferentes e mediram os espectros de amostra com diferentes
resoluções espectrais. Os dados espectrais baixados da biblioteca espectral do USGS foram medidos
por diferentes instrumentos, que são fornecidos em quatro bandas de 0,2–3,0 ÿm, 1,5–6,0 ÿm, 5–25 ÿm
e 25–200 ÿm, respectivamente. Os dados armazenados na biblioteca espectral JPL variam de 0,4 a 2,5
ÿm com resolução espectral de 1 nm (0,4–0,8 ÿm) e 4 nm (0,8–2,5 ÿm). Os dados espectrais
armazenados na biblioteca espectral da John Hopkins University (JHU) consistiam em espectros de
rochas registrados de 2,08 a 25 ÿm e espectros de minerais registrados de 0,4 a 14 ÿm. PDS Spectral
Library é uma contribuição multifonte de várias bibliotecas espectrais (por exemplo, CRISM, Janice
Bishop, JMUSTARD, RVMORRIS e
Machine Translated by Google

GRANDES DADOS DA TERRA 203

0,6

<0,03 mm

0,03-0,05 mm

0,5 0,05-0,07 mm

0,07-0,11 mm

0,11-0,15 mm

0,15-0,23 mm
0,4
0,23-0,3 mm

0,3-0,6 mm

0,6-1 mm
Refletância
0,3
1-2 mm

2-3 mm

3-4 mm
0,2

0,1

0
0 0,5 1,0 1,5 2.0 2.5
Comprimento de onda/ÿm

Figura 6. Espectros de refletância da hematita com diferentes tamanhos de partícula. Dados espectrais de
NEU medidos em laboratório (Wang et al., 2018).

TLROUSH Spectral Library), em que os dados espectrais variam de 0,3 a 26 ÿm. A biblioteca
espectral de infravermelho termal da Arizona State University (ASU) adquiriu a emissividade
de materiais terrestres na janela atmosférica de 8–14 ÿm. O MISA contendo 583 imagens de
espectros minerais varia de 0,25 a 5,0 ÿm. Os dados medidos por espectrorradiômetro FTIR
em laboratório variam de 0,4 a 20 ÿm com resolução espectral de 6 cmÿ1 (número de onda).
Os dados compartilhados e os dados medidos podem ser integrados para projetar
aproximadamente um conjunto de dados de banda completa para explorar a combinação
completa de recursos de rochas e espectros minerais. Os espectros de calcita extraídos do
conjunto de dados de banda completa são mostrados na Figura 7. A calcita como minerais de
carbonato com a composição química (CaCO3) tem características de absorção diagnóstica
das regiões VNIR, MIR e FIR por causa das bandas combinacionais e harmônicas de vibrações da ligação C–
2
composição CO 3 (Gupta, 2003; Hunt & Salisbury, 1971). O espectro da calcita indica
a presença de características proeminentes de absorção espectral nas faixas de comprimento
de onda de 2,50–2,55 µm (4000–3922 cmÿ1) e 2,30–2,35 µm (4348–4255 cmÿ1) no VNIR
(Clark et al., 1990; Gaffey, 1986), em torno de 13,70–14,04 µm (730–712 cm–1) e 11,19–11,40
µm (894–877 cm–1) no MIR (Lane & Christensen, 1997), e duas fortes absorções separadas
em torno de 110 cmÿ1 e 228 cmÿ1 no FIR (Farmer, 1974; Legodi, Waal, & Potgieter, 2001).

3.2.3. Composição mineral


A composição do material é um fator intrínseco que afeta o espectro da rocha. O espectro
mineral depende de três características básicas da composição mineral, incluindo os
elementos da composição química, a geometria espacial ou estrutura dos átomos e a força
das forças interatômicas. Diferentes conteúdos minerais e assembléias minerais indicam
Machine Translated by Google

204 BS XIE ET AL.

Figura 7. Os dados espectrais de banda completa do mineral calcita de diversas bibliotecas (ou seja, USGS,
PDS, JHU, ASU e MISA). A curva (varia de 1,6–200 µm/6250-50 cmÿ1) do USGS é exibida no eixo horizontal do
número de onda para destacar as características das bandas do infravermelho distante, enquanto outras curvas
são exibidas no eixo horizontal do comprimento de onda.

um conjunto único de características espectrais. O estabelecimento de um conjunto de dados


espectrais sobre composição e conteúdo mineral pode ser usado para explorar e verificar a relação
entre refletividade, intensidade de banda característica e materiais minerais.
Para reconhecer o impacto do conteúdo mineral e composição química, o espécime de calcita
misturado com caulinita, montmorilonita e dolomita é selecionado, por exemplo, a partir do conjunto
de dados característicos da composição mineral (Figura 8). O gráfico mostra que a composição
mineral tem uma influência significativa no segmento do espectro característico espectral, que se
reflete no pico de absorção proeminente em torno de 1,4 µm devido à vibração de grupos OH- em
minerais de silicato (ou seja, caulinita, montmor ilonita) em relação à dolomita (CaMg(CO3)2) (Hunt
& Salisbury, 1970). A curva de espectro de calcita-montmorilonita tem uma banda de absorção
profunda e larga em torno de 1,9 µm por causa da água interlamelar, comparando as curvas de
espectro de calcita caulinita e calcita-montmorilonita. Além disso, a amostra de calcita-caulinita
com maior teor de calcita tem características de absorção mais amplas e profundas em 2,34 e 2,5
µm.

4. Validação técnica

O processo de controle de qualidade foi projetado para avaliar os dados espectrais em duas
dimensões: integridade e validade dos dados. A integridade dos dados requer a integridade dos
metadados e a validade dos dados mede a justificabilidade da assinatura espectral. Os métodos de
controle de qualidade foram projetados para curvas espectrais simples e múltiplas, o que foi
brevemente ilustrado em trabalho anterior (Xie et al., 2020). Os dados com má qualidade foram
eliminados antecipadamente e os dados qualificados foram importados para o RockSL após a
verificação dos dados.
Machine Translated by Google

GRANDES DADOS DA TERRA 205

TEA BECK Beckman

Calcita (0,80)
1.4 1.9 2.34 + Caolinita (0,20)
2.5

1.4 1.9 2.34


Calcita (0,70)
+ Caolinita (0,30)

Calcita (0,80)
+ Montmorilonita (0,20)

Calcita (0,50)
+ Dolomita (0,50)

0,35 0,85 1.35 1,85 2,35 2,5 0,2 0,7 1.2 1.7 2.2 2.7 3.0

Comprimento de onda/ÿm

Figura 8. Os espectros do mineral de calcita com diferentes minerais de mistura medidos por dispositivos
espectrais analíticos (ASD) e instrumento de Beckman (baixado da biblioteca USGS Spectral). Os espectros são
compensados para maior clareza.

Para avaliar a integridade dos dados e melhorar a reutilização dos dados, cada registro no RockSL é
classificado de acordo com o modelo de metadados (Tabela 2). Registros sem parâmetros básicos
comuns foram classificados como médios, e registros sem parâmetros básicos comuns e informações de
medição foram classificados como baixos.
Do ponto de vista da validade dos dados, o fluxo de trabalho de validação semiautomática foi
projetado para avaliar a qualidade dos dados. Os limiares de refletância ou emissividade (ou seja, 0 e
1,0) e o algoritmo boxplot foram aplicados para detectar outliers de uma única curva espectral
automaticamente. A confiabilidade e disponibilidade dos dados serão bastante reduzidas quando o
número de outliers ultrapassar uma certa proporção, que pode ser avaliada através do algoritmo boxplot.
O algoritmo boxplot pode exibir a distribuição de uma série de pontos e encontrar os outliers de erro
usando estatísticas (por exemplo, mediana e quartil). A fórmula do algoritmo boxplot é a seguinte:

IQR ¼ jQ3 Q2j (1)

Emax ¼ Q3 þ 1:5 ÿ IQR (2)

Emin ¼ Q2 1:5 ÿ IQR (3)

onde Q2= o valor no percentil 25 e Q3= o valor no


percentil 75.
Por exemplo, o conjunto de dados espectrais de hematita baixado da biblioteca espectral RVMORRIS
(Lane, Morris, Mertzman e Christensen, 2002) foi testado com base no algoritmo boxplot para mostrar a
distribuição das curvas espectrais (Figura 9). Os dados espectrais não qualificados foram considerados
indisponíveis quando a proporção de pontos anormais excedeu o limite (definido como 0,4). No entanto,
devido ao valor dos dados publicados, o valor anormal
Machine Translated by Google

206 BS XIE ET AL.

Figura 9. O resultado da verificação de dados de amostras de hematita com base no algoritmo boxplot.

os dados foram avaliados novamente por observação visual para evitar seleção incorreta de dados. O fluxo
de trabalho de validação semiautomática pode garantir a qualidade do conjunto de dados integrado até certo
ponto.
Para garantir a estabilidade e a precisão dos dados de amostragem espectral, o espécime-alvo é medido
repetidamente pelo mesmo espectrômetro. As curvas com anomalias óbvias em vários grupos de dados
semelhantes podem ser identificadas com precisão pela observação manual, que é demorada. Os
indicadores importantes (Xie et al., 2020) foram projetados para avaliar automaticamente a qualidade dos
dados de múltiplas curvas espectrais semelhantes observadas em nosso laboratório, incluindo (1) a precisão
da conformidade interna indicando o desvio entre o espectro alvo e o espectro médio e (2 ) o deslocamento
da posição do pico de absorção principal. Os dados de amostragem espectral fornecidos pela NEU foram
aplicados com sucesso ao monitoramento da área da mina e extração de carvão (Mao et al., 2014). A
fórmula de conformidade interna é mostrada como

ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff

m
P j¼1ð Pni¼1 ÿ2 ijÞ
ÿ¼ÿ (4)
s mÿn

ÿij ¼ Fij Fiði ¼ 1; 2; . . . ; mÞ n; d ¼ 1; 2; . ;. . (5)

PMj¼1
ser ¼ (6)
m Fij ;ði ¼ 1; 2; . . . ; nÞ

ondeFij= a refletividade observada no ponto correspondente; m= número de


observações repetidas; e n= número de pontos da curva
envolvidos no cálculo.
Múltiplos espectros semelhantes (ou seja, os espectros de amostra de monzonita medidos por 102F
FTIR) e um espectro de ruído foram testados para a precisão da conformidade interna (Figura 10).
Machine Translated by Google

GRANDES DADOS DA TERRA 207

Figura 10. O resultado da verificação de dados de múltiplas curvas de amostra de monzonita com base na conformidade interna.

5. Notas de uso
Como afirmado anteriormente, dados compartilhados com diversos formatos (ou seja, ASCII e arquivos de
imagem) de várias bibliotecas espectrais representativas (ou seja, USGS, JHU, JPL, ASU, PDS e MISA) e
espectros de amostragem de rocha/mineral foram verificados e colocados para construir um abrangente biblioteca
espectral com formato mais digital e melhor consistente. Os dados espectrais foram armazenados em uma tabela
relacional correspondente na forma de registro de linha. Uma biblioteca espectral de rocha integrada (RockSL)
contém não apenas o grande conjunto de dados espectrais para acesso unificado, recuperação rápida e serviço
de correspondência, mas também o conjunto de dados de características dos principais parâmetros/metadados
(por exemplo, tamanho de partícula, composição mineral e banda completa, etc.) para mineração de dados e
descoberta de conhecimento.
Foi desenvolvido um sistema de software operacional do RockSL capaz de gerenciar dados, recuperar
informações e aplicar ao usuário, que poderia ser utilizado para a importação de conjuntos de dados de código
aberto com metadados relacionados, a vetorização de imagens de curvas espectrais, a consulta de dados de
atributos e dados espectrais, a análise quantitativa de dados espectrais e a correspondência de minerais
desconhecidos e espectros de rocha (Figura 4). Os dados espectrais no RockSL serão publicados como um
arquivo de banco de dados (.db), que inclui várias tabelas de dados relacionais de dados espectrais de rochas/
minerais e dados auxiliares relacionados. O arquivo de banco de dados pode ser gerenciado e operado por meio
do SQL, que ajuda os usuários a obter dados de destino rapidamente e estabelecer um conjunto de dados
completo de acordo com suas próprias necessidades. Os usuários também podem desenvolver software de
análise e gerenciamento de dados relevantes por conta própria, com base no arquivo de banco de dados
compartilhado. O produto da biblioteca integrada (RockSL), juntamente com o software operacional, foi lançado
e é compartilhado no GitHub (https://github.com/CSU-PCP-XBS/spectral-dataset-RockSL). GitHub é
Machine Translated by Google

208 BS XIE ET AL.

uma plataforma de hospedagem para projetos de software de código aberto e proprietário, que auxiliam os
servidores no compartilhamento de dados e códigos. A publicação do RockSL no GitHub facilitará a liberação e
compartilhamento de dados para as comunidades, o que permite aos usuários acompanhar a atualização de
dados e feedback sobre problemas com serviços de dados. Esperamos que mais pesquisadores possam se
juntar a nós e contribuir com dados personalizados para o RockSL para melhorar a disponibilidade e o valor
prático dos dados para as comunidades globais.

declaração de divulgação

Nenhum potencial conflito de interesse foi relatado pelo(s) autor(es).

Financiamento

Este trabalho foi apoiado conjuntamente pelo Programa-Chave da Fundação Nacional de Ciências da Natureza da China
[41930108], Centro de Ciências Básicas da Fundação Nacional de Ciências Naturais da China [72088101], o programa
líder em inovação da Central South University sob Grant 506030101 e o Talents programa de coleta da província de
Hunan China sob Grant Governo Popular da província de Hunan Governo Popular da província de Hunan 2018RS3013.

Notas sobre contribuidores

Busheng Xie é Ph.D. aluno da Escola de Geociências e Infofísica da Central South University.
Ele obteve seu diploma de bacharel em Engenharia Geomática pela Central South University na
China. Sua pesquisa atual se concentra na organização de dados, análise e visualização de
sensoriamento remoto hiperespectral e geociência.

Shengyu Zhou recebeu um diploma de MS da Central South University em 2021. Seus


interesses de pesquisa incluem análise de banco de dados espectrais na área de mineração.

Lixin Wu é bacharel em pesquisa de mineração pela Universidade de Mineração e Tecnologia


da China, Xuzhou, China em 1988 e mestre e doutor em geomática pela Universidade de
Mineração e Tecnologia da China (Pequim), Pequim, China em 1991 e 1997, respectivamente.
Ele está trabalhando com a Central South University, Changsha, China, como um dos principais
professores de Geomática na Escola de Geociências e Infofísica. Dr. Wu é atualmente um
acadêmico da Academia Eurasiana Internacional de Ciências (IEAS). Ele foi co-presidente de
aplicativos do usuário no Comitê de Sensoriamento Remoto, IEEE Geoscience e Remote
Sensing Society. Atualmente é membro do Global Risk
Machine Translated by Google

GRANDES DADOS DA TERRA 209

Assessment Framework (GRAF) Expert Group das Nações Unidas, membro do Infrastructure
Implementation Board do Group on Earth Observation (GEO), presidente do WG III-8 da
International Society for Photogrametry and Remote Sensing (ISPRS), membro da o
Comitê Nacional da China da Sociedade Internacional para a Terra Digital (ISDE), o vice-
presidente do Comitê de Observação Espacial da Sociedade de Sismologia da China e o
editor-chefe do Journal of Geography and Geo-Information Science (chinês).

Wenfei Mao é bacharel e mestre pela Jilin University, Changchun, China, em 2011 e
2015, respectivamente, e Ph.D. graduou-se em engenharia de minas digitais pela
Northeastern University, Shenyang, China, em 2020. Atualmente, ele trabalha como pós-
doutor na Central South University, Changsha, China. Seus interesses de pesquisa
incluem sensoriamento remoto de geohazards e mecânica de rochas de sensoriamento
remoto (RSRM).

Wei Wang nasceu em 1989 em Hunan, China. Atualmente é professor associado na


Escola de Geociências e Infofísica da Central South University. Ele recebeu seu Ph.D. em
Fotogrametria e Sensoriamento Remoto pela Universidade de Wuhan em 2017. Seus
interesses de pesquisa incluem sensoriamento remoto óptico e a laser, sensoriamento
remoto do ambiente atmosférico, processamento e aplicação de nuvens de pontos.

Declaração de disponibilidade de dados

A biblioteca espectral integrada (RockSL) descrita neste artigo está disponível abertamente no GitHub em https://github.com/CSU-
PCP-XBS/spectral-dataset-RockSL.

Referências

Baldridge, AM, Hook, SJ, Grove, CI e Rivera, G. (2009). A biblioteca espectral ASTER versão 2.0.
Sensoriamento remoto do ambiente, 113(4), 711–715.
Christensen, PR, Bandfield, JL, Hamilton, VE, Howard, DA, Lane, MD, Piatek, JL e Stefanov, WL ( 2000). Uma
biblioteca espectral de emissão térmica de minerais formadores de rochas. Jornal de pesquisa geofísica, 105
(E4), 9735–9739.
Clark, RN, King, TVV, Klejwa, M., Swayze, GA e Vergo, N. (1990). Espectroscopia de reflectância de alta resolução
espectral de minerais. Jornal de Pesquisa Geofísica, 95 (B8), 12653–12680.
Clark, RN, Swayze, GA, Gallagher, AJ, King, TV e Calvin, WM (1993). A biblioteca espectral digital de pesquisa
geológica dos EUA: versão 1 (0,2 a 3,0 ÿm). Relatório de arquivo aberto.
Clark, RN, Swayze, GA, Wise, RA, Live, KE, Hoefen, TM, Kokaly, RF e Sutley, SJ ( 2007). Biblioteca espectral
digital USGS splib06a: US Geological Survey Data Series, 231.
Farmer, V. (1974). Monografia 4 da sociedade mineralógica: Os espectros infravermelhos de minerais (pp. 427).
Londres: Mineralogical Society.
Gaffey, SJ (1986). Refletância espectral de minerais de carbonato no infravermelho visível e próximo (0,35–2,55
mícrons): Calcita, aragonita e dolomita. Mineralogista Americano, 71, 151–162.
Goetz, AF, Vane, G., Solomon, JE, & Rock, BN (1985). Espectrometria de imagem para controle remoto de terra
de detecção. Ciência, 228(4704), 1147–1153.
Grove, CI, Hook, SJ, & Paylor, ED, II. (1992). Compilação de espectros de refletância de laboratório de 160
minerais, 0,4 a 2,5 micrômetros. Pasadena, CA: Laboratório de Propulsão a Jato, NASA.
Machine Translated by Google

210 BS XIE ET AL.

Gupta, RP (2003). Geologia de sensoriamento remoto (2ª ed., pp. 655). Springer: Berlim, Alemanha.
Hueni, A., Nieke, J., Schopfer, J., Kneubühler, M., & Itten, KI (2009). O banco de dados espectral specchio para melhor usabilidade
a longo prazo e compartilhamento de dados. Computers & Geosciences, 35(3), 557–565.
Hunt, GR, & Salisbury, JW (1970). Espectros visíveis e infravermelhos de minerais e rochas: I silicato
minerais. Geologia Moderna, 1, 283-300.
Hunt, GR, & Salisbury, JW (1971). Espectros no visível e no infravermelho próximo de minerais e rochas: II.
Carbonatos. Geologia Moderna, 2, 23–30.
Kahle, AB, & Goetz, AFH (1981). Uma base de dados de espectros de campos geológicos. Anais do 15º Simpósio Internacional de
Sensoriamento Remoto do Meio Ambiente. Ann Arbor, Michigan, EUA
Kokaly, RF, Clark, RN, Swayze, GA, Livo, KE, Hoefen, TM, Pearson, NC, . . . . . . . . . Klein, AJ (2017).
Biblioteca espectral do USGS versão 7: série de dados de pesquisa geológica dos EUA 1035. 61p, março de 2020. https://
pubs.usgs.gov/ds/1035/ds1035.pdf
Kruse, FA, Lefkoff, AB, Boardman, JW, Heidebrecht, KB, Shapiro, AT, Barloon, PJ, & Goetz, AFH ( 1993). O sistema de
processamento de imagem espectral (SIPS) - visualização interativa e análise de dados de espectrômetro de imagem.
Sensoriamento Remoto do Ambiente, 44(2–3), 145–163.
Kruse, FA (1994). Análise de dados de espectrômetro de imagem - um tutorial. Anais do Simpósio Internacional de Res. de
Detecção Espectral, 1, 44–50.
Lane, MD, & Christensen, PR (1997). Espectroscopia de emissão infravermelha térmica de anidro
carbonatos. Jornal de Pesquisa Geofísica: Planetas, 102 (E11), 25581–25592.
Lane, MD, Morris, RV, Mertzman, SA e Christensen, PR (2002). Evidência de grãos de hematita platy em Sinus Meridiani, Marte.
Journal of Geophysical Research: Planets, 107(E12), 5126.
Legodi, MA, Wall, DD, & Potgieter, JH (2001). Determinação Quantitativa de CaCO3 em Cimento
Misturas por FT-IR. Espectroscopia Aplicada, 55(3), 361–365.
Ma, C., Sheng, GR, Wang, ZJ e Wang, Z. (2015). Análise de características espectrais para diferentes granulometrias de solos.
Jornal Chinês de Ciência do Solo, 02, 292–298.
Mao, YC, Ma, BD, Liu, SJ, Wu, LX, Zhang, XX, & Yu, ML (2014). Estudo e validação de um modelo de sensoriamento remoto para
extração de carvão baseado em características do espectro de refletância. Jornal Canadense de Sensoriamento Remoto:
Journal Canadien, 40(5), 327–335.
Mcfadden, FR, & Hoffer, JA (1988). Gerenciamento de banco de dados (2 ed.). Califórnia, EUA: The Benjamin/
Cumming's Publishing Company.
McGlone, JC, & Shufelt, JA (1994). Geometria projetiva e de espaço de objetos para construção monocular
Extração. Pensilvânia, EUA: Carnegie Mellon University.
Meerdink, SK, Hook, SJ, Roberts, DA e Abbott, EA (2019). A biblioteca espectral ECOSTRESS versão 1.0. Sensoriamento Remoto
do Ambiente, 230(111196), 1–8.
Michener, WK, & Brunt, JW (2009). Dados ecológicos: design, gestão e processamento (pp.
92–116). Oxford, Reino Unido: Wiley-Blackwell Science.
Noronha, S., & Nevatia, R. (2001). Detecção e modelação de edifícios a partir de múltiplas imagens aéreas.
IEEE Transactions on Pattern Analysis and Machine Intelligence, 23(5), 501–518.
Okin, GS, & Painter, TH (2004). Efeito do tamanho do grão na refletância espectral detectada remotamente de superfícies arenosas
do deserto. Sensoriamento remoto do ambiente, 89(3), 272–280.
Pelkey, SM, Mustard, JF, Murchie, S., Clancy, RT, Wolff, M., Smith, M., & Gondet, B. ( 2007). Produtos de resumo multiespectral
CRISM: Parametrização da diversidade mineral em Marte a partir da refletância.
Jornal de planetas de pesquisa geofísica, 112 (E8), 171–178.
Peng, W. & Liu, G. (1982). In Zhou, M. S (Eds.). Espectros infravermelhos de minerais (pp. 68–490). Pequim:
Imprensa Científica.

Rasaiah, BA, Jones, SD, Bellman, C., Malthus, TJ e Hueni, A. (2015). Avaliação da espectroscopia de campo
qualidade de metadados. Sensoriamento Remoto, 7(4), 4499–4526.
Rasaiah, B., Malthus, T., Jones, SD e Bellman, C. (2012). Protocolos de metadados críticos em campanhas de campo
hiperespectrais para a construção de conjuntos de dados hiperespectrais robustos. Em Anais do XXII Congresso ISPRS (Vol.
26). Melbourne, Austrália.
Rybkina, A., Hodson, S., Gvishiani, A., Kabat, P., Krasnoperov, R., Samokhina, O., & Firsova, E. (2018) .
CODATA e os desafios globais na ciência baseada em dados. Jornal Russo de Ciências da Terra, 18(4), ES4002.
Machine Translated by Google

GRANDES DADOS DA TERRA 211

Salisbury, JW, & Eastes, JW (1985). O efeito do tamanho da partícula e da porosidade no contraste espectral em
o infravermelho médio. Ícaro, 64(3), 586–588.
Shanshan, W., Kefa, Z., Nannan, Z., & Wang, J. (2014). Análise de dados espectrais de rochas e minerais na
região de Hatu Western Junggar, Xinjiang. Anais do SPIE 9260, Sensoriamento Remoto de Superfície Terrestre,
II, 92602V.
Song, L., Liu, SJ, Yu, ML, Mao, YC e Wu, LX (2017). Um método de classificação baseado na combinação do
espectro visível, infravermelho próximo e infravermelho térmico para a distinção entre carvão e ganga.
Spectroscopy and Spectral Analysis, 37(2), 416–422.
Stelle, CA, Ariza-Lopez, FJ, & Urena-Chamber, MA (2018). Biblioteca espectral: Uma proposta de modelo de dados.
IGARSS 2018–2018 IEEE International Geoscience and Remote Sensing Symposium, Valência, Espanha, (pp.
7395–7398).
Su, L., Li, X., Wang, J., & Tang, S. (2003). Alguns problemas de conhecimento espectral típico de objetos terrestres
construção de base e serviço espectral. Avanços em Ciências da Terra, 2, 185–191.
van der Meer, FD, van der Werff, HMA, van Ruitenbeek, FJA, Hecker, CA, Bakker, WH, Noomen, MF, . . . Woldai,
T. (2012). Sensoriamento remoto geológico multi e hiperespectral: Uma revisão.
International Journal of Applied Earth Observation & Geoinformation, 14(1), 112–128. van der
Meer, F. (2004). Análise de recursos de absorção espectral em imagens hiperespectrais.
Jornal Internacional de Observação Aplicada da Terra e Geoinformação, 5(1), 55–68.
Vignesh, KM, & Kiran, Y. (2020). Análise comparativa de mapeamento mineral para hiperespectral e
imagens multiespectrais. Arabian Journal of Geosciences, 13(4), 160.
Wang, D., Liu, SJ, Mao, YC, Wang, Y., & Tian-Zi, LI (2018). Um método baseado no espectro infravermelho térmico
para análise do conteúdo de sio_2 em ferro tipo anshan. Spectroscopy and Spectral Analysis, 38 (7), 2101–2106.

Whitaker, S., & Pigford, RL (1960). Uma abordagem à diferenciação numérica de dados experimentais.
Industrial and Engineering Chemistry, 52(2), 185–187.
Xie, BS, Zhou, SY e Wu, LX (2020). Uma biblioteca espectral mineral integrada usando dados compartilhados para
sensoriamento remoto hiperespectral e mapeamento geológico. Os Arquivos Internacionais de Fotogrametria,
Sensoriamento Remoto e Ciências da Informação Espacial, 43, 69–75.
Yang, B. (1987). Características do espectro reflexivo de rochas e minérios e sua aplicação. Geoquímica, 1, 8.
Zhang, Y., Xiao, Q., Wen, J., You, DQ, Dou, BC e Tang, Y. (2017). Revisão sobre bibliotecas espectrais:
Progresso e aplicação. Journal of Remote Sensing, 21(1), 12–26.
Zhong, SY, Xiao, Q., Wen, JG, Zheng, XM, Ma, MG, Qu, YH, Zheng, K., Chi, TH, Tang, Y., You, D.
Q., Hao, DL, Cheng, J., He, M., Jiang, T. Jin, R., Yao, XJ e Zhao, LJ ( 2020). Projeto e realização de biblioteca
espectral de fundo de objetos terrestres para levantamento e mapeamento. Journal of Remote Sensing (chinês),
24(6), 701–716.
Zhou, X., & Zhou., D. (2009). Revisão da biblioteca digital de objetos terrestres espectrais. Espectroscopia e
Spectral Analysis, 29(6), 1616–1622.

Você também pode gostar