Você está na página 1de 3

RGB TEORIA

A visualização de imagens hiperespectrais é desafiadora porque há simplesmente mais


Informações em uma imagem hiperespectral do que podemos processar visualmente ao
mesmo tempo. Ao melhor A solução depende da aplicação. Por exemplo, se identificar e
diferenciar Certas plantas são de interesse, em seguida, classificando pixels nas plantas E usar
cores falsas distintas para representá-las pode ser a abordagem mais útil. Essa rotulagem pode
ser colocada em camadas em cima de uma visualização completa dos dados da imagem As
visualizações completas podem ser úteis para orientar o visualizador, analisando o conteúdo da imagem,
E a compreensão contextual resulta de algoritmos de classificação ou de mistura. Neste capítulo,
discutimos a partir de uma perspectiva de ciência de cores alguns dos problemas E questões que surgem
na criação e interpretação de visualizações hiperespectrales, E descreva soluções que podem ser úteis para
uma variedade de abordagens de visualização.
Esperamos que este capítulo seja útil tanto para quem precisa fazer sentido Imagens hiperespecíficas e
ara aqueles que projetam ferramentas de processamento de imagens. Primeiro em Sect. 2 discutimos os
principais desafios: perda de informação, interpretação visual, cor Saturação, imagens pré-atenciosas,
métricas e, em seguida, use componentes principais Análise como um estudo de caso. Então na Sect. 3
discutimos algumas soluções que podem ajudar Enfrentar esses desafios, incluindo o equilíbrio do branco,
funções de base otimizadas e Adaptando as funções de base. Na Sect. 4 concluimos e consideramos
alguns dos Questões nesta área.

2 Desafios
Considere uma imagem hiperspectral H com d componentes, ou seja, cada pixel é um Vetor d-
dimensional. Para visualizar H, cada pixel pode ser mapeado para um componente de três Vetor
que pode ser exibido como um valor RGB em um monitor. Portanto, A visualização
hiperespectral pode ser vista como um d? Redução de 3 dimensões Problema e qualquer solução
padrão de redução de dimensionalidade pode ser usada. No entanto, uma boa visualização
apresentará informações de forma fácil para Um humano para interpretar de forma rápida e
correta. Nas seções a seguir, explicamos Algumas das principais questões que tornam difícil
esse ideal. Para cavar mais Os problemas de imagem e ciência da cor apresentados nesta seção,
nos referimos ao leitor Para as seguintes referências: para aqueles novos para colorir a ciência, o
livro de Stone [1] Fornece uma introdução amigável; Fórmulas e outros detalhes para a maioria
dos tópicos Discutido aqui pode ser encontrado na Wikipedia; A maioria dessas fórmulas e mais
Os detalhes sobre o processamento digital prático para imagens podem ser encontrados no
recente Livro de Trussell e Vrhel [2]. Para aqueles cuja pesquisa envolve a engenharia de cores,
Recomendamos a compilação de pesquisas publicadas como Digital Color Imagem [3].
Referências adicionais para questões específicas são fornecidas onde eles Surgir no texto.

2.1 Perda de informação


Todas as visualizações hiperspectivas (estáticas) são com perdas. Primeiro, um mapas de dimensões d
Até três dimensões exibidas. Em segundo lugar, a maioria das telas são apenas 8 bits, E isso geralmente
implica um erro de quantificação. Considere, por exemplo, os principais componentes Análise que apeia o
pixel H [i] [j] para um tridimensional visível Pixel RGB da seguinte forma:

Onde p1, p2 e p3 são os três primeiros componentes principais da imagem H. Mesmo Se a imagem
original H for de 8 bits, as projeções em (1) geralmente serão uma grande quantidade Maior profundidade
de bits, mas terá que ser quantificado para ser exibido. Uma terceira causa da perda de informação é
cortar valores de pixels para a faixa de exibição, O que torna impossível diferenciar os pixels cortados. É
comum a escala Visualizações hiperespecrais para aumentar o contraste, mas isso faz com que os pixels
Exceder o intervalo de valores de exibição (por exemplo, [0 ... 1]), e eles devem ser cortados. Isto é
Tentando aumentar o contraste com uma escala não-linear, como uma função sigmóide, Mas para
displays de profundidade finita (por exemplo, displays de 8 bits), isso apenas move a informação Perda de
pixels de médio alcance porque os valores de escala não linear devem ser quantificados Para exibir
valores.
.2 métricas
A métrica certa para uma visualização depende da aplicação. Uma vez que uma métrica tenha Foi
decidido, deve ser formada uma estratégia de visualização que otimize diretamente Para a métrica
fornecida. Uma métrica geral é o quão bem as diferenças nos espectros Correlacionar-se com as
diferenças percebidas em uma imagem. Por exemplo, Jacobson e Gupta Olhou a correlação entre a
distância de crominância (a * b * em CIELAB Espaço) de diferentes pixels e o ângulo entre o original
correspondente Espectros [4]. Cui et al. Definir uma métrica similar baseada em correlação que considere
Distâncias euclidianas de pixels no espaço espectral e espaço de cores CIELAB [5], bem como Como
separação de recursos e aspectos da visualização interativa como métricas. Visualização Os métodos que
utilizam PCA usaram métricas como o máximo do componente. Índice de correlação de energia / mínimo
(MEMC) e entropia para avaliar Propriedades de diferentes métodos [6]. É importante reconhecer que
medir a qualidade de uma visualização por sua Energia ou "medida de informação" relacionada, como a
entropia, pode recompensar o ruído. Em última análise, a métrica certa depende da aplicação, e deve ser
subjetiva Avaliação de utilidade. No entanto, uma vez que não é possível construir visualizações Que
otimizem diretamente para avaliações subjetivas, devemos usar nosso conhecimento De visão humana e
tentar correlacionar avaliações subjetivas com otimizável Critérios objetivos.

2.3 Interpretação Visual


Como as pessoas interpretam uma imagem? Para uma simples visualização de falso cor com apenas
Algumas cores falsas, diferentes cores falsas como vermelho, verde, azul, laranja e roxo podem ser
usadas. Dado apenas algumas dessas falsas cores, os humanos interpretarão o falso Cores como
representando categorias não relacionadas. No entanto, treinamento sociocultural e As cores do mundo
natural fazem com que as pessoas interpretem instintivamente algumas cores falsas em Formas padrão,
particularmente que o azul significa água, marrom significa terra, verde Significa vegetação densa, e
amarelo significa vegetação mais leve (por exemplo, grama). Visualizações Que concordem com esses
mapeamentos intuitivos serão mais rápidos e fáceis de Compreender que falsos mapas de cores que
exigem que o espectador consulte uma legenda para Cada cor.
Se mais de algumas cores falsas forem exibidas, as pessoas não verão um conjunto de Cores não
relacionadas, mas, em vez disso, interpretam cores semelhantes como sendo semelhantes. Por exemplo,
Se você mostrar a um humano uma imagem de sensoriamento remoto com 50 cores falsas diferentes
Incluindo 15 tons de verde, a inclinação natural é interpretar as áreas verdes Como relacionado.
Exatamente quantas cores falsas podem ser usadas antes que os humanos comecem a Interprete as cores à
medida que as cores da imagem dependem de pistas contextuais (se as pistas espaciais Sugerem que é
uma imagem, as pessoas são mais propensas a interpretá-la como uma imagem), bem como Sobre a
pessoa. A pesquisa de nomes de cores indica que a maioria das pessoas percebe 11 categorias de cores
distintas, e isso sugere que até 11 cores falsas possam ser Usado como cores não relacionadas, mas nós
hipotetizamos que, quando organizado em uma imagem, ele Pode levar apenas sete cores antes que as
pessoas interpretem intuitivamente as cores como imagem Cores em vez de verdadeiras cores falsas.
Assim, ao usar uma multiplicidade de cores falsas, Mapear conceitos semelhantes para cores semelhantes
combinará o intuitivo de um humano Pressupostos sobre o que as cores significam. Este efeito é,
naturalmente, dependente do contexto, Por exemplo, em uma imagem natural, não assumimos que uma
fruta vermelha e um vermelho Bola estão relacionados.

Dada uma multiplicidade de cores falsas, as pessoas vão querer julgar a semelhança de Os espectros
subjacentes ou o material gerador por quão semelhante aparecem os cores eles. É uma busca contínua na
ciência da cor para quantificar com precisão o quão similar dois As cores aparecem. Medir a semelhança
entre cores usando descrições RGB é perigoso. RGB é uma descrição de cor que é útil para monitores,
que quase todos Opere adicionando quantidades de luz vermelha (R), verde (G) e azul (B) para criar uma
imagem. Portanto, uma cor RGB pode ser interpretada diretamente por um monitor como a quantidade de
Cada luz que o monitor apagará. No entanto, os monitores diferem e, portanto, um O valor RGB parecerá
diferente em dois monitores diferentes. Por esse motivo, RGB é Chamou uma descrição de cor
dependente do dispositivo, e quanto uma diferença em RGB O assunto depende do hardware de exibição.
Mas o problema com o uso de RGB para medir as diferenças de cores realmente tem mais Para fazer com
o observador humano. Se uma métrica de distância de cor for boa, qualquer A diferença de 10 unidades
entre duas cores parece ser a mesma diferença Para um espectador. Mas isso simplesmente não é o caso
com valores RGB, mesmo que sejam Padronizado (como sRGB ou Adobe RGB).
Uma solução para medir as diferenças de cores que os engenheiros de cores consideram serem Trabalhar
tolerável na maioria das situações práticas é descrever as cores no CIELAB Espaço de cores e, em
seguida, medir a diferença de cores como distância euclidiana no CIELAB Espaço (ou uma variante
deste, veja, por exemplo, DE94). O espaço de cores CIELAB é um Descrição de cor independente do
dispositivo com base na medição dos espectros reais de luz Representando a cor. Nada na ciência da cor
é simples no entanto, e há uma Número de ressalvas sobre a mensuração de diferenças de cores com
CIELAB. Uma ressalva é Que a aparência de uma cor depende das cores circundantes (ver Fig. 1 para
Um exemplo), e a CIELAB não leva em consideração as cores circundantes. (Mais Existem modelos de
aparência de cores complicados que levam as cores circundantes a Conta [7].) Uma segunda ressalva é
que é preciso converter as cores RGB de um monitor para Cores CIELAB. Como o RGB é um espaço de
cores dependente do dispositivo e o CIELAB é um Espaço de cores independente do dispositivo, a
maneira correta de mapear as cores RGB de um monitor para As cores CIELAB requerm medir os
espectros de cores exibidas pelo monitor Para ajustar um modelo de cores RGB coloridas para cores
CIELAB para esse monitor.
No entanto, a maioria dos monitores possui uma configuração padronizada embutida Espaços RGB
independente do dispositivo, e por isso é prático assumir que o monitor é SRGB e depois use cálculos
sRGB-para-CIELAB padrão. Outra preocupação em quantificar a forma como os seres humanos
percebem as diferenças é que os seres humanos Interprete diferenças de matiz diferentemente das
diferenças de leveza ou saturação. No Contexto de uma imagem, se os pixels adjacentes tiverem o mesmo
matiz, eles são mais propensos a ser Considerado parte do mesmo objeto do que se eles tiverem matizes
diferentes. Assim, é Importante considerar como a tonalidade será renderizada ao projetar ou interpretar
uma visualização.

2.4 Saturação de cor e neutros


Somos mais sensíveis a pequenas variações nos neutros do que nas cores vivas; Lá Realmente são muitos
tons de cinza. É mais fácil julgar consistentemente as diferenças Entre cores neutras do que entre cores
aturadas. Por exemplo, o perceptual A diferença entre um cinza rosado e um cinza azulado pode ser o
mesmo que o Diferença perceptiva entre um vermelho brilhante e um vermelho cereja, mas é geralmente
Mais fácil de lembrar, descrever e reencontrar a diferença entre os cinzas. Além disso, se uma isualização
tiver muitas cores fortes, elas causarão simultâneas Contraste, o que faz com que a mesma cor
pareça significativamente diferente dependendo de As cores circundantes. Um exemplo é
mostrado na figura 1. O contraste simultâneo Torna difícil reconhecer a mesma cor em
diferentes partes de uma imagem e Julgar com precisão as diferenças entre os pixels.
Pequenas regiões de cores saturadas brilhantes são denominadas imagens pré-atenientes [8],
Porque essas regiões chamam a atenção do telespectador, independentemente da intenção do
usuário foco. Assim, é aconselhável usar cores saturadas brilhantes com moderação como
destaques, Rótulos ou a camada de informações importantes para uma visualização em
segundo plano.

2.5 Cegueira de cor


Aproximadamente 5% da população é cor-cega, com a maioria incapaz de distinguir Vermelho de verde
na mesma luminância. Projetando e modificando imagens para Informar ao máximo os usuários cegos de
cor é uma área de interesse ativo [9].

Você também pode gostar