Você está na página 1de 20

INTERFACE GRÁFICA PARA IMAGEAMENTO QUÍMICO APLICADO A

DIAGNÓSTICOS DE TUMORES DE SISTEMA NERVOSO CENTRAL


Denise Ribeiro, deniise.chs@gmail.com¹
João Meidanis, meidanis@scylla.com.br2
Andreia de Melo Porcari, andreia.porcari@usf.edu.br¹
¹Universidade São Francisco - Av. São Francisco de Assis, 218 - Jardim São Jose, Bragança Paulista - SP, 12916-900.
2
Centro Infantil Boldrini - Rua Dr. Gabriel Porto, 1270 - Cidade Universitária, Campinas - SP, 13083-210.

RESUMO: O método convencional para classificação de tumores em ambiente intraoperatório é a histologia de


cortes de congelação, técnica que produz artefatos de leitura ao patologista, impactando no diagnóstico e definição de
margem cirúrgica. Como alternativa, a técnica de Desorption Electrospray - Mass Spectrometry Imaging (DESI-MSI)
permite obter imagens moleculares capazes de correlacionar-se ao diagnóstico histológico convencional. A
complexidade dessa análise, implica na necessidade do desenvolvimento de uma ferramenta gráfica para orientação do
neurocirurgião. Desta forma, o trabalho buscou desenvolver uma interface gráfica para visualizar a classificação da
imagem química por DESI-MSI, realizada sobre espécimes cirúrgicos coletados durante a remoção de tumores do
Sistema Nervoso Central (SNC). A partir da coleta dos dados espectrométricos, sua organização, e construção de
modelos de classificação (etapas prévias realizadas em outros subprojetos), este projeto realizou a construção da
interface web, por meio da computação gráfica utilizando a combinação de Shiny e linguagem R, para conversão dos
dados brutos, renderização, visualização e sobreposição das imagens. A interface foi desenvolvida de forma individual
para os dados da análise DESI-MSI, havendo um menu lateral com a identificação da amostra, um campo para inserção
do valor de razão massa/carga (m/z), um campo para escolha da classe e outro para escolha da anotação do patologista,
permitindo a sobreposição das imagens de acordo com a predição de cada modelo treinado. As imagens químicas obtidas
pela técnica DESI-MSI e a sua correlação com a classificação histológica são exibidas na interface de maneira simples
e amigável. Dado o exposto, o desenvolvimento da interface gráfica para visualizar informações classificatórias de
espectros provenientes do tecido cerebral, viabilizou uma ferramenta capaz de aprimorar a qualidade do diagnóstico
intraoperatório e contribuiu para uma análise mais rápida, direta e precisa de biópsias provenientes do tecido do SNC.
Palavras-chave: Espectrometria de Massas, Imageamento, Interface Gráfica, Tumores do Sistema Nervoso Central.

ABSTRACT: The conventional method for classifying tumors in an intraoperative environment is the histology of
freezing cuts, a technique that produces reading artifacts to the pathologist, impacting on the diagnosis and definition of
surgical margin. Alternatively, the Electrospray Desorption - Mass Spectrometry Imaging (DESI-MSI) technique allows
molecular images capable of correlating to conventional histological diagnosis. The complexity of this analysis implies
the need for the development of a graphic tool for guidance of the neurosurgeon. Thus, the work sought to develop a
graphical interface to visualize the classification of chemical image by DESI-MSI, performed on surgical specimens
collected during the removal of tumors of the Central Nervous System (CNS). From the collection of spectrometric data,
its organization, and construction of classification models (previous steps performed in other subprojects), this project
carried out the construction of the web interface, through computer graphics using the combination of Shiny and R
language, for the conversion of raw data, rendering, visualization and overlap of images. The interface was developed
individually for the data of the DESI-MSI analysis, with a lateral menu with the identification of the sample, a field for
insertion of the mass/load ratio value (m/z), a field for class choice and another for choosing the pathologist's annotation,
allowing the overlap of images according to the prediction of each trained model. The chemical images obtained by the
DESI-MSI technique and its correlation with histological classification are displayed in the interface in a simple and
user-friendly way. Given the above, the development of the graphical interface to visualize classification information of
spectra from brain tissue, enabled a tool capable of improving the quality of intraoperative diagnosis and contributed to
a faster, direct and accurate analysis of biopsies from CNS tissue.
Keywords: Mass Spectrometry, Imaging, Graphical Interface, Central Nervous System Tumors.

1. INTRODUÇÃO
Os tumores primários do Sistema Nervoso Central (SCN) fazem parte de um grupo heterogêneo de tumores,
sendo os meduloblastomas e os gliomas considerados os tipos de tumores encefálicos mais comuns na faixa etária
pediátrica (WEN; HUSE, 2017), (UDAKA; PACKER, 2018). O estabelecimento correto do diagnóstico é, portanto,
fundamental para a condução clínica do caso, permitindo uma programação terapêutica e a utilização de protocolos
específicos que se adequam a cada tipo de tumor, impactando diretamente na abordagem terapêutica e, portanto, no
prognóstico dos pacientes. O procedimento cirúrgico é geralmente a primeira etapa do tratamento e, sendo assim,
necessita de informações relevantes e de fácil visualização em tempo real, que possam orientar o neurocirurgião na
distinção de tecidos tumorais e tecidos normais do cérebro. O método convencional para classificação destes tumores em
ambiente intraoperatório é a histologia que, embora forneça relevantes informações para condução do cirurgião, fica
limitada pela urgência da resposta ao uso de cortes de congelação que ocasionam artefatos de leitura ao patologista,
2

impactando no diagnóstico e definição de margem cirúrgica. Observou-se a necessidade do desenvolvimento de novas


tecnologias que orientem o neurocirurgião e o auxiliem na distinção de tecido tumoral do tecido cerebral normal, de forma
precisa e rápida, evitando assim a remoção desnecessária do parênquima cerebral normal da lesão (CALLIGARIS;
NORTON; FELDMAN; IDE et al., 2013).
Com o objetivo de fornecer ferramentas analíticas para auxiliar o patologista no momento da decisão, apresenta-
se o imageamento por espectrometria de massas (MSI, do inglês Mass Spectrometry Imaging), uma tecnologia robusta e
altamente sensível que permite a análise biomolecular de tecidos, podendo contribuir para a diferenciação dos tumores
com maior rapidez e precisão, facilitando, em tempo real, a decisão do neurocirurgião durante o ato operatório
(CALLIGARIS; NORTON; FELDMAN; IDE et al., 2013), (IFA; EBERLIN, 2016)⁠.
Devido à complexidade de análise e visualização dos tumores obtidos através da técnica de MSI durante
procedimentos cirúrgicos, há necessidade de desenvolvimento de ferramentas que permitam a interpretação dos dados
não por especialistas químicos, mas por médicos cirurgiões e patologistas, possibilitando que a técnica se torne
clinicamente relevante. Dado o exposto, este trabalho teve por objetivo o desenvolvimento de uma interface gráfica para
visualização de espectros e suas classificações, a partir da imagem de espectrometria de massas de tecidos cerebrais
retirados de pacientes pediátricos portadores de tumores primários de SNC, para análise durante a cirurgia. Os modelos
classificatórios previamente obtidos a partir do perfil lipídico dos tecidos serão exibidos nesta interface com o objetivo
de agilizar e facilitar o processo do neurocirurgião, com possível aplicação em tempo real. Para o desenvolvimento da
Interface Gráfica foi necessário atender os objetivos específicos definidos pelos requisitos funcionais do Anexo 1.

2. LEVANTAMENTO BIBLIOGRÁFICO
2.1 Espectrometria de Massas (MS)
A Espectrometria de Massas (do inglês, mass spectrometry) é uma ferramenta analítica que utiliza campos
elétricos e/ou magnéticos para controlar as trajetórias de íons em fase gasosa e assim obter sua razão massa/carga (m/z),
no vácuo, para diferenciá-los (ERIKSSON; BROTONS; REZELI; SUITS et al., 2020). Um espectrômetro de massas é
composto de quatro partes principais: (i) sistema de introdução de amostra (ii) fonte de ionização (iii) analisador de m/z
(iv) detector, como observado na Fig. (1).

Figura 1. Representação estrutural de um espectrômetro de massas. Figura adaptada de Porcari (PORCARI,


2018).

2.2 Técnicas de Ionização Ambiente

Um conjunto específico de técnicas de MS, chamada de MS ambiente (GERMANO; O'DRISCOLL, 2009),


consiste em técnicas que se baseiam na análise direta de amostras, com pouco ou nenhum preparo das mesmas, em
ambiente aberto, livre de vácuo. A principal representante deste grupo é a técnica de DESI-MS (Desorption Electrospray
Ionization – Mass Spectrometry) (BADU-TAWIAH; EBERLIN; OUYANG; COOKS, 2013) e seu mecanismo pode ser
visualizado na Fig. (2).
3

Figura 2. Representação da ionização por DESI-MS. Fonte: Figura adaptada de WU; DILL; EBERLIN, et al.,
2013.

Na técnica de DESI, a ionização se baseia em um spray de solvente carregado com potencial elétrico que é
direcionado à superfície da amostra intacta. Esse solvente carregado é capaz de dessorver as moléculas da superfície, bem
como ionizá-las, permitindo que sejam levadas ao espectrômetro de massas, onde ocorre sua detecção.

2.3 Imageamento por DESI-MS

Ao monitorar-se o perfil químico de uma superfície em conjunto com a informação espacial do mesmo
(coordenadas x e y), é possível gerar imagens químicas das amostras analisadas, observando a diferente distribuição de
íons nas diferentes regiões da amostra. Diversas técnicas de MS são capazes de gerar imagens químicas, no entanto,
DESI-MS se torna atrativa por não requerer preparo de amostra e ser realizada em ambiente aberto, livre de vácuo. Em
um experimento de imageamento, a área total é subdividida (conceitualmente) em pixels que são analisados
individualmente. Para cada pixel adquire-se um espectro de massas, sendo o montante de espectros adquiridos nos
diferentes pixels relacionados com suas coordenadas espaciais. Como cada pixel representa um espaço associado ao
espectro de massas, ao exibir as intensidades de um íon específico em todos os pixels, é possível formar uma imagem
química. A distribuição de íons específicos pode ser visualizada pela criação de imagens químicas baseadas na intensidade
desses íons (WU; DILL; EBERLIN; COOKS et al., 2013). O processo de imageamento pode ser observado na Fig. (3).

Figura 3. Representação do método de imageamento por MSI. (a) A área total adquirida é subdividida em pixels.
Estes pixels são inspecionados individualmente a fim de obter-se o espectro de massas daquele ponto e então
armazenar suas coordenadas espaciais. Os números 1 e 2 representam o processo de dessorção e ionização. (b)
Depois que a superfície foi escaneada, pode se observar a criação de uma imagem química com a distribuição dos
íons específicos. A escala de cor para cada pixel representa a intensidade normalizada para aquele íon em
particular. Figura adaptada de WU; DILL; EBERLIN, et al., 2013.
4

2.4 Computação Gráfica

Denomina-se computação gráfica a área da ciência em que se estuda a formação, manipulação e análise de
imagens. Na computação gráfica as informações produzidas são representadas visualmente como imagens e disseminadas
de um computador para um humano (computer-to-human) por meio de recursos computacionais, como um display e seus
dispositivos de interação. Por outro lado, a ISO (do inglês, International Organization for Standardization) a define como
“um conjunto de ferramentas para conversão de dados para ou de um dispositivo através do computador”. Desta forma,
a computação gráfica também é considerada como um campo interdisciplinar, pois engloba áreas da física, matemática,
engenharia, design gráfico e interações entre homem-computador, onde cada uma desempenha um papel fundamental
(JOHN F. HUGHES, 2013), (ISO, 1996). Este é um recurso utilizado desde em terminais considerados simples (que
interagem via linhas de comando) até em interfaces gráficas complexas. Observa-se, na Fig. (4) o relacionamento das
áreas que compõem a computação gráfica.

Figura 4. Relacionamento entre subáreas da computação gráfica.

2.4.1 Síntese de imagens

Conhecida também por computação gráfica gerativa, a síntese de imagens tem como objetivo a produção de
imagens sintéticas, ou seja, as representações de objetos visualizados em um computador a partir de dados, por meio de
extensivas técnicas de computação gráfica, modelos matemáticos e especificações geométricas. É comumente utilizada
para a criação de protótipos, simulação de ambientes e outros fatores, onde o processo recebe um input de um ou mais
modelos geométricos e gera uma imagem a partir destes no output (PERSIANO; OLIVEIRA, 2018), (AZEVEDO, 2018).

2.4.2 Processamento de imagens

Uma imagem digital pode ser descrita como uma função bidimensional 𝑓(𝑥, 𝑦), tal que x e y são as coordenadas
espaciais e a amplitude de f para qualquer par de coordenada recebe a denominação de intensidade ou nível de cinza.
Observa-se que uma imagem digital é então determinada por um número finito de elementos que possuem uma
localização e um valor (BATCHELOR, 2016).
O processamento é responsável pela aplicação de um conjunto de operações matemáticas (algoritmos) sobre
uma imagem, gerando uma nova representação visual (matricial) ou descrição do conteúdo. A Fig. (5) representa o fluxo
do sistema de processamento de imagem.
5

Figura 5. Representação do sistema de processamento de imagem.

2.4.3 Análise de imagens

A análise de imagens é uma subárea da computação gráfica, que visa extrair informações do conteúdo, por
exemplo a especificação de componentes da imagem para a identificação de um indivíduo ou o reconhecimento de
caracteres de uma placa, a partir da representação visual. No contexto do presente trabalho, a análise de imagens visa
auxiliar em tomadas de decisões, como o diagnóstico de um tumor em um paciente. O processo de análise requer uma
sequência de técnicas de representação, descrição e classificação de padrões, além das técnicas de processamento de
imagens, para obter o conteúdo informativo de uma imagem (PERSIANO; OLIVEIRA, 2018). O fluxo da análise de
imagem é descrito na Fig. (6).

Figura 6. Análise de Imagem.

2.4.4 Representação de imagens digitais

Para a formação de uma imagem bidimensional, a função 𝑓(𝑥, 𝑦), sendo discreta, recebe o brilho refletido em
seus pontos que pertencem à um conjunto de números reais de uma dada região do espaço. Pode ser amostrada como uma
matriz onde os índices referentes às linhas e colunas indicam uma posição na imagem. O valor atribuído à essas
coordenadas correspondem ao seu nível de cinza e cada conjunto de pares 𝐼(𝑥, 𝑦) recebe então o nome de pixel (do inglês
picture element) ou spel (do inglês, space element).
O brilho 𝐼(𝑥, 𝑦) está normalmente no intervalo [0, 2𝑏 − 1], onde b é o número de bits por pixel, ou seja, a
profundidade da imagem, resultando no valor necessário para seu armazenamento. Como exemplo, para b = 8 a imagem
pode armazenar até 256 níveis de cinza, onde o preto corresponde ao 0 e o branco ao 255. Este é um processo chamado
de digitalização, que envolve a amostragem e quantização da imagem (VELHO, 1997). Segundo Schwartz (2007), a
amostragem gera uma matriz 𝑀 𝑥 𝑁 de amostras, onde M representa o número de linhas e N o número de colunas e a
quantização é responsável por definir o número de inteiros em nível de cinza, conforme exemplificado na Fig. (7).
6

Spel
y
x

Figura 7. Representação matricial da imagem e seus níveis de cinza. Adaptada de Pedrini (PEDRINI, 2007).

2.4.5 Sobreposição de imagens

Considerando-se imagens coloridas, o modelo de cores comumente conhecido e utilizado é o RGB (do inglês,
red, green e blue), que surgiu a partir de estudos sobre a composição da luz onde, por meio de ajustes nas três cores
primárias, obtém-se diferentes intensidades para cada uma, gerando assim as cores conhecidas como secundárias
(SAÚDE, 2018; VELHO, 1997). Além dessas componentes, uma imagem digital pode conter uma quarta conhecida como
transparência, que permite a sobreposição de uma imagem sobre um fundo de maneira que este não seja totalmente
coberto pela imagem sobreposta (SAÚDE, 2018).

2.5 Ferramentas para modelagem de Banco de Dados

O conceito de banco de dados relacionais apareceu pela primeira vez na literatura em 1970 no artigo publicado
por E.F. Codd e intitulado “A Relational Model of Data for Large Shared Data Banks” no ACM Journal, sendo que o
modelo proposto passou a ser considerado a base para o Sistema de Gerenciamento de Banco de Dados Relacionais
(SGBDR). Até aquele momento, os bancos de dados não possuíam relacionamento entre as tabelas onde os dados eram
armazenados e eram chamados de bancos de dados sequenciais, pois possuíam uma tripla de caracteres de textos que não
permitia algum tipo de relacionamento entre eles. Com o surgimento de bancos de dados relacionais, Codd então idealizou
uma maneira estruturada de realizar as consultas e criou uma linguagem que considerava fácil para extrair ou manipular
não somente dados, mas estruturas em si, aproveitando a característica de relacionamento entre os bancos.
Desta forma, a primeira implementação realizada da linguagem SEQUEL, foi realizada pela IBM no intuito de
implementar o modelo descrito por Codd e sua evolução deu origem a linguagem SQL (do inglês, Structured Query
Language) (CODD, 1970). A linguagem é caraterizada pela utilização de tabelas, que são compostas por (i) linhas que
contém os registros (ii) colunas contendo campos e atributos para identificar as relações e tem por objetivo padronizar a
forma como os dados são consultados (PICHETTI; VIDA; CORTES, 2021).
Criado em 1995 por Michael Widenius, o MySQL é um sistema de gerenciamento para banco de dados
relacionais Open Source (código aberto), lançado sob a licença GNU General Public License (FOUNDATION, 2007).
Em razão às preocupações relacionadas ao licenciamento, posteriormente Michael criou o MariaDB, no intuito de lançar
no mercado uma ferramenta compatível com MySQL, porém aprimorada (DYER, 2015). Os sistemas de gerenciamento
de banco de dados relacionais (SGBDR) são ferramentas que foram desenvolvidas para aplicações web, com o objetivo
de realizar o processamento de dados armazenados em diversas tabelas e garantir uma indexação rápida em repositórios,
o que é possível devido a otimização no processo de acesso sequencial dos dados.

2.6 Ferramentas para Desenvolvimento da Interface Gráfica

2.6.1 Software e linguagem R

A linguagem R foi criada durante a década de 90 em Auckland, Nova Zelândia por Ross Ihaka e Robert
Gentlemamn no departamento de estatística da universidade. Além de uma linguagem, é também um ambiente (software)
que tem como objetivo realizar análise estatística e criar gráficos, podendo ser descrito como uma implementação
diferenciada da linguagem S. É uma linguagem interpretada, pois os comandos são enviados para uma console, avaliados
7

e então executados, obtendo-se assim uma resposta em tela. O R fornece uma ampla variedade de técnicas estatísticas
como modelagem linear e não linear, testes estatísticos clássicos, classificação, agrupamento e técnicas gráficas, sendo
altamente expansível com o uso de bibliotecas para funções específicas (FARIA; PARGA, 2021). Optou-se por utilizar a
versão mais recente da linguagem R (version 4.1.0), no momento da realização deste projeto.

2.6.2 Cardinal package

O Cardinal é uma biblioteca que foi desenvolvida para fornecer métodos estatísticos para análises e manipulação
de dados provenientes de imagens de espectrometria de massas (MSI) oferecendo suporte a técnicas baseadas em
Desorption Ionization-based MSI (BEMIS; HARRY; EBERLIN; FERREIRA, et al., 2015).
Possui uma interface abstrata para manipulação de conjunto de dados, o que simplifica a maior parte das tarefas
básicas que ocorrem durante uma análise estatística, incluindo o processamento de imagens e espectro de massas, além
da exibição dinâmica de ambos (plot). Embora seja um pacote robusto que também realiza etapas de pré-processamento,
como normalização e correção de linha de base, sua principal funcionalidade é análise estática, classificação de métodos
e agrupamentos baseados em centroides (BEMIS, 2021).

2.6.3 Shiny package

O Shiny é uma biblioteca que tem como objetivo facilitar o desenvolvimento de aplicações web de maneira
interativa, diretamente de scripts em linguagem R, sendo compatível com as suas últimas versões lançadas (4.0, 3.6, 3.5,
e 3.4). Optou-se então por utilizar a versão mais recente do Shiny Package (version 1.7.1) no desenvolvimento deste
projeto, pois esta possui um modelo de programação reativa e expansível, facilitando a transformação de um código R
existente em um aplicativo reativo, onde as saídas reagem automaticamente às novas entradas oriundas do usuário. Sua
aparência é baseada no Bootstrap e pode ser customizada diretamente com integrações entre R e HTML / CSS /
JavaScript, além de uma integração perfeita com o R Markdown. Outras características atribuídas, são: (i) ferramentas
para monitorar desempenho (ii) suporte para programação assíncrona (iii) capacidade de marcação do estado do código
e/ou geração do código para reprodução da saída (CHANG, 2021).

3. METODOLOGIA
No âmbito da extensão deste projeto, foram estabelecidas tarefas relativas ao treinamento e disponibilização de
modelos para predizer a classificação do tecido a partir de espectros de massas e construir uma interface web, por meio
da computação gráfica, para visualização dos resultados. O projeto está dividido em três fases listadas a seguir (i) Coleta
e organização dos dados (ii) Treinamento e classificação dos modelos (iii) Construção de interface gráfica, sendo apenas
a última, o foco deste artigo.
A representação das funcionalidades que englobam a Interface gráfica é demonstrada de forma simplificada pelo
Diagrama de Caso de Uso da Fig. (8).

Figura 8. Diagrama de Caso de Uso.


8

3.1 Amostragem e coleta de dados

A carga inicial de dados foi coletada e fornecida no início de março/2021 por demais pesquisadores envolvidos,
numa parceria institucional entre o Centro Infantil Boldrini (Campinas, SP), a Universidade São Francisco (Bragança
Paulista, SP) e a Universidade do Texas (Houston, EUA). Todas as amostras de tecido são provenientes do Boldrini e
foram coletadas e analisadas em projeto aprovado pelo comitê de ética (CAAE: 38849614.2.0000.5376), constando
atualmente cerca de 100 amostras, com previsão de entrada de novos laudos ao decorrer do projeto. Sendo assim será
necessária a atualização dos repositórios de dados químicos e clínicos periodicamente.
Os dados recebidos possuem o formato de planilhas, que foram geradas pelo software MSI Reader (North
Carolina State University, EUA). Essas planilhas contêm pares de colunas que representam a razão m/z de cada íon
detectado, sua intensidade e a marcação da região do corte histológico do qual esta informação foi extraída, em formato
de coordenada x e y, correspondentes a regiões patologicamente uniformes. Em adição, foram recebidos os dados brutos
oriundos do espectrômetro de massas LTQ-XL (Thermo Fisher) correspondentes à lâmina inteira obtida pelo
imageamento do corte de congelação, incluindo as regiões patológicas de interesse e outras não especificadas.

3.2 Organização dos dados em formato para processamento

O banco de dados utilizado pela aplicação, foi criado conforme o Modelo Entidade Relacionamento (também
chamado Modelo ER, ou simplesmente MER) apresentado na Fig. (9).

Figura 9. Modelo Entidade Relacionamento.

O volume de dados foi então processado, armazenado e organizado conforme descrito abaixo:

I. Tabela patient - possui o registro de identificação do paciente e indica se os dados são de um paciente
retrospectivo ou prospectivo. Por razões de sigilo, não há mais informações sobre o paciente no banco de
dados.
II. Tabela sample - contém as amostras com seu próprio identificador, um apontador para o paciente ao qual a
amostra pertence e a data de coleta. Pode haver mais de uma amostra por paciente. Incialmente o banco
possui 83 pacientes.
III. Tabela spectrum – armazena os espectros, onde cada espectro é uma lista de 12240 valores em ponto
flutuante, que correspondem à intensidade do sinal para razões massa/carga (m/z) que vão de 180.0833 a
1200.0, em incrementos de 1/12 unidades (0.0833). Esta lista é armazenada no banco de dados em formato
9

blob, ou seja, um grande bloco de bits que pode apenas ser armazenado e recuperado, sem que outras
operações normais de bancos de dados possam ser feitas sobre ele. Em adição, cada espectro contém seu
próprio identificador, a data de coleta no equipamento, um apontador para a amostra de onde veio, as
coordenadas x e y do ponto dentro desta amostra, e a classificação patológica do espectro. São armazenados
apenas espectros que possuem classificação patológica para treinamento do modelo.
IV. Tabela classification – possui as classificações patológicas para a qual os espectros apontam.
V. Tabela immunohistochemistry – ainda não carregada no banco de dados, irá conter informações como data
de coleta relacionadas as amostras da tabela sample.
VI. Tabela model – contém a descrição dos métodos de machine learning utilizados no treinamento do modelo.
VII. Tabela predicton – possui o resultado das predições obtidas pelos modelos.

3.3 Análise de dados, treinamento e classificação dos modelos

Para a análise de dados e desenvolvimento, os dados espectrais foram processados e utilizados por demais
pesquisadores envolvidos para treinar os modelos de classificação de espectros de massas utilizando estatística
multivariada e aprendizagem de máquina, por meio de: (i) SVM (ii) Random Forest (iii) Rede Neural e (iv) LASSO,
sempre considerando conjunto de treinamento com 75% dos dados e conjunto de validação com 25% dos dados.

3.4 Carregando as bibliotecas utilizadas

Para iniciar o desenvolvimento da tela, foi necessário primeiramente importar os pacotes que seriam utilizados
conforme o Algoritmo 1.

Algoritmo 1: Load packages


1: library(shiny)
2: library(shinyWidgets)
3: library(Cardinal)
4: library(odbc)
5: library(RMySQL)
6: library(config)
7:
8: options(Cardinal.dark=TRUE) *define o background da imagem gerada pelo Cardinal

3.5 Conexão com o database e seleção dos dados

As informações retornadas em tela, foram armazenadas no banco de dados como descrito em 3.2. A conexão foi
estabelecida de acordo com o Algoritmo 2, implementado no código principal da interface.

Algoritmo 2: Algoritmo para conexão com o database


1: config <- config::get(file = “../shiny-config/config.yml”) *contém as informações de acesso ao db
2: com <- RMySQL::dbConnect( *RMySQL é a biblioteca utilizada para a conexão
3: RMySQL::MySQL(),
4: user = config$user,
5: password = config$password,
6: dbname = config$database,
7: host = config$host
8: )

A infraestrutura do servidor web foi construída em containers. Esta é uma abordagem utilizada no
desenvolvimento de softwares onde um aplicativo ou serviço, suas dependências e configurações são empacotados juntos
à uma imagem de container. Assim, o aplicativo implantado em um container pode ser testado como uma unidade e
implantado no sistema operacional do host, otimizando os processos, uma vez que também isola as aplicações
(NISHANIL, 2021). Visando a segurança das informações contidas no database, foi criado um arquivo do tipo .yml que
é utilizado pelo container, sendo este armazenado um nível abaixo da pasta pública que contém o código da interface
exibida no navegador (acesso interno). Este arquivo contém os dados sensíveis para acesso ao ‘db’ que são consultados
e armazenados na variável ‘con’, conforme descrito no algoritmo acima e não ficam disponíveis ao acesso público,
diferentemente da interface. O carregamento dos dados necessários para exibição na tela pode ser observado no Algoritmo
3 a seguir.
10

Algoritmo 3: Load data


1: patients <- dbGetQuery(con, “SELECT id FROM patient”) *Carrega a lista de pacientes
2:
3 class.df <- dbGetQuery(con, “SELECT id, label FROM classification”) *Carrega as classificações
4: classes <- as.list(class.df$id) *Armazena na variável como lista
5: names(classes) <- c(class.df$label) *Define a label de exibição
6:

3.6 Definições para construção da interface web

Optou-se pela utilização da biblioteca Shiny para a construção da interface web, devido sua eficiência ao gerar
imagens e gráficos diretamente de scripts em linguagem R.

3.7 Exibição da imagem química e do espectro

3.7.1 Conversão de dados

Os espectros de massas obtidos pixel a pixel originalmente possuem formato .raw. Para que a biblioteca Cardinal
realizasse o processo de leitura destes dados, foi necessária a conversão dos dados recebidos em formato .raw para o
formato imzML. Esta conversão foi realizada utilizando o software imzML Converter (RACE; STYLES; BUNCH, 2012),
onde após o processo de conversão foram gerados dois arquivos: um em formato .idb e outro em .imzml, ambos
armazenados em um diretório no servidor da aplicação.

3.7.2 Renderização

O algoritmo Define server (Anexo 3) foi utilizado para o processo de renderização e exibição dos seguintes itens:
as imagens de uma amostra de tecido de um paciente, seus respectivos espectros e as sobreposições com os resultados de
predição. Definiu-se a função server com os parâmetros necessários para execução das tarefas. A variável filename recebe
o id do paciente selecionado na interface (retornado pela query patients em Load Data), o utiliza para concatenar o
caminho da imagem + id do paciente + extensão do arquivo e então retorna a informação no formato texto. Posteriormente,
a variável mse, recebe essa informação e utiliza o readMSIData para fazer a leitura do arquivo imzML, cujo nome é
recebido da variável filename, sendo utilizada também para a definição dos parâmetros de visualização como mass.range,
resolutions e units. O texto que contém algumas informações/instruções para o usuário em tela, é retornado pelo método
output$patient.
A renderização da imagem ocorre a seguir, por meio do método output$MSimage, que recebe os dados da
variável mse e utiliza o método annot para selecionar o modelo de predição que será exibido por meio de uma condicional
(if and else) contendo os atributos necessários para geração da imagem.

3.8 Sobreposição de imagens químicas e histopatológicas

Os modelos previamente treinados com base nas anotações do patologista foram utilizados para predizer a
classificação de determinado espectro da amostra. Essa classificação resulta numa imagem que pode ser sobreposta à
imagem química.

4. RESULTADOS E DISCUSSÃO
O design foi definido de acordo com a necessidade de exibição dos dados obtidos pela análise DESI-MSI para
cada paciente, havendo um menu lateral, no lado esquerdo da tela, que contém as informações do paciente, uma barra
para seleção do valor de m/z a ser visualizado e um campo para escolha da anotação, ou seja, a sobreposição de acordo
com a predição de cada modelo treinado. Há ainda um espaço definido para exibir a legenda das possíveis classes dos
componentes histológicos retornados pelo modelo treinado, para identificar-se a qual classe o pixel selecionado pertence.
O lado direito possui duas divisões, sendo uma para a imagem gerada a partir da amostra de tecido do paciente e outra
para o espectro de massas adquirido do pixel selecionado na imagem. O algoritmo utilizado no desenvolvimento do layout
pode ser observado no Anexo 2 e o resultado do layout na Fig. (10).
11

Figura 10. Protótipo da Interface Gráfica.

Por padrão, caso o usuário não insira um valor de m/z para visualização, após selecionar o paciente, a primeira
imagem a aparecer é denominada TIC (do inglês, total ion current), ou seja, é exibido o resultado do somatório de todas
as correntes iônicas produzidas por todos os íons detectados em uma faixa especifica de m/z ou em um espectro de massas
(TODD, 1991). Ao selecionar-se um pixel (click) na imagem gerada de determinado paciente, por meio do parâmetro
input$image_click o método output$spectrum, captura as coordenadas do pixel selecionado, armazena nas variáveis
correspondentes aos eixos x e y, exibindo em tela (plot) o espectro daquele pixel, como exemplificado na Fig. (11).

Figura 11. Exemplo de espectro exibido a partir da seleção de um pixel.

De acordo com o Anexo 2, o método annot pode ser descrito da seguinte forma: (i) a variável sql recebe as
informações consultadas no database por uma query, (ii) captura as coordenadas do pixel selecionado e armazena em
variáveis, (iii) cria um vetor de M linhas x N colunas, (iv) utiliza o vetor no laço de repetição para verificar a classificação
do espectro para cada coordenada e (v) exibe a imagem com a classificação sobrepondo a imagem da amostra do paciente.
O mesmo processo é atribuído a todos os modelos de ML treinados e, na Fig. (12), tem-se o resultado obtido pela
sobreposição sem o recurso de transparência aplicado na imagem gerada pela classificação SVM.
12

Figura 12. Sobreposição de imagem com classificação SVM.

5. CONCLUSÃO
Este projeto buscou a construção de uma interface gráfica para visualização das informações de classificação
dos espectros de massas, provenientes do tecido cerebral retirado do paciente durante o ato cirúrgico. Tal interface
contribuirá para o aprimoramento do diagnóstico intraoperatório, além de possibilitar uma análise mais rápida, direta e
precisa de biópsias provenientes de tecido encefálico.
As imagens lipídicas obtidas pela técnica de DESI-MSI e a sua correlação com a classificação histológica são
exibidas na interface de maneira simples e amigável. Constatou-se, no entanto, durante testes realizados, a necessidade
de otimização no processamento dos dados devido ao tempo de espera para geração da primeira imagem da amostra
selecionada. Em relação às predições realizadas pelos modelos, observou-se nos primeiros testes que os algoritmos
armazenaram a predição de cada pixel na memória de maneira exata, demonstrando o quão poderoso um modelo ML
pode ser. Observou-se ainda que a imagem sobreposta obtida por todos os modelos testados (SVM, Random Forest,
Redes Neurais e Lasso) era idêntica, porém com valores de predição diferentes.
Em relação aos requisitos funcionais RF01, RF02 e RF03 (Anexo 1), houve êxito no desenvolvimento das
funcionalidades, porém não foi possível atender todos os itens mencionados nos requisitos específicos. Limitações
relacionadas à infraestrutura, como a estruturação do servidor e os containers utilizados para hospedagem da aplicação
web, implicaram na necessidade de readequação do ambiente e atrasaram o desenvolvimento do item 12, tópico 3 (Anexo
1), não sendo possível desenvolver a função para o recurso de transparência ser aplicado na sobreposição da imagem.
Para construção de um ambiente sólido, optou-se portanto, pela alteração da integração R + PHP, em que o projeto seria
inicialmente desenvolvido, para a utilização do Shiny package, fato que simplificou o processo.
Dado o exposto, os resultados obtidos são considerados satisfatórios e o software passará por ajustes e testes
finais antes de sua implementação em ambiente intraoperatório.

6. REFERÊNCIAS
AZEVEDO, E. Computação Gráfica - Teoria e Prá¡tica: Geração de Imagens. 2nd edição ed. Grupo GEN, 2018.
9788595152427.

BADU-TAWIAH, A. K.; EBERLIN, L. S.; OUYANG, Z.; COOKS, R. G. Chemical aspects of the extractive methods
of ambient ionization mass spectrometry. Annu Rev Phys Chem, 64, p. 481-505, 2013.

BATCHELOR, B. G. Book Review: Digital Image Processing:. SAGE PublicationsSage UK: London, England, 2016-
07-24 2016.

BEMIS, K. A. A mass spectrometry imaging toolbox for statistical analysis - Package Cardinal. 112 p. 2021.
13

BEMIS, K. D.; HARRY, A.; EBERLIN, L. S.; FERREIRA, C. et al. Cardinal: an R package for statistical analysis of
mass spectrometry-based imaging experiments. In: Bioinformatics, 2015. v. 31, p. 2418-2420.

BOSER, B. E.; GUYON, I. M.; VAPNIK, V. N. A training algorithm for optimal margin classifiers | Proceedings of the
fifth annual workshop on Computational learning theory. Proceedings of the fifth annual workshop on Computacional
learning theory, p. 144-152, 1992.

CALLIGARIS, D.; NORTON, I.; FELDMAN, D.; IDE, J. et al. Mass spectrometry imaging as a tool for surgical
decision-making. Journal of mass spectrometry : JMS, 48, n. 11, 2013 Nov 2013.

CODD, E. F. A Relational Model of Data for Large Shared Data Banks. IBM Research Laboratory, San Jose,
California, 1970.

DYER, R. J. T. Learning MySQL and MariaDB. @OReillyMedia, 2015. 9781449362904.

ERIKSSON, J. O.; BROTONS, A. S.; REZELI, M.; SUITS, F. et al. MSIWarp: A General Approach to Mass Alignment
in Mass Spectrometry Imaging. 2020.

FARIA, P. D.; PARGA, J. P. F. A. INTRODUÇÃO À LINGUAGEM R - Seus fundamentos e sua prática. 2021.
586 p. 978650012606-8.

FOUNDATION, F. S. GNU GENERAL PUBLIC LICENSE. p. https://fsf.org/, 2007. Acesso em: 18 de out.2021.

GERMANO, S.; O'DRISCOLL, L. Breast Cancer: Understanding Sensitivity and Resistance to Chemotherapy and
Targeted Therapies to Aid in Personalised Medicine. Current Cancer Drug Targets, 9, n. 3, May 2009 2009. Text.

HO, T. K. Random Decision Forest. Proceedings of the 3rd International Conference on Document Analysis and
Recognition, Montreal, p. 278–282, 1995.

IFA, D. R.; EBERLIN, L. S. Ambient Ionization Mass Spectrometry for Cancer Diagnosis and Surgical Margin
Evaluation. Clinical Chemistry, 62, n. 1, p. 111-123, 2016-01-01 2016.

ISO. ISO/IEC 2382-13:1996(en), Information technology Vocabular Part 13: Computer graphics. 1996.
Disponível em: https://www.iso.org/obp/ui/#iso:std:iso-iec:2382:-13:ed-2:v1:en.

JOHN F. HUGHES, A. V. D., MORGAN MCGUIRE, DAVID F. SKLAR, JAMES D. FOLEY, STEVEN K. FEINER,
KURT AKELEY. Computer Graphics Principles and Practice. Addison-Wesley, 2013. v. Third Edition).
978032139952-6.

NISHANIL. Introdução aos contêineres e ao Docker. 2021. Disponível em: https://docs.microsoft.com/pt-


br/dotnet/architecture/microservices/container-docker-introduction/.

PEDRINI, W. R. S. E. H. Análise de imagens digitais: princípios, algoritmos e aplicações Editora Thomson Learning
Edições Ltda, 2007. 978852210595-3.

PERSIANO, R. C. M.; OLIVEIRA, A. A. F. Introdução a Computação Gráfica. Livros Técnicos e Científicos Editora
Ltda, 2018. 978972722877-5.

PICHETTI, R. F.; VIDA, E. D. S.; CORTES, V. S. M. P. Banco de Dados. Grupo A, 2021. 9786556900186.

RACE, A. M.; STYLES, I. B.; BUNCH, J. Inclusive sharing of mass spectrometry imaging data requires a converter for
all. Journal of Proteomics, 75, n. 16, 2012.

RUSSELL, S.; NOVIG, P. Artificial Intelligence A Modern Approach. Second Edition ed. 2013. 013790395-2.

SANTOSA, F.; SYMES, W. W. Linear Inversion of Band-Limited Reflection Seismograms. 2006-07-14 1986. research-
article.

SAÚDE, A. V. Computação Gráfica e Processamento de Imagens. Editora e Distribuidora Educacional S.A, 2018.
978855221367-3.
14

SHOBHA, G.; RANGASWAMY, S. Chapter 8 - Machine Learning. Handbook of Statistics, 2018.

TODD, J. F. J. Recommendations for nomenclature and symbolism for mass spectroscopy (including an appendix of
terms used in vacuum technology). (Recommendations 1991). Pure and Applied Chemistry, 63, n. 10, p. 1541-1566,
1991.

UDAKA, Y. T.; PACKER, R. J. Pediatric Brain Tumors. Neurologic clinics, 36, n. 3, 2018 Aug 2018.

VELHO, J. G. E. L. Image Processing for Computer Graphics. 1997. 978147572747-0.

WEN, P. Y.; HUSE, J. T. 2016 World Health Organization Classification of Central Nervous System Tumors.
Continuum (Minneapolis, Minn.), 23, n. 6, Neuro-oncology, 2017 Dec 2017.

WU, C.; DILL, A. L.; EBERLIN, L. S.; COOKS, R. G. et al. Mass spectrometry imaging under ambient conditions. Mass
Spectrometry Reviews, 32, n. 3, p. 218-243, 2013.
15

7. ANEXO
Anexo 1 –Documentação de Requisitos de Software
16
17
18

Anexo 2 – Algoritmo Define User Interface


19

Anexo 3 – Algoritmo Define server


20

Você também pode gostar