Você está na página 1de 12

Resumo

Com o advento dos citômetros de fluxo capazes de medir um número crescente de parâmetros,
os cientistas continuam a desenvolver painéis maiores para explorar fenotipicamente as
características de suas amostras celulares. No entanto, esses avanços tecnológicos geram
conjuntos de dados de alta dimensão que se tornam cada vez mais difíceis de analisar
objetivamente dentro dos tradicionais programas de bloqueio manuais. A fim de melhor analisar
e apresentar dados, os cientistas fazem parceria com bioinformáticos com experiência na análise
de dados de alta dimensão para analisar seus dados de citometria de fluxo. Embora esses
métodos tenham se mostrado altamente valiosos no estudo da citometria de fluxo, eles ainda
precisam ser incorporados em um pacote direto e fácil de usar para cientistas que não possuem
experiência computacional ou de programação. Para atender a essa necessidade,
desenvolvemos o ExCYT, uma Interface Gráfica do Usuário (GUI) baseada em MATLAB que
otimiza a análise de dados de citometria de fluxo de alta dimensão implementando técnicas
analíticas comumente empregadas para dados de alta dimensão, incluindo redução de
dimensionalidade por t-SNE. uma variedade de métodos automatizados e manuais de
agrupamento, heatmaps e novos fluxogramas de alta dimensão. Além disso, o ExCYT fornece
opções tradicionais de seleção de populações selecionadas de interesse para mais análises de t-
SNE e agrupamento, bem como a capacidade de aplicar portas diretamente nos gráficos t-SNE.
O software oferece a vantagem adicional de trabalhar com arquivos FCS compensados ou não.
No caso de ser necessária uma compensação pós-aquisição, o usuário pode optar por fornecer
ao programa um diretório de manchas únicas e uma amostra sem mancha. O programa detecta
eventos positivos em todos os canais e usa esses dados selecionados para calcular mais
objetivamente a matriz de compensação. Em resumo, o ExCYT fornece um pipeline de análise
abrangente para obter dados de citometria de fluxo na forma de arquivos FCS e permitir que
qualquer indivíduo, independentemente do treinamento computacional, use as mais recentes
abordagens algorítmicas para entender seus dados.
Introdução
Os avanços na citometria de fluxo e no advento da citometria de massa permitiram que médicos
e cientistas identificassem rapidamente e caracterizassem fenotipicamente amostras
biologicamente e clinicamente interessantes com novos níveis de resolução, criando grandes
conjuntos de dados de alta dimensão que são ricos em informações. Embora os métodos
convencionais para analisar dados de citometria de fluxo, como o gating manual, tenham sido
mais simples em experimentos onde há poucos marcadores e esses marcadores tenham
populações visualmente discerníveis, essa abordagem pode falhar na geração de resultados
reprodutíveis ao analisar conjuntos de dados de dimensões maiores ou com marcadores
coloração em um espectro. Por exemplo, em um estudo multiinstitucional, onde ensaios de
coloração intracelular (ICS) estavam sendo realizados para avaliar a reprodutibilidade da
quantificação de respostas de células T específicas de antígeno, apesar da boa precisão
interlaboratorial, a análise, particularmente gating, introduziu uma fonte significativa de
variabilidade. Além disso, o processo de administrar manualmente a população de interesses,
além de ser altamente subjetivo, consome muito tempo e exige muito trabalho. No entanto, o
problema de analisar conjuntos de dados de alta dimensão de maneira robusta, eficiente e
oportuna não é novidade para as ciências da pesquisa. Estudos de expressão gênica geralmente
geram conjuntos de dados de dimensões extremamente altas (geralmente da ordem de centenas
de genes), onde formas manuais de análise seriam simplesmente inviáveis. A fim de abordar a
análise desses conjuntos de dados, tem havido muito trabalho no desenvolvimento de
ferramentas de bioinformática para analisar a expressão gênica. dados. Essas abordagens
algorítmicas acabam de ser adotadas recentemente na análise de dados de citometria à medida
que o número de parâmetros aumentou e provaram ser inestimáveis na análise desses conjuntos
de dados de alta dimensionalidade.
Apesar da geração e aplicação de uma variedade de algoritmos e pacotes de software que
permitem aos cientistas aplicar essas abordagens de bioinformática de alta dimensão aos seus
dados de citometria de fluxo, essas técnicas analíticas ainda permanecem em grande parte não
utilizadas. Embora possa haver uma variedade de fatores que limitaram a ampla adoção dessas
abordagens aos dados de citometria, o maior obstáculo que suspeitamos no uso dessas
abordagens pelos cientistas é a falta de conhecimento computacional. Na verdade, muitos
desses pacotes de software (por exemplo, flowCore, flowMeans e OpenCyto) são escritos para
serem implementados em linguagens de programação, como R, que ainda exigem
conhecimento substancial de programação. Pacotes de software como o FlowJo são populares
entre os cientistas devido à simplicidade de uso e à natureza 'plug-and-play', além da
compatibilidade com o sistema operacional do PC. A fim de fornecer a variedade de técnicas
analíticas aceitas e valiosas para o cientista programação desconhecida, desenvolvemos
ExCYT, uma interface gráfica do usuário (GUI) que pode ser facilmente instalado em um PC /
Mac que puxa muitas das técnicas mais recentes, incluindo a dimensionalidade redução para
visualização intuitiva, uma variedade de métodos de agrupamento citados na literatura,
juntamente com novos recursos para explorar a saída desses algoritmos de agrupamento com
heatmaps e novos gráficos de fluxo / caixa de alta dimensão.
O ExCYT é uma interface gráfica do usuário construída em MATLAB e, portanto, pode ser
executada diretamente no MATLAB ou é fornecido um instalador que pode ser usado para
instalar o software em qualquer PC / Mac. O software está disponível em
https://github.com/sidhomj/ExCYT. Apresentamos um protocolo detalhado de como importar
dados, pré-processá-los, realizar redução de dimensionalidade de t-SNE, agrupar dados,
classificar e filtrar clusters com base nas preferências do usuário e exibir informações sobre os
clusters de interesse via heatmaps e novo fluxo de alta dimensão / box parcelas (Figura 1). Os
eixos nos gráficos t-SNE são arbitrários e em unidades arbitrárias e, como tal, nem sempre são
mostrados nas figuras para simplificar a interface do usuário. A coloração dos pontos de dados
nos "Heatmaps t-SNE" é de azul para amarelo com base no sinal do marcador indicado. Em
soluções de clustering, a cor do ponto de dados é baseada arbitrariamente no número do cluster.
Todas as partes do fluxo de trabalho podem ser executadas na GUI de painel único (Figura 2 e
Tabela 1). Finalmente, demonstraremos o uso do ExCYT em dados previamente publicados
explorando o panorama imunológico do carcinoma de células renais na literatura, também
analisados com métodos semelhantes. O conjunto de dados de amostra que usamos para criar
as figuras neste manuscrito, juntamente com o protocolo abaixo, pode ser encontrado em
https://premium.cytobank.org/cytobank/projects/875, ao registrar uma conta.
1. Coletando e Preparando Dados de Citometria
1. Coloque todas as manchas individuais em uma pasta sozinha e rotule pelo nome do canal
(por fluoróforo, não marcador).
2. Importação de Dados e Pré-Processamento
1. Para pausar ou salvar ao longo desse pipeline de análise, use o botão Save Workspace no
canto inferior esquerdo do programa para salvar o workspace como um arquivo ".MAT" que
pode ser carregado posteriormente através do botão Load Workspace. Não execute mais de uma
instância do programa por vez. Portanto, ao carregar um novo espaço de trabalho, certifique-se
de verificar se não há outra instância do ExCYT em execução.
2. Para iniciar o pipeline de análise, primeiro selecione o tipo de citometria (Citometria de Fluxo
ou Citometria de Massa - CYTOF), sob os Parâmetros de Seleção de Arquivo, selecione o
número de eventos a serem amostrados do arquivo (para este exemplo use 2000). Uma vez que
os dados foram importados com sucesso, uma caixa de diálogo irá aparecer informando ao
usuário que os dados foram importados com sucesso.
3. Pressione o botão Auto-Compensation (Compensação Automática) para realizar uma etapa
opcional de auto-compensação, conforme feito pela Bagwell & Adams9. Selecione o diretório
contendo manchas únicas. Selecione a amostra não manchada na caixa de diálogo da interface
do usuário.
1. Coloque um gate de dispersão frontal / lateral em qualquer uma das amostras neste diretório
que será usado para selecionar eventos para calcular a matriz de compensação. Recomenda-se
usar a amostra não corada para este propósito. Neste ponto, um algoritmo foi implementado
para definir limites consistentes no percentil 99 da amostra não corada para definir eventos
positivos em cada uma das manchas únicas para calcular a matriz de compensação. Quando
isso terminar, uma caixa de diálogo informará ao usuário que a compensação foi executada.
4. Em seguida, pressione Gate Population e selecione as populações de células de interesse,
como é a convenção em análises de citometria de fluxo. Quando a população de células for
selecionada, insira o número de porcentagens de análise de eventos a jusante (nesses 10000
eventos). 5. Em seguida, selecione o número de canais a serem usados para análise na caixa de
listagem na extrema direita da caixa de pré-processamento (use os canais específicos mostrados
no exemplo).
3. Análise do t-SNE
1. Pressione o botão t-SNE para que o programa comece a calcular o conjunto de dados de
dimensionalidade reduzida para visualização na janela abaixo do botão t-SNE. Para salvar a
imagem do t-SNE, pressione Salvar imagem TSNE. Em uma máquina com 8 CPUs a 3,4 GHz
cada e 8 GM RAM, essa etapa deve levar cerca de 2 minutos para 10.000 eventos, 10 minutos
para 50.000 eventos e 20 minutos para 100.000 eventos. 2. Para criar um 'heatmap t-SNE', como
visto em várias publicações CYTOF10,11, selecione uma opção no menu pop-up Marcador-
específico T-SNE (use os marcadores específicos CD64 ou CD3 como mostrado no exemplo)
. Uma figura aparecerá mostrando uma representação de mapa de calor do gráfico t-SNE que
pode ser salvo para geração de figura. 3. Selecione as áreas de interesse nos gráficos t-SNE pelo
usuário para análises posteriores usando o botão Gate t-SNE.
4. Análise de Cluster
1. Para iniciar a análise de cluster, selecione uma opção na caixa de listagem Método de Cluster
(neste exemplo, us DBSCAN com um fator de distância de 5 na caixa de diálogo à direita da
caixa de listagem). Pressione o botão Cluster.
2. Use uma das seguintes opções para algoritmos de agrupamento automatizado encontrados
no painel "Parâmetros automatizados de agrupamento":
1. KMEANS Duro (no t-SNE): Aplique o k-means clustering aos dados bidimensionais
reduzidos do t-SNE e requer que o número de clusters seja fornecido ao algoritmo12.
2. KMEANS Duro (em Dados HD): Aplique o k-means clustering aos dados originais de alta
dimensão que foram dados ao algoritmo t-SNE. Mais uma vez, o número de clusters precisa ser
fornecido ao algoritmo.
3. DBSCAN: Aplique o método de clustering de clustering, chamado Clustering Espacial
Baseado em Densidade de Aplicativos com Noise13 que agrupa os dados t-SNE bidimensionais
reduzidos e requer um fator de distância não-dimensional que determina o tamanho geral dos
clusters. Este tipo de algoritmo de clustering é bem adequado para agrupar a redução de t-SNE,
já que é capaz de agrupar cluster não-esferoidal que frequentemente estão presentes na
representação reduzida de t-SNE. Além disso, devido ao fato de operar com dados
bidimensionais, é um dos algoritmos de cluster mais rápidos.
4. Agrupamento Hierárquico: Aplique o método de agrupamento hierárquico convencional aos
dados de alta dimensão onde toda a matriz de distância Euclideana é calculada entre todos os
eventos antes de fornecer ao algoritmo um fator de distância que define o tamanho do cluster.
5. Baseado em gráfico de rede: Aplique um método de clustering que tenha sido introduzido
mais recentemente na análise de dados de citometria de fluxo quando houver subpopulações
raras que o usuário queira detectar11,14. Esse método depende primeiro da criação de um
gráfico que determina as conexões entre todos os eventos nos dados. Esta etapa consiste em
fornecer um parâmetro inicial para criar o gráfico, que é o número de k vizinhos mais próximos.
Esse parâmetro geralmente governa o tamanho dos clusters. Nesse ponto, outra caixa de diálogo
aparece solicitando ao usuário que empregue um dos 5 algoritmos de agrupamento aplicados
ao gráfico. Estes incluem 3 opções para maximizar a modularidade do gráfico, o Método Danon
e um algoritmo de agrupamento espectral14,15,16,17,18. Se alguém quiser uma solução de
clustering geralmente mais rápida, recomendamos o Spectral Clustering ou o Fast Greedy
Modularity Maximization. Enquanto os métodos de maximização da modularidade, juntamente
com o método Danon, determinam o número ideal de clusters, o Cluster espectral exige que o
número de clusters seja fornecido ao programa.
6. Mapa Auto-Organizado: Empregue uma rede neural artificial para agrupar os dados de alta
dimensão. 7. GMM - Maximização de Expectativas: Crie um Modelo Gaussiano de Mistura
usando a técnica de Maximização de Expectativas (EM) para agrupar os dados de alta
dimensão.19 Esse tipo de método de cluster também requer que o usuário insira o número de
clusters. 8. Inferência Bayesiana Variacional para GMM: Crie um Modelo Gaussiano de
Mistura, mas ao contrário do EM, ele pode determinar automaticamente o número dos
componentes da mistura k.20 Embora o programa exija um número de clusters a serem dados
(maior que o número esperado de clusters ), o algoritmo determinará o número ideal sozinho.
3. Para estudar uma área específica do gráfico t-SNE, pressione o botão Selecionar Cluster
Manualmente para desenhar um conjunto de clusters definidos pelo usuário. De nota, os clusters
não podem compartilhar membros (ou seja, cada evento só pode pertencer a um cluster).
5. Filtragem de Cluster
1. Conjunto (s) de clusters identificados manualmente ou através de um dos métodos
automáticos descritos acima podem ser filtrados da seguinte forma.
1. Para classificar clusters (no painel Filtro de Cluster) por qualquer um dos marcadores
medidos na experiência, selecione uma opção no menu pop-up Classificar. Para definir se o
pedido é crescente ou decrescente, pressione o botão Crescente / Decrescente à direita do menu
pop-up Classificar. Isso atualizará a lista de clusters na caixa de listagem "Clusters (Filtration)"
e os reordenará em ordem decrescente de expressão de cluster mediana desse marcador. A
porcentagem denotada na caixa de listagem "Clusters (Filtragem)" indica a porcentagem da
população que esse cluster representa.
2. Para definir um valor limite mínimo para um determinado cluster em um determinado canal,
selecione uma opção no menu pop-up Threshold (neste exemplo, o marcador CD65 e defina
um limite em 0.75). Digite um valor na caixa numérica abaixo do gráfico ou use a barra
deslizante para definir um limite. Quando o limite estiver definido, pressione Adicionar Acima
do Limite ou Adicionar Abaixo do Limite para especificar a direção do limite. Depois que esse
limite for definido, ele será listado na caixa Limites ao lado do painel "Filtro de cluster", no
qual o marcador, o valor do limite e a direção serão listados, para que o usuário saiba quais
limites estão sendo aplicados. Por fim, a plotagem tSNE será atualizada desfocando os clusters
que não atendem aos requisitos da filtragem e a caixa de listagem "Clusters (Filtragem)" será
atualizada para mostrar os clusters que atendem aos requisitos de filtragem.
3. Para definir um limite mínimo para a frequência de um cluster, insira um limite numérico na
caixa Limite de Freqüência do Cluster (%) no painel Filtro de Cluster (neste exemplo, use 1%).
6. Análise e visualização de cluster
1. Para selecionar clusters para análise e visualização adicionais, selecione clusters em Clusters
(Filtration) listbox e pressione o botão Select à para movê-los para a caixa de listagem Cluster
Analyze.
2. Para criar heatmaps de clusters, selecione os clusters de interesse na caixa de listagem Cluster
Analyze e pressione o botão HeatMap of Clusters. Quando este botão é pressionado, uma figura
irá aparecer contendo um mapa de calor juntamente com dendrogramas no cluster e nos eixos
dos parâmetros. O dendrograma no eixo vertical agrupará os agrupamentos por aqueles que
estão intimamente relacionados, enquanto o dendrograma no eixo horizontal agrupará os
marcadores que estão associados. Para salvar o mapa de calor, pressione Arquivo | Exportar
configuração | Exportar.
3. Para criar um "Gráfico de caixa de alta dimensão" ou "Gráfico de fluxo de alta dimensão",
selecione os grupos de interesse na caixa de listagem Análise de cluster e pressione o botão
Gráfico de caixa dimensional alto ou o botão Gráfico de fluxo dimensional alto. Esses gráficos
podem ser usados para avaliar visualmente a distribuição de determinados canais de vários
clusters em todas as dimensões.
4. Para mostrar clusters em gráficos de fluxo 2D tradicionais, selecione a transformação (linear,
log10, arcsinh) e canal no painel Fluxo Convencional e pressione Gráfico de Fluxo
Convencional.
Resultados representativos
Para testar a usabilidade do ExCYT, analisamos um conjunto de dados curadoria publicado por
Chevrier et al. intitulado 'Um Atlas Imune de Carcinoma Renal de Células Claras', onde o grupo
conduziu a análise de CyTOF com um extenso painel imunológico em amostras de tumores
retiradas de 73 pacientes11. Dois painéis separados, um painel mielóide e linfóide, foram
usados para caracterizar fenotipicamente o microambiente tumoral. O objetivo do nosso estudo
foi recapitular os resultados de seu t-SNE e análise de cluster, mostrando que ExCYT poderia
ser usado para chegar às mesmas conclusões, bem como mostrar métodos adicionais de
visualização e análise de cluster.
Para testar a usabilidade do ExCYT, analisamos um conjunto de dados curadoria publicado por
Chevrier et al. intitulado 'Um Atlas Imune de Carcinoma Renal de Células Claras', onde o grupo
conduziu a análise de CyTOF com um extenso painel imunológico em amostras de tumores
retiradas de 73 pacientes11. Dois painéis separados, um painel mielóide e linfóide, foram
usados para caracterizar fenotipicamente o microambiente tumoral. O objetivo do nosso estudo
foi recapitular os resultados de seu t-SNE e análise de cluster, mostrando que ExCYT poderia
ser usado para chegar às mesmas conclusões, bem como mostrar métodos adicionais de
visualização e análise de cluster.
No manuscrito original, o grupo descreveu 22 agrupamentos de células T identificados pelo
painel linfóide e 17 agrupamentos de células identificados pelo painel mieloide. Na Figura 3 e
na Figura 4 da publicação, o grupo mostra heatmaps de clusters, gráficos t-SNE com soluções
de clustering codificadas por cores e heatmaps tSNE nos subpainéis A, B e C. Para realizar a
análise, obtivemos o manualmente dados controlados do Cytobank e amostra 2000 eventos de
cada arquivo ou levou o arquivo inteiro se tivesse menos de 2000 eventos, seguindo o pipeline
de análise ilustrado no manuscrito original. Neste ponto, amostramos um total de 100.000
eventos através do nosso parâmetro de subamostragem pós-gate, realizado a análise t-SNE, e
usamos uma variedade de métodos de clustering para explorar os dados de várias maneiras.
Primeiro, examinamos o painel mieloide seguindo o mesmo pipeline de análise do manuscrito
original, completando a análise do t-SNE e criando heatmaps dos vários marcadores (Figura
3A). Enquanto o manuscrito original normalizou os heatmaps do t-SNE para o 99º percentil de
cada marcador, o ExCYT não faz esse tipo de normalização para seus heatmaps. No entanto,
distribuições semelhantes de co-expressão de marcadores foram observadas como descrito no
manuscrito original. Em seguida, aplicamos um método baseado em gráfico de rede para
agrupar os dados criando o gráfico com 100 k vizinhos mais próximos e agrupando o gráfico
otimizando a modularidade do gráfico usando a implementação do Fast-Greedy no ExCYT,
onde encontramos 19 sub-registros populações de células (Figura 3B). Ao comparar o mapa de
calor desses clusters criados pelo ExCYT com o mapa de calor publicado no manuscrito
original, notamos que fomos capazes de identificar aglomerados similares de células mieloides
(Figura 3C). É digno de nota que o manuscrito original identificou e contrastou duas sub-
populações de células mielóides que identificamos em nossa análise definida por
HLADRintCD68intCD64intCD36 + CD11b + (Cluster 13) e HLA-DR + CD4 + CD68 + CD64
+ CD36-CD11b- (Cluster 18) . A visualização por gráfico de caixa de alta dimensão dessas
duas populações revelou diferenças estatisticamente significantes (Mann-Whitney) nos seis
marcadores mencionados (Figura 1D).
Em seguida, analisamos o painel linfóide com uma abordagem de agrupamento hierárquico
mais convencional e mais rápida. Esta abordagem produziu distribuições de marcadores
semelhantes através de heatmaps t-SNE (Figura 4A). Além disso, o agrupamento dos dados via
agrupamento hierárquico (Figura 4B) demonstrou agrupamentos semelhantes de células
linfóides (Figura 4C). É importante ressaltar que também identificamos a população única de
células T reguladoras do manuscrito original, definida como CD4 + CD25 + Foxp3 + CTLA-4
+ CD127- (Cluster 17) por meio de nosso diagrama de fluxo de alta dimensão (Figura 4D).
Por fim, queríamos empregar um método dentro do ExCYT para avaliar de forma rápida e
quantitativa as associações entre os marcadores. Começamos usando um algoritmo de
clustering hard-k para estabelecer 5000 clusters nos dados bidimensionais do t-SNE (Figura
4E). Em seguida, usamos a expressão mediana de todos os marcadores de todos esses clusters
para criar um mapa de calor desses clusters (Figura 4F). Como esses heatmaps agrupam linhas,
bem como colunas semelhantes, esse método de abstração de dados, aplicando uma malha fina
de clusters e, em seguida, criando um mapa de calor, permite obter co-associações facilmente,
como a co-associação de Tim- 3, PD-1, CD38 e 4-1BB.

Figura 1: Pipeline e Recursos ExCYT. (A) ExCYT começa importando dados brutos do FCS,
aplicando compensação opcional, gating e subamostragem aleatória antes da análise
downstream. Isso garante que todos os eventos que estão sendo analisados sejam relevantes
para o experimento que está sendo analisado. A redução de dimensionalidade do t-SNE é então
realizada para visualizar todos os eventos e os heatmaps t-SNE podem ser gerados para
visualizar as distribuições fenotípicas. Finalmente, uma variedade de algoritmos de clustering
pode ser aplicada na transformação t-SNE ou em dados brutos de alta dimensão. (B) Novos
recursos de classificação e limite permitem que os usuários classifiquem rapidamente possíveis
centenas de clusters para encontrar aqueles de interesse. (C) Heatmaps de clusters podem ser
criados para examinar como vários clusters se comparam entre si, bem como quais marcadores
co-associam. (D) Novos gráficos de fluxo / caixa de alta dimensão podem ser gerados como
uma forma de clusters de contra-indicação em dados originais enquanto se aprecia a natureza
de alta dimensionalidade dos dados.

Figura 2: Interface gráfica do usuário ExCYT: A interface gráfica do usuário ExCYT permite
um fluxo de trabalho simplificado trabalhando da esquerda para a direita do painel à medida
que o usuário importa seus dados, conduz a redução de dimensionalidade t-SNE, clustering e
análise final de cluster e visualização .
Figura 3: Recapitulação de subpopulações mielóides de Chevrier et al. (A) Mapa térmico t-SNE
do painel mieloide (B) Gráfico t-SNE da cor do painel mieloide codificado pelo algoritmo de
agrupamento Network-Graph (C) Mapa térmico de aglomerados identificados por solução de
agrupamento no painel mieloide (D) Gráfico box comparativo de alta dimensão comparação de
subpopulações mieloides contrastantes (Clusters 13 e 18) referenciadas no manuscrito original.
Figura 4: Recapitulação de Sub-Populações Linfóides de Chevrier et al. (A) Heatmaps t-SNE
do painel linfóide (B) plotagem t-SNE da cor do painel linfóide codificada pelo algoritmo de
agrupamento hierárquico (C) Mapa de calor dos aglomerados identificados pela solução de
agrupamento no painel linfático (D) População de células T (Cluster 17) no manuscrito original
(E) Solução de agrupamento de 5000 k de análise de cluster k-means em dados de t-SNE (F)
Mapa térmico de aglomerados identificados por k-means clustering em painel linfóide
mostrando co-associações de marcadores.
Discussão
Aqui apresentamos ExCYT, uma nova interface gráfica de usuário executando algoritmos
baseados em MATLAB para agilizar a análise de dados de citometria de alta dimensão,
permitindo que pessoas sem experiência em programação implementem os mais recentes
algoritmos de análise de dados de alta dimensão. A disponibilidade deste software para a
comunidade científica mais ampla permitirá que os cientistas explorem seus dados de citometria
de fluxo em um fluxo de trabalho intuitivo e direto. Através da redução da dimensionalidade
do t-SNE, aplicando um método de agrupamento, sendo capaz de classificar / filtrar
rapidamente esses agrupamentos, e criar mapas de calor flexíveis e personalizáveis, os cientistas
serão capazes de não apenas entender as subpopulações definidas de forma única em suas
amostras, mas será capaz de criar visualizações que sejam intuitivas e facilmente entendidas
por seus colegas.
Embora o programa seja flexível no manuseio de uma variedade de tipos de dados (citometria
de fluxo convencional versus citometria de massa), existem algumas considerações para a
utilidade ideal do programa. O primeiro deles diz respeito à qualidade dos dados,
especificamente dos dados de citometria de fluxo. Compensação adequada e resolução de
espectros de emissão sobrepostos é de suma importância. Dados mal compensados podem
inadvertidamente levar a falsas co-associações de marcadores e formação de agrupamentos que
não são de significância biológica verdadeira. Portanto, é altamente recomendável que os dados
de entrada sejam de qualidade de som antes de prosseguir com a análise do t-SNE e posterior
análise a jusante. Além disso, o uso do algoritmo de compensação automática implementado
no ExCYT requer claras manchas únicas para todos os canais, a fim de calcular com precisão
os parâmetros de compensação.
Outra consideração importante para o uso do ExCYT é quando a concatenação de vários
arquivos FCS em uma análise (conforme demonstrado neste manuscrito), eles devem ser
comparáveis em todos os canais. Primeiro, isso significa que o mesmo painel precisa ser usado
em todas as amostras e que não há desvio entre as amostras em todos os canais. Por exemplo,
se alguém lesse duas amostras em dias separados e tingisse CD8 em FITC em ambos os dias,
mas a voltagem do citômetro fosse ajustada diferentemente em um dia resultando em uma
população CD8 levemente deslocada, poderia gerar clusters falsos na análise a jusante , como
esta mudança foi gerada em função da variação do instrumento e não devido a significância
biológica. Embora versões futuras do ExCYT possam normalizar amostras para suas manchas
únicas, neste ponto, deve-se considerar cuidadosamente que os arquivos FCS podem ser
comparados entre si antes de importá-los para o ExCYT.
Finalmente, o processo de agrupamento não é absoluto / rígido. Diferentes algoritmos e
parâmetros de clustering podem gerar diferentes soluções de clustering. Se a solução do
algoritmo é apropriada é para o usuário determinar sintetizando sua compreensão da biologia
com a solução de clustering. Por exemplo, quando se compreende o ambiente imunológico dos
tumores, pode-se estar interessado em aglomerados macroscópicos (isto é, células T vs células
B vs células mielóides) enquanto outro pode estar interessado em subpopulações de
aglomerados macroscópicos. A resolução dos clusters é determinada pelo usuário e, portanto,
nenhuma solução de cluster é "correta". Esta é uma das principais vantagens de usar os gráficos
de fluxo de alta dimensão disponíveis no ExCYT. A capacidade de visualizar a distribuição de
um determinado cluster em todos os canais pode ajudar o usuário a determinar se eles estão
agrupados não apenas de uma maneira biologicamente relevante, mas de uma maneira que é
relevante para a pergunta científica que está sendo feita no experimento. Embora nosso objetivo
seja fornecer uma infinidade de métodos usados na literatura para agrupar dados de citometria
de fluxo de alta dimensão e fornecer métodos adicionais de agrupamento, recomendamos o uso
de métodos como k-means e DBSCAN para explorar os dados por meio de iteração rápida no
número do cluster. e tamanho e passar para abordagens de gráfico de rede e modelo gaussiano
para abordagens mais robustas, mas mais demoradas.
Dadas essas considerações, o ExCYT ainda é uma ferramenta altamente flexível e valiosa para
explorar dados de citometria de alta dimensionalidade e oferece recursos exclusivos /
diferenciadores do que outros pacotes disponíveis disponíveis para realizar esse tipo de análise
(Tabela 2). Primeiro, o ExCYT se diferencia na maioria das abordagens de análise de citometria
de fluxo utilizando algoritmos de redução de dimensionalidade e de cluster pela sua capacidade
de ser usado sem qualquer conhecimento de script / programação. Além disso, ao agregar
muitos algoritmos de clustering citados ao longo da literatura, acreditamos que fornecemos
mais opções para dados de clustering. Finalmente, nossa característica exclusiva de filtragem e
classificação de clusters, juntamente com a exibição por meio de novos fluxogramas de alta
dimensionalidade, permite que os usuários explorem as características de seus clusters de forma
rápida e eficiente, tornando o processo de "descoberta" de subpopulações simples e eficiente.

Você também pode gostar