Escolar Documentos
Profissional Documentos
Cultura Documentos
simuladas que utilizaremos ao longo do artigo. Na enquanto a resolução de massa média das
§3 descrevemos a abordagem adotada para obter o 6
partículas bárions é 1, 4 × 10 𝑀. A parte
melhor pipeline para prever os parâmetros do DM
hidrodinâmica da simulação inclui receitas
da galáxia e as métricas de desempenho usadas
atualizadas para formação e evolução estelar,
para avaliar a precisão dessas previsões. No §4
enriquecimento químico, resfriamento e feedbacks
discutimos os resultados obtidos em nossas
(Weinberger et al. 2017; Pillepich et al. 2018b;
análises. Em particular, avaliamos a exatidão e
Nelson et al. 2018). Também é responsável pelo
precisão das quantidades previstas e realizamos
feedback AGN (Weinberger et al. 2017) e pelo
uma análise de importância do recurso.
modelo de ventos galácticos (Pillepich et al.
Finalmente, no §5 tiramos as conclusões e
2018b), imitando o feedback de supernovas.
discutimos as perspectivas futuras.
A simulação evolui a partir das condições iniciais,
começando no redshift 𝑧 = 127, até 𝑧 = 0 e 136
2 DADOS SINTÉTICOS instantâneos de saída estarem disponíveis. Para
Conforme mencionado no §1, neste trabalho este trabalho, usamos apenas o instantâneo 𝑧 = 0,
usamos dados sintéticos da simulação onde o catálogo de objetos inclui 1.048.574
IllustrisTNG-100 (TNG100, doravante) para os subestruturas. Entre estes, para nossa análise
quais tanto as quantidades bariônicas (ver também selecionamos todas as subestruturas
§2.3) quanto às propriedades dos halos de matéria correspondentes a SubHalos selecionados por
escura (ver também §2.2) são fornecidos. amigos de amigos (FoF), tendo “galáxias” com
massa DM e tamanhos DM maiores que zero e
Na nossa abordagem, as quantidades bariônicas 8
10 𝑀⊙
são as “características”, ou seja, as entradas de massas estelares 𝑀* (𝑧 = 0) > ℎ
. O
entrada das ferramentas de ML, enquanto as número de SubHalos selecionados em nosso
propriedades do halo escuro são os “alvos”, ou catálogo é 43.379, correspondendo ao mesmo
seja, as quantidades que as ferramentas de ML número de SubHalos, no TNG. Doravante nos
precisam prever para cada galáxia correspondente referiremos a esses objetos como “galáxias”1.
a uma determinada entrada.
Abaixo apresentamos detalhes da simulação e o
catálogo de ‘features’ e ‘targets’ de galáxias 2.2 Metas
extraídas do TNG100. Começamos definindo os alvos, ou seja, as
quantidades que queremos prever e que
representam a saída do algoritmo de ML.
2.1 Simulação e catálogo de galáxias Conforme esclarecido anteriormente, neste
A simulação TNG100 é uma simulação trabalho estamos interessados nas propriedades
cosmológica magneto-hidrodinâmica usando um DM das galáxias. A saída do TNG100 fornece
volume móvel de 106, 5 𝑀𝑝𝑐 lado a lado. Os informações separadamente sobre diferentes
parâmetros cosmológicos são definidos de acordo espécies de matéria. No catálogo completo, essas
com Planck 2015 (Ade et al. 2016), ou seja, diferentes espécies de matéria são divididas em
ΩΛ = 0, 6911, Ω𝑚 = 0, 3089, Ω𝑏 = 0, 0486 𝑒 𝐻 grupos denotados por Tipo i, onde i=0, ..., 5
correspondem respectivamente a: gás, MS,
.
traçadores, estrelas + partículas de vento e
3
A simulação contém 1. 820 partículas de
3
matéria escura, 1. 820 células hidrodinâmicas e
1
3 Further details on the TNG100 data can be found on
1. 820 partículas traçadoras de Monte Carlo, com https://www.tngproject.org/data/docs/specifications
buracos negros2. O catálogo TNG100 nos fornece • P4: Banda 𝐾 de Johnson-Bessel (𝜆 = 2,22 𝜇𝑚);
as seguintes quantidades de DM (Tipo_1):
• P5: banda SDSS 𝑔 (𝜆 = 0,469 𝜇𝑚);
• T1: Matéria DM total. No catálogo TNG100
• P6: banda SDSS 𝑟 (𝜆 = 0,617 𝜇𝑚);
este é o parâmetro SubhaloMass. Denotamos este
alvo como 𝑀DM e é dado em unidades de • P7: banda SDSS 𝑖 (𝜆 = 0,748 𝜇𝑚);
10
(10 𝑀⊙)/ℎ; • P8: banda SDSS 𝑧 (𝜆 = 0,893 𝜇𝑚);
4
No domínio alvo, T1 está fortemente
Note-se que no cenário plausível de perfis de dispersão de
velocidade quase constante, a abertura tem um efeito mínimo correlacionado com T2, enquanto T3 está
na estimativa global 1D, em relação a outros efeitos como o fortemente correlacionado com T4, mas esses dois
amolecimento gravitacional que pode impactar fortemente as grupos estão levemente correlacionados entre
órbitas estelares em torno dos centros das galáxias (De Rijcke
et al. 2019). eles. Isto é bastante surpreendente, pois é
esperado, que a matéria MS total (T1) deva estar inicial dos do tipo tardio na análise atual, a
correlacionada com a massa dentro de alguns correlação geral pode ser enfraquecida (de forma
raios dados (por exemplo, massa MS dentro do semelhante ao que foi comentado para os raios
raio de meia massa estelar, T3), pois quanto maior escuros e luminosos). Finalmente, as
for a massa total, quanto maior deve ser a massa características cinemáticas estão fortemente
em todos os raios. Por outro lado, as simulações correlacionadas entre elas e estão fortemente
parecem mostrar que existe uma correlação mais correlacionadas positivamente com as massas (S1,
estreita entre o MS total e o meio raio do DM, S3 e S4) e a fotometria. Isso significa que as
denotando a presença de uma relação de escala simulações podem reproduzir outras relações
tamanho-massa para o componente MS. Notamos clássicas de escala para galáxias, correlacionando
também que, uma vez que existe uma correlação luminosidade (e massas) com a velocidade de
fraca entre este último com o raio comovente rotação de galáxias do tipo tardio (a chamada
contendo metade da massa estelar (S1), podemos relação Tully-Fisher, ver, por exemplo, ref;
interpretar a correlação mais fraca entre T1 e também em sua forma bariônica, ver por exemplo,
ambos T3 e T4, como consequência da fraca McGaugh 2012; McGaugh & Schombert 2015) ou
correlação entre os raios de meia massa escuro luminosidade e dispersão de velocidade (a
(T2) e estelar (S2). Este último é interessante chamada relação Faber-Jackson, ver, por exemplo,
porque pode refletir a variação devido à Faber & Jackson 1976; Hyde & Bernardi 2009a).
combinação de diferentes populações de galáxias, Ressaltamos aqui que não estamos interessados
por ex. galáxias de tipo inicial e tardio (ver, por em verificar se as simulações estão reproduzindo
exemplo, Huang et al. 2017; Zanisi et al. 2020), corretamente as relações observadas, pois isso
que não tentamos separar neste trabalho, mas implicaria ter um conjunto completo de
investigaremos no próximo artigo (Wu et al., em observações simuladas realistas das propriedades
preparação). da galáxia, que serão abordadas em análises
futuras. Aqui queremos verificar se, dados alguns
O grupo de feições fotométricas apresenta forte
observáveis definidos nas simulações e
correlação positiva entre elas, o que é óbvio, pois
reproduzindo corretamente a existência de
todas estão conectadas via distribuição de energia
correlações em galáxias reais, é possível fazer
espectral de galáxias (SED), definindo suas
previsões corretas das propriedades DM
populações estelares (ver, por exemplo, Bruzual &
desconhecidas das galáxias, de forma consistente.
Charlot 2003; Vazdekis et al. 2012). Pela mesma
razão, vemos uma forte anti-correlação entre as Concluímos esta primeira inspeção visual das
características fotométricas e as massas estelares5 correlações entre características e alvos, notando
S3 e S4, que codifica as razões massa-luz estelar que nenhuma característica apresenta uma
das populações estelares. Por outro lado, a correlação muito estreita com os alvos. Se
correlação entre a fotometria e o raio da meia existisse uma correlação tão estreita, então seria
massa estelar é mais fraca (∼ −0,3), mas possível usar essa correlação única para fazer
semelhante em magnitude àquela entre as massas previsões diretas do DM nas galáxias. Por outro
estelares e o mesmo S2 (∼0,4). Isto significa que lado, esperamos que combinando as informações
as conhecidas relações tamanho-luminosidade e de diferentes características, um algoritmo de ML
tamanho-massa (ver, por exemplo, Baldry et al. possa “interpolar” essas correlações e obter
2012, Roy et al. 2018) são reproduzidas pelas valores precisos para os diferentes alvos.
simulações, mas as suas correlações são menos Para avaliar a relevância de cada grupo na
significativas do que outras. Uma razão para uma predição das características do DM, realizaremos
correlação tamanho-massa mais pobre é que estas quatro análises. Primeiro, analisamos como cada
têm inclinações diferentes em diferentes tipos de grupo individualmente pode ser usado para prever
galáxias. Como não separamos os sistemas do tipo características do DM e, finalmente, combinamos
5
Observe que o sinal da correlação entre massas e magnitude todos os grupos em uma análise conjunta.
é sempre invertido porque galáxias mais massivas também
são mais luminosas, o que significa que têm magnitudes mais
negativas, por definição.
3 MÉTODO com 𝑋 ∈ R𝑐 e 𝑌 ∈ R𝑑. Para tarefas de regressão,
os elementos de y𝑖 pertencem a reais. Para
Neste trabalho, utilizamos a abordagem de
aprendizagem supervisionada, um ramo comum problemas de classificação, os elementos de y𝑖 são
do ML (Goodfellow et al. 2016). Nesta categoria inteiros, mas não é o nosso caso.
de aprendizagem, pretendemos construir uma Neste trabalho, 𝑋 é representado por todas as
função numérica que nos permita associar objetos características do setor claro, e 𝑌 é representado
no domínio 𝑋 (características) a objetos no pelo alvo do setor escuro, e juntos formam nosso
domínio 𝑌 (alvos) 𝑓 : 𝑋 → 𝑌, o que pode ser visto conjunto de dados, que dividimos aleatoriamente
como uma aproximação para um possível em 80% para a amostra de treinamento e 20%
~ para a amostra de treinamento. amostra de teste.
subjacente à solução exata 𝑓 . Por outras palavras,
procuramos explicar 𝑌 com 𝑋, mapeando entradas
em saídas.
3.2 Pipeline
Há uma infinidade de métodos de ML que podem
3.1 Amostras de treinamento e teste ser usados para resolver problemas de regressão
Para construir esta função aproximada, usamos (Hastie et al. 2009), então: 𝑖) como encontrar, se
apenas uma parte da amostra de dados chamada houver, o melhor método de ML para um
conjunto de treinamento. A melhor aproximação determinado problema? 𝑖𝑖) quais são as melhores
para 𝑓 é alcançada através da minimização de uma operações de engenharia de atributos a serem
função de custo. A amostra restante, chamada de aplicadas antes da análise de ML?
conjunto de testes, é usada para medir o Aqui, a fim de explorar e avaliar todo o espaço de
desempenho, comparando os valores verdadeiros possibilidades, decidimos usar uma ferramenta
(simulados no nosso caso) com os previstos. O automatizada de aprendizado de máquina python
objetivo final é otimizar o modelo que funciona chamada Tree-based Pipeline Optimization Tool
igualmente bem nas amostras de treinamento e de (Olson et al. 2016, TPOT em resumo). Vale
teste (ou seja, um modelo que generaliza bem). ressaltar que, mais do que um único método de
Para evitar viés devido à escolha do conjunto de regressão, o TPOT retorna o “melhor” pipeline,
treinamento e do conjunto de teste, é realizado um que pode ser feito de um único método ou de uma
procedimento de reamostragem de validação combinação de diferentes algoritmos. Uma
cruzada para avaliar o modelo. Espera-se que tal descrição mais detalhada da análise TPOT
modelo faça previsões sobre outros dados que realizada neste artigo é encontrada no Apêndice B
devem ser bem representados pelo conjunto de e os melhores pipelines relatados na Tab. B1.
teste.
A generalização é a propriedade que diferencia
3.3 Métricas de desempenho
uma abordagem de ML de uma solução de
otimização convencional, normalmente usando
todo o conjunto de dados de forma indistinguível.
O conjunto de treinamento, denotado aqui por 𝐴,
consiste em um n-upla (𝑥𝑖 , 𝑦𝑖) (entrada, saída)
como vetor x𝑖 e y𝑖 pertencente ao espaço vetorial
𝑋 e 𝑌 respectivamente:
𝐴 = ((𝑥1, 𝑦1), (𝑥2, 𝑦2), ( ))
..., 𝑥𝑛, 𝑦𝑛 .
com 𝑋 ∈ 𝑅𝑐 e 𝑌 ∈ 𝑅𝑑. Para tarefas de
regressão, os elementos de y𝑖 pertencem a reais.
Para problemas de classificação, os elementos de
y𝑖 são inteiros, mas não é o nosso caso.
Conforme previsto, neste trabalho, focamos na métricas estatísticas bem estabelecidas. Essas
precisão que as ferramentas de ML podem métricas também são usadas para evitar
alcançar na previsão de algumas propriedades underfitting/overfitting nas análises.
específicas de DM das galáxias. Como usaremos
A primeira métrica estatística que utilizamos é o
as mesmas galáxias simuladas como caso de teste,
coeficiente de determinação 𝑅2, que é definido
este experimento é bastante ideal, e a precisão que
por,
encontramos deve ser considerada um limite
^ 2
superior para aplicações futuras em galáxias reais. 2
𝑅 =1−
( )
∑ 𝑦𝑖−𝑦𝑖
,
Em particular, este teste pode fornecer fortes ^ 2
∑(𝑦 −𝑦)
indicações sobre o potencial do conjunto 𝑖
^
completo de dados, composto por fotometria, onde 𝑦𝑖 denota os pontos de dados, 𝑦 denota os
espectroscopia e parâmetros estruturais, ou
pontos previstos e 𝑦 é o valor médio do conjunto
mesmo um subconjunto desses dados. Conforme
de dados. Observe que a Eq. 2 pode ser
descrito no §2, estes fornecem uma aproximação
interpretado como uma versão padronizada da
de ordem 0 do conjunto de dados típico esperado
soma do erro quadrático médio (MSE). Quanto
de inquéritos futuros. 2
mais próximo 𝑅 estiver de 1, melhor será o
Para quantificar a precisão dos valores previstos, 2
pipeline. Para o caso perfeito, onde 𝑅 = 1, o
emitidos pelos pipelines apresentados na Tab. B1,
modelo ajusta-se perfeitamente aos dados, o que
são comparados com os valores “verdadeiros” da
corresponde a MAE = MSE = 0. Além disso, na
amostra de teste, fazemos uso de algumas
avaliação da análise de regressão, 𝑅 mostrou-se
2 dados observacionais da sua matéria luminosa.
mais informativo e confiável do que outras Para cada um dos quatro alvos, realizamos
métricas Chicco et al. (2021). previsões com quatro dados de entrada distintos,
como segue:
O segundo estimador estatístico é o coeficiente de
correlação de Pearson, previamente introduzido e 𝑖) Considerando apenas as feições fotométricas;
utilizado para a matriz de correlação (ver S 2.4), 𝑖𝑖) Considerando apenas recursos estruturais;
que, para efeitos de avaliar a precisão da previsão,
𝑖𝑖𝑖) Considerando apenas recursos cinemáticos;
é definido de forma semelhante como
^ 𝑖𝑣) Combinando todos os recursos em uma análise
ρ= ( ),
𝑐𝑜𝑣 𝑦,𝑦
σ ^σ𝑦 conjunta.
𝑦
Aqui, estamos interessados em medir a correlação Isto perfaz um total de 16 resultados, quatro
entre os dados de teste y𝑖 e os valores relativos previsões para os quatro alvos. As previsões da
^
previstos 𝑦 associados a um mesmo alvo. última das análises listadas (iv) representam o
resultado principal do artigo, mas as análises i), ii)
Os resultados para as métricas estatísticas acima e iii) são úteis para compreender a capacidade
mencionadas são apresentados e discutidos no § preditiva dos diferentes tipos de observações
4.1. Além disso, para fins de completude, separadamente.
apresentamos também o Erro Médio Absoluto
(MAE) e o MSE, que são definidos Para as análises conjuntas, apresentamos também
respectivamente por, a importância dos subgrupos de características nas
regressões para todos os alvos.
^
∑|||𝑦𝑖 − 𝑦𝑖 |||
𝑀𝐴𝐸 = 𝑁
,
2 4.1 Resultados
( ^
∑ 𝑦𝑖 − 𝑦𝑖 )
𝑀𝑆𝐸 = 𝑁
, Conforme discutido na Seção 3.1, durante o
onde 𝑁 é o número total de pontos de dados. O processo TPOT, o conjunto de dados é dividido
MAE fornece uma medida do desvio dos valores em duas amostras: amostras de treinamento e
previstos em relação aos verdadeiros e, portanto, amostras de teste. Enquanto a amostra de
espera-se que seja relativamente pequeno para treinamento, que consiste em 80% da amostra
previsões precisas. O MSE é uma medida da total, são os dados utilizados pelo TPOT para
dispersão da previsão em torno dos valores determinar o melhor pipeline, a amostra de teste
verdadeiros e, portanto, é menor para previsões representa os dados que utilizamos para fazer as
mais precisas. previsões e avaliar a precisão do pipeline
encontrado. Esta última tarefa é feita aplicando as
2
Em geral, se por um lado 𝑅 e 𝜌 medem a métricas de desempenho, discutidas no § 3.3, à
correlação estrita entre os valores previstos e amostra de teste: quanto melhores forem as
verdadeiros, o MAE e o MSE medem a presença métricas, melhor será o modelo. Também é
ou não de deslocamento sistemático e as importante avaliar as métricas de desempenho do
incertezas gerais dos valores previstos. conjunto de treinamento porque elas podem ser
usadas para avaliar o overfitting. O overfitting
ocorre quando as métricas calculadas com a
4 ANÁLISES amostra de teste são significativamente piores do
Nesta seção, mostramos os resultados sobre as que as obtidas com a amostra de treinamento.
previsões dos pipelines de ML selecionados pelo Neste caso, mesmo que o modelo seja capaz de
TPOT (ver §3.2 e Apêndice B) que retornaram ajustar parte do total de dados, ele é considerado
para os quatro alvos e discutimos sua precisão e irrealista porque o pipeline ajustado não consegue
dispersão. Isto permite-nos tirar conclusões sobre prever adequadamente os dados que não foram
a viabilidade dos métodos ML para derivar as utilizados no processo de aprendizagem. Para um
propriedades DM das galáxias, a partir apenas dos modelo com significado físico, espera-se que as
métricas de desempenho calculadas com o fornecem uma dispersão menor e um resultado
conjunto de teste não difiram significativamente mais consistente para todos os valores de T1. Isto
dos valores obtidos com o conjunto de também é quantificado pelo menor MAE (0,131)
treinamento. e MSE (0,043), mostrando uma precisão bastante
boa.
Todos os resultados para as métricas de
2
desempenho discutidas em § 3.3 (ou seja, 𝑅 , 𝜌, Para T2 (raio móvel contendo metade da massa
MAE e MSE), calculados tanto para a amostra de DM), nenhum grupo de características separado
2
treinamento quanto para a amostra de teste, são por si só é capaz de fornecer previsões com 𝑅 >
apresentados na Tab. 1. Em geral, consideramos 0,8, no entanto, quando combinados na análise
que nenhuma das análises sofre overfitting, pois conjunta, todas as características juntas
todos os resultados obtidos com amostra de 2
treinamento e amostra de teste são compatíveis retornar uma previsão satisfatória (𝑅 = 0,865,
entre si. para a amostra de teste). Como é mostrado nos
painéis superior esquerdo, superior direito e
Na Figura 2 mostramos os resultados referentes ao inferior esquerdo da Fig. 3, pode-se ver que todas
T1 (matéria MS total). Pode-se ver que os as análises de grupo único (fotométricas,
recursos fotométricos e cinemáticos por si só estruturais e cinemáticas) mostram uma dispersão
geralmente podem fornecer melhores previsões sensível, particularmente na faixa
em comparação com os recursos estruturais. Em 0 ≲𝐿𝑜𝑔𝑅 𝐷𝑀 ≲ 1 , onde também observamos uma
particular, os recursos fotométricos fornecem os 2
os melhores pipelines para a análise nível de desempenho quase perfeito (𝑅2 = 0,987,
correspondente para T3 e T4 são diferentes. para o treinamento conjunto e 𝑅2 = 0,993, para o
A análise da “importância do recurso” é uma Para este primeiro artigo, não entramos em
prática comum em aplicações de ML. Isso é usado detalhes sobre a importância relativa das
para descobrir qual dos recursos desempenha o características em cada grupo (por exemplo,
papel mais decisivo nos algoritmos de ML para bandas ópticas vs. NIR em fotometria, massa
prever os alvos. Isso não tem nada a ver com estelar vs. massa gasosa em estrutural, etc.)
precisão, pois a importância do recurso não porque isso pode ser parcialmente função de os
seleciona os recursos que retornam a melhor tipos de galáxias, que também não distinguimos
precisão, mas apenas o seu impacto nas previsões nesta análise. Estes aspectos farão parte da
finais. próxima etapa do projeto (Wu et al., em
preparação), portanto, a seguir discutiremos
Para nossa análise de importância de atributos, apenas a importância relativa dos diferentes
utilizamos o método permutation_importance grupos.
(Breiman 2001), fornecido pelo software
scikit-learn (Pedregosa et al. 2011). Seguindo a ordem dos alvos na Fig. 6, podemos
ver que as características fotométricas são as que
impulsionam mais as previsões da matéria DM A importância do raio de meia-luz pode sugerir
total (T1), raio comovente de meia massa DM que os parâmetros estruturais podem contar mais
(T2) e massa DM dentro de duas vezes a meia no T2 (raio de meia massa do DM). Isto seria
massa estelar. raio (T4), enquanto para a massa verdade se houvesse uma forte correlação entre os
DM dentro do raio de meia massa estelar (T3), as raios de meia massa do DM e a matéria estelar.
características mais importantes são as Conforme já mencionado em §2.4, de acordo com
características estruturais (raio de meia massa a matriz de correlação da Figura 1, não há
estelar e massas estelares totais dentro de um e correlação forte entre T2 e S2 (0,3). Portanto, a
dois raios de meia massa estelar, em particular). forte dependência de T2 nos parâmetros de
fotometria é razoável, já que estes últimos
A cinemática é a segunda característica
(combinados com a massa estelar dentro dos
importante para T1 e T3, embora
parâmetros estruturais) fornecem as maiores
surpreendentemente seja a menos importante para
restrições na massa escura e o raio de meia massa
T4, que, de acordo com a discussão na seção
do DM é determinado por sua correlação com o
anterior, não deve ser diferente de T3, dada a
DM. massa.
definição próxima das duas grandezas.
No geral, da Figura 6 podemos concluir que não
Para compreender o comportamento do T4 e, em
há nenhum grupo específico de observáveis que
geral, passar para a interpretação física destes
possamos descartar ao fazer previsões de matéria
resultados de “importância da característica”,
escura em galáxias. A fotometria é imperdível,
precisamos primeiro enfatizar o que acontece
pois fornece informações sobre a luminosidade e
quando duas ou mais características estão
as massas estelares das galáxias. Mas isto é
altamente correlacionadas. Nesse caso, a
bastante óbvio e os levantamentos de imagens são
permutação de um recurso terá um impacto
sempre o primeiro passo para catalogar galáxias.
pequeno nas previsões de ML porque o modelo
Os parâmetros cinemáticos são menos óbvios.
pode obter as mesmas informações de um recurso
Apesar da cinemática interna ser reconhecida
correlacionado que não foi permutado. A Figura 1
como uma informação importante sobre as
mostra algumas correlações fortes entre
galáxias, elas são difíceis de medir, por isso são
características de diferentes grupos. Por exemplo,
frequentemente deixadas de lado em grandes
a fotometria e a massa estelar apresentam índices
levantamentos espectroscópicos onde os objetivos
de correlação > 0,9, devido à sua estreita ligação
principais continuam sendo as medições do desvio
física. Na verdade, a massa dentro do raio da
para o vermelho das galáxias (mas veja SDSS:
meia-luz (𝑅ℎ), 𝑀𝑠𝑡𝑎𝑟(𝑅ℎ) = 𝑀/𝐿𝑥 ×𝐿𝑥/2, onde
Thomas et al. 2013; LAMOST: Napolitano e
𝑀/𝐿𝑥 e 𝐿𝑥 são a razão massa-luz e a luminosidade outros 2020). Pesquisas futuras são projetadas
total na banda 𝑥, respectivamente. para listar esses parâmetros (ver WEAVE:
Com esta premissa necessária, podemos tentar Costantin et al. 2019; WAVES: Driver et al.
interpretar a diferença entre a importância dos 2019). Portanto, estes serão cruciais para as
recursos T3 e T4. A fotometria, por conter análises de ML que propomos aqui.
também informações sobre a massa estelar, é uma Antecipamos que o resultado mais importante
característica importante para prever a massa deste artigo é que os observáveis luminosos
escura, uma vez que a massa estelar e a massa podem fornecer previsões precisas do DM dentro
escura estão fortemente correlacionadas (ver, por do raio de meia-luz. Para estas análises, os
exemplo, Moster et al. 2010). Portanto, a parâmetros estruturais da galáxia são medidas
fotometria é importante tanto para T3 quanto para cruciais a recolher, apesar de serem bastante
T4. No entanto, T3 é a massa estritamente dentro difíceis e exigentes em termos computacionais
do raio da meia-luz, portanto este parâmetro (ver, por exemplo, Yoon et al. 2011, Baldry et al.
estrutural (S1) conta tanto quanto a massa estelar. 2012). No entanto, ferramentas de ML estão
Então, para T3, em geral, os parâmetros sendo desenvolvidas recentemente para realizar
estruturais (raios e massas estelares) assumem a também esse tipo de análise e torná-las possíveis
fotometria.
para futuras grandes pesquisas do céu (Tuccillo et dentro do raio de meia massa, T3), todas as
al. 2018, Li et al. 2020). características são quase igualmente importantes.
Para concluir esta seção, queremos enfatizar as
diferenças entre a “importância do recurso” e as
5. CONCLUSÕES
métricas estatísticas da análise separada dos
grupos Fotométrico, Estrutural e Cinemático Usamos as simulações Illustris-TNG para
relatados na Tabela 1. Embora estes tenham uma investigar se as ferramentas de aprendizado de
conexão importante (como mencionado acima), máquina podem fazer previsões sólidas sobre o
eles não carregam as mesmas informações, mas conteúdo de DM em galáxias em uma
representam conjuntos de dados complementares. determinada cosmologia, com uma determinada
Em particular, ao comparar a “importância do receita de formação de galáxias, a partir de
recurso” e os resultados das métricas estatísticas, parâmetros observacionais simples. Os principais
podemos ver como o desempenho dos diferentes objetivos deste trabalho ainda são exploratórios,
grupos muda quando permitimos a interação entre pois estamos utilizando, para este projeto, um
eles. Por exemplo, para T1, a ordem de conjunto de dados ideal onde tanto a amostra de
contribuição na análise de importância do recurso treinamento quanto a amostra de teste são
é a mesma que a ordem de desempenho das extraídas de simulações. Em outras palavras, o
2 “observacional
métricas estatísticas como escala 𝑅 ou 𝜌 com a
mesma classificação da Fig. 6. Pelo contrário, quantidades” usadas como catálogos simulados
para T2 e T3, embora o grupo de características ainda carecem de realismo observacional para nos
mais importante permaneça o mesmo, os outros permitir uma avaliação completa das precisões
dois permutam a sua ordem de importância. Isto que se pode esperar empregando essas técnicas.
significa que na análise de junção para T3 os No entanto, como primeiro passo, queremos
parâmetros cinemáticos contam mais do que os demonstrar que esta é uma direção viável a
parâmetros estruturais para melhorar a precisão, explorar para futuras análises de grandes amostras
mesmo que, individualmente, a cinemática por si de galáxias, como aquela que se espera que seja
2
só tenha um 𝑅 e 𝜌 pior que a fotometria, e observada em futuros levantamentos fotométricos
também MAE e MSE piores. e espectroscópicos. Esta é a primeira tentativa de
aplicar a técnica de ML a galáxias, que segue
Para T4, o grupo de feições Fotométricas assume tentativas anteriores feitas para fazer previsões de
o papel principal na análise conjunta sobre o matéria escura em aglomerados de galáxias (por
grupo de feições Estruturais, pelos motivos exemplo, Yan et al. 2020).
discutidos acima. Isso nos leva a concluir que a
importância do recurso não é uma métrica Aproveitando os catálogos públicos do
quantitativa para um determinado conjunto de Illustris-TNG, identificamos uma série de
dados, pois não é derivada deterministicamente. parâmetros observacionais, representando os
Na verdade, o seu resultado depende dos pipelines recursos que queremos usar para fazer previsões
específicos em uso (ver Apêndice B), que de DM. Estes foram agrupados em três conjuntos
privilegiaram uma característica de um grupo de principais: parâmetros de fotometria (ou seja, as
recursos em detrimento de outro, mas isso não magnitudes em 8 bandas diferentes), parâmetros
significa que outro pipeline possa dar preferência estruturais (ou seja, o raio de meia massa estelar e
aos recursos de uma maneira diferente. três massas bariônicas diferentes), parâmetros
cinemáticos (ou seja, dispersão de velocidade 1D
No entanto, a importância desta análise continua a de todos partículas e a velocidade máxima de
ser a de saber se existem grupos de variáveis que rotação). Também usamos os parâmetros do halo
podem ser excluídas da análise em virtude de da matéria escura (massa DM total, raio de
darem pouca ou nenhuma contribuição às movimento de meia massa DM, massa DM dentro
previsões alvo. Em particular, demonstramos que do raio de meia massa estelar e os raios de meia
para o melhor alvo que podemos prever (o DM massa) como uma série de “alvos” para o ML
prever. Devido à multiplicidade de algoritmos de
aprendizagem ML existentes no mercado, todos os alvos (incluindo este raio também) um
apresentando vantagens e desvantagens em resultado excelente (0,87 . 𝑅2 . 0,98).
alcançar a melhor precisão nas previsões alvo,
adotamos uma aprendizagem supervisionada onde
exploramos um amplo conjunto de modelos com a
ajuda do TPOT. Esta é uma ferramenta
automatizada para transformações de dados e
algoritmos de aprendizado de máquina que usa
um procedimento de pesquisa genética para
descobrir com eficiência um pipeline de modelo
com melhor desempenho para um determinado
conjunto de dados. Apresentamos nossos
resultados graficamente nas Figuras 2, 3, 4 e 5, e
numericamente na Tabela 1. Os melhores
pipelines, fundados pela ferramenta automatizada
de ML, fornecem diferentes níveis de precisão das
previsões dependendo do alvo do DM.
Resumimos os principais resultados aqui abaixo:
𝑖) As ferramentas de ML são uma solução
promissora para fazer previsões do conteúdo de
DM em galáxias a partir de uma série de medições
fotométricas, espectroscópicas e estruturais
simples. Os resultados obtidos neste trabalho, no
entanto, baseiam-se em “observáveis luminosos”
idealizados e as precisões alcançadas neste
primeiro experimento são possivelmente muito
otimistas. Isto não afeta a conclusão sobre a
aplicabilidade destas técnicas, mas encoraja-nos a
avançar no desenvolvimento destas ferramentas
utilizando maior realismo nos conjuntos de dados
simulados. Estes últimos serão usados para treinar
ferramentas de ML para fazer previsões sobre o
conteúdo de DM de galáxias reais em
levantamentos fotométricos e espectroscópicos de
próxima geração;
𝑖𝑖) As características estruturais e fotométricas são
particularmente eficazes para a previsão de DM
do raio de meia massa estelar (0,88 .𝑅2 . 0,94) e a
previsão de DM dentro do dobro da proporção de
meia massa estelar (0,90 . 𝑅2 . 0,92). Além disso,
características fotométricas se destacam para
prever a matéria MS total (𝑅2 , 0,86).
𝑖𝑖𝑖) O raio comovente contendo metade da massa
DM é o alvo mais difícil de ser determinado e
nenhum grupo de observações sozinho consegue
fazer isso (𝑅2 . 0,75), mas a análise conjunta
melhorou visivelmente as previsões dadas a todos