Escolar Documentos
Profissional Documentos
Cultura Documentos
Maringá
Agosto de 2016
1
YAN GUILHERME GIMENES AMORIM
Maringá
Agosto de 2016
2
RESUMO
Com o passar dos dias telescópios em torno da Terra capturam mais e mais
imagens de galáxias distantes, sendo assim, o interesse pela classificação de
forma automatizada é crescente devido ao grande número de dados que são
coletados, configurando assim um cenário rico no qual são criadas
oportunidades para a criação de algoritmos de classificação e ordenação
dessas imagens. Na investigação dessas oportunidades de pesquisa, será
utilizado como base o projeto online de ciência cidadã em astronomia Galaxy
Zoo, que consiste em convidar pessoas para classificarem morfologias de um
grande número de galáxias. Técnicas de aprendizado de máquina podem ser
empregadas de forma alternativa e complementar aos algoritmos de
processamento de imagens, possibilitando a extração e a avaliação de padrões
dessas imagens. Entretanto, tanto na análise de algoritmos de processamento
de imagens quanto na utilização de técnicas de aprendizado de máquina, a
literatura reporta trabalhos que complementam a compreensão desse
problema. Nesse cenário, a plataforma Kaggle de crowdsourcing levantou uma
competição junto com o Galaxy Zoo e Winton Capital para produzir o Galaxy
Challenge, onde participantes ajudarão a classificar galáxias em categorias.
Nesta monografia, apresentará todas as etapas do processo de
desenvolvimento de um algoritmo de processamento de imagens e
aprendizado de máquina para classificar e ordenar tipos de galáxias, e de fato,
apresentar os métodos e técnicas que resolvem a competição Galaxy
Challenge. Por fim, serão reportados resultados da aplicação das técnicas em
uma tabela comparativa com os primeiros colocados da competição.
3
ABSTRACT
Over the days telescopes around the Earth capture more and more images of
distant galaxies, thus the interest in automated classification is growing because
of the number of data that are collected, thus creating a rich setting in which
they are created opportunities for creating classification algorithms and sort
these images. In the investigation of these research opportunities, it will be used
as a basis the project online crowd-science in astronomy Galaxy Zoo, which is
to invite people to rate morphologies of a large number of galaxies. machine
learning techniques can be employed in alternative and complementary to the
image processing algorithms form, enabling the extraction and evaluation
standards of these images. However, both the analysis of image processing
algorithms as the use of machine learning techniques, literature reports works
that complement the understanding of this problem. In this scenario, the
crowdsourcing platform Kaggle up a competition with the Galaxy Zoo and
Winton Capital to produce the Galaxy Challenge, where participants will help
classify galaxies into categories in the competition are asked to analyze galaxy
images in order to find metrics automation that reproduce the likelihood of
deliberate distribution by human classifications. In this monograph will present
all stages of the development process of an image processing algorithm and
machine learning to classify and sort types of galaxies, and in fact, present the
methods and techniques that solve the Galaxy Challenge competition. Finally,
they will be reported to the application of techniques results in a comparative
table with the top finishers in the competition.
4
LISTA DE FIGURAS
5
LISTA DE ABREVIATURAS
6
SUMÁRIO
1. INTRODUÇÃO........................................................................................................8
2. JUSTIFICATIVA....................................................................................................10
5 METODOLOGIA...................................................................................................12
6 REFERENCIAL BIBLIOGRÁFICO........................................................................13
6.1 Introdução.............................................................................................................. 13
7. CRONOGRAMA DE ATIVIDADES.......................................................................15
8. RESULTADOS ESPERADOS..............................................................................16
9. REFERÊNCIAS....................................................................................................17
1. INTRODUÇÃO
7
A necessidade pela compreensão de como e por que estamos aqui é uma das
questões fundamentais para a humanidade. Parte da resposta consiste nas
origens das galáxias, como por exemplo a nossa Via Láctea. No entanto, ainda
existem dúvidas sobre como a Via Láctea ou qualquer outra galáxia de nosso
universo foi formado e evoluiu. Nesse caso, compreender a distribuição,
localização, forma, tamanho e cor são peças fundamentais para resolver esse
enigma [Willett et al. 2013].
Esse novo método de Ciência Cidadã mostrou ser um grande avanço para a
área de pesquisa científica. A fim de melhorar e compreender como as
diferentes formas (ou morfologias) de galáxias se relacionam com a física que
os criaram, através de suas classificações, foi criada uma competição na
plataforma de crowdsourcing Kaggle em parceria com Galaxy Zoo e Winton
Capital para produzir o desafio Galaxy, nessa competição pede-se aos
participantes classificarem as imagens de galáxias em categorias a fim de
8
encontrar métricas de automatização que reproduzem a probabilidade de
distribuição deliberada pelas classificações humanas.
9
2. JUSTIFICATIVA
10
3. FATORES CRÍTICOS NA ELABORAÇÃO DO PROJETO
Sabemos que existem alguns fatores críticos para a execução desse projeto:
11
5 METODOLOGIA
12
6 REFERENCIAL BIBLIOGRÁFICO
6.1 Introdução
13
Muitas vezes, nem todos os usuários vão concordar em todas as suas
respostas, por isso é útil quantificar essa incerteza.
14
porém precisamos determinar apenas a fração de pessoas que determinaram e
classificaram a galáxias em determinados tipos.
7. CRONOGRAMA DE ATIVIDADES
15
8. RESULTADOS ESPERADOS
16
9. REFERÊNCIAS
V. Le, Quoc; Ngiam, Jiquan, Coates, Adam, Lahiri, Abhik, P., Bobby; Y. Ng.,
Andrew. Optimization methods for deep learning. In Proceedings of the Twenty-
Eighth International Conference on Machine Learning, 2011. Disponível em: <
http://ai.stanford.edu/~ang/papers/icml11-OptimizationForDeepLearning.pdf >.
Acesso em: 28 ago. 2016.
17
Dean, Jeffrey; S. Corrado, Greg; Monga, Rajat; Chen, Kai; Devin, Matthieu; V.
Le, Quoc; Mao Z., Mark; Ranzato, Marc’Aurelio; Senior, Andrew; Tucker, Paul;
Yang, Ke; Y. Ng, Andrew. Large Scale Distributed Deep Networks. Disponível
em: < http://static.googleusercontent.com/media/research.google.com/pt-
BR//archive/large_deep_networks_nips2012.pdf>. Acesso em: 28 ago. 2016.
Bengio, Yoshua. Learning Deep Architectures for AI, 2009. Disponível em: <
http://www.iro.umontreal.ca/~bengioy/papers/ftml_book.pdf>. Acesso em: 28
ago. 2016.
Kyle W. Willett (Minnesota U.) et al.. Aug 15, 2013. 30 pp. Galaxy Zoo 2:
detailed morphological classifications for 304,122 galaxies from the Sloan
Digital Sky Survey. Disponível em: < http://arxiv.org/pdf/1308.3496v2.pdf>.
Acesso em: 28 ago. 2016.
18