Você está na página 1de 5

FACULDADE DE TECNOLOGIA SENAI CIMATEC

PROGRAMA DE PÓS-GRADUAÇÃO EM MODELAGEM COMPUTACIONAL E


TECNOLOGIA INDUSTRIAL
MESTRADO ACADÊMICO E DOUTORADO

EDITAL 001 / 2015 - VAGAS REGULARES

9ª TURMA DO MESTRADO – 6ª TURMA DO DOUTORADO


ANEXO II - FORMULÁRIO DE APRESENTAÇÃO DO PRÉ-PROJETO
(intenção para desenvolvimento da dissertação)

NOME DO COMPLETO DO CANDIDATO


FREDERICO ANDRADE XAVIER

TEMA DA DISSERTAÇÃO (SUGESTÃO)


Indicar o tema ou título provisório da dissertação que pretende elaborar.
Redes Neurais Artificiais para resolução de problemas de classificação e reconhecimento de
padrões

OBJETIVO
Indicar o que norteará a sua pesquisa de mestrado – objetivo geral e objetivos específicos

Objetivo geral – Estudar arquiteturas de Redes Neurais Artificiais (RNAs) e Aprendizado de Máquina
para resolução de problemas de classificação de dados e reconhecimento de padrões

Objetivos Específicos
1) Comparar a eficácia/eficiência de 3 tipos de Arquitetura de Redes Neurais/ Algoritmos de
Treinamento Supervisionado (Redes Feedforward de múltiplas camadas, Redes Recorrentes,
Deep Learning) na resolução de 2 problemas/aplicações:
1.1) Sistema de visão de máquina para reconhecimento de letras/gestos em linguagem Libras
(Linguagem Brasileira de Sinais)
1.2) Reconhecimento óptico de caracteres (OCR)

2) Levantamento de um banco de imagens de letras em Linguagem Libras, para treinamento


supervisionado, validação e teste
3) Levantamento de um banco de imagens de caracteres alfa-numéricos, para treinamento
supervisionado, validação e teste
FACULDADE DE TECNOLOGIA SENAI CIMATEC
PROGRAMA DE PÓS-GRADUAÇÃO EM MODELAGEM COMPUTACIONAL E
TECNOLOGIA INDUSTRIAL
MESTRADO ACADÊMICO E DOUTORADO

EDITAL 001 / 2015 - VAGAS REGULARES

9ª TURMA DO MESTRADO – 6ª TURMA DO DOUTORADO


JUSTIFICATIVA
Dissertar sobre a importância do trabalho, conforme sua contribuição teórica, relevância para a
empresa / organização, sociedade ou outro motivo.

RNAs são um campo em franca ascensão desde a proposta do algoritmo de backpropagation por
John Hopfield em 1982. As últimas pesquisas e avanços neste campo demonstraram o poder das
RNAs na resolução de problema lineares e não lineares de relativa complexidade, tais como:

• Análise (e Previsão) de Séries temporais: por exemplo, prever índices pluviométricos num dado
período ou prever flutuações do índice da Bolsa de Valores (IBOVESPA)
• Otimização Linear e Não-Linear: a exemplo do problema de Caixeiro-viajante (um problema de
otimização NP-completo)
Classificação & Reconhecimento de Padrões: esta é certamente uma das áreas onde o poder de
resolução das RNAs tem se mostrado mais significativo. RNAs permitem a classificação/separação de
dados complexos, sem a necessidade de um estudo aprofundado das características de cada classe
do conjunto. Um grande exemplo é o problema de reconhecimento de faces (visão computacional),
cujos algoritmos de feature extraction (extração de características) são extremamente complexos e
nem sempre eficientes. No caso em questão, as próprias RNAs conseguem extrair características
relevantes de cada classe (por exemplo: gênero, idade, cor da pele, etnia etc) sem o “projetista” da
rede ter a necessidade de estudar a fronteira de separação destas classes, ou seja: as RNAs “fazem
todo o trabalho”.

Outros campos da área de Inteligência Artificial / Aprendizado de Máquina (machine learning) têm
demonstrado grande evolução nas últimas décadas, a saber: lógica fuzzy, Abordagens Estatísticas da
IA e Algoritmos Genéticos. Tais campos ultimamente vêm se entrelaçando com a Redes Neurais,
criando campo de “Redes Neurais Híbridas”.

Dado este cenário, foi proposto projetar um sistema de visão computacional baseado em RNAs que
possa reconhecer letras e gestos estáticos em Linguagem Brasileira de Sinais (Libras). Tal sistema
poderia, por exemplo, avaliar o desempenho de um aluno que esteja iniciando seus estudos em
Linguagem de Sinais. Se por um lado, o campo de processamento de Linguagem Natural sofreu
franco desenvolvimento na última década (de forma que é possível encontrar em qualquer
smartphone um processador de linguagem natural que entenda comandos verbais do usuário),
pouquíssimo avanço foi feito para reconhecimento de sinais e gestos, de forma que este é um desafio
para o campo de machine learning e visão computacional nos próximos anos. Além disto, é sabido
que o processamento de gestos visuais é um problema de resolução mais complexa que o
processamento de linguagem natural, de forma que o campo possui uma grande oportunidade para
pesquisa acadêmica.
FACULDADE DE TECNOLOGIA SENAI CIMATEC
PROGRAMA DE PÓS-GRADUAÇÃO EM MODELAGEM COMPUTACIONAL E
TECNOLOGIA INDUSTRIAL
MESTRADO ACADÊMICO E DOUTORADO

EDITAL 001 / 2015 - VAGAS REGULARES

9ª TURMA DO MESTRADO – 6ª TURMA DO DOUTORADO


DESENVOLVIMENTO
Discorrer sobre como vai desenvolver a dissertação – possíveis procedimentos metodológicos para a
pesquisa (por exemplo, pesquisas experimentais com uso de laboratórios e/ou uso de software,
estudo de pesquisa-ação, levantamento tipo survey, modelagem e simulação, desenvolvimento teórico
– conceitual, entre outros.
A metodologia para desenvolvimento do tema proposto irá consistir em 3 ações principais:

1) Levantamento de um banco de imagens de gestos estáticos ou sinais (especificamente,


letras) em Linguagem Brasileira de Sinais (Libras).
2) Estudo e levantamento Bibliográfico de arquiteturas de RNAs mais apropriadas para resolução
da aplicação proposta (um problema de classificação)
3) Desenvolvimento do sistema de visão computacional proposto e análise da eficiência de cada
modelo de arquitetura utilizada.

Para a Parte 1 (Levantamento do Banco de Imagens) a seguinte metodologia será adotada:

I – 10 (dez) locutores de Linguagem Libras são convidados a participar do levantamento do banco de


imagens. Os locutores devem possuir características distintas entre si (ex: gênero, idade, cor da pele,
peso) de forma que a mão dos locutores (órgão que executa os gestos) possua formas, cores e
padrões diferentes. Tal variabilidade é importante para adicionar flexibilidade no aprendizado da rede,
caso contrário a RNA ficaria “especialista” em um tipo de dado apenas (ex: “mãos magras e brancas)

II – Cada locutor, diante de uma câmera, repete um dado gesto (por exemplo, a letra “A”) N vezes. N
imagens são capturadas. N ainda será determinado mediante estudo, porém certamente N ≤ 5.
(provavelmente, N = 2 ou 3 será um número ideal).
A proposta do sistema é reconhecer / classificar as 23 letras do alfabeto, de forma que o procedimento
acima será repetido para cada letra. Ao total,
FACULDADE DE TECNOLOGIA SENAI CIMATEC
PROGRAMA DE PÓS-GRADUAÇÃO EM MODELAGEM COMPUTACIONAL E
TECNOLOGIA INDUSTRIAL
MESTRADO ACADÊMICO E DOUTORADO

EDITAL 001 / 2015 - VAGAS REGULARES

9ª TURMA DO MESTRADO – 6ª TURMA DO DOUTORADO

Para a Parte 2 (Estudo e levantamento bibliográfico):


Pretende-se estudar 3 tipos de arquiteturas apropriadas para a resolução do tipo de aplicação
proposta (classificação de dados): (Redes Feedforward de múltiplas camadas, Redes Recorrentes,
Deep Learning). As 3 arquiteturas tem se mostrado eficientes na classificação de dados e
reconhecimento de padrões, com cada uma tendo suas particularidades. Após o estudo do estado da
arte das arquiteturas acima, cada uma será implementada no sistema de visão computacional
proposto.

Para a Parte 3 (Desenvolvimento do sistema de visão):


Com o banco de imagens levantado, o mesmo será importado no sistema de visão. Inicialmente, as
imagens deverão passar por um pré-processamento: os dados devem ser normalizados de forma que
a RNA possa processá-los de forma igual. Isto inclui a aplicação de filtros na imagem e adequação da
resolução (bit depth). Os exemplos abaixo são para as letras “A”e “B”em Libras:
FACULDADE DE TECNOLOGIA SENAI CIMATEC
PROGRAMA DE PÓS-GRADUAÇÃO EM MODELAGEM COMPUTACIONAL E
TECNOLOGIA INDUSTRIAL
MESTRADO ACADÊMICO E DOUTORADO

EDITAL 001 / 2015 - VAGAS REGULARES

9ª TURMA DO MESTRADO – 6ª TURMA DO DOUTORADO

As imagens devem ser divididas entre 2 conjuntos: um conjunto para Treinamento (Supervisionado) e
um conjunto para Validação e teste.
Para o projeto, treinamento e validação da RNA será utilizado o software MATLAB com o toolbox de
Redes Neurais. Tal toolbox consiste num framework/biblioteca de funções voltadas para o projeto de
Redes Neurais, que facilitam bastante o trabalho do projetista. O MATLAB também possui um toolbox
de Visão computacional e Processamento de Imagens, de forma que praticamente todo o sistema
de visão poderá ser implementado em linguagem MATLAB.

RESULTADOS ESPERADOS
Apontar resultados que poderão ser obtidos com a sua dissertação.

• Um Banco de imagens de gestos em libras (letras do alfabeto) robusto e confiável.


• Sistema de visão computacional, baseado em Redes Neurais, capaz de distinguir / classificar de
forma eficiente gestos em Linguagem Libras.
• Obter uma analise comparativa da eficiência de arquiteturas distintas de RNAs aplicadas ao
problema proposto

REFERÊNCIA BIBLIOGRÁFICA
Citar 5 (cinco) obras (principais) para fundamentação teórica de dissertação.

Você também pode gostar