Você está na página 1de 19

UNIVERSIDADE DO ESTADO DE MATO GROSSO

FACULDADE DE CINCIAS EXATAS E TECNOLGICAS


BACHARELADO EM CINCIA DA COMPUTAO

USO DE AUTMATOS FINITOS APLICADOS AO


RECONHECIMENTO DO PADRO DE ARMAZENAMENTO DE
IMAGENS DICOM

ELTON FLIX DE OLIVEIRA BENEVIDES

CCERES
2017
UNIVERSIDADE DO ESTADO DE MATO GROSSO
FACULDADE DE CINCIAS EXATAS E TECNOLGICAS
BACHARELADO EM CINCIA DA COMPUTAO

USO DE AUTMATOS FINITOS APLICADOS AO


RECONHECIMENTO DO PADRO DE ARMAZENAMENTO DE
IMAGENS DICOM

ELTON FLIX DE OLIVEIRA BENEVIDES

Projeto de Trabalho de Concluso de Curso


apresentado disciplina de TCC1 do Ba-
charelado em Cincia da Computao da
UNEMAT/Cceres como parte de seus re-
quisitos avaliativos.

Orientador: Nivaldi Calonego Junior

CCERES
2017
Lista de tabelas

Tabela 1 Reconhecedores e as classes de linguagens em que atuam . . . . 13


Tabela 2 Cronograma do Projeto . . . . . . . . . . . . . . . . . . . . . . . . . 15
Lista de abreviaturas e siglas

ACR American College of Radiology

DICOM Digital Imaging and Communications in Medicine

DNA Deoxyribonucleic Acid

ISO International Organization for Standardization

NEMA National Electrical Manufacturers Association

PDA Pushdown Automaton

XML eXtensible Markup Language


Lista de smbolos

Letra grega delta

Letra grega Gama

Letra grega Sigma

Pertence
Sumrio

1 INTRODUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 JUSTIFICATIVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3 METODOLOGIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

4 OBJETIVOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.1 Objetivos Gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.2 Objetivos Especficos . . . . . . . . . . . . . . . . . . . . . . . . . . 9

5 REFERENCIAL TERICO . . . . . . . . . . . . . . . . . . . . . . . . 10
5.1 Padro de armazenamento de imagens DICOM . . . . . . . . . . . 10
5.2 Autmatos Finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
5.3 Linguagens Formais . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5.4 Consideraes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

6 CRONOGRAMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

REFERNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
5

1 Introduo

A teoria dos autmatos o estudo de dispositivos ou mquinas abstratas.


Segundo (HOPCROFT; ULLMAN; MOTWANI, 2002), essencial para o estudo do
limite da computao, entretanto, o cenrio da Teoria dos Autmatos sob a tica da
Computao mudou dos anos 1970 para os dias atuais.O desenvolvimento na cincia
tem feito com que as pesquisas com autmatos foquem mais em aplicaes do que na
teoria em si.
Com o foco da computao se voltando s aplicaes, atualmente "a Cincia da
Computao se tornou um assunto de carter mais vocacional, e h um severo prag-
matismo entre muitos alunos que se dedicam a ela"(HOPCROFT; ULLMAN; MOTWANI,
2002). Atitudes mais pragmticas tendem a deixar de lado reas do conhecimento que
no possuem validade prtica, assim, uma das formas atuais de se trabalhar com a
Teoria dos Autmatos, consiste na verificao de tal validade, atravs dos diversos
problemas que ela trata.
Uma vez que a rea est bem consolidada, as pesquisas envolvendo autmatos
se voltaram para suas aplicaes nas diferentes reas do conhecimento (HOPCROFT;
ULLMAN; MOTWANI, 2002) que esto relacionadas com a computao. Essas apli-
caes podem ser vistas em reas como a Gentica Molecular, onde autmatos a
pilha so construdos usando molculas de DNA , segundo (KRASINSKI; SAKOWSKI;
POPLAWSKI, 2012), a Robtica Mvel onde, segundo (SALES, 2012), aprendizado de
autmatos usando redes neurais usado para construo de melhores sistemas de
navegao, e a Medicina, em que segundo (JIANG et al., 2013), autmatos celulares
tem sido usados para anlise de objetos em imagens mdicas.
Entre tantos problemas tratados pela teoria dos autmatos, pode-se destacar o
reconhecimento de padres em arquivos de texto, de imagem e protocolos de comuni-
cao, onde especificaes complexas podem trazer dificuldades de implementao,
uma vez que no possvel testar um programa para cada entrada (HOPCROFT; ULL-
MAN; MOTWANI, 2002). Um exemplo dessa complexidade de especificao o padro
DICOM para imagens mdicas. Esse padro, elaborado com o intuito de universalizar
os formatos de arquivo e transmisso de imagens mdicas e informaes relacionadas
(NEMA, 2016a), contm uma especificao extensa e com muitos parmetros a serem
considerados, tornando os testes de soluo para todas as possibilidades invivel, e
assim como outras situaes, apresentando uma oportunidade para a verificao da
validade prtica da Teoria dos Autmatos.
Diante do cenrio apresentado a respeito da especificao para imagens mdi-
Captulo 1. Introduo 6

cas, este trabalho se concentra na elaborao de uma soluo para leitura de arquivos
em formato DICOM atravs da proposio de um modelo matemtico que represente a
especificao. Enquanto no captulo seguinte apresentada a justificativa do projeto, os
captulos 3 e 4 apresentam a metodologia e os objetivos, respectivamente. O captulo
5 traz a fundamentao terica do trabalho e por ltimo, o captulo 6 apresenta o
cronograma de atividades.
7

2 Justificativa

O padro DICOM, hoje usado internacionalmente, propiciou no s a intero-


perabilidade entre equipamentos, mas tambm a possibilidade de desenvolvimento
de novos sistemas que pudessem manipular informaes mdicas a fim de dar maior
suporte ao diagnstico pelo profissional. Entretanto, tais sistemas necessitam fazer a
leitura dos arquivos de imagens com qualquer entrada vlida, precisando assim, que a
soluo garanta a conformidade do padro.
Os arquivos em formato DICOM, devido sua especificao extensa e a ne-
cessidade de se garantir determinados parmetros, possuem uma complexa estrutura
e esta por sua vez, dificulta a leitura dos arquivos. Entretanto, uma vez que existe
uma especificao que define a estrutura de um arquivo DICOM e caso essa estrutura
seja uma linguagem, os arquivos seriam as sentenas desta, sendo possvel ento,
definir um autmato finito que fizesse o reconhecimento de qualquer sentena nessa
linguagem. Assim, importante que a estrutura dos arquivos seja categorizada como
linguagem, para ento um autmato ser elaborado para reconhecer suas sentenas,
ou seja, fazer a leitura dos arquivos.
Um compilador de linguagem de programao funciona de maneira semelhante
ao descrito anteriormente, j que um analisador lxico (autmato finito), construdo
com base em uma especificao, reconhece sentenas vlidas em uma determinada
linguagem. A vantagem desse mecanismo, no ser preciso conhecer todas as
sentenas possveis da linguagem, pois com base nas restries da especificao, o
autmato modela todos os caminhos possveis permitidos para as entradas.
Os autmatos constituem os fundamentos da Cincia da Computao, sendo a
mquina abstrata a ser produzida, a soluo para a leitura de arquivos especificados
no padro DICOM, mas de forma independente de tecnologia. Dessa forma, o modelo
proposto serviria como base para qualquer implementao da especificao, tanto a
nvel de software quanto a nvel de hardware.
8

3 Metodologia

A execuo do trabalho se dar de acordo com os seguintes mtodos:

Reviso bibliogrgica sistemtica que, segundo (UNESP, 2015), consiste em "m-


todos sistemticos e explcitos para recuperar, selecionar e avaliar os resultados
de estudos relevantes". Boas revises sistemticas ajudam o pesquisador dentro
do contexto de grande nmero de informaes disponveis, alm de sistematizar
as evidncias presentes na literatura (UNESP, 2015).

Teoria dos Autmatos atravs da sua aplicao para solues de problemas compu-
tacionais. Nesse mbito, a teoria ser trabalhada em dois pontos de vista:

das linguagens formais para a anlise e categorizao da linguagem definida


na especificao DICOM.
dos autmatos para a modelagem das mquinas abstratas de reconhecimento
das sentenas na linguagem dada.
9

4 Objetivos

4.1 Objetivos Gerais


A pesquisa tem por objetivo a elaborao de uma mquina abstrata que faa o
reconhecimento de sentenas de arquivos de imagens no formato DICOM.

4.2 Objetivos Especficos

Conhecer os conceitos e especificao de autmatos finitos.

Analisar o padro DICOM.

Verificar a compatibilidade entre o padro estudado e as classes gramaticais de


Chomsky

Construir um modelo matemtico que represente o padro.


10

5 Referencial Terico

Neste captulo sero discutidas as temticas que embasam o trabalho e suas


relaes com a soluo proposta. A seo 5.1 discorre sobre o padro DICOM, sua
origem e caractersticas no tocante ao armazenamento em arquivos. A seo 5.2,
discute autmatos finitos, suas variaes e aplicaes. Na seo 5.3, so discutidos os
conceitos relativos s linguagens formais e como esto ligadas aos autmatos. Por fim,
so feitas consideraes a respeito do projeto.

5.1 Padro de armazenamento de imagens DICOM


Atentando-se para a crescente variedade de dispositivos de diagnsticos digitais
disponveis no mercado e as consequncias da falta de compatibilidade entre os
mesmos, a ACR e a NEMA formaram em conjunto um comit que props um modelo
de padronizao das imagens geradas por tais dispositivos e os dados relacionados,
para que fosse garantida a qualidade das imagens e a integridade das informaes
nelas contidas. Duas verses desse padro foram lanadas, em 1985 e 1988 (ARC-
NEMA 1.0 e ARC-NEMA 2.0 respectivamente), mas somente com uma grande reviso
feita em 1993, que o mesmo passou a se chamar DICOM (NEMA, 2016a). Hoje, padro
DICOM adotado internacionalmente como parte da ISO 12052:2006 (ISO, 2006)
e possui vrios mecanismos para garantir a transmisso e armazenamento desses
dados.
Segundo (GUIMARES, 2002), entre as principais caractersticas do padro
destacam-se o intercmbio de objetos em redes de comunicao entre meios de
armazenamento atravs de protocolos de servios e a compatibilidade atravs da
especificao em diferentes nveis. Para prover intercmbio entre mdias removveis,
o padro DICOM prev um modelo de formato de arquivo que tem como principal
conceito o encapsulamento de elementos de dados (Data Sets), contendo informaes
das imagens e tambm informaes mdicas (NEMA, 2016b).
Atualmente, o padro suporta o uso de ferramentas baseadas em XML para a
acesso s informaes contidas nos arquivos (NEMA, 2016c) e algumas pesquisas,
como (ZHAO; LEE; HU, 2005) tem estudado a criao de esquemas XML para repre-
sentar a estrutura de tags DICOM. Outras reas de estudo com relao ao padro
DICOM so estudadas atualmente, a exemplo de (ALMUKHTAR et al., 2015) com
tratamento de imagens e (DZWONKOWSKI; PAPAJ; KYKACZEWSKI, 2015) com en-
criptao. O uso de autmatos pode ajudar na elaborao de um modelo matemtico
que verifique se o conjunto de dados do arquivo vlido segundo o padro DICOM,
Captulo 5. Referencial Terico 11

assim, um breve estudo sobre autmatos apresentado na seo 5.2.

5.2 Autmatos Finitos


Quando na dcada de 1930, Alan Turing props a sua mquina de computao
abstrata (TURING, 1936), o matemtico postulava sobre os limites de uma mquina de
computao (HOPCROFT; ULLMAN; MOTWANI, 2002) e os resultados de seu estudo
se tornaram a base da computao moderna. Entre 1940 e 1960 se tornou popular
entre pesquisadores o estudo de mquinas de computao simples, os autmatos
finitos. Criados inicialmente para modelar funes cerebrais, se mostraram muito
teis em diversas reas. Na mesma poca, um linguista norte-americano chamado
Noam Chomsky, estudando gramticas formais, elaborou um mtodo de formalizao
para linguagens. Os estreitos laos entre as classes de linguagem de Chomsky e os
autmatos finitos serviram como base para importantes componentes de software,
incluindo compiladores (HOPCROFT; ULLMAN; MOTWANI, 2002).
Informalmente, um autmato um modelo capaz de aceitar todas as sentenas
que pertenam a determinada linguagem, rejeitando todas as demais, sendo desse
modo, uma alternativa s gramticas na representao de linguagens formais, descritas
na seo 5.3. Nesse conceito informal, os autmatos possuem uma fita que contm a
cadeia de entrada, dividida em clulas onde cada uma delas um smbolo da cadeia.
A leitura da fita feita por um cursor que sempre aponta para o prximo smbolo a
ser processado. Ao ler um smbolo, o reconhecedor usa um controlador, chamado de
mquina de estados, para registrar informaes como a mudana em seu estado atual,
feita atravs de transies. Formalmente, um autmato representado por uma 5-tupla
(Q, , ,q0,F) (HOPCROFT; ULLMAN; MOTWANI, 2002), onde:

Q conjunto finito de estados.

conjunto finito de smbolos (ou alfabeto).

funo de transio.

q0 estado inicial.

F conjunto de estados de aceitao, onde F Q.

Entre os autmatos finitos existentes, destaca-se o autmato a pilha ou PDA,


por ter algumas caractersticas diferentes de um automato mais simples. Como o nome
sugere, o PDA possui uma pilha que funciona como uma memria no modelo last-in-
first-out (SIPSER, 2007), permitindo ao mesmo armazenar informaes relevantes
para a deciso de transio de estados. Formalmente, um PDA descrito sendo
P=(Q,,,,q0,z0,F) (HOPCROFT; ULLMAN; MOTWANI, 2002), onde:
Captulo 5. Referencial Terico 12

Q conjunto finito de estados.

conjunto finito de smbolos de entrada (alfabeto de entrada).

conjunto finito de smbolos de pilha (alfabeto de pilha, pode conter ou ser ).

funo de transio.

q0 estado inicial.

z0 smbolo de incio da pilha (pertence a ).

F conjunto de estados de aceitao, onde F Q.

5.3 Linguagens Formais


Uma linguagem um conjunto de sentenas geradas a partir de uma especi-
ficao, ou gramtica. A teoria das linguagens formais permite o estudo de modelos
matemticos que especificam e reconhecem um tipo de linguagem, as linguagens que
podem ser representadas por mecanismos formais (RAMOS; NETO; VEGA, 2009).
Uma linguagem, em geral, um conjunto de cadeias de smbolos de um alfabeto, essas
cadeias so formadas por agrupamento desses smbolos que por fim, so agrupa-
das em um conjunto denominado linguagem. Noam Chomsky, ao estudar um modelo
que representasse as linguagens naturais, apresentou importantes concluses sobre
formalizao de linguagens, atravs de gramticas (RAMOS; NETO; VEGA, 2009).
Gramticas so especificaes finitas de gerao, com as quais possvel sin-
tetizar exaustivamente o conjunto de cadeias que compe um determinada linguagem,
conhecida tambm como metalinguagem, a gramtica composta por 4 elementos: o
vocabulrio (grupo finito e no vazio de smbolos), o alfabeto (conjunto finito e no vazio
de smbolos terminais), as produes (conjunto de regras gramaticais) e a raiz (smbolo
inicial) (HOPCROFT; ULLMAN; MOTWANI, 2002). Formalmente, uma gramtica
definida por uma qudrupla (V, ,P,S), onde:

V o vocabulrio.

o alfabeto.

P so as produes.

S a raiz.

Adicionalmente, define-se N=V- como smbolos no terminais da gramtica.


O estudo de Chomsky categorizou as linguagens e suas respectivas gramticas de
acordo com algumas caractersticas. Dentre elas, podem ser destacadas:
Captulo 5. Referencial Terico 13

O conjunto de propriedades exibidas pela linguagem.

Caractersticas estruturais significativas da linguagem.

Modelo de reconhecedor mais simples necessrio para reconhecer a linguagem.

As categorias de Chomsky foram enumeradas de 0 a 3, variando o nvel de


complexidade da linguagem. As linguagens do tipo 3, so as linguagens regulares,
mais simples e geradas por gramticas lineares. Um nvel acima, esto as linguagens
do tipo 2, as linguagens livres de contexto, geradas por gramticas livres de contexto
(HOPCROFT; ULLMAN; MOTWANI, 2002). Estas possuem a particularidade de nas
suas produes, haver apenas um smbolo no terminal em seu lado esquerdo e
uma combinao qualquer de smbolos terminais e no terminais do outro lado. As
linguagens do tipo 1 so conhecidas como sensveis ao contexto e no permitem a
priori cadeias vazias. Por ltimo, as linguagens do tipo 0, que possuem gramtica
irrestrita e so chamadas de linguagens recursivamente enumerveis (RAMOS; NETO;
VEGA, 2009).
Usando o trabalho de Chomsky, os diferentes tipos de autmatos podem ser
agrupados em classes de acordo com a linguagem que reconhecem, como pode ser
demonstrado na tabela 1 com algumas classes de autmatos(HOPCROFT; ULLMAN;
MOTWANI, 2002):

Tabela 1 Reconhecedores e as classes de linguagens em que atuam

Reconhecedor Classe de Linguagem Hierarquia


Autmatos finitos Determinsticos Linguagens Tipo 3
e no-determinsticos regulares
Autmatos a pilha Linguagens Tipo 2
livres de contexto
Mquina de Turing com fita limitada Linguagens Tipo 1
sensveis ao contexto
Mquina de Turing Linguagens Tipo 0
recursivamente enumerveis

importante notar a relao de hierarquia existente entre as classes de lingua-


gem, onde as mais simples so, na verdade, casos particulares das mais complexas,
dessa forma, toda linguagem do tipo 3 tambm do tipo 2 por exemplo e todas as
linguagens so casos particulares de linguagens do tipo 0 (RAMOS; NETO; VEGA,
2009).
Captulo 5. Referencial Terico 14

5.4 Consideraes
Os estudos e discusses apresentados revelam a complexidade da soluo a
ser desenvolvida, e diante disso, a contribuio da proposta promissora pois abrange
qualquer nvel de implementao. Mesmo com a relao entre linguagem e autmato
se tornando explcita agora, a dificuldade em caracterizar a estrutura dos arquivos
DICOM como linguagem pode atrasar ou mesmo inviabilizar a elaborao do modelo
matemtico posterior. Nessa perspectiva, a prpria caracterizao pode ser vista como
objetivo maior do trabalho. Mesmo assim, espera-se que at o prazo final estipulado
no cronograma de atividades, tanto a caracterizao, como o modelo estejam prontos,
afim de se apresentar uma soluo completa.
15

6 Cronograma

previsto um perodo de 5 meses para a execuo deste projeto. A tabela 2


explicita as atividades a serem desenvolvidas em funo do tempo em meses.

Tabela 2 Cronograma do Projeto

Agosto/17 Setembro/17 Outubro/17 Novembro/17 Dezembro/17


-Fudamentao
em autmatos x
-Fundamentao
em linguagens
formais x x
-Fundamentao
no padro DICOM x
-Classificao
da linguagem x x
-Modelagem x x
-Redao Final x x
-Defesa x x
16

Referncias

ALMUKHTAR, A. et al. "direct dicom slice landmarking"a novel research technique to


quantity skeletal changes in orthognathic surgery. PLoS One, v. 10, 2015. Citado na
pgina 10.

BIBLIOTECA PROF. PAULO DE CARVALHO MATTOS. TIPOS DE REVISO DE


LITERATURA. [S.l.], 2015. 9 p. Disponvel em: <http://www.fca.unesp.br/Home/
Biblioteca/tipos-de-evisao-de-literatura.pdf>. Citado na pgina 8.

DZWONKOWSKI, M.; PAPAJ, M.; KYKACZEWSKI, R. A new quaternion-based


encryption method for dicom images. IEEE Transactions on Image Processing, v. 24, p.
46144622, 2015. Citado na pgina 10.

GUIMARES, R. R. Converso de Imagens do Formato DICOM Visando a


Inter-Operacionalidade de Sistemas Atravs da WEB. Dissertao (Dissertao de
Mestrado) Universidade Federal do Rio Grande do Sul, 2002. Citado na pgina 10.

HOPCROFT, J. E.; ULLMAN, J. D.; MOTWANI, R. Introduo Teoria de Autmatos,


Linguagens e Computao. 2. ed. Rio de Janeiro: Elsevier, 2002. Citado 4 vezes nas
pginas 5, 11, 12 e 13.

INTERNATIONAL ORGANIZATION STANDARDIZATION. ISO 12502: Health


informatics: Digital imaging and communications in medicine (dicom) including
workflow and data management. [S.l.], 2006. 48 p. Disponvel em: <https:
//www.iso.org/standard/43218.html>. Citado na pgina 10.

JIANG, H. et al. Liver segmentation based on snakes model and improved growcut
algorithm in abdominal ct image. Computacional and Mathematical Methods in
Medicine, v. 2013, 2013. Citado na pgina 5.

KRASINSKI, T.; SAKOWSKI, S.; POPLAWSKI, T. Autonomous push-down automaton


built on dna. Informatica, v. 36, p. 263276, 2012. Citado na pgina 5.

NATIONAL ELECTRICAL MANUFACTURERS ASSOCIATION. DICOM Standard Part


1: Dicom ps3.1 2016e - introduction and overview. [S.l.], 2016. 34 p. Disponvel em:
<http://dicom.nema.org/medical/dicom/current/output/pdf/part01.pdf>. Citado 2 vezes
nas pginas 5 e 10.

NATIONAL ELECTRICAL MANUFACTURERS ASSOCIATION. DICOM Standard Part


10: Dicom ps3.1 2016e - media storage and file format for media interchange. [S.l.],
2016. 48 p. Disponvel em: <http://dicom.nema.org/medical/dicom/current/output/pdf/
part10.pdf>. Citado na pgina 10.

NATIONAL ELECTRICAL MANUFACTURERS ASSOCIATION. DICOM Standard


Part 10: Dicom ps3.1 2016e - data dictionary. [S.l.], 2016. 48 p. Disponvel em:
<http://dicom.nema.org/medical/dicom/current/output/pdf/part10.pdf>. Citado na
pgina 10.
Referncias 17

RAMOS, M. V. M.; NETO, J. J.; VEGA talo S. Linguagens Formais. Teoria, Modelagem
e Implementao. 1. ed. [S.l.]: Bookman, 2009. Citado 2 vezes nas pginas 12 e 13.

SALES, D. O. NeuroFSM: aprendizado de Autmatos Finitos atravs do uso de redes


Neurais Artificiais aplicadas robs mveis e veculos autnomos. Dissertao
(Dissertao de Mestrado) Universidade de So Paulo, 2012. Citado na pgina 5.

SIPSER, M. Introduo Teoria da Computao. 2. ed. [S.l.]: Cengage Learning, 2007.


Citado na pgina 11.

TURING, A. M. On computable numbers with an application to the entscheidungspro-


blem. Proceedings of the London Mathematical Society, v. 42, n. 2, 1936. Citado na
pgina 11.

ZHAO, L.; LEE, K. P.; HU, J. Generating xml schemas for dicom structured reporting
templates. Journal of the American Medical Informatics Association, v. 12, p. 7283,
2005. Citado na pgina 10.