Escolar Documentos
Profissional Documentos
Cultura Documentos
onde A uma matriz de nmeros reais no negativos indexada por Q Q, denominada de matriz de probabilidades de transio de estados, E uma matriz de nmeros reais no negativos indexada por Q que contm as probabilidades de emisso de smbolos em cada estado, Q o conjunto de estados do modelo, o vetor da distribuio inicial de probabilidades desses estados e o conjuto de smbolos do alfabeto. No ponto de vista matemtico, os elementos mais importantes, e que devem ser levados em considerao so a matriz de transio de estados, matriz com as probabilidades de emisso de smbolos em um determinado estado e o vetor de probabilidades iniciais. Estas estruturas so consideradas mais importantes, pois todos os clculos executados pelos algoritmos relacionados aos Modelos Ocultos de Markov, dependem delas. Observando estas estruturas tambm possvel visualizar o nmero de estados e o nmero de smbolos que esto envolvidos no modelo. A seguir possvel notar um exemplo, extremamente simplicado, que mostra as estruturas pertencentes aos Modelos Ocultos de Markov em uma aplicao voltada para o processo de etiquetagem. Os estados do modelo so representados pelas classes gramaticais, os smbolos do modelos so representados pelas palavras da lngua portuguesa. mostrado uma si-
14
mulao para a construo de um Modelo Oculto de Markov baseado no seguinte texto marcado:
A_ARTD cidade_N est_V muito_ADV poluda_V ._PT Os_ARTD carros_N esto_V correndo_V na_CPR cidade_N !_PT.
Observando as transies de estados possvel montar a matriz com as probabilidades de transio (matriz A). Divide-se a quantidade de transies de um estado para o outro pela ocorrncia total do mesmo estado. Por exemplo: A classe gramatical V (Verbo) ocorre quatro vezes no texto marcado, analisando as transaes da classe V as probabilidades cam na seguinte forma:
V ART D = V N = V V =
0 4 1 4 0 4
; ;
1 4
V ADV = V PT =
1 4
. .
;
1 4
V CP R =
Visualizando a matriz de transio de estados possvel observar o nmero de estados que pertence ao modelo que est sendo construdo. Neste caso seis estados pertencem ao modelo (ARTD, N, V, ADV, PT, CPR). A execuo deste processo, levando em conta todas as transies, constri a matriz de transio de estados, que pode ser vista a seguir:
A= 0.00 1.00 0.00 0.00 0.00 0.00 0.00 0.66 0.00 0.00 0.33 0.00 0.00 0.00 0.25 0.25 0.25 0.25 0.00 0.00 1.00 0.00 0.00 0.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 1.00 0.00 0.00 0.00 0.00
Os smbolos que esto envolvidos nesse modelo so as palavras da lngua portuguesa (A, cidade, est, carros, os, etc). A matriz que contm as probabilidades de emisso de smbolos em um determinado estado construda levando em considerao a diviso de um smbolo em um determinado estado pela ocorrncia total deste mesmo smbolo. O exemplo a seguir mostra essa idia:
15
A palavra cidade aparece duas vezes no texto. Nas duas vezes que aparece, ela pertencente a classe N (Substantivo Comum). Ento divide-se a quantidade de vezes que a palavra aparece em um estado x pela ocorrncia total dessa mesma palavra. Casualmente, a palavra cidade aparece duas vezes no texto, e as duas vezes ela est no estado N, o que resultaria em uma probabilidade de 100% de ocorrer a palavra cidade no estado N. O clculo das probabilidades da matriz E realizado atravs da seguinte frmula:
P (Op |S) = Op S ; Op
(5.1)
a ocorrncia da palavra p no estado S; Op a ocorrncia total da palavra p. Realizando este clculo para todas as palavras (smbolos) em todos os estados obtem-se a matriz de probabilidades de emisso de smbolos em um estado. O vetor de probabilidades iniciais calculado analisando os estados que iniciam frases, no caso do texto marcado tem-se somente um estado que inicia frases, nas duas vezes que uma frase iniciada ela est no estado ARTD. Neste caso fcil de tirar a concluso que a probabilidade do modelo iniciar no estado ARTD 100%. Outro exemplo da utilizao dos Modelos Ocultos de Markov o clssico exemplo do Cassino, que possu dados corretos e dados viciados, e estes dados so trocados de forma aleatria. O exemplo mostra um Modelo Oculto de Markov e pode ser explicado da seguinte forma: Imagine que se est em um Cassino, mais precisamente em um jogo de dados. Nesse jogo lanado um dado a cada jogada, porm o Cassino no revela qual dado lanado. Sabe-se tambm que o Cassino possui dois dados (um viciado e um normal). Outra informao importante que o Cassino sempre comea um jogo com o dado honesto. De acordo com as probabilidades deste exemplo, possvel montar um Modelo Oculto de Markov. Exemplo do Cassino:
Op S
De vez em quando o Cassino troca os dados para que sejam feitos novos lanamentos.
16
Honesto Honesto =
5 100
; ; ; .
95 100 10 100
Desonesto Desonesto =
90 100
A partir da descrio deste caso, pode-se obter um Modelo Oculto de Markov onde os estados so o tipo de dado (Honesto ou Desonesto), o conjuto de observaes possveis so os nmeros existentes nos dados {1,2,3,4,5,6}, a matriz de transio de estados montada a partir das probabilidades de transio dos dados e a matriz de probabilidades de emisso dos dados construda atravs da informao das probabilidades de cada observao no Dado Honesto ou no Dado Desonesto. As probabilidades iniciais so obtidas atravs da informao de que o Cassino sempre comea os lanamentos com o Dado Honesto. No caso do exemplo do Cassino tem-se o modelo que mostrado logo a seguir: Cassino:
A= 0.95 0.05 0.166 0.166 0.166 0.166 0.10 0.90 0.100 0.100 0.100 0.100
No caso dos dados, aps 10 lanamentos pode-se ter a seguinte seqncia de observaes (representada por S ):
S = {1, 3, 6, 1, 1, 2, 2, 2, 3, 6}
17
determinada seqncia de observaes. Outro aspecto que deve ser considerado na soluo destes problemas a busca de algoritmos ecientes para produo de um resultado satisfatrio. A soluo de um destes problemas de fundamental importncia para o processo de etiquetagem baseado em Modelos Ocultos de Markov. Este problema consiste em achar a melhor seqncia de estados para uma determinada seqncia de observaes. Mais adiante ser descrito mais detalhadamente os problemas e as respectivas solues. As denies dos problemas e as suas respectivas solues so apresentadas nos itens a seguir:
um modelo precisa-se encontrar uma seqncia de estados que melhor explique (segundo algum critrio preciso) a gerao da seqncia de observaes. Para solucionar este problema utilizado o Algoritmo de Viterbi.
parmetros de um Modelo de modo que a probabilidade de uma seqncia de observaes seja maximizada. Para solucionar este problema utilizado o Algoritmo de Baum Welch.
18
Outra rea de grande interesse e de vasta aplicao dos Modelos Ocultos de Markov a Biologia Computacional, mais especicamente, Alinhamento de Seqncias Biolgicas. O trabalho (BRITO, 2003) cita a aplicao dos Modelos Ocultos de Markov em Alinhamentos de Seqncias. Em (SILVA, 2002) possvel encontrar aplicaes dos Modelos Ocultos de Markov na gentica (Alinhamento mltiplo, bacterifago lambda e Xylella fastidiosa). Na rea da Meteorologia, os Modelos Ocultos de Markov tambm so muito aplicados. (HUGHES; GUTTORP; CHARLES, 1996) mostra um Modelo Oculto de Markov que relaciona a ocorrncia de preciptaes em vrias estaes meteorolgicas e padres atmosfricos de circulao.