Escolar Documentos
Profissional Documentos
Cultura Documentos
Monograa apresentada para obteno do Grau de Bacharel em Estatstica pela Universidade Federal da Paraba - UFPB.
Orientador:
Resumo
O inter-relacionamento de dados epidemiolgicos, geralmente, tratado por mtodos que levem em conta as suas caractersticas espaciais. Nesse sentido, vrios mtodos de decteo de cluster, tal como o algoritmo Scan, tm sido sugeridos na literatura. Normalmente, essa metodologia utiliza como centros espaciais os centrides dos elementos espaciais envolvidos e, alm disso, se utiliza apenas de conceitos univariados. No entanto, o mesmo procedimento no consegue trabalhar bem quando os centros dos objetos em estudo so caractersticas qualitatitivas da populao, como por exemplo, as causas externas de bitos que acomentem uma certa regio ou um municpio. Esse ltimo fato motivou a criao de um modelo hbrido de agrupamento de dados que utiliza um mistura das losoas dos Algoritmos Genticos com a Lgica Nebulosa Fuzzy, chamado de Modelo Hbrido Gentico-Fuzzy (MHGF). Essa proposta foi aplicada a um banco de dados, fornecido pela Secretaria de Sade do Estado da Paraba, que relacionou os 30 principais municpios paraibanos com as 8 principais causas externas de bitos descritas no Captulo XX da CID-10 para os anos de 2006 a 2010. Os resultados se mostraram bastante satisfatrios com relao aos agrupamentos formados dos municpios dentro das causas. Inclusive, em muitas situaes, foi observado que muitos municpios participantes de um mesmo grupo (causa) mantinham, sobretudo, as suas caractersticas de associao espacial. Esse estudo aplicado sugere, portanto, uma boa qualidade e ecincia do modelo proposto e o aponta como uma metodologia alternativa de agrupamentos de dados.
Abstract
The interrelationship of epidemiological data, is generally treated by methods that take into account their spatial characteristics. Accordingly, various methods of cluster detection, as the Scan algorithm, have been suggested in the literature. Typically, this methodology uses space centers as the centroids of the spatial elements involved and also makes use only of univariate concepts. However, the same procedure can not work well when the centers of the objects under study are the population characteristics of qualitative approaches, for example, external causes of deaths imposed on a certain region or a municipality. This latter fact prompted the creation of a hybrid model of grouping data using a mixture of the philosophies of Genetic Algorithms with Fuzzy Logic, called Genetic-Fuzzy Hybrid Model (GFHM). This proposal was applied to a database, provided by Health Department of the State of Paraba, which listed the top 30 municipalities of Paraba with 8 main causes of deaths described in Chapter XX of ICD-10 for the years 2006 to 2010 . The results were quite satisfactory with regard to groups formed within the municipalities within of causes. In fact, in many situations, it was noted that many municipalities participating in a same group (external causes) maintained, especially the characteristics of spatial association. This applied study therefore suggests a good quality and eciency of the proposed model and shows as an alternative method of data clusters.
Dedicatria
Dedico este trabalho a minha me Wilta Maria Diniz Amrico Marinho e ao meu pai Jos Walter Marinho da Silva por serem pais presentes na minha vida dando total apoio aos meus sonhos. Estas duas pessoas em
nenhum momento mediram esforos para realizao dos meus desejos, me guiaram pelo caminho correto me ensinando dessa forma a fazer boas escolhas mostrando que a honestidade e o respeito so essenciais vida e que sempre devo lutar para o que quero. Aos meus pais devo a pessoa que me tornei e tenho muito orgulho de cham-los de pai e me.
Agradecimentos
Agradeo aos meus pais, Wilta Maria Diniz Amrico Marinho e Jos Walter Marinho da Silva por terem me dado incentivos e condies para concluir meus estudos, incentivos estes de grande importncia para que eu pudesse chegar a concluso do curso de bacharelado em estatstica. Agradeo aos meus demais familiares por terem mostrado interesses em minha caminhada na graduao e nos estudos mais elementares, me dando incentivos e foras para concluir o curso. Ao meu orientador Joab de Oliveira Lima pela grande dedicao esta monograa que com tanta presteza colaborou neste trabalho, em que as inmeras reunies realizadas para construo deste trabalho foram de grande importncia para enriquecer meus conhecimentos em estatstica e como pessoa. Aos professores da iniciao cientca Ronei Marcos de Moraes e Neir Antunes Paes pelos conhecimentos transmitidos durante toda minha graduao, experincias estas que acrescentaram bastante nos meus conhecimentos. Agradeo aos demais professores da graduao em estatstica pelos ensinamentos transmitidos, em especial aos professores Ulisses Umbelino dos Anjos, Eufrsio de Andrade Lima Neto, Hemlio Fernandes Campos Colho, Andra Vanessa Rocha, Antonio Marcos de Moraes, Marcelo Rodrigo Portela Ferreira, Renata Patrcia Lima Jernymo. Ao meu amigo de infncia Rafhael Lopes Pires Fernandes pela grande amizade. Agradeo ele pelo bom convvio e vrias discusses na rea de Cincia da Computao, discusses estas saudveis e de extrema importncia para aprofundar meus conhecimentos de programao. A minha amiga Surama Marjouri Campos da Fonsca Maia por me dar bastante incentivos e acreditar no meu potencial, incentivos estes que ajudaram a me dedicar cada vez mais aos meus estudos. Aos meus grandes amigos de graduao Josemir Ramos de Almeida, Marclio Regis da Silva pelos bons momentos durante o bacharelado em estatstica, pelos estudos em
conjunto e pelas madrugadas em claro estudando para a graduao e realizando trabalhos de consultoria. Agradeo aos demais amigos do curso pelo bom convvio, trocas de informaes e boas conversas, Jeerson, Natlia Rodrigues Guedes Gondim, Rodrigo Cabral da Silva, Sadraque Enias de Figueiredo Lucena, Telmo Cristiano da Silva.
Sumrio
Objetivos especcos
1.6
Estrutura da monograa . . . . . . . . . . . . . . . . . . . . . . . . . .
p. 23
p. 26 p. 26 p. 28 p. 28 p. 28 p. 29 p. 29
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Distncia de Mahalanobis
3.3 3.4
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
p. 29 p. 33
4 Introduo Teoria
4.1
Fuzzy
p. 35 p. 35 p. 35 p. 36 p. 37 p. 37 p. 38 p. 39
Teoria Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 4.1.2 4.1.3 Histrico e conceitos iniciais . . . . . . . . . . . . . . . . . . . . Comparao entre Lgica Fuzzy, Lgica Booleana e Probabilidade Componente da Teoria dos Conjuntos Fuzzy . . . . . . . . . . . 4.1.3.1 4.1.3.2 Variveis lingusticas . . . . . . . . . . . . . . . . . . . Funes de Pertinncias . . . . . . . . . . . . . . . . .
4.2
. . . . . . . . . . . . . . . . . . . . . . . . . .
p. 45 p. 45 p. 45 p. 46
p. 56 p. 56 p. 57 p. 57 p. 58 p. 58
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Descrio do Problema a ser Otimizado . . . . . . . . . . . . . . . . . . 6.3.1 Transformando Tabelas de Contingncias em Medidas de Distncias Bidimensionais . . . . . . . . . . . . . . . . . . . . . . . . .
p. 59 p. 62 p. 63
6.4 6.5
Funo Objetivo
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.5.1
p. 63
7 Aplicaes e Discusses
7.1 7.2 7.3 Delineamento do Processo de Amostral de Simulao Relao entre Municpios e Causas Externas de bitos Resultados e Discusses 7.3.1 7.4 . . . . . . . . . . . . . . . . . . .
p. 70 p. 70 p. 71 p. 72 p. 73 p. 76
. . . . . . . . . . . . . . . . . . . . . . . . . .
p. 79
p. 80
f ()
do Captulo 5 . do Captulo 5
p. 80 p. 82 p. 86 p. 90 p. 90 p. 91 p. 92 p. 93 p. 94 p. 95 p. 95 p. 96 p. 97 p. 98 p. 99 p. 100
f ()
Cdigo da Anlise de Correspondncia e Mtodo Fuzzy-C-Means . . . . Tabelas de Contingncias A.4.1 A.4.2 A.4.3 A.4.4 A.4.5 . . . . . . . . . . . . . . . . . . . . . . . . .
Ano de 2006 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2007 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2008 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2009 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2010 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.5
Distncias entre Municpios e Causas Externas de bitos. . . . . . . . . A.5.1 A.5.2 A.5.3 A.5.4 A.5.5 Ano de 2006 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2007 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2008 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2009 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2010 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.6
Pertinncias para o Ano de 2006 . . . . . . . . . . . . . . . . . . . . . . Pertinncias para o Ano de 2007 . . . . . . . . . . . . . . . . . . . . . . Pertinncias para o Ano de 2008 . . . . . . . . . . . . . . . . . . . . . .
A.10 Pertinncias para o Ano de 2009 . . . . . . . . . . . . . . . . . . . . . . A.11 Pertinncias para o Ano de 2010 . . . . . . . . . . . . . . . . . . . . . .
A.12 Tabelas de Agrupamentos pelo Mtodo Hbrido Gentico Fuzzy (MHGF) p. 105 A.13 Ano de 2006 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.13.1 Ponto de Corte igual 0,10 A.13.2 Ponto de Corte igual 0,20 A.13.3 Ponto de Corte igual 0,30 A.13.4 Ponto de Corte igual 0,50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 105 p. 105 p. 106 p. 107 p. 108 p. 109 p. 109 p. 110 p. 111 p. 112 p. 113 p. 113 p. 114 p. 115 p. 116 p. 117 p. 117 p. 118 p. 119 p. 120
A.14 Ano de 2007 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.14.1 Ponto de Corte igual 0,10 A.14.2 Ponto de Corte igual 0,20 A.14.3 Ponto de Corte igual 0,30 A.14.4 Ponto de Corte igual 0,50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.15 Ano de 2008 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.15.1 Ponto de Corte igual 0,10 A.15.2 Ponto de Corte igual 0,20 A.15.3 Ponto de Corte igual 0,30 A.15.4 Ponto de Corte igual 0,50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.16 Ano de 2009 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.16.1 Ponto de Corte igual 0,10 A.16.2 Ponto de Corte igual 0,20 A.16.3 Ponto de Corte igual 0,30 A.16.4 Ponto de Corte igual 0,50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.17 Ano de 2010 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.17.1 Ponto de Corte igual 0,10 A.17.2 Ponto de Corte igual 0,20 A.17.3 Ponto de Corte igual 0,30 A.17.4 Ponto de Corte igual 0,50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
p. 121 p. 121 p. 122 p. 123 p. 124 p. 125 p. 125 p. 126 p. 127 p. 128 p. 129
A.18.1 Para o ano de 2006 . . . . . . . . . . . . . . . . . . . . . . . . . A.18.2 Para o ano de 2007 . . . . . . . . . . . . . . . . . . . . . . . . . A.18.3 Para o ano de 2008 . . . . . . . . . . . . . . . . . . . . . . . . . A.18.4 Para o ano de 2009 . . . . . . . . . . . . . . . . . . . . . . . . . A.18.5 Para o ano de 2010 . . . . . . . . . . . . . . . . . . . . . . . . .
Referncias
p. 130
Lista de Figuras
1 2 3 4 5 6 7 8 9 10
Grco da funo de pertinncia para a varivel lingustica meia-idade. Troca de Material Gentico para o Algoritmo Gentico Binrio. Resumo dos Algoritmos Genticos. . . . .
p. 38 p. 48 p. 48 p. 50 p. 51 p. 61 p. 61 p. 73 p. 74 p. 75
. . . . . . . . . . . . . . . . . . . .
f ().
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Distncias Euclidiana.
Distncias de Mahalanobis.
Grco Perceptual para o Ano de 2006. . . . . . . . . . . . . . . . . . . Grcos para os 4 pontos de cortes considerados, 2006. Grcos para os 4 pontos de cortes considerados, 2007. . . . . . . . . . . . . . . . . . .
Lista de Tabelas
1 2 3 4
Codicao dos 30 municpios considerados paraibanos. . . . . . . . . . Estrutura dos dados para Anlise de Correspondncia. Tabela de Correspondncia. . . . . . . . . .
p. 19 p. 31 p. 32
. . . . . . . . . . . . . . . . . . . . . . . .
Tabela com as Solues Candidatas Iniciais e com as Propores Calculadas com Base na Funo Objetivo. . . . . . . . . . . . . . . . . . . . p. 52
6 7 8
Tempo de convergncia em horas do algoritmo MHGF. Tabela de Contingncia para o ano de 2006.
. . . . . . . . . . . . . . .
Pertinncias Obtidas pelo Modelo Hbrido Gentico Fuzzy (MHGF) para o ano de 2006. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 76
Evoluo das inter-relaes entre municpios e causas externas para o ponto de corte 0,20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 77 p. 90 p. 91 p. 92 p. 93 p. 94
10 11 12 13 14 15 16 17 18 19
Tabela de Contingncia para o Ano de 2006. . . . . . . . . . . . . . . . Tabela de Contingncia para o Ano de 2007. . . . . . . . . . . . . . . . Tabela de Contingncia para o Ano de 2008. . . . . . . . . . . . . . . . Tabela de Contingncia para o Ano de 2009. . . . . . . . . . . . . . . . Tabela de Contingncia para o Ano de 2010. . . . . . . . . . . . . . . .
Distncias Calculadas entre Municpios e Causas Externas de bito, 2006. p. 95 Distncias Calculadas entre Municpios e Causas Externas de bito, 2007. p. 96 Distncias Calculadas entre Municpios e Causas Externas de bito, 2008. p. 97 Distncias Calculadas entre Municpios e Causas Externas de bito, 2009. p. 98 Distncias Calculadas entre Municpios e Causas Externas de bito, 2010. p. 99
20
Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2006. . . . . . . . . . . . . . . . . . . . . . . . . p. 100
21
Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2007. . . . . . . . . . . . . . . . . . . . . . . . . p. 101
22
Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2008. . . . . . . . . . . . . . . . . . . . . . . . . p. 102
23
Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2009. . . . . . . . . . . . . . . . . . . . . . . . . p. 103
24
Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2010. . . . . . . . . . . . . . . . . . . . . . . . . p. 104 p. 105 p. 106 p. 107 p. 108 p. 109 p. 110 p. 111 p. 112 p. 113 p. 114 p. 115 p. 116 p. 117 p. 118 p. 119 p. 120 p. 121 p. 122
25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42
Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. .
43 44
Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. .
p. 123 p. 124
17
Introduo
John Dewey
mo de obra africana, a colonizao mercantilista, o coronelismo, as oligarquias antes e depois da independncia, tudo isso somado a um Estado caracterizado pelo autoritarismo burocrtico, contribuiu fortemente para o aumento da violncia que atravessa a histria do Brasil. Diversos fatores colaboram para aumentar a violncia, tais como a urbanizao acelerada, que traz um grande uxo de pessoas para as reas urbanas e assim contribui para um crescimento desordenado das cidades. Colaboram tambm para o aumento da violncia as fortes aspiraes de consumo, em parte frustradas pelas diculdades de insero no mercado de trabalho. As causas da violncia so associadas, em parte, a problemas sociais como misria, fome e desemprego. Mas nem todos os tipos de violncia derivam das condies econmicas. Alm disso, um Estado ineciente e sem programas de polticas pblicas de segurana, contribui para aumentar a sensao de injustia e impunidade, que , talvez, a principal causa da violncia. Os acidentes de transportes tambm expressam uma forma de violncia pois pem em risco as pessoas, o meio ambiente, em que dessa forma representa uma forte ameaa sociedade. Tais acidentes representam custos elevados para o Estado que s podem
ser diminudos com a aplicao de medidas pblicas ecientes. Conforme a frota cresce e envelhece e o trnsito se torna mais perigoso, a rede pblica de sade precisa investir mais
18
em equipamentos e prossionais para o atendimento das vtimas. Tais investimentos no se devem unicamente este tipo de violncia mas a todas as formas de violncia presentes em nosso pas. A Paraba no se encontra fora do contexto nacional. Devido ao crescimento dos
municpios paraibanos e a acelerada urbanizao de alguns deles, possvel perceber um aumento da violncia nessas regies. Segundo a Secretaria de Sade do Estado da
Paraba houve um aumento signicativo nas mais variadas causas de violncia que se deu principalmente na Grande Joo Pessoa nos ltimos 5 anos. Tais problemas podem ser
contornados com a aplicao de medidas pblicas que visam a reduo dessas violncias e que consequentemente reetem a diminuio da mortalidade por causas no naturais.
19
Municpios
Tabela 1: Codicao dos 30 municpios considerados paraibanos. Municpios Joo Pessoa Campina Grande Santa Rita Bayeux Patos Cabedelo Sap Sousa Queimadas Mamanguape Guarabira So Bento Esperana Caapor cajazeiras Cdigos JP CG SR BA PA CA SA SO QE MA GA SB ES CP CJ Municpios Catol do Rocha Lagoa Seca Pedras de Fogo Alhandra Alagoa Grande Solnea Remgio Monteiro Conde Cuit Soledade Alagoa Nova Areia Aroeira Boqueiro Cdigos CR LS PE AH AG SL RE MO CO CU SD AN AR AO BO
Apesar dos dados serem provenientes e de responsabilidade da Secretaria de Sade Estadual, importante perceber que essas informaes so bastante diversicadas, po-
1.3 Justicativa
dendo responder sobre as polticas de seguranas dessas regies. A causa plo, reete o grau de criminalidade de um dado municpio. J a causa
20
X95, W 19
por exem(causa de
bito de queda sem especicao) refere-se a uma varivel pouco informativa, no sentido de que um municpio associado esta causa no reete muito as condies scio econmicas dessa localidade. Contudo, esta varivel foi considerada no estudo por ser de interesses de algumas pessoas para o monitoramento da qualidade dos dados, que no ser tratado neste trabalho. Para construo desses relacionamentos foram consideradas as variveis sociais sexo, escolaridade, faixa etria, raa/cor. Todas essas variveis, sabidamente, inuenciam os
1.3 Justicativa
Tradicionalmente os mtodos de agrupamentos que envolvem elementos espaciais se baseiam em medidas e ponderaes espaciais, como o caso do mtodo de Varredura
so os mtodos de agrupamentos de dados (no espaciais), as principais obras da literatura estatstica apontam, quase sempre, para os procedimentos de agrupamentos rgidos, ou seja, que obrigam que cada item (objeto ou pessoa) pertena a um, e somente um, grupo. Mesmo essas ltimas tcnicas apresentam algumas limitaes, como por exemplo, a manipulao de dados de atributos. Portanto, percebe-se que no existe um mtodo
de agrupamento, digamos, uniformemente melhor, mais eciente e mais verstil que se aplique a todas as situaes prticas. Mas foram as limitaes dos mtodos citados que motivaram a construo de um mtodo de agrupamento capaz de combinar as caractersticas de algoritmos de agrupamento espaciais com a possibilidade de utilizao de um plantel de variveis categricas multidimensionais. O mtodo no faz uso da distribuio geogrca dos elementos espaciais, mas, ainda assim, consegue fornecer respostas muita prximas da tcnica de Varredura Scan, com o atrativo de se basear em conjuntos de dados multivariados com atributos. O mtodo no faz uso da distribuio geogrca dos elementos espaciais, mas, ainda assim, consegue fornecer respostas muita prximas da tcnica de varredura Scan, com o atrativo de se basear em conjuntos de dados multivariados com atributos.
1.4 Motivao
21
1.4 Motivao
Os mtodos de classicao de dados, sejam eles mtodos hierrquicos ou no-hierrquicos, possuem uma losoa de classicao rgida, conhecida na literatura como classicao crisp. Na contramo dessa idia esto os mtodos de aprendizado supervisionado, como o caso dos mtodos nebulosos Fuzzy que relaxam essa losoa de rigidez, permitindo assim, que um indivduo possa pertencer de um cluster ao mesmo tempo. Tendo em vista que uma das metas do trabalho agrupar os municpios paraibanos com as causas de bitos estudadas, parece ser mais realista permitir que um mesmo municpio esteja relacionado com mais de uma causa ao mesmo tempo, de acordo com alguma medida de proximidade. A necessidade de se construir modelos de agrupamentos mais exveis, no sentido de necessitar no utilizar parmetros espaciais foi o grande fator motivador desse trabalho. Um estudo poderia est interessado em agrupar municpios, por exemplo, utilizando dimenses, ou seja, agrupar tais localidades (dentro das causas externas) para certas faixas de PIB (dimenso 1) ou de IDH (dimenso 2), problema este que pode ser difcil tratar com as metodologias clssias de agrupamento de dados.
Avaliar a evoluo das inter-relaes entre municpios e causas externas no perodo de 2006 a 2010;
22
comparao da lgica Fuzzy com a lgica booleana o que ajudara no entendimento das diferenas entre as lgicas. Aps a introduo dos conhecimentos sobre lgica Fuzzy e Ser apresentado o
mtodo de agrupamento Fuzzy C-Means. No Captulo 5 sero introduzidos os conceitos de algoritmos evolutivos em especial os algoritmos genticos, em que sero apresentados alguns exemplos que facilitaram o entendimento da teoria evolucionria. No Captulo
6 ser apresentado uma proposta de um modelo Fuzzy C-Means Gentico para agrupamento de dados. Neste Captulo tambm ser apresentado a descrio do problema a ser otimizado, a funo objetivo a ser otimizada, bem como o passo a passo do algoritmo
23
Os primeiros trabalhos sobre teoria Fuzzy ocorreram nos na segunda metade dos anos 60, em que em 1965 Lotfali Askar Zadeh matemtico do Azerbaijo nascido em 1921 props a lgica difusa, mais conhecida como lgica Fuzzy. O primeiro trabalho sobre a lgica Fuzzy, Fuzzy Sets, foi publicado no volume 8 da revista Information and control nas pginas 338 a 353 no ano de 1965 (43). Trata-se de um artigo que formaliza a
teoria nebulosa em que h toda uma formalizao matemtica dos conceitos da teoria
Zadeh publicou um outro artigo entitulado Fuzzy sets and systems no Jornal Fox de 10 pginas (29-39) (44). At os dias de hoje Zadeh continua publicando trabalhos sobre
teoria Fuzzy, trabalhos estes tericos e aplicados. Atualmente Zadeh est com 89 anos e atua no Departamento de Computao da Universidade da Califrnia, Berkley. Usando os conceitos introduzidos por Zaheh h vrios artigos aplicados utilizando lgica difusa, como o artigo Publicado por Garcia e Filho com o ttulo Desempenho energtico de um sistema de refrigerao aplicando o controle adaptativo Fuzzy em que consideram um sistema de ar condicionado que minimizasse o custo de energia (13). Outros trabalhos que utilizam lgica Fuzzy so: HARRIS C. J., MOORE C. G., BROWN M., Intelligent control: Aspects of Fuzzy Logic and Neural Nets, World Scientic, 1993 (4); KOSKO, BART, Neural networks and Fuzzy systems: a dynamical systems approach to machine intelligence, Prentice-Hall International, 1992 (27), COX E., The Fuzzy Systems Handbook: a Practitioner's Guide to Building, Using and Maintaining Fuzzy Systems, Professional, 1994 (6); PEDRYCZ W., GOMIDE F., Fuzzy Systems Engineering: Toward Human-Centric Computing, Wiley/IEEE Press, 2007 (35). O mtodo de otimizao conhecido como Algoritmo Gentico" foi criado por John Henry Holland. Existem na literatura vrias aplicaes da teoria de algoritmos genticos, dentre esses trabalhos pode-se citar: GOLDBERG D. E. Genetic Algorithms in Search,
24
Optimization, and Machine Learning. EUA: Addison-Wesley, 1989, pgina 80 (16), em que discute formas de representao do espao de busca, GOLDBERG D. E. Genetic Algorithms in Search, Optimization, and Machine Learning, EUA: Addison-Wesley, 1989, p. 121, que discute e compara diversas formas de seleo de indivduos (14), GOLDBERG D. E. Genetic Algorithms in Search, Optimization, and Machine Learning. EUA: AddisonWesley, 1989, p. 147 que discute operaes que podem ser aplicadas nos indivduos para a reproduo, dentre outros (15). H vrios artigos sobre algoritmos evolutivos e em especial sobre os algoritmos genticos em lngua portuguesa, dentre esses artigos podemos citar: Algoritmos Genticos: Aplicao Robtica, dissertao defendida por Pires em 1998 na Faculdade de Engenharia da Universidade do Porto (36), GOLDBARG C. Algoritmos evolucionrios na determinao da congurao de custo mnimo de sistemas de co-gerao de energia com base no gs natural, Pesqui. Oper. 25(2): pp. 231-259, 2005 (17); LEITE. Aplicao
de algoritmos genticos na determinao da operao tima de sistemas hidrotrmicos de potncia, Sba Controle & Automao 17(1): pp. 81-88, 2006 (28). Ainda assim na literatura h poucos artigos que combinam algoritmos genticos com a teoria Fuzzy, dentre eles podemos citar KLAWONN F., KELLER A. Fuzzy Clustering with Evolutionary Algorithm, internacional of Intelligent Systems, volume 13,1998 (25). Este artigo apresenta o mtodo uma abordagem da teoria Fuzzy C-Means para identicao de clusters. Uma proposta bem parecida com o tcnica utilizada nessa monograa. Contundo, o artigo prope um mtodo em que os centrides no so denidos a priori. No nosso caso os centrides sero pre-estabelecidos antes mesmo da execuo do mtodo de agrupamento. O autor tambm prope uma abordagem para a construo de agrupamentos usando algoritmos genticos, contudo segundo os autores essa abordabem no promissora devido a caracterstica do espao paramtrico em que a funo objetivo varia ser bastante complicado. Pode-se citar tambm LIU H. C., JEAG B. C.,YU Y. K. Fuzzy C-Means Algorithm Based on Standard Mahalanobis Distances, International Symposium on Information Processing, China, 2009, pp. 422-427, em que os autores trazem algumas modicaes do Os autores propuseram uma metodologia de agrupa-
mento Fuzzy utilizando a distncia de Mahalanobis, ao invs das distncias euclidianas. Um outro trabalho relevante o trabalho publicado por NUOVO A. G., CATANIA V., PALESI M. The Hybrid Genetic Fuzzy C-Means: a Reasoned Implementation, International Conference on Fuzzy Systems, Cavtat, Croatia, 2006, pp 33-38 (32). Neste artigo
25
apresentada uma abordagem hbrida que integram Fuzzy C-Means (FCM) e algoritmos Algoritmos Genticos (AGs) para projetar um classicador timo para o problema de classicao especca. Essa integrao permite a gerao automtica de um sistema de classicao, com um subconjunto de funcionalidades otimizadas, a partir de um banco de dados de exemplos. Segundo os autores o classicador gerado supera o algoritmo FCM clssico.
26
Jules Verne
3.1 Introduo
A estatstica multivariada lida com problemas em que se observa vrias medidas sobre um mesmo item (pessoa ou objeto). Na verdade, as principais principais idias da
Anlise Multivariada surgiram a partir da generalizao de tcnicas univariadas. Segundo Furtado(2008) a necessidade de compreenso das relaes entre as diversas variveis, de maneira conjunta faz com que as anlises multivariadas sejam complexas ou at mesmo difceis. E, talvez, por isso, sejam, ainda, to pouco utilizadas como ferramenta estatstica. Em geral, os objetivos para os quais a anlise multivariada se presta so:
Reduo da massa de dados conservando o mximo de informao original possvel; Agrupamento de tens similares baseados em dados amostrais ou experimentais; Investigao de inter-dependncias entre as variveis objetos de estudo, buscando, para isso, identicar relaes estruturais;
A anlise multivariada de dados vem sendo amplamente utilizada por vrias reas do conhecimento. Em estudos da rea mdica, por exemplo, tcnicas multivariadas podem ser implementadas para criar uma funo que separe pessoas doentes e no doentes considerando algumas caracterstica. Em estudos de pesquisa de mercado, muitas empresas
3.1 Introduo
27
tentam traar o perl scio-econmico de seus clientes em busca de identicar grupos diferenciados de consumo. Os dados multivariados provm de estudos em que so selecionadas
p 1 variveis ou
caractersticas para serem mensuradas. Entretanto, alguns pesquisadores denem anlise multivariada como sendo exames de relaes entre mais de duas variveis. A representao das informaes multivariadas dada por amostral ou experimental de uma Dessa forma as medidas das
xmn
m-sima
unidade
n-sima
varivel mensurada.
variveis em
X
~
logo abaixo.
x11
x12
x1j
x1n
x 21 x22 x2j x2n . . . . . .. . . . . . . . . . . . X= xi1 xi2 x1j x1n ~ . . . . . .. . . . . . . . . . . . xm1 xm2 xmj xmn
Outros autores preferem denir a anlise multivariada como uma tcnica adequada estudar problemas nos quais todas as mltiplas variveis so assumidas como tendo uma distribuio normal multivariada, como apresentada pela equao 3.1.
f (x) =
onde
1 (2) ||
~
p 2 1 2
[ 1 (X )t 2 ~ ~ ~
(X )] ~ ~ ,
(3.1)
medida de similaridade ponderada pela covari~ ~ ~ ~ ~ ncia entre os elementos e ser discutida rapidamente na Seo 3.2. Os valores e so ~ ~ o vetor de mdia e matriz de covarincia populacional respectivamente. Os estimadores do vetor de mdia e matriz de covarincia populacional sero representados da forma que segue (11).
(X )t 1 (X ) representa uma
X1 X2 X= . . ~ . Xp
28
X(m n)
C,
cjk =
1 m1
(xjk xj )(xjk xj )
i=1
(3.2)
Atravs da matriz de covarincia pode-se calcular a matriz de correlao elemento da matriz dado por
R,
em que cada
rjk =
cjk , em que sj sk
sj sk
(22).
conhecida como distncia Euclidiana, denida como segue para dois pontos
no
29
ab
=
j=1
(daj dbj )2
(3.3)
Existem outras medidas de distncia comumente utilizadas em diversos mtodos de agrupamentos,entre elas esto as distncias de Mahalanobis e de Manhattan.
Distncia Euclidiana
A distncia Euclidiana ou distncia mtrica a distncia entre dois pontos que pode ser demonstrada pela aplicao repetida do teorema de Pitgoras. Ao aplicar o teorema de Pitgoras como distncia, o espao euclidiano torna-se um espao mtrico. A distncia Euclidiana, em sua forma mais geral, denida como:
(p1 q1
)2
+ (p2 q2
)2
+ + (pn qn
)2
=
i=1
(pi qi )2
Distncia de Mahalanobis
A distncia de Mahalanobis uma medida alternativa que agrega a informao das covarincias entre as variveis ao seu clculo. O clculo dessa distncia bastante simples e pode ser obtido pela expresso abaixo.
d(X 1 , X 2 ) =
~ ~ em que
(X 1 X 2 )t S 1 (X 1 X 2 ),
~ ~ ~ ~
30
forma, possvel posicionar os produtos em um mapa ou grco em que cruzam-se duas variveis. Em outras palavras, um mapa perceptual reete uma espcie de representao visual de percepes que um respondente tem sobre objetos em duas ou mais dimenses. Cada objeto tem uma posio especial no mapa perceptual que est associado a uma similaridade ou preferncia relativa a outros objetos no que se refere s dimenses do mapa perceptual. A maioria das aplicaes da AC envolve um conjunto de objetos e
atributos em que os resultados so congurados em um mapa perceptual comum. As primeiras consideraes matemticas a respeito da Anlise de Correspondncia foram feitas por Hirshfeld em 1935. Alguns autores denem Anlise de Correspondncia como um mtodo de anlise fatorial para variveis categricas. A AC foi primeiramente utilizada, por Fisher (1940) para a anlise de tabelas de contingncia posteriormente foi redescoberta na Frana por Benzecri em 1969. Atualmente a tcnica Anlise de Correspondncia tem sido extremamente empregada em diversas reas do conhecimento, com uma nfase maior para as reas de Psicologia, Psiquiatria, Neurocincias e Datamining. em que tem sido extremamente usado naquele pas como um mtodo estatstico no processo de Data Mining. A partir de 1975, a tcnica de Anlise de Correspondncia vem sendo utilizada em diversas reas do conhecimento, em publicaes em diversos idiomas (20). Uma aplicao comum da metodologia de Anlise de Correspondncia tem sido na reduo dimensionalidade dos dados, obtidas atravs do mapeamento perceptual das relaes de inter-dependncia de informaes amostrais que, na maioria das vezes, representam dados no-mtricos. Tal mtodo tambm conhecido como escalonamento ou escore timo, mdia recproca ou anlise de homogeneidade. A proximidade entre os objetos no grco indica o nvel de associao entre tais objetos no mbito amostral. O mtodo AC difere de outras tcnicas de escalonamento multidimensional em sua habilidade de acomodar tanto dados no-mtricos quanto relaes no lineares. As trs principais caractersticas que diferem a Anlise de Correspondncia dos outros mtodos de escalonamento multidimensional so:
uma tcnica composicional, e no decomposicional, porque o mapa perceptual baseado na associao entre objetos e um conjunto de caractersticas descritivas ou atributos especicados pelo pesquisador.
Sua aplicao mais direta na retratao da correspondncia de categorias de variveis, particularmente quelas medidas em escalas nominais. Tal correspondncia
31
Os principais benefcios da AC residem em sua habilidade para representar linhas e colunas em um espao conjunto.
Na AC, uma decomposio dos dados obtida para se estudar a estrutura dos mesmos sem que um modelo seja hipotetizado ou que uma distribuio de probabilidade tenha sido assumida, o que uma grande vantagem. Outro aspecto, discutido por Von der
Heizden et all (1989), que a anlise de correspondncia, geralmente, introduzida sem qualquer tratamento estatstico prvio, para dados categricos, o que prova sua utilidade e exibilidade. Em consequncia disso, os testes estatsticos infernciais clssicos, em sua maioria, no so aplicveis, estando a soluo sugerida apenas pela distribuio grca de seus resultados (1). tambm, um meio de criar conguraes representando as linhas da tabela por pontos no espao, tal que a distncia Euclidiana entre os pontos na congurao seja igual a distncia qui-quadrado calculadas entre as linhas da tabela. O nico pressuposto a ser respeitado que os dados sejam uma matriz retangular de entradas no negativas. O tipo mais comum de matriz de entrada uma tabela Para o caso de
Anlise de Correspondncia Simples temos uma tabela de dupla entrada sendo essa a forma mais simples de AC. A Tabela 2 abaixo apresenta a estrutura do banco de dados em uma Anlise de Correspondncia Simples. Tabela 2: Estrutura dos dados para Anlise de Correspondncia. B A 1 2 . . . i . . . I Total Coluna 1 2 ... j ... J Total Linha
n11 n21
. . .
n12 n22
. . .
. . .
n1j n2j
. . .
. . .
n1J n2J
. . .
n1+ n2+
. . .
ni1
. . .
ni2
. . .
. . .
nij
. . .
. . .
niJ
. . .
ni+
. . .
nI1 n+1
nI2 n+2
nIj n+j
nIJ n+J
nI+
N
nij
a
a frequncia observada pela interseco da i-sima categoria da varivel A com categoria da varivel B;
j -sima
32
i-sima j -sima
categoria de A; categoria de B;
Seja
a matriz de frequncias absolutas, ou seja, temos que A matriz de frequncias relativas ser
N = [nij ]IxJ P
gerada
a partir da Tabela 2.
P =
1 N e chamada de n
pode ser
p11 p21
. . .
p12 p22
. . .
. . .
p1j p2j
. . .
. . .
p1J p2J
. . .
p1+ p2+
. . .
pi1
. . .
pi2
. . .
. . .
pij
. . .
. . .
piJ
. . .
pi+
. . .
pI1 p+1
ni+ e n
n+j . n
pIj p+j
pIJ p+J
pI+
1
em que
pij =
nij , n
pi+ =
Da Tabela 3 os vetores de frequncias relativas marginais so denominado massas e so calculado em relao ao total geral
n.
ni+ e a massa da n
O vetor
P,
i-simo
ai
i-sima
categoria da varivel A.
1j 2j Ij 1j 2j Ij = [ n+j , n+j , , n+j ] = [ p+j , p+j , , p+j ] ,
j = 1, 2, , J ,
ai
so denidas as distncias
entre pers linha utilizando a mtrica Euclidiana ponderada, tambm conhecida como distncia qui-quadrado, denida abaixo:
ij ( ni+
nit j 2 ) nit +
n+j n
(3.4)
33
dc (ai , ai t )
ai
ai t
ponderada O vetor
Dc
cj =
n+j n
j = 1, 2, , J .
c = [c1 , c2 , , cJ ]t Dr
tambm chamado de perl linha mdio ou centride dos pers linha. De forma anloga, as distncias qui-quadrado entre pers colunas so obtidas na mtrica diagonal das propores marginais de linha que uma matriz
ri =
ni+ i n
= 1, 2, , I ,
por ser uma tcnica de aprendizagem no supervisionada a Anlise de Agrupamentos no considera um nmero de grupos xo e realizada com base na similaridade ou dissimilaridade entre as observaes. No geral, os mtodos de agrupamento de dados utilizam como medidas de similaridades as mais variadas mtricas de distncias entre pontos, como distncias Euclidianas, Mahalanobis, Manhattan, dentre outras (21). Dentre os principais mtodos de agrupamento de dados, se pode citar a classe dos mtodos hierrquicos e no-hierrquicos. Os mtodos de agrupamentos hierrquicos cria uma hierarquia de agrupamentos que podem ser representadas em uma estrutura de rvore, chamada de Dendograma. As razes contm um nico agrupamento com todas as
34
observaes e as folhas correspondem s observaes individuais. Os agrupamentos hierrquicos so realizados por sucessivas fuses ou sucessivas divises. Dentro desse sistema de hierarquias, os procedimentos de agrupamentos aglomerativos iniciam-se com tantos grupos quanto forem os objetos, ou seja, cada objeto forma um grupo. Dessa forma, os objetos mais similares so agrupados e fundidos sequencialmente at formar um grupo nico contendo todos os objetos. J os mtodos hierrquicos divisivos trabalham no sentido inverso, ou seja, o processo inicia com um nico grupo contendo todos os objetos e, sucessivamente, esse grupo vai sendo subdividido em grupos cada vez menores at que haja tantos grupos quantos forem o nmero de objetos existentes na amostra. Por outro lado os mtodos no hierrquicos tm o objetivo de particionar os dos em
objetos considera-
produzam medidas sobre a qualidade das parties que sero originadas. Dessa forma, os mtodos no hierrquicos produzem parties num nmero xo de classes, ou seja, h que se escolher o nmero de agrupamentos priori. Um dos mtodos no hierrquicos mais utilizados o mtodo das k-mdias (22). Os mtodos clssicos de agrupamento de dados so bastante rgidos na construo dos agrupamentos, ou seja, se so identicados a um, e somente um, dos
grupos preestabelecidos.
a noo de rigidez precisa ser relaxada, isto , que se permita a um determinado item pertencer a um ou mais grupos ao mesmo tempo, os mtodos que utilizam a lgica nebulosa
por exemplo, se um anfbio um animal que tem caractersticas de animais aquticos e terrestres, portanto, vai apresentar caractersticas semelhantes ambos os grupos. O conceito de conjunto Fuzzy proporciona a vantagem de expressar esse tipo de situao em que um indivduo compartilha similaridade com vrios grupos atravs da possibilidade de um algoritmo associar cada indivduo parcialmente a todos os grupos (29)(12).Essa metodologia ser discutida com mais detalhes na seo que segue.
35
36
paz de tratar a incerteza resultante dos termos da linguagem natural vagos. [Mukaidono, 2001] deu um exemplo disso com a palavra meia-idade. comum classicar uma pessoa de meia idade ou no, apesar de no se saber exatamente quando se comea ou termina o perodo considerado meia-idade. Considere, a ttulo de exemplo, que o perodo de meia idade compreende o intervalo fechado
I = [35, 55]
I,
de meia-idade depois do dia de seu aniversrio de 35 anos. De mesmo modo uma pessoa de 56 anos no pertence mais esse grupo. Contudo, tamanha preciso no desejada em relao a este conceito, dados que os limites do intervalo
precisamente. Na verdade a nica idia que se tem uma idia vaga a respeito dos limites do intervalo de meia-idade (40). Pelo exemplo de incerteza do conceito de meia idade foi possvel perceber que a lgica tradicional impe limites bruscos ao contrrio da lgica Fuzzy que no impe limites to rspidos, proporcionando graus de pertinncias de elementos a uma determinada categoria. Dessa forma, a lgica Fuzzy capaz de capturar informaes vagas, em geral descrita em linguagem natural e convert-las para um formato numrico e de fcil manipulao.
37
Uma grande vantagem do uso da lgica Fuzzy a possibilidade de transformar a linguagem natural em conjuntos numricos, permitindo dessa forma a manipulao computacional. Zedeh deniu variveis lingusticas como variveis nas quais os valores so palavras ou sentenas em linguagem natural ou articial. As variveis lingusticas assumem valores denominados lingusticos, como por exemplo baixo, mdio, alto referente a varivel altura.
I1 (x) =
1
35x 15
x 20 20 < x < 35 x 35
ou
0 0
I2 (x) =
x 20
x 60
x20 15 60x 15
0
x45 15
I3 (x) =
As funes apresentadas acima podem ser observada na Figura 1. Podemos observar que a funo em questo apresenta uma forma triangular, no entanto a funo de pertinncia poderia assumir outras estruturas como Linear, Trapezoidal, Formato S, Formato Z, Gaussiana, Irregular dentre outras, sendo essas formas padres denidas na literatura que as funo de pertinncias podem assumir, podendo tambm ser denida pelo usurio.
38
4.1.3.2
Funes de Pertinncias
U, x
um nmero,
A (x)
no intervalo
[0, 1].
pertinncia de
x em A.
Dessa forma um elemento pertence a um conjunto em uma escala A funo de pertinncia apresentada abaixo e em seguida
[0, 1].
A : U [0, 1]
Denio 4.1.1.
U [0, 1], (x) [0, 1]
de
Um subconjunto Fuzzy
de
U x
:
com
chamada funo de pertinncia do conjunto Fuzzy F. Dessa forma, o valor indica o grau com que o elemento de
F,
F.
Do ponto de vista formal, a denio de um subconjunto Fuzzy foi obtida simplesmente aplicando-se o contra-domnio da funo caractersticas, que o conjunto para o intervalo
{0, 1},
[0, 1].
particular de conjunto Fuzzy. Por exemplo, considere o conjunto Esse conjunto, tem funo caracterstica par.
Cp (n) = 1
se
par e
Cp (n) = 0 F
m-
Portanto o conjunto dos nmeros pares um particular conjunto (44). A critrio de exemplo considere o subconjunto Fuzzy
F uzzy
j que
Cp (n) [0, 1]
dos nmeros
F = {n N : n
pequeno }
39
O nmero 0(zero) pertence pertence a esse conjunto? E o nmero 1000? Usando a teoria Fuzzy, poderamos dizer ambos pertencem
deve ser construda de forma coerente com o termo pequeno que caracteriza seus
elementos no conjunto universo dos nmeros naturais. Uma possvel funo de pertinncia para o subconjunto Fuzzy
(n) =
Se a funo de pertinncia ao subconjunto
1 n+1
(n) for o caso, se pode dizer que o nmero 0(zero) pertence (0) = 1, enquanto o nmero 1000 pertence (1000) = 0, 0011.
Neste caso, a
(n)
crisp. O algoritmo nebuloso Fuzzy c-means o mtodo de agrupamento mais utilizado por
ser simples de ser implementado, o mais rpida execuo e por no inigir restries ao conjunto de dados (39). O algoritmo melhor que o mtodo k-means que um algoritmo
hard pois o algoritmo Fuzzy C-means evita mnimos locais. O mtodo trata-se de uma
verso nebulosa do mtodo de agrupamento rgido k-means, sendo usado classicar um universo de amostras em categorias nebulosas de acordo com sua disposio no espao euclidiano. Bezdek introduziu a idia de um parmetro de fuzzicao (m ) no intervalo
[1, n],
temos
que determina o grau de fuzicao (fuziness ) nos agrupamentos, ou seja, para o efeito uma agrupamento crisp dos elementos aos clusters. Porm, quando
m = 1
m > 1,
O algoritmo do mtodo Fuzzy C-means se divide em dois procedimentos onde o primeiro consiste em calcular os centros de cada grupo e a atribuio de pontos estes centros utilizando uma forma de distncia euclidiana. Este processo se repete at que os centros dos agrupamentos tenha se estabilizados. Supondo que tem-se um conjuntos de indivduos vduo
xk
, k = 1, , n,
40
O algoritmo de agrupamento FCM um algoritmo no hierrquico cujo objetivo fornecer uma partio Fuzzy de um conjunto de indivduos homogneos em c agrupamentos. Para a construo dos c grupos o FCM dene e minimiza uma funo objetivo, funo esta que mede a adequao entre os indivduos e agrupamentos. A funo objetivo denida abaixo:
J(U, G) =
k=1 i=1
(uik ) (xk , gi ) =
k=1 i=1 p
(uik )
m l=1
(xkl gil )2
(4.1)
(xk , gi ) =
l=1
onde
(xkl gil )2
(4.2)
U M = G=
matriz de pertinncia
{uik }
do indivduo
ao cluster
Ci ;
m ]1, +[= um parmetro que controla a (fuzzines ) da pertinncia dos indivduos; (xk , gi ) =
o quadrado da distncia
L2
e um prottipo de cluster i.
Proposio 4.2.1.
que segue:
Sejam os prottipos
J(U, G)
, l = 1, 2, , p (uik )m
(4.3)
k=1
Prova: Uma vez que, no passo de representao, a pertinncia de cada indivduo
no
cluster
Ci ,
o parmetro
J(U, G)
como:
Jil (gil )
i=1 d=1
onde:
Jil (gil ) =
k=1
41
J(U, G) aditivo e desta forma o problema torna-se achar o gil que minimize
dJil (gil ) dgil
Jil (gil ).
= 0.
Dessa forma
temos que:
k=1
(uik )m
k=1
O resultado at agora mostra que atualizando-se ponto extremo de
gil
Jil (gil ).
da segunda derivada.
d2 Jil (gil ) d (uik )m > 0 (uik )m (xkl gil ) = 2 = 2 2 d(gil ) d(gil ) k=1 k=1
Como a segunda derivada de se
Jil (gil ) positiva, pode-se ento concluir que calculandoJil (gil ). uik
de cada indivduo
gil
Proposio 4.2.2.
i(i = 1, , c),
c
Seja a pertinncia
k(k = 1, , n)
ao cluster
J(U, G)
uik 0
e
i=1
uik = 1
c uik = h=1
l=1
(4.4)
Prova: Considere que no passo de alocao, os prottipos e o parmetro m esto xos. Uma vez que independentes e a minimizao de
gi
do cluster
Ci , (i = 1, , c),
U uk
J(U, G)
(uk ):
42
(uk ) =
i=1
minimizar
(uik )m
l=1
(xkl gil )2
sob a restrio
J(U, G)
implica em minimizar
(uk )
c i=1
uik = 1.
Seja o lagrangiano de
(uk ):
c p c
F (, uk ) =
i=1
O par
(uik )
m l=1
(xkl gil ) (
i=1
(uik )m 1) F , F ,
for zero.
(, uk )
se o gradiente de
Igualando o gradiente de
(4.5)
(xkl gil )2 = 0
l=1
(4.6)
uik =
p
1 m1
m
l=1
2 (xkl gil )
(4.7)
c c
1 m1
uhk =
h=1 h=1
1 m1
2 (xkl ghl ) 1
l=1
1 m1
c p
h=1
l=1
1 m1 1 =1 (xkl ghl )2
43
1 m1
1
c
m1 1 2 (xkl ghl ) 1
h=1
uik =
1 1
p l=1 (xkl
h=1
ghl )2 1
1 m1
2 (xkl gil ) 1
l=1
=
c
1 m1
=
h=1
para
i = 1, , c; k = 1, , n. uik
pela Equao 4.4leva a um
J(U, G).
(uk )
leva minimizao
J(U, G).
(uk )
e consequentemente para
J(U, G)
c i=1
uik = 1.
(uk ) = [m(uik )m1 (xkl gil )2 ] uik d=1 2 (uk ) = [m(m 1)(uik )m2 (xkl gil )2 ] 2 (uik ) d=1
Note que:
44
(uk )
A matriz
H((uk ))
uma matriz diagonal com todos elementos positivos. Este fato denida positiva e portanto isto implica que atualizar
H((uk ))
uik
J(U, G)
(3).
45
teorias atravs das quais a Natureza, por meio de seus recursos, resolveu problemas de grande complexidade. Assim pode-se dizer que a natureza otimiza seus mecanismos para resolver um ou mais problemas. A partir de um problema de otimizao, mesmo que se desconhea o que se est otimizando, possvel encontrar uma soluo tima, ou no mnimo, uma boa soluo, atravs dos Algoritmos Evolutivos e suas variaes. Em resumo, tais algoritmos podem trabalhar em cima de problemas, sem que exista um conhecimento explicito, sobre as suas solues timas. Os Algoritmos Evolutivos buscam tratar as estruturas de objetos abstratos de uma populao, como, por exemplo, variveis de um problema de otimizao, atravs da manipulao de operadores inspirados na evoluo biolgica, chamados comumente de operadores genticos.
mquina de estados nitos ou autmato nito uma modelagem de um comportamento composto por estados, transies e aes reetindo as mudanas desde a entrada num estado, no incio do
1 Uma
46
so analisados por uma funo de payo (penalidade) de acordo com a sada da mquina. A reproduo desses indivduos feita apenas por operadores de mutao, sendo que todos indivduos da populao atual geram novos descendentes. Esse processo caracteriza o que se chama de reproduo assexuada . Na seleo de novos indivduos os descendentes (lhos) competem com os pais e somente os indivduos com maior tness sobrevivem(3). Dessa forma, a PE garante que todos os indivduos de uma tal populao iro produzir novos descendentes e, somente, os melhores indivduos entre os atuais e os descendentes iro sobreviver, em que o domnio dos melhores indivduos chamado de elitismo total. O elitismo mais utilizado garante a sobrevivncia apenas dos que
k -melhores
indivduos em
k < N,
sendo
cada soluo na populao avaliada, alguns indivduos so selecionados para a prxima gerao, e recombinados ou mutados para formar uma nova populao (37). A grande vantagem dos algoritmos genticos esta no fato de no precisarmos saber como funciona a funo objetivo que queremos otimizar, apenas t-la disponvel para ser aplicada aos indivduos e comparar os resultados suciente. A nova populao ento utilizada como entrada para a prxima iterao do algoritmo. A seguir mostram-se os principais conceitos de algoritmos genticos (26).
sistema, at o momento presente. 2 Tipo de reproduo que ocorre sem a troca de material gentico.
47
Pode ser um problema de
otimizao, um conjunto de regras e testes para identicar os indivduos mais aptos, ou mesmo uma caixa preta em que sabemos apenas o formato das entradas; 2. Cdigo gentico: uma representao do espao de busca do problema a ser resolvido. O cdigo gentico deve ser uma representao capaz de representar todo o conjunto dos valores no espao de busca e precisa ter tamanho nito; 3. Indivduo: meramente um portador do seu cdigo gentico; 4. Seleo: Trata-se de uma parte chave do algoritmo gentico. Em geral, usa-se o
mecanismo de seleo por roleta, em que os indivduos so ordenados de acordo com a funo-objetivo e lhes so atribudas probabilidades decrescentes de serem escolhidos. A escolha feita ento aleatoriamente de acordo com essas probabilidades. Dessa forma conseguimos escolher como pais os mais bem adaptados, sem deixar de lado a diversidade dos menos adaptados. Outras formas de seleo podem ser aplicadas dependendo do problema a ser tratado; 5. Reproduo: A reproduo se divide em trs etapas sendo elas o acasalamento, a recombinao e a mutao.
Acasalamento: a escolha de dois indivduos para se reproduzirem em que em geral geral dois descendentes para manter o tamanho populacional;
Recombinao:
processo que imita o processo biolgico homnimo na reproduo sexuada em que os descendentes carregam em seu cdigo gentico parte do cdigo gentico do do pai e parte do cdigo da me. Dessa forma essa recombinao garante que os melhores indivduos sejam capazes de trocar entre si as informaes que os levam a ser mais aptos a sobreviver, e assim gerar descendentes ainda mais aptos. A critrio de exemplo considere a representao binria com 8 bits de dois nmeros em que a cadeia de bits (cromossomos ) de um nmero
A =
11001011
B
e do nmero
B = 11011111.
e 3 bits do nmero
C =
relativamente alta. Com essa informao, possvel, por exemplo, gerar dois
48
O Filho 1 com a parte gentica inicial do Pai A e a parte gentica nal do Pai B; O Filho 2 com a parte gentica inicial do Pai B e a parte gentica nal do Pai A.
Mutao: O processo de mutao realizado com a probabilidade mais baixa possvel no entanto essa probabilidade existe, e tem como objetivo permitir maior variabilidade gentica na populao, impedindo que a busca que estagnada em um mnimo local. O processo de mutao no h troca de material gentico como no exemplo anterior, ou seja, no h uma recombinao dos
aleatoriamente um bit de um indivduo e trocar o seu valor. Dessa forma seja um indivduo
A = 11001001.
A = 10001001.
O processo dos Algoritmos Genticos passam pode ser resumido pela Figura abaixo: Figura 3: Resumo dos Algoritmos Genticos.
49
Os exemplos de cross-over e mutao apresentados acima pertencem classe de algoritmos genticos de representao binria , em que os materiais genticos so representados por cromossomos que so uma sequncia de zeros e uns de conjuntos de bits estabelecido. Assim, a representao binria tem diculdades com mltiplas dimenses de variveis contnuas, especialmente quando uma grande preciso requerida. Para que a preciso desejada seja alcanada, um grande nmero de bits na cadeia dos cromosso-
1. No tempo
t0 ,
um conjunto de solues iniciais gerado e esse funcionar como Durante toda a execuo
2. Para essa populao inicial cada indivduo avaliado atravs de uma medida de aptido, ou tness, geralmente, representada pela prpria funo objetivo; 3. Dois indivduos (os pais) so escolhidos de acordo com os seus graus de adaptao, isto , indivduos mais adaptados (mais fortes) tm uma probabilidade maior de serem selecionados; 4. Os indivduos selecionados passaro por um processo de reproduo que envolve no s o crossing-over, como tambm a mutao, produzindo lhos. caracterizam-se como dois novos candidatos a perpetuarem a espcie. 5. Esses lhos so adicionados populao inicial e todo o processo repetido at que a populao no possa ser mais melhorada". Esses lhos
50
Para otimizao de parmetros contnuos a representao real a mais adequada, e segue o mesmo uxo descrito no diagrama apresentado na Figura 4. Em todo esse
tpico foi discutido os conceitos mais relevantes da teoria sober os algoritmos genticos mas, para tornar essa idia mais clara e objetiva, considere o exemplo abaixo como parte da explicao da teoria de algoritmos genticos. O objetivo do problema encontrar o parmetro funo
f (),
com
variando no intervalo
[2, 5; 2, 5].
f ()
f () = 6 + 2 seno(14),
com
(5.1)
2, 5 2, 5.
O grco da funo
f ()
f ()
mximo global o que um problema para muitos mtodos de otimizao, em que dessa forma muitos algoritmos no so capazes de localizar o timo global na presena de mltiplos timos locais. mtodo de busca local. Na Figura 5 pode-se observar um ponto vermelho, sendo este o ponto de mximo global da funo de 11,561141. O A exemplo o mtodo de busca Hill Climbing sendo este um
f ()
com
variando no intervalo
[2, 5; 2, 5]
f ()
51
f ().
pertencente ao espao paramtrico que maximiza a funo objetivo. Assim, o objetivo do algoritmo gentico encontrar esse valor para
f ()
seguem abaixo:
A funo objetivo
F O; 1 t NIT,
em que
indica as geraes;
P rR:
Sugesto
P rR = 0, 90;
P rM = 0, 01; N SE = 5; EP S = 108 ;
chamadas de
2. (Gerao
t = 0):
= 6 + 2 seno(14))
candidatas e ordenar esse vetor (com base na funo objetivo) em rodem decrescente; 4. Calcular a propores simples e as propores acumuladas a partir da soma das funes objetivo obtidas. Abaixo segue um exemplo ctcio da estrutura dessa. 5. Selecionar (usando a tcnica da Roleta Russa) duas solues candidatas (os dois indivduos) dentre as 15 solues apresentadas na Gerao
t = 0,
52
Tabela 4: Tabela com as Solues Candidatas Iniciais e com as Propores Calculadas com Base na Funo Objetivo.
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Total
Solues 2,319054079 -2,157887509 -1,637852107 1,535309915 -1,182515946 -2,477416303 -0,787606433 -0,297479171 -0,285729545 -0,228049562 0,886791589 -1,562166204 -1,557588427 -2,000869778 1,630069887 *
FO
10,66723 10,34924 8,16439 7,12349 7,04802 6,77317 6,62003 6,07555 6,06180 6,00266 5,88148 5,70587 5,55394 4,96244 4,03953 101,02883
Propores 0,10559 0,10244 0,08081 0,07051 0,06976 0,06704 0,06553 0,06014 0,06000 0,05942 0,05822 0,05648 0,05497 0,04912 0,03998 1,00000
Acumulada (PrA ) 0,10559 0,20803 0,28884 0,35935 0,42911 0,49615 0,56168 0,62182 0,68182 0,74124 0,79946 0,85594 0,91091 0,96003 1,00000 *
seleo seja proporcional adaptao de cada indivduo, ou seja, uma soluo mais apta (com funo objetivo maior) teria uma maior probabilidade de ser selecionada que uma soluo menos apta (com funo objetivo menor). Isso feito atravs do seguinte procedimento:
(0; 1);
(0; 1);
tcnica de amostragem com reposio. O processo de seleo feito utilizando uma tcnica de amostragem com reposio. Em vista disso, uma mesma soluo candidata pode ser selecionada duas vezes numa mesma gerao; 6. Com as duas solues candidatas selecionadas, juntamente com as suas respectivas funes objetivo calculadas, vericar se haver (ou no) o processo de crossover
53
ou recombinao (troca de material gentico dos dois candidatos). Isso poder ser realizado a partir do seguinte procedimento:
Bernoulli(P rR),
P rR
Se
Passo);
N U M3 = 1,
Sejam didata data
i , j , F O()it i ) e F O()jt
j )
funes objetivo;
Calcule
espcie de uma medida de variabilidade para cada soluo candidata e que sero inversamente proporcionais aos valores de suas funes objetivo;
i ,
e desvio-padro
?it .
Faa
o mesmo para a outra soluo candidata, isto , gere um nmero aleatrio (N U M5 ), atribudo ao indivduo dia
e desvio-padro
?jt .
Faa
i = N U M5
j = N U M4 ,
j ,
i .
de criar solues candidatas novas a partir das informaes genticas dos seus concorrentes. Se
N U M4 > 2, 5
ou
N U M4 < 2, 5,
ento faa
N U M4
54
igual ao limite do domnio da funo (ou -2,5 ou 2,5). Proceda de forma anloga para
N U M5 .
7. Com as duas novas solues candidatas (depois de terem, ou no, realizadas o crosso-
Gerar um nmero aleatrio (N U M6 ) de uma Distribuio de Bernoulli (P rM ), ou seja, gerar um dgito binrio, de modo que a probabilidade de sair 1 de
P rM
Se
passo);
N U M6 = 1,
[ 1 ; 1 ]. t t
nuindo medida que as geraes vo avanando, evitando assim, variaes altas nas geraes mais adiantadas;
Faa faa
i = i + ERR1 i
j = j + ERR2 .
Se
i > 2, 5
ou
j < 2, 5,
ento
j .
8. Calcule a funo objetivo para cada uma das novas solues candidatas e utilize o seguinte critrio para inclu-las (ou no) na lista das 15 solues candidatas da gerao inicial:
Se pelo menos uma das solues candidatas apresentar uma adaptao melhor (maior valor da funo objetivo) que qualquer uma das 15 solues candidatas geradas no 2
solues candidatas (que caria nesse momento 16 solues) e delete a ltima (ou as duas ltimas);
Se pelo menos uma das solues candidatas apresentar uma adaptao melhor (maior valor da funo objetivo) que a melhor soluo candidata (aquela com o maior valor da funo objetivo, ou seja, a primeira candidata da lista ordenada) gerada no 2
solues candidatas (que caria nesse momento 16 solues) e delete a ltima (ou as duas ltimas). E, alm disso, verique se possvel inclu-la tambm (ou as duas) na lista de Solues de Elite (que receber, no mximo, as melhores solues).
N SE = 5
55
9. Ordene as 15 novas solues candidatas e repita tudo novamente a partir do 4 passo at que tenha atingido o total de iteraes (N IT ) ou que a diferena, em mdulo, entre a soluo encontrada no 8 Elite seja menor que
EP S .
Esses procedimentos sero repetidos at que o critrio de parada seja atingido. Nos anexos desse trabalho podem ser encontrado duas implementaes desse exemplo na linguagem R e no pacote estatstico SAS. O algoritmo implementado na linguagem R considerou uma populao de 8000 indivduos e foram feitas 300 interaes, ou seja, foram consideradas 300 geraes que para convergncia" o algoritmo levou 4,265293 segundos. O valor da funo
f ()
timo igual
2,360763, valores estes bem prximos do real. Com base em tudo que foi visto, decidiu-se propor um mtodo hbrido de otimizao que combine as melhores propriedades da lgica nebulosa Fuzzy com as principais idias da losoa dos algoritmos genticos. Essa proposta ser discutida com mais detalhes a seguir.
56
6.1 Introduo
A proposta de um modelo hbrido para agrupamentos de dados une conceitos de algoritmos genticos com os da lgica de conjuntos nebulosos Fuzzy. Esse mix de ferramentas fornecer um mtodo de agrupamento mais exvel e eciente na hora de agrupar os dados, representando assim melhor a realidade dos diversos problemas prticos. Modelos
clssicos para agrupar dados, em geral, se utilizam de uma losoa crisp em que um indivduo pertence a um, e somente um agrupamento. Em geral, essa construo rgida de agrupamentos de dados no coerente com a realidade. Para contornar esse problema, comum a utilizao de conceitos da lgica difusa (ver Captulo 4), nos quais permitem que um indivduo possa pertencer a todos os grupos, segundo uma medida de pertinncia. O modelo proposto tambm faz uso dos Algoritmos Genticos como uma ferramenta fundamental na otimizao dos parmetros da metodologia Fuzzy, visto que esses algoritmos evolutivos no fazem uso de derivadas, inverses de matrizes ou qualquer outro clculo que pode tornar o procedimento complexo computacionalmente. Mas antes da discusso detalhada do mtodo proposto, convm explanar como foi realizado todo o processo de denio, captao, crtica e delineamento do banco de dados que ser utilizado nesse trabalho.
57
assim, o SIM um sistema de vigilncia epidemiolgica nacional, cujo objetivo captar dados sobre os bitos do pas a m de fornecer informaes sobre mortalidade para todas as instncias do sistema de sade. O banco de dados, inicialmente gerado, apresentou mais de um milho de linhas, representando cerca de 700 MB em formato DBF. Os dados listavam os bitos ocorridos por todas as causas de bitos fornecidas pelo livro de Classicao Internacional de Doenas (CID-10). As informaes de interesse (tais como nome do paciente, nomes dos pais, CRN do mdico que constatou o bito, nome do hospital, bem como o endereo do indivduo que veio a bito, dentre outras informaes ) foram ltradas utilizando o software TabWin 3.61, fornecido pelo Ministrio da Sade. A partir do carregamento da base de dados original, os dados passaram a ser tratados utilizando a linguagem R, em que foram ltrados os bitos ocorridos por homicdios referente causas externas pertencente ao captulo XX da CID-10. Para a consulta das
descries das causas foi utilizado o software livre Classix 0.1. Este software permite a consulta das causas de bitos da CID-10 por captulo ou pela codicao das causas e est disponvel para o sistema Linux. A opo de se utilizar a linguagem R foi devido o TabWin esconder, de certa forma, algumas informaes,uma vez que os cruzamentos de variveis so feitos por alguns arquivos
58
6.2.2 Linguagem R
Para a realizao das simulaes foi utilizado o pacote estatstico R em sua verso 11.1 de 31 de maio de 2010. O pacote R uma linguagem e um ambiente de desenvolvimento integrado, para clculos estatsticos e grcos. A linguagem R foi criada inicialmente
por Ross Ihaka e Robert Gentleman na Universidade de Auckland, Nova Zelndia e foi desenvolvido por um esforo colaborativo de pessoas em vrios locais do mundo (38). O nome R provm em parte das iniciais dos criadores e tambm de um jogo gurado com a linguagem S (da Bell Laboratories, antiga AT&T). No entanto, a linguagem R no deriva da linguagem S como muitos acreditam (9). A linguagem resultante muito similar em sintaxe ao S, mas a implementao subjacente e semntica so derivados da linguagem Scheme. O cdigo fonte do R est disponvel sob a licena GNU GPL (GNU General Public License ) e as verses binrias pr-compiladas so fornecidas para Windows, Macintosh, e muitos sistemas operacionais Unix/Linux. Apesar do seu carter gratuito, o R uma ferramenta bastante poderosa com boas capacidades ao nvel de programao e um conjunto bastante vasto (e em crescimento) de packages que acrescentam bastante potencialidades j poderosa verso base do R.
passam, obrigatoriamente, pelas idias de similaridade vistas na Seo 3.2. Dessa forma, como o problema multidimensional, o que se quer encontrar as melhores pertinncias de todos os municpios para todas as causas. Como uma maneira de
59
simplicar o espao de busca, decidiu-se trabalhar apenas com os 30 principais municpios paraibanos com registros nas e 10 8 principais causas de bitos. Dessa forma, as matrizes de pertinncias candidatas a solues timas tero 30 linhas por 8 colunas. Com isso,
ainda que considerando essas restries, as solues timas do subespao de busca estaro contidas no espao R30 8, de dimenso 240. A melhor maneira de transformar informaes de contagem em medidas de distncia (proximidade) aplicando a tcnica multivariada de Anlise de Correspondncia. esse procedimento que ser apresentado a seguir.
causas externas de bitos consideradas neste trabalho que podem ser representadas no
. Os dados foram reduzidos ao espao bidimensional devido este ser mais simples de
visualizar os relacionamentos as categorias das variveis envolvidas. Para a escolha do nmero de dimenses que seriam adotadas utilizou-se a regra dos autovalores maiores que 1. A partir desse critrio, decidiu-se por utilizar apenas 2 di-
90%
da
variabilidade total dos dados originais. A AC em sua teoria utiliza a distncia Euclidiana para calcular as dissimilaridades entre linhas e colunas da matriz de correspondncia. Contudo, preferiu-se empregar as distncia de Mahalanobis, uma vez que essa levam em considerao a matriz de varincia-covarincia dos pontos no
R2 .
60
Tabela 5: Tabela de contigncia a critrio ilustrativo com o quantitativo de bitos ocorridos em 2010. Causas Externas de bito Municpios Alagora Grande Alagoa Nova Alhandra Areia Aroeira Bayeux Boqueiro Caapor Cabedelo Cajazeiras Campina Grande Catol do Rocha Conde Cuit Esperana . . . Sap Sousa Total V03 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 . . . 0 0 17 V09 0 0 2 0 0 0 0 0 1 0 0 0 0 0 0 . . . 0 0 9 V49 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 . . . 0 1 15 V89 0 0 3 1 1 2 1 1 1 2 30 0 2 5 2 . . . 1 4 103 V99 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 . . . 1 0 1 W19 0 1 0 1 0 0 0 1 0 0 4 0 0 0 1 . . . 1 0 18 X70 1 1 0 0 0 1 0 0 1 1 7 0 1 0 0 . . . 0 0 24 X95 0 1 4 2 2 30 2 4 15 2 57 2 2 2 1 . . . 15 4 381 Total 1 3 9 4 3 35 3 6 18 7 98 2 6 7 4 . . . 18 9 568
A AC em sua teoria utiliza a distncia euclidiana para calcular as distncias entre linhas e colunas da matriz de correspondncia. Contudo, utilizou-se da distncia de
Mahalanobis para o clculo das distncias por considerar a variabilidade dos pontos no espao
mtodo AC. O grco bidimensional com os pontos de municpios e causas mostram a proximidade entre esses pontos, entretanto no capaz de mostrar os agrupamentos dos pontos, pois no existe nenhuma medida eciente para agrupar tais dados. Os pares de coordenadas de cada ponto foram padronizados da forma que segue:
Q(X 1 ; X 2 ) = Q
~ ~ em que
X 1 1 X 2 2 ; ~ ~ 1 2
(6.1)
e X 2 so vetores das coordenadas obtidas pela anlise de correspondncia ~ ~ dos pontos, sejam eles os municpios ou causas, isto , linha ou coluna da tabela de contingncia. Os valores e X 2 com ~ ~ mdias 1 e 2 respectivamente. Com as coordenadas padronizadas, utilizou-se a Equao e se referem aos desvios padres dos vetores 3.4 para o clculo das distncias entre os pontos. Com tais coordenas estimadas possvel perceber de forma supercial o relacionamento entre os dados em grcos perceptuais,
X1
X1
61
em que neste caso bidimensional. A critrio de exemplo, segue dois grcos perceptuais com as coordenadas no padronizadas e com as coordenadas padronizadas, grcos estes obtidos pela Anlise de Correspondncia para o ano de 2010, em que
D1 e D2 refere-se as
dimenses das linhas e colunas da tabela de contingncia respectivamente, em que pontos so as causas e as estrelas os municpios.
municpios e
causas em um espao
nicpio
M1
c2 ,
por
exemplo, o municpio
M1
c2 .
Ainda
M1
M1
c2
c20
forma, percebe-se que os agrupamentos formados tm uma interpretao clara e bastante direta devido caracterstica inerente a cada centride, onde todos os centrides que so os centros de cada um dos agrupamentos formados possuem uma expresso lingustica associada ele, como por exemplo, a causa Homicdio por Arma de Fogo referente a causa X95 do Captulo XX da CID-10. Assim, o problema busca encontrar os melhores agrupamentos utilizando a losoa de algoritmos genticos em conjunto com a Lgica Nebulosa Fuzzy. Otimizando uma funo objetivo que estabelea os melhores agrupa-
mentos, possvel tirar resultados bastante interessantes de cada agrupamento formado, resultados estes que so fceis de serem observados porque, de forma bastante supercial, o problema apresenta uma contextualizao bastante simplria que agrupar regies em conglomerados que possuem uma expresso lingustica associada. Mas esse problema de otimizao tem uma caracterstica particular. Os centros (centrides) dos agrupamentos
62
Por isso, uma adaptao do mtodo Fuzzy C-Means foi
J(U, D),
onde
mc
e D a matriz de
m c.
J(U, D) =
i=1 j=1
onde
(uij ) (xi , dj ) =
i=1 j=1
(uij )
m j=1
(xij dij )2 ,
uij
m=2
gij
no so atualizados, ou
seja, os centrides no sofrem alteraes em cada interao do algoritmo como ocorre no mtodo FCM. No Mtodo Hbrido Gentico Fuzzy os
gij
so pr-estabelecidos e obtidos
pela anlise de correspondncia. Logo o que resta otimizar a matriz de matriz de pertinncias em que cada linha da matriz
Umc
que a
Umc
apresenta as pertinncias de um
determinado indivduo (municpio) pertencer a cada um dos importante observar que o espao paramtrico da funo
c agrupamentos formados. m c.
J(U, D)
modo, tem-se que encontrar as melhores combinaes entre linhas e colunas da matriz de pertinncia
Umc
um dado agrupamento
c.
importante observar que as distncias dos municpios para as causas (grupos) so xas, o que no ocorre no Fuzzy C-Means, em que as distncias dos indivduos mudam a cada interao devido os centrides sofrerem um processo estocstico. A funo objetivo
63
m = 2.
J(U, D) =
j=1 i=1
onde
(uij )2 (dij )2 , j
(6.2)
uij
(dij )2
a um agrupamento
i,
distncias
J(U, D), U
uma medida
de qualidade dos agrupamentos formados, de modo que as matrizes aquelas que tornarem a funo objetivo com valor menor possvel.
desejadas sero
P0
ng , preciso de convergncia
np0
ne
nss
As probabilidades de crossover (Pr ) e mutao (PM ) pode variar a depender do problema. O parmetro
np0
P0 .
grande de solues iniciais de forma a garantir uma maior variabilidade nas geraes, possibilitando assim encontrar solues mais diversicadas.
Passo 2:
Gerar aleatoriamente
np 0
e abrig-las no array
P0 .
As solues candidatas devem ser geradas de forma aleatria de forma que cada linha da matriz candidata (Unc )some 1.
64
P0 ,
FO . J(U, D)
e os va-
Para cada soluo candidata ser aplicado a funo objetivo lores sero guardados no vetor
FO . FO
de modo que os primeiros
Passo 4:
indivduos sero aqueles mais adaptados, ou seja, com menor funo objetivo. A ordenao deve ser feita de modo que as posies iniciais antes da ordenao sejam guardadas.
Passo 5:
ne ,
Unc
timas. Essa espcie de "cpia de segurana" das melhores solues candidatas uma estratgia de programao para no perder, ao longo da evoluo do algoritmo, esses indivduos.
Passo 6:
arem para a fase da reproduo, de modo que tais indivduos selecionados tenham probabilidades de seleo proporcionais sua funo objetivo, ou seja, indivduos mais aptos (com valores menores para a funo objetivo) tenham mais chances de serem selecionados.
Passo 7:
Bernoulli(Pr ),
sendo 1 o sucesso e 0
o fracasso. Caso o nmero gerado seja 1 haver recombinao (crossover) entre as solues candidatas. Em havendo o processo de recombinao, siga os sub-passos abaixo:
P0
faa e
R1nc
pela matriz
Rnc
uma soma baixa denominada linha boa pois contribuem para minimizao da funo objetivo nhas ruins.
J(U, D)
R(1) nc
R(2) nc
respectivamente e guarde suas posies. Considera as ilustraes do processo de recombinao apresentados abaixo.
65
selecionada pela matriz
U (1) nc
(dnc )2 .
Observe que no trata-se de produto matricial e que os elementos das matrizes esto elevados ao quadrado.
(Unc )2 ,
ou seja:
66
R(1) nc
R(2) nc
e posteriormente
selecione uma linha boa e uma linha ruim utilizando os mesmos critrios de seleo das solues candidatas.
Seleciona uma linha boa e uma linha ruim para cada uma das matrizes
R(1) nc e
R(2) nc .
R(1) nc
e
R(1) nc
R(2) nc
solues candidatas. A troca de uma linha boa por uma linha ruim pode vir
67
a melhorar as solues candidatas, todavia isso no necessariamente ocorre. O que importante entender que a troca de material gentico deve ocorrer, sendo isso suciente para o algoritmo. Este procedimento pode ser resumido da seguinte forma.
Para
Bernoulli(PM ) = 1, U (2)
R(1) nc
R(2) nc
obtidas no passo anterior e troque a linha ruim da matriz boa da matriz matriz e a linha boa da matriz
U (1) nc
com a linha
U (1) nc
U (2) nc .
A matriz
Unc
e no na matriz
Rnc .
Rnc
Unc
Passo 8:
datas.
Selecione duas linhas e duas colunas da matriz que sofrer mutao para serem trocadas. Observe que a mutao se d por uma desordenao dos elementos genticos da prpria soluo candidata. O procedimento pode ser resumido da forma que segue.
68
Passo 19:
tiveram
Para aqueles que iro sofrer mutao, ou seja, para aqueles que o processo de mutao ser iniciado.
Bernoulli(PM ) = 1
Passo 20:
U nif orme(1, n)
As linhas
Passo 21:
Gere mais dois nmeros aleatrios independentes com distribuio Os dois valores geradores referem-se as colunas das matrizes
Passo 9:
J(U, D)
pertinncias.
69
recombinao e/ou mutao com os valores das funes objetivo dos indivduos da
P0 .
menos uma das funes objetivo calculadas para as piores" solues candidatas de as solues de elite.
P0 ,
P0 .
Passo 11:
geraes indicado no Passo 1 seja atingido ou at que o primeiro valor da soluo de elite seja menor que at que para um nmero razovel de geraes consecutivas, ou seja,
nss
Passo 12:
No captulo que segue, uma aplicao da metodologia proposta ser efetuada e os principais resultados sero discutidos.
70
Aplicaes e Discusses
Unc .
ng = 50.000
elite, 20 solues. J para a aplicao dos operadores genticos, foram considerados uma probabilidade de recombinao de 85% e de mutao de 5%. Como critrio de parada, utilizou-se
nss = 100
com um
= 103 .
O problema de simulao abordado nesse documento bastante complexo, principalmente devido alta dimensionalidade do subespao de busca da funo objetivo que se encontra no espao vetorial
J(U ; D)
240
foram bastante consistentes para a grande maioria dos municpios, no deixando de haver tambm, algumas ocorra eventuais inconsistncias, o que no deixa de ser compreensvel, haja vista a complexidade do problema a ser otimizado. Por outro lado, em termos de desempenho, utilizou-se um computador com processador Intel(R) Core(TM) 2 Duo CPU, T5550, 1.83GHz e observou-se que, em mdia, o
71
algoritmo consumiu cerca de 4,45 horas para gerar os resultados para cada ano, sendo que em torno de 76% desse tempo, o algoritmo consumiu realizando as tarefas de recombinao, como mostra a Tabela 5. Tabela 6: Tempo de convergncia em horas do algoritmo MHGF.
Tempo em Hora Anos 2006 2007 2008 2009 2010 Total 4,302651 4,658944 4,268316 4,254411 4,752415 Cross-over 3,011856 3,727155 2,987821 2,935544 4,277174 Mutao 1,290795 0,931789 1,280495 1,318867 0,475242
(JP), Santa Rita (SR), Bayeux (BA) e Cabedelo (CA) esto todos inter-relacionados com a causa X95, uma vez que todos esses municpios esto prximos dessa causa. Logo, o grco perceptual da AC fornece avaliaes diretas de dissimilaridades entre os elementos estudados simplesmente analisando os seus padres de distncias. Dessa forma, as coordenadas produzidas pela Anlise de Correspondncia para os municpios e causas foram utilizadas para se calcular as distncias (expresso 6.1) entre esses dois conjuntos de elementos. A partir da, essa matriz de distncias fomentou a gerao dos resultados simulados, atravs da execuo do modelo de agrupamento proposto. As demais tabelas de contingncias podem ser encontradas no Anexo A.4.
72
Causas Municipio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO V03 0 0 1 0 0 4 0 1 3 0 0 0 1 0 0 0 38 0 0 0 0 1 0 0 6 0 1 0 0 0 V09 0 0 0 0 0 1 0 0 2 0 2 0 0 0 0 0 4 0 1 0 0 0 0 1 8 2 0 0 0 1 V49 0 0 3 0 0 1 0 0 0 3 0 0 0 0 0 0 4 0 0 0 1 1 0 0 0 1 1 1 0 8 V89 4 7 0 3 3 10 2 1 2 2 78 4 3 2 5 4 38 4 2 3 13 1 13 9 2 1 3 7 1 4 V99 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 2 0 0 3 0 0 0 W19 3 0 0 0 1 2 1 1 1 3 5 0 0 0 1 1 7 0 0 0 1 1 0 0 4 0 0 0 0 0 X70 1 0 0 1 1 0 1 0 0 3 8 1 1 2 2 0 11 1 1 2 6 2 3 0 3 2 0 0 0 0 X95 1 0 1 4 2 32 2 2 11 0 102 3 3 1 7 3 222 3 1 6 12 1 3 1 38 7 11 3 2 5
73
Nesse trabalho decidiu-se denir os pontos de corte 0,10, 0,20, 0,30 e 0,50, no sentido de facilitar o estudo de possveis impactos dessas escolhas sobre os agrupamentos formados. Por isso, resolveu-se apresentar os resultados comparando os agrupamentos formados para cada um dos pontos de corte considerados em cada ano. Anlise de Sensibilidade e ser discutida na Seo 7.3.1. A essas anlises chamou-se Por outro lado, pensando na
evoluo temporal das inter-relaes entre causas e os principais municpios paraibanos, para um ponto de corte especco, tais municpios foram avaliados. A esse conjunto de resultados, denominou-se Anlise Longitudinal que ser apresentada na Seo 7.3.2.
74
numa escala mais extendida. Tambm no foram circulados todos os agrupamentos para que a visualizao no fosse prejudicada. De qualquer forma os agrupamentos formados podem ser observados nas Tabelas de Agrupamentos apresentadas no Anexo A.12, em que o cdigo 1" indica que o municpio pertence causa considerada com base no ponto de corte escolhido. Claramente nota-se que a escolha do ponto de corte impacta, e muito, os agrupamentos formados. Com o ponto de corte
Pc = 0, 10
V 09
(Pedestre traumatizado em acidentes de transporte no especicado) engloba, tambm, todos os municpios pertencentes ao grupo formado pela causa zado em coliso com automvel). J para
V 03
(Pedestre traumati-
Pc = 0, 20
ser mais consistentes com um nmero de municpios participantes um pouco menor. Para
Pc = 0, 30, Pc = 0, 50 os agrupamentos formados se mostram mais rigorosos, aproximandose dos mtodos tradicionais que utilizam a losoa Hard" (um municpio alocado para uma, e somente uma, causa). Figura 9: Grcos para os 4 pontos de cortes considerados, 2006.
De um modo geral, o aumento da exigncia, em relao ao ponto de corte, faz com que todos os municpios que pertencem aos grupos considerados de causas externas apresentam, no mnimo, uma inter-relao bastante forte com as respectivas causas. Ainda
75
assim, eventualmente, alguns municpios que apresentam uma distncia razoavelmente pequena de uma dada causa no foi incorporado essa causa, o que era para acontecer. Mas esses resultados so compreensveis dada a tamanha complexidade do objeto a ser otimizado, que so as matrizes de pertinncia. Figura 10: Grcos para os 4 pontos de cortes considerados, 2007.
Para o ano de 2007 tambm se observa que medida que o ponto de corte vai aumentando os contornos denem os agrupamentos agrupamentos em torno das causas externas de bitos vo diminuindo apresentando clusters mais coerentes com os pontos de cortes
Pc = 0, 20
ou
Pc = 0, 30.
76
Tabela 8: Pertinncias Obtidas pelo Modelo Hbrido Gentico Fuzzy (MHGF) para o ano de 2006.
V09
0,02635 0,08117 0,05760 0,10576 0,01140 0,06264 0,03849 0,14816 0,18362 0,13236 0,04368 0,03437 0,02589 0,03373 0,07992 0,03705 0,10335 0,02099 0,05567 0,07134 0,02368 0,09367 0,07576 0,07610 0,17564 0,19531 0,04020 0,03345 0,14617 0,05716
V49
0,02021 0,03310 0,61335 0,02969 0,01527 0,01013 0,01527 0,00997 0,02528 0,10119 0,02302 0,01447 0,00881 0,01985 0,02255 0,01020 0,01172 0,01864 0,02261 0,02524 0,01402 0,04740 0,02744 0,02962 0,00987 0,01882 0,00904 0,01537 0,01545 0,60973
V89
0,55357 0,23504 0,04038 0,35887 0,55480 0,02384 0,60296 0,11362 0,06495 0,16368 0,29971 0,71602 0,15026 0,23480 0,24708 0,30467 0,02530 0,46794 0,16756 0,14215 0,14074 0,10280 0,27527 0,23819 0,03101 0,13083 0,15430 0,09941 0,15790 0,04095
V99
0,05922 0,21898 0,08655 0,06967 0,01804 0,01492 0,04116 0,07855 0,04611 0,13638 0,03607 0,03994 0,12619 0,10536 0,13588 0,05290 0,01673 0,03033 0,11140 0,11403 0,06289 0,22012 0,19233 0,23811 0,03862 0,09361 0,06876 0,18158 0,09584 0,08886
W19
0,05031 0,08080 0,04880 0,13547 0,02773 0,05345 0,06094 0,27135 0,04426 0,09120 0,09600 0,04197 0,08342 0,05189 0,11156 0,23571 0,05030 0,04520 0,17754 0,20136 0,04597 0,12355 0,07885 0,07712 0,04121 0,32485 0,29913 0,09242 0,31653 0,05077
X70
0,22818 0,25291 0,04882 0,16913 0,25502 0,02861 0,16120 0,03696 0,08140 0,18195 0,30469 0,08208 0,52909 0,41416 0,29931 0,29226 0,02928 0,27780 0,32501 0,26264 0,59336 0,14408 0,26268 0,25374 0,02938 0,06205 0,21862 0,49118 0,08399 0,05044
X95
0,03142 0,05142 0,05072 0,09605 0,09713 0,71878 0,05248 0,29771 0,23217 0,10359 0,15009 0,04650 0,05505 0,09881 0,06141 0,03960 0,64648 0,11028 0,11158 0,14218 0,08731 0,15862 0,04666 0,04564 0,14244 0,10690 0,12338 0,05884 0,13332 0,05012
ter em avaliar avaliar evoluo temporal das causas que mais acomentem os principais
77
mesmo tempo, para torna-la representativa do universo estudado, decidiu-se escolher os municpios de Joo Pessoa, Campina Grande, Cabedelo e Bayeux. Eventuais municpios que merecerem algum destaque podero ser citados na anlise. O ponto de corte escolhido para formar os agrupamentos foi
Pc = 0, 20.
desses quatro municpios pode ser naturalmente reproduzidas para os demais municpios paraibanos considerados neste trabalho. Desse modo, foi observado que para o ponto de corte adotado, o municpio de Joo Pessoa sempre esteve associado causa
todos os anos. Ainda para o ano de 2006, o municpio que apresentou inter-relacionamento com os bitos por homicdios provocados por arma de fogo, alm de Joo Pessoa e Bayeux foi o municpio de Caapor. Todos os resultado aqui comentados podem ser encontrados na tabela abaixo para os 5 anos considerados para
Pc = 0, 20.
Tabela 9: Evoluo das inter-relaes entre municpios e causas externas para o ponto de corte 0,20.
Ano JOO PESSOA 2006 2007 2008 2009 2010 X95 X95 X95 X95 X95
Municpio CAMPINA GRANDE X70; V89 V89 W19; X95 V89 V89; X95 CABEDELO X95; V03 W19; X95 X95 V03 V03; V99; X95 BAYEUX X95 V03 X95 V09 X95
Ainda em 2006, observa-se que o municpio de Campina Grande (CG) apresenta associao com a causa
X95,
matizado em coliso com automvel, juntamente com o municpio de Santa Rita (SR). No ano de 2007 observou-se que mais municpios foram incorporados ao cluster formado pela causa de homicdio provocado por arma de fogo. Os municpios que esto contidos nesse agrupamento so os mesmos do ano de 2006 (Joo Pessoa, Bayeux, Santa Rita e Caapor) mais os municpios de Pedras de Fogo (PE), Patos (PA) e Catol do Rocha. Para esse ano o municpio de Campina Grande (CG) apresentou mais relao com acidentes acidentes de transporte. No ano de 2008, Joo Pessoa, Santa Rita, Cabedelo e o municpio de Patos (ver no anexo), continuam apresentando relaes signicativas com a causa de bito por homi-
78
cdios por arma de fogo e o municpio Bayeux no foi mais includo nesse agrupamento, mostrando possivelmente uma melhora nas polticas de seguranas pblicas desse municpio. O municpio de Campina Grande continua apresentando inter-relacionamento
V 89.
X95
e os municpios de
Santa Rita (SR), Caapor (CA) e Bayeux caram bastante prximos mas no chegaram a pertencer a este agrupamento. O municpio de Campina Grande para este ano no
apresentou inter-relacionamento com nenhuma causa de externa de bito. No ano de 2010, observou-se que muitos municpios que em 2009 no apresentaram inter-relacionamentos voltaram a reetir as mesmas relaes dos anos anteriores 2009. O municpio de Campina Grande voltou a apresentar um inter-relacionamento considervel com a causa externa de bito
Observa-
se que em nenhum momento Joo Pessoa esteve longe da causa de bito de homicdio por arma de fogo (X95) mostrando sua forte ligao para esta prtica de homicdio. importante vericar que uma caracterstica muito peculiar do mtodo MHGF so as interseces enter os agrupamentos mostrando a exibilidade do modelo. Vale
lembrar que interpretaes espaciais podem ser tomadas partindo do pressuposto que os municpios dentro do mesmo agrupamento so vizinhos geogracamente, como o caso dos municpios de Joo Pessoa, Bayeux, Cabedelo e Santa Rita que possivelmente formam um conglomerado espacial em torno da causa de bito por homicdio provocados por arma de fogo.
79
Este trabalho apresentou um novo mtodo para agrupamento de dados utilizando a Lgica Nebulosa Fuzzy em paralelo com Algoritmos Genticos. O mtodo, em geral, apresentou resultados bastante satisfatrios, nos remetendo a agrupamentos que j eram esperados subjetivamente devido a vivncia com os dados e com proximidades espaciais. Tais resultados tambm esto de acordo com os levantamentos feito pela Secretaria de Sade da Paraba, mostrando assim, uma coerncia nos agrupamentos encontrados. Isso mostra que o modelo proposto pode ser tambm indicado quando se deseja identicar agrupamentos espaciais, em que no se faz necessrio utilizar shapes de mapas geogrcos, mesmo no sendo uma especialidade do metodologia sugerida. O modelo hbrido ainda pode ser recomendado para os casos em que se deseje identicar agrupamentos em torno de variveis especcas, tais como PIB ou IDH, o que os demais mtodos de agrupamentos no conseguem tratar. Em resumo, pode-se armar que a modelagem proposta nesse
trabalho servir como uma alternativa para estudos em que se necessite investigar padres multivariados de inter-relacionamentos. Mas ainda no foi feito tudo em relao ao Modelo Hbrido Gentico Fuzzy. Uma sugesto de trabalho futuro seria a otimizao do parmetro m de fuzzicao, que nesse trabalho, utilizou-se
m = 2.
otimizao do ponto de corte (Pc ), no sentido de gerar grupos o mais homogneo possvel ou at mesmo a implementao de outros modelos hbridos que envolvam, por exemplo, (a) Algoritmo Scan com Algoritmo Gentico; (b) Estimao de densidades Kernel com Algoritmos de Colnia de Formigas ou (c) Fuzzy C-Means com Redes Neurais.
80
81
82
* PROBABILIDADE DE MUTAO; NSE; * NMERO DE SOLUES DE ELITE; EPS; * EPSLON (ERRO ADMISSVEL DE PARADA); TAM_POP; * TAMANHO DA POPULAO INICIAL; */ %MACRO GA_SIMPLES(NIT,PRR,PRM,NSE,EPS,TAM_POP);
83
/* INICIA DE EVOLUO DO ALGORITMO GENTICO */ DO IT=1 TO NIT; *RESET PRINT; IF IT=1 THEN SOLUCOES_ELITE=LISTA_SOLUCOES[1:NSE,1:2]; NUM1=RANUNI(0); NUM2=RANUNI(0); DO I=1 TO TAM_POP; IF NUM1<=LISTA_SOLUCOES[I,4] THEN DO; SOL1=LISTA_SOLUCOES[I,1]; FO1=LISTA_SOLUCOES[I,2]; I=16; END; END; DO I=1 TO TAM_POP;
84
85
86
NA MATRIZ NOVAS_SOLUCOES */ LISTA_SOLUCOES=NOVAS_SOLUCOES; LISTA_SOLUCOES[,3]=LISTA_SOLUCOES[,2]/LISTA_SOLUCOES[+,2]; CALL SORT (LISTA_SOLUCOES,{2},{2}); DO I=1 TO TAM_POP; IF I=1 THEN LISTA_SOLUCOES[I,4]=LISTA_SOLUCOES[I,3]; ELSE LISTA_SOLUCOES[I,4]=LISTA_SOLUCOES[I-1,4]+LISTA_SOLUCOES[I,3]; END; END; QUIT; %MEND GA_SIMPLES; /* EXECUTA A MACRO GA_SIMPLES*/ %GA_SIMPLES(50,0.85,0.10,5,0.000001,200);
87
Roleta = runif(2, min(acumulado), max(acumulado)) # Gera dois numeros aleatorios no intervalo [0,1] PR1 = PU1 = which(acumulado == min(acumulado[acumulado >= Roleta[1]])) # Posicao da primeira matriz U / R PR2 = PU2 = which(acumulado == min(acumulado[acumulado >= Roleta[2]])) # Posicao da segunda matriz U / R n = length(POP)/(dim(POP[,,1])[1]*dim(POP[,,1])[2]) # Numero de matrizes iniciais. PR1 = n - PR1 + 1 PR2 = n - PR2 + 1
88
89
90
Municipio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO
V03 0 0 1 0 0 4 0 1 3 0 0 0 1 0 0 0 38 0 0 0 0 1 0 0 6 0 1 0 0 0
V09 0 0 0 0 0 1 0 0 2 0 2 0 0 0 0 0 4 0 1 0 0 0 0 1 8 2 0 0 0 1
V49 0 0 3 0 0 1 0 0 0 3 0 0 0 0 0 0 4 0 0 0 1 1 0 0 0 1 1 1 0 8
V89 4 7 0 3 3 10 2 1 2 2 78 4 3 2 5 4 38 4 2 3 13 1 13 9 2 1 3 7 1 4
V99 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 2 0 0 3 0 0 0
W19 3 0 0 0 1 2 1 1 1 3 5 0 0 0 1 1 7 0 0 0 1 1 0 0 4 0 0 0 0 0
X70 1 0 0 1 1 0 1 0 0 3 8 1 1 2 2 0 11 1 1 2 6 2 3 0 3 2 0 0 0 0
91
Municipio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO
V03 0 0 0 0 0 6 0 0 2 0 0 0 0 0 0 1 21 0 1 0 0 0 0 0 2 0 0 0 0 1
V09 0 0 0 0 0 7 0 0 2 0 0 0 1 0 0 0 8 0 2 0 0 3 0 0 7 0 0 0 0 0
V49 1 0 0 0 0 1 0 0 1 1 3 0 0 0 0 2 6 0 3 0 3 0 0 0 1 2 1 1 0 0
V89 0 3 1 1 2 5 5 2 3 2 103 2 0 3 6 3 38 3 2 7 6 2 9 6 3 6 0 1 6 1
V99 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 1 1 0 14 0 0 0
W19 0 0 0 0 0 2 0 0 2 1 4 0 1 0 0 0 7 1 0 1 0 0 2 0 1 0 0 1 0 0
X70 1 0 0 1 2 3 0 0 2 3 15 2 0 1 1 1 12 2 0 1 5 0 3 0 5 1 1 0 0 0
X95 1 0 2 2 2 41 7 6 20 1 98 7 1 3 6 1 273 3 1 1 19 9 4 0 38 3 13 2 1 0
92
Municipio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO
V03 1 0 0 0 0 7 0 2 6 2 1 0 1 0 0 1 28 0 1 0 2 2 0 0 6 0 0 0 0 0
V09 1 0 0 0 0 3 0 0 1 0 0 0 1 0 0 0 6 0 0 0 1 0 0 0 4 0 1 1 0 1
V49 1 0 0 0 0 4 0 0 0 1 4 0 0 0 0 0 4 0 1 0 2 1 0 0 1 0 2 0 0 0
V89 0 3 3 2 3 7 2 1 3 3 74 2 3 5 4 3 49 3 4 3 8 3 11 5 6 0 2 2 5 4
V99 1 0 0 0 0 2 0 0 0 2 0 0 0 0 0 0 2 0 0 0 0 0 0 0 2 0 4 0 0 0
W19 2 1 0 1 1 2 0 0 1 0 8 0 0 0 1 0 16 0 2 0 0 0 2 0 0 1 2 0 0 0
X70 4 4 0 0 0 5 0 0 0 1 11 1 0 0 1 2 13 4 0 1 4 0 3 1 1 2 3 0 1 4
X95 0 3 4 1 0 43 3 2 16 0 88 4 1 1 5 2 296 3 5 3 49 2 4 2 62 2 12 2 3 3
93
Municipio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO
V03 0 0 0 0 0 3 0 0 0 2 0 0 0 0 0 0 13 0 1 0 0 1 0 0 4 0 0 1 0 0
V09 1 0 0 0 0 2 0 2 0 1 0 0 0 0 0 0 8 0 0 0 0 0 0 0 2 0 0 0 0 0
V49 0 0 0 0 0 0 0 1 1 2 1 1 0 0 0 0 8 0 0 0 1 0 0 0 0 2 4 2 0 1
V89 1 3 2 3 8 5 1 4 6 1 39 5 4 5 4 4 47 4 7 12 19 2 11 6 13 6 2 2 2 6
V99 5 0 0 0 0 1 0 0 0 0 0 0 0 0 0 2 0 0 1 0 0 0 0 0 0 0 1 3 0 0
W19 1 3 1 1 0 2 1 0 0 1 19 0 0 1 0 0 7 2 0 1 4 0 1 1 3 0 1 0 2 1
X70 4 1 3 1 1 1 1 0 0 2 10 0 0 2 4 2 13 2 2 0 5 2 3 0 1 2 2 0 0 2
94
Municipio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO
V03 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 1 12 0 1 0 0 0 0 0 1 0 0 0 0 0
V09 0 0 2 0 0 0 0 0 1 0 0 0 0 0 0 1 5 0 0 0 0 0 0 0 0 0 0 0 0 0
V49 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 7 0 2 0 2 0 0 0 0 0 0 0 0 1
V89 0 0 3 1 1 2 1 1 1 2 30 0 2 5 2 1 21 1 3 2 7 0 3 1 2 2 1 1 3 4
V99 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
W19 0 1 0 1 0 0 0 1 0 0 4 0 0 0 1 0 3 1 0 1 1 0 2 1 0 0 1 0 0 0
X70 1 1 0 0 0 1 0 0 1 1 7 0 1 0 0 0 4 0 0 0 3 2 0 1 1 0 0 0 0 0
X95 0 1 4 2 2 30 2 4 15 2 57 2 2 2 1 5 174 1 4 1 13 4 3 1 26 4 15 0 0 4
95
V09
1,32748 1,97920 3,41819 0,96040 1,19177 0,35711 1,06053 0,37321 0,24421 1,97980 0,89921 1,19777 1,04674 1,42067 0,93789 1,10245 0,26698 1,19777 0,98367 0,84862 1,08362 1,28325 1,60402 1,78175 0,21809 0,40237 0,74652 1,28435 0,72062 2,49998
V49
3,14922 3,58575 0,69537 3,27351 3,21846 3,13686 3,17215 3,14156 3,23211 1,45506 3,28010 3,30936 3,16277 3,25488 3,22821 3,26836 3,19386 3,30936 3,14984 3,24030 3,06907 2,25249 3,39763 3,34965 3,20656 2,69704 2,82085 2,83110 3,30654 0,51193
V89
0,17017 0,75182 3,83400 0,30750 0,03740 0,90251 0,16730 0,88695 1,22088 1,85022 0,37893 0,09201 0,18147 0,20492 0,30838 0,14998 1,06669 0,09201 0,24394 0,41152 0,19666 0,99110 0,37660 0,57106 1,22327 1,01586 0,59109 0,44182 0,59881 2,73445
V99
0,57096 0,65194 3,59144 1,02372 0,75417 1,51880 0,84457 1,50596 1,84091 1,48296 1,08986 0,82945 0,85128 0,57740 1,00722 0,88173 1,68871 0,82945 0,90394 1,10520 0,75658 0,85636 0,58736 0,43919 1,83606 1,44073 1,02730 0,48944 1,29591 2,46060
W19
0,65489 1,32449 3,40997 0,44043 0,55814 0,46886 0,43775 0,45955 0,77680 1,60795 0,42384 0,60097 0,42314 0,76219 0,39720 0,51548 0,63156 0,60097 0,37212 0,37668 0,41588 0,75869 0,95618 1,10705 0,76862 0,42151 0,06819 0,58901 0,44364 2,36050
X70
0,29480 0,96508 3,58834 0,31489 0,23043 0,75378 0,16517 0,74012 1,07791 1,64605 0,36154 0,30745 0,15796 0,40443 0,27970 0,26025 0,92394 0,30745 0,17044 0,35791 0,06763 0,77168 0,59998 0,74773 1,07521 0,77899 0,34062 0,32440 0,53875 2,49866
X95
1,06789 1,68524 3,67786 0,64634 0,90830 0,07591 0,78085 0,08046 0,28037 2,06520 0,57805 0,89398 0,76886 1,14371 0,63440 0,80088 0,12841 0,89398 0,70607 0,53432 0,83391 1,26656 1,31269 1,51068 0,28476 0,50779 0,60462 1,10258 0,37395 2,70220
96
V09
1,02277 2,53370 1,08013 1,20253 1,48564 0,39379 1,26180 0,89850 0,56287 1,53370 1,46442 0,97094 0,19865 1,46153 1,45319 1,40088 0,56548 1,42617 1,07253 2,06928 1,00263 0,38818 1,72192 2,49137 0,42107 1,67153 3,54284 1,07583 2,22219 1,00110
V49
0,18092 1,57999 0,38035 0,41558 0,60534 0,67278 0,45547 0,38461 0,58271 0,62178 0,59244 0,36541 0,98008 0,59053 0,58557 0,47758 0,56304 0,57573 0,55349 1,13902 0,31704 0,73073 0,82076 1,44410 0,63935 0,72827 3,17181 0,31501 1,27928 0,47808
V89
0,72269 0,82212 0,63208 0,50925 0,22604 1,32258 0,45043 0,81376 1,15094 0,18237 0,24754 0,74097 1,57397 0,25047 0,25897 0,32719 1,14644 0,28770 1,30169 0,35868 0,71019 1,32816 0,03389 1,16733 1,30190 0,08638 3,67103 0,63821 0,51069 0,73043
V99
4,22977 4,78746 4,42610 4,42977 4,47002 4,33306 4,44695 4,41264 4,42172 4,43702 4,47278 4,41012 4,54305 4,47286 4,47388 4,35737 4,39622 4,48586 3,56599 4,64127 4,36521 4,44012 4,54768 3,73887 4,30094 4,43046 0,88717 4,35988 4,67445 4,52496
W19
0,26191 1,55755 0,12326 0,23819 0,51459 0,60592 0,29217 0,10524 0,42005 0,56984 0,49248 0,07625 0,83594 0,48951 0,48084 0,45821 0,42006 0,45131 0,94968 1,09250 0,12582 0,59506 0,74565 1,70792 0,59273 0,71144 3,60726 0,16671 1,24640 0,04022
X70
0,26051 1,29779 0,16973 0,06381 0,25329 0,84688 0,06754 0,34512 0,68066 0,29634 0,23399 0,27245 1,10798 0,23132 0,22388 0,16850 0,67414 0,20338 0,94273 0,83527 0,23504 0,85777 0,49046 1,42603 0,82553 0,43416 3,51243 0,16200 0,98673 0,29863
X95
0,38973 1,89492 0,44531 0,56567 0,84757 0,24957 0,62544 0,26734 0,11525 0,89375 0,82679 0,33666 0,52793 0,82394 0,81579 0,75987 0,09499 0,79004 0,77348 1,43146 0,36283 0,27287 1,08481 1,90349 0,23066 1,03081 3,45059 0,43543 1,58364 0,39341
97
V09
3,63008 1,98450 0,85614 2,17695 1,23989 0,45669 1,62490 0,57392 0,62248 0,33990 0,92646 0,76593 0,92695 1,72924 1,10798 2,02336 0,56741 1,22135 0,78964 2,26153 0,92503 0,61940 1,30285 2,00868 0,65160 0,73772 0,26377 3,01646 1,01313 1,15360
V49
3,40307 1,89846 0,85202 2,07464 1,21034 0,63048 1,53554 0,62237 0,77196 0,30486 0,94997 0,82374 0,96731 1,64091 1,04547 1,77811 0,71105 1,17970 0,68483 2,17719 0,93969 0,68405 1,25530 1,93475 0,75811 0,75835 0,31880 2,80675 1,03806 1,10305
V89
3,93408 0,72616 0,45023 0,94339 0,11682 1,06574 0,39768 0,75037 0,96421 0,95017 0,45985 0,64174 0,51195 0,48830 0,18571 1,98221 0,95512 0,07396 0,56479 0,99510 0,43641 0,74327 0,03336 0,73485 0,82327 0,58443 1,01717 3,52315 0,42210 0,12629
V99
1,09690 5,16659 4,96544 5,13084 5,09677 5,03117 4,97289 4,91323 5,15375 4,62282 5,09722 5,07825 5,14980 5,02674 4,88544 3,06980 5,09200 5,03279 4,61317 5,32646 5,06826 4,98205 5,04904 5,26940 5,09778 4,96119 4,69730 1,60684 5,16215 4,95855
W19
3,97177 0,65191 0,52660 0,87297 0,16126 1,13979 0,33803 0,82773 1,03331 1,03083 0,52652 0,71186 0,57465 0,42142 0,26407 2,01278 1,02666 0,14475 0,64182 0,91816 0,50545 0,81833 0,06030 0,65664 0,89371 0,66050 1,09748 3,57297 0,48041 0,20694
X70
3,41327 0,99999 0,59248 1,14635 0,60382 1,08552 0,65065 0,76404 1,06610 0,76603 0,70434 0,79512 0,76956 0,75060 0,39668 1,47869 1,02753 0,53967 0,33260 1,27326 0,67014 0,80306 0,56107 1,05917 0,93191 0,67407 0,87438 2,99498 0,73668 0,46716
X95
4,07241 1,62207 0,46146 1,84301 0,81704 0,19094 1,29449 0,23235 0,07636 0,47757 0,44743 0,25899 0,41305 1,38803 0,78282 2,29551 0,05821 0,82749 0,67151 1,88287 0,46554 0,18691 0,91071 1,61825 0,07742 0,33544 0,41690 3,51475 0,51373 0,79123
98
V09
1,67528 1,28666 1,18312 1,39320 1,90608 0,24063 1,14055 0,54142 0,57011 1,39407 1,09262 0,92199 0,89089 1,90569 1,08992 1,09250 0,62155 1,30157 0,81360 1,19702 0,62113 0,64478 1,53114 1,57968 0,49199 0,96676 0,81278 0,83642 1,42783 1,20246
V49
1,26967 0,98686 1,28179 1,30989 1,75586 0,52899 1,25745 0,89960 0,94044 1,00764 1,10215 0,94323 0,90055 1,82998 1,06361 0,90425 0,91697 1,00723 0,83501 1,13438 0,89409 0,70956 1,36779 1,46380 0,87524 0,58694 0,47409 0,91231 1,34690 0,91823
V89
2,15696 0,75608 0,41839 0,14633 0,68843 1,05872 0,46668 1,09996 1,13954 2,00399 0,21948 0,36622 0,38763 0,63241 0,18520 0,44752 0,94311 0,74034 0,46422 0,09256 0,89462 0,63491 0,41442 0,34938 1,16765 1,00181 1,64557 0,48479 0,17062 0,69676
V99
0,83038 2,12681 2,78926 2,71262 3,03139 1,98100 2,76861 2,32056 2,34813 0,74406 2,58489 2,43891 2,39448 3,19950 2,53025 2,25311 2,38634 2,15303 2,33611 2,57108 2,37480 2,22257 2,66988 2,81646 2,26816 1,70508 1,04274 2,42250 2,74847 2,11400
W19
1,67111 0,61681 0,71842 0,67967 1,16119 0,59112 0,71364 0,81033 0,86003 1,47673 0,48943 0,35765 0,31292 1,20146 0,43652 0,34495 0,71025 0,62278 0,27807 0,50030 0,66140 0,28692 0,78067 0,84683 0,84589 0,55055 1,06397 0,39305 0,71645 0,52386
X70
1,24141 0,29267 1,21806 0,92688 1,19081 1,04036 1,23055 1,34174 1,39163 1,12643 0,94848 0,88011 0,84137 1,37144 0,86400 0,47873 1,26572 0,31847 0,83301 0,84252 1,21972 0,85482 0,83295 0,99140 1,36065 0,16785 0,94210 0,95095 0,95886 0,27402
X95
2,18569 1,32028 0,66776 1,07882 1,62227 0,41686 0,61041 0,17678 0,20837 1,93298 0,71482 0,58665 0,58700 1,52142 0,76381 0,99982 0,01404 1,32329 0,53291 0,89377 0,04840 0,42542 1,30911 1,28265 0,25598 1,20556 1,38636 0,45874 1,10440 1,22749
99
V09
4,74535 2,95386 0,58468 1,58750 0,80230 0,76811 0,80230 1,20843 0,79731 1,09652 1,15113 0,74754 1,35628 1,52976 1,96296 0,28703 0,66828 1,99652 0,69354 1,96296 1,26141 2,06222 1,75921 2,46788 0,79361 0,80230 0,88770 2,17535 2,17535 1,01635
V49
4,16172 2,29983 0,56164 0,92767 0,23775 0,44434 0,23775 0,52563 0,45616 0,41383 0,47184 0,57088 0,67462 1,16109 1,38850 0,44413 0,31153 1,36049 0,31279 1,38850 0,57843 1,53775 1,14123 1,78591 0,45233 0,23775 0,45771 1,85377 1,85377 0,58988
V89
4,19413 2,19633 0,78930 0,51533 0,53425 1,16827 0,53425 0,58841 1,17035 0,63947 0,53306 1,31368 0,58935 0,48866 0,67431 1,14719 1,05820 0,76874 0,59723 0,67431 0,64657 1,84070 0,51796 1,52059 1,16747 0,53425 1,12482 1,15040 1,15040 0,29586
V99
3,65904 2,11733 1,46301 1,50092 1,17192 0,52362 1,17192 1,08137 0,50437 0,98768 1,10474 0,46985 1,18291 2,07127 2,09443 0,95912 0,66859 1,93449 1,26392 2,09443 1,06070 0,99202 1,79662 1,90397 0,50858 1,17192 0,50081 2,75633 2,75633 1,52167
W19
3,30418 1,28760 1,78236 0,58125 1,36932 1,68736 1,36932 0,97266 1,67097 1,09580 1,01679 1,83867 0,82173 1,32429 0,69137 1,93105 1,65805 0,36838 1,51540 0,69137 0,93896 1,50569 0,56221 0,54997 1,67071 1,36932 1,57140 1,66805 1,66805 1,31893
X70
2,57646 0,78476 2,11305 1,20948 1,64110 1,48230 1,64110 1,18265 1,45408 1,23276 1,26109 1,57751 1,10805 2,12758 1,69875 1,92839 1,55081 1,39036 1,81196 1,69875 1,10951 0,49580 1,44307 0,76199 1,45667 1,64110 1,34785 2,64976 2,64976 1,82404
X95
3,99173 2,20993 0,83641 1,06529 0,53514 0,14671 0,53514 0,61632 0,15150 0,49311 0,59886 0,29671 0,76090 1,45345 1,59781 0,47045 0,09451 1,51523 0,61899 1,59781 0,63736 1,32064 1,32366 1,78234 0,14812 0,53514 0,15989 2,14517 2,14517 0,88917
100
A.6 Tabelas de Pertinncias Segundo o Mtodo Gentico Fuzzy (MHGF) A.7 Pertinncias para o Ano de 2006
Tabela 20: Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2006.
V09
0,02635 0,08117 0,05760 0,10576 0,01140 0,06264 0,03849 0,14816 0,18362 0,13236 0,04368 0,03437 0,02589 0,03373 0,07992 0,03705 0,10335 0,02099 0,05567 0,07134 0,02368 0,09367 0,07576 0,07610 0,17564 0,19531 0,04020 0,03345 0,14617 0,05716
V49
0,02021 0,03310 0,61335 0,02969 0,01527 0,01013 0,01527 0,00997 0,02528 0,10119 0,02302 0,01447 0,00881 0,01985 0,02255 0,01020 0,01172 0,01864 0,02261 0,02524 0,01402 0,04740 0,02744 0,02962 0,00987 0,01882 0,00904 0,01537 0,01545 0,60973
V89
0,55357 0,23504 0,04038 0,35887 0,55480 0,02384 0,60296 0,11362 0,06495 0,16368 0,29971 0,71602 0,15026 0,23480 0,24708 0,30467 0,02530 0,46794 0,16756 0,14215 0,14074 0,10280 0,27527 0,23819 0,03101 0,13083 0,15430 0,09941 0,15790 0,04095
V99
0,05922 0,21898 0,08655 0,06967 0,01804 0,01492 0,04116 0,07855 0,04611 0,13638 0,03607 0,03994 0,12619 0,10536 0,13588 0,05290 0,01673 0,03033 0,11140 0,11403 0,06289 0,22012 0,19233 0,23811 0,03862 0,09361 0,06876 0,18158 0,09584 0,08886
W19
0,05031 0,08080 0,04880 0,13547 0,02773 0,05345 0,06094 0,27135 0,04426 0,09120 0,09600 0,04197 0,08342 0,05189 0,11156 0,23571 0,05030 0,04520 0,17754 0,20136 0,04597 0,12355 0,07885 0,07712 0,04121 0,32485 0,29913 0,09242 0,31653 0,05077
X70
0,22818 0,25291 0,04882 0,16913 0,25502 0,02861 0,16120 0,03696 0,08140 0,18195 0,30469 0,08208 0,52909 0,41416 0,29931 0,29226 0,02928 0,27780 0,32501 0,26264 0,59336 0,14408 0,26268 0,25374 0,02938 0,06205 0,21862 0,49118 0,08399 0,05044
X95
0,03142 0,05142 0,05072 0,09605 0,09713 0,71878 0,05248 0,29771 0,23217 0,10359 0,15009 0,04650 0,05505 0,09881 0,06141 0,03960 0,64648 0,11028 0,11158 0,14218 0,08731 0,15862 0,04666 0,04564 0,14244 0,10690 0,12338 0,05884 0,13332 0,05012
101
V09
0,05211 0,08353 0,04744 0,01924 0,06533 0,09232 0,01954 0,05326 0,07347 0,06441 0,06547 0,09623 0,13046 0,03215 0,03215 0,02195 0,04072 0,06546 0,13363 0,07394 0,02707 0,10501 0,02402 0,05429 0,10280 0,01569 0,04519 0,05039 0,07806 0,04065
V49
0,39328 0,10823 0,30982 0,04739 0,09836 0,07304 0,04640 0,06067 0,04664 0,09637 0,09912 0,09958 0,05105 0,17096 0,17111 0,08069 0,08116 0,09920 0,15796 0,09954 0,07613 0,04397 0,16564 0,19202 0,05223 0,03602 0,05041 0,07729 0,10419 0,07430
V89
0,06251 0,43810 0,06189 0,05252 0,46112 0,04330 0,05991 0,03441 0,02922 0,49499 0,44713 0,04792 0,03479 0,23273 0,22764 0,09355 0,02022 0,42518 0,06921 0,49266 0,04946 0,02965 0,64558 0,19550 0,03131 0,80194 0,07052 0,04382 0,46622 0,11443
V99
0,00670 0,02605 0,00562 0,01288 0,01194 0,01225 0,01315 0,01233 0,01303 0,01192 0,01188 0,02137 0,01026 0,02309 0,02305 0,00703 0,00792 0,01165 0,03420 0,01836 0,01406 0,01401 0,01143 0,04562 0,01459 0,00592 0,65071 0,01268 0,02125 0,02351
W19
0,18555 0,09675 0,26589 0,18724 0,09576 0,06099 0,17773 0,48779 0,33922 0,08884 0,09816 0,34423 0,03804 0,18263 0,18346 0,06855 0,05480 0,10236 0,16081 0,08954 0,29267 0,32907 0,03456 0,18002 0,33192 0,03685 0,04432 0,41865 0,09340 0,52818
X70
0,10162 0,08020 0,13283 0,56676 0,13342 0,05075 0,57010 0,09926 0,07247 0,11304 0,14325 0,13026 0,03540 0,21904 0,22298 0,66238 0,03684 0,16030 0,12540 0,07795 0,38513 0,07002 0,08011 0,15336 0,07328 0,06036 0,04566 0,17887 0,08016 0,07288
X95
0,15355 0,10512 0,13728 0,03429 0,09023 0,12775 0,03329 0,19751 0,33293 0,08781 0,09091 0,20687 0,04885 0,04832 0,04849 0,04037 0,69560 0,09165 0,22945 0,09570 0,06540 0,22365 0,02116 0,06667 0,25027 0,02544 0,04633 0,16866 0,10016 0,09360
102
V09
0,07495 0,05731 0,06690 0,06109 0,01996 0,10673 0,04824 0,06493 0,07231 0,45517 0,05459 0,07046 0,06232 0,05704 0,04537 0,15248 0,10214 0,03269 0,05312 0,06525 0,08177 0,06954 0,05414 0,10081 0,03782 0,11693 0,16675 0,14902 0,06215 0,05400
V49
0,06419 0,11575 0,12375 0,11987 0,02045 0,11454 0,10666 0,07729 0,09272 0,22356 0,11757 0,12332 0,07578 0,03618 0,10367 0,11558 0,03543 0,08985 0,06123 0,04652 0,10882 0,07970 0,01276 0,07817 0,17323 0,09120 0,09921 0,10790 0,11767 0,03005
V89
0,05708 0,28584 0,27054 0,27742 0,36462 0,09310 0,30324 0,18543 0,08660 0,03724 0,13535 0,23950 0,12805 0,18038 0,34464 0,13531 0,05537 0,43341 0,22809 0,30902 0,16273 0,08559 0,29466 0,37670 0,12690 0,33747 0,03116 0,12205 0,28400 0,33412
V99
0,53676 0,02538 0,01850 0,02861 0,00485 0,01825 0,02011 0,01137 0,01627 0,02119 0,02862 0,01796 0,02161 0,01309 0,01633 0,11268 0,03428 0,01371 0,00909 0,02372 0,02035 0,01974 0,01686 0,02599 0,03542 0,01897 0,00701 0,18240 0,01876 0,03645
W19
0,05664 0,29837 0,25680 0,28563 0,30673 0,11952 0,32572 0,10167 0,11339 0,05161 0,30199 0,23322 0,09501 0,45391 0,29460 0,08982 0,09599 0,30779 0,21919 0,26182 0,17742 0,05800 0,41405 0,18418 0,14466 0,12355 0,03864 0,07682 0,27087 0,31998
X70
0,10612 0,10838 0,10048 0,11211 0,04623 0,03979 0,10638 0,11665 0,03151 0,04727 0,08618 0,07989 0,14982 0,11605 0,10759 0,17552 0,10629 0,06390 0,13124 0,13679 0,07488 0,13390 0,02988 0,09563 0,03642 0,08078 0,23427 0,14944 0,09047 0,08757
X95
0,05553 0,05923 0,10245 0,06199 0,18413 0,32844 0,04911 0,18547 0,46393 0,07820 0,21214 0,16784 0,33627 0,05068 0,05006 0,12660 0,47458 0,03307 0,21631 0,11105 0,24973 0,41304 0,05735 0,07947 0,40258 0,15364 0,12278 0,12217 0,09892 0,06447
103
V09
0,10949 0,10289 0,06792 0,04902 0,07775 0,25569 0,07149 0,06230 0,05993 0,17347 0,05860 0,18891 0,06705 0,06701 0,05553 0,08255 0,02969 0,09990 0,17936 0,05502 0,07013 0,09603 0,06170 0,06006 0,06806 0,13085 0,13498 0,10641 0,03397 0,13125
V49
0,14450 0,16818 0,06432 0,05080 0,07596 0,11182 0,10639 0,04442 0,03633 0,09481 0,05827 0,06439 0,19640 0,06891 0,05638 0,11170 0,08530 0,05631 0,08692 0,05059 0,08269 0,13842 0,06655 0,06314 0,04535 0,09711 0,23582 0,05775 0,03825 0,08493
V89
0,08367 0,07378 0,28585 0,41855 0,28872 0,10087 0,13200 0,03036 0,05634 0,07581 0,33987 0,23243 0,15967 0,29183 0,35570 0,12949 0,06966 0,09806 0,15772 0,46030 0,05152 0,07437 0,30342 0,32950 0,02868 0,04824 0,04619 0,33958 0,67067 0,07755
V99
0,31414 0,04028 0,05802 0,05249 0,06070 0,05469 0,04972 0,03343 0,01501 0,21036 0,05401 0,02838 0,03005 0,06550 0,05299 0,03512 0,00379 0,02454 0,02725 0,04262 0,02300 0,01880 0,06144 0,06000 0,03373 0,02796 0,07123 0,03923 0,03597 0,02825
W19
0,07777 0,11425 0,19033 0,17046 0,11402 0,14813 0,12661 0,04305 0,04018 0,14464 0,19690 0,13881 0,13929 0,18605 0,19915 0,18942 0,07189 0,23258 0,17955 0,09414 0,08936 0,21488 0,19284 0,18590 0,04138 0,10121 0,10153 0,14840 0,06052 0,12240
X70
0,10061 0,37827 0,08362 0,08011 0,21011 0,10138 0,16928 0,05509 0,02501 0,11237 0,08134 0,13633 0,08921 0,10193 0,08157 0,18398 0,00716 0,28141 0,06345 0,16956 0,10727 0,22448 0,11275 0,10021 0,05474 0,46851 0,19098 0,05587 0,07000 0,41890
X95
0,08311 0,07135 0,13080 0,08394 0,05975 0,10297 0,18999 0,18473 0,16791 0,08852 0,10518 0,11015 0,24199 0,10538 0,09700 0,12574 0,70932 0,13510 0,23093 0,03686 0,42959 0,17311 0,09536 0,09586 0,12981 0,07542 0,07127 0,09509 0,05912 0,08250
104
V09
0,08755 0,05960 0,20476 0,07530 0,15743 0,11725 0,15743 0,08399 0,03742 0,15056 0,04614 0,04752 0,07888 0,16689 0,07821 0,19718 0,11346 0,03701 0,09584 0,04562 0,14999 0,04457 0,05896 0,05728 0,12523 0,15743 0,11507 0,09484 0,07616 0,15723
V49
0,12438 0,07655 0,30694 0,13157 0,37201 0,14459 0,37201 0,30330 0,06504 0,31836 0,13186 0,06199 0,14985 0,12529 0,12467 0,15567 0,15208 0,09201 0,16959 0,06216 0,29735 0,12106 0,12608 0,10127 0,09794 0,37201 0,14827 0,08539 0,13107 0,29079
V89
0,08584 0,10271 0,14863 0,14418 0,15089 0,05705 0,15089 0,20664 0,02543 0,14956 0,22478 0,02701 0,12357 0,23095 0,14640 0,06178 0,05368 0,13360 0,12193 0,44100 0,15841 0,11312 0,14416 0,06253 0,05370 0,15089 0,06028 0,20558 0,22483 0,24495
V99
0,11825 0,11107 0,06132 0,09350 0,05638 0,13477 0,05638 0,11493 0,22399 0,06964 0,05847 0,24043 0,10090 0,05008 0,09177 0,11489 0,11344 0,07346 0,04864 0,04781 0,07229 0,18096 0,12199 0,09852 0,08622 0,05638 0,14238 0,09789 0,14997 0,05543
W19
0,16576 0,17805 0,05755 0,19613 0,05467 0,05610 0,05467 0,05464 0,01894 0,06815 0,06506 0,02043 0,16202 0,13261 0,20842 0,05649 0,05261 0,44066 0,09099 0,11913 0,08184 0,13736 0,32748 0,24491 0,03866 0,05467 0,05899 0,10783 0,11245 0,06358
X70
0,20854 0,29832 0,04005 0,16635 0,03736 0,05847 0,03736 0,06512 0,02296 0,05091 0,08517 0,02498 0,16746 0,06477 0,16391 0,05651 0,05356 0,06771 0,03613 0,13161 0,06070 0,27709 0,07650 0,27694 0,07117 0,03736 0,06230 0,13610 0,11131 0,04060
X95
0,10700 0,10241 0,08739 0,10360 0,09356 0,25225 0,09356 0,11502 0,36035 0,11381 0,31381 0,28423 0,12081 0,14641 0,09749 0,12784 0,29386 0,10910 0,35985 0,05945 0,10236 0,07753 0,06619 0,07554 0,38805 0,09356 0,25206 0,13030 0,10769 0,07586
105
A.12 Tabelas de Agrupamentos pelo Mtodo Hbrido Gentico Fuzzy (MHGF) A.13 Ano de 2006
A.13.1 Ponto de Corte igual 0,10
Tabela 25: Agrupamento dos Municpios para com as Causas Externas de bito.
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
Referncias
1 2
BENZCRI J.P. Correspondence Analysis Handbook. New York: Marcel, 1992. BEZDEK J. C., CORAY C., GUNDERSON C. , WATSON J. Detection and Characte-
rization of Cluster Substructure. SIAM Journal of Applied Mathematics, 40: pp. 339-372, 1981. 3 CAVALCANTI N. L. Clusterizao baseada em algoritmos Fuzzy, Universidade Federal
de Pernambuco, 2006. 4 BROWN M.,HARRIS C. J., MOORE C. G., Intelligent control: Aspects of Fuzzy
Logic and Neural Nets, World Scientic, 1993. 5 CINTULA, LIBOR B. P. Fuzzy class theory, Academy of Sciences of the Czech Repu-
blic 154, volume 154, pp. 3455, 2005. 6 COX E. The Fuzzy Systems Handbook: a Practitioner's Guide to Building, Using and
Maintaining Fuzzy Systems, Eds: Professional,1, 1994; 7 CORREA, S. S. Lgica Nebulosa, XVIII Escola de Redes Neurais , volume 18, pp.
7390, 1999. 8 CLAIR U. S., YUAN B. Fuzzy Set Theory: Foundations and Applications, Prentice
Hall PTR, Upper Saddle River, NJ, 1997. 9 10 CRAWLEY M. J. The R Book, Wiley, 1, 2007. DANTAS, GOLDBARG M. Algoritmos evolucionrios na determinao da congu-
rao de custo mnimo de sistemas de co-gerao de energia com base no gs natural, Pesquisa Operacional 25, volume 25, pp. 231259, 2005. 11 12 FERREIRA, F. D. Estatstica Multivariada, 1, Eds: UFLA, pp. 341-391 ,2008. FANCO C. R. Novos Mtodos de Classicao Nebulosa e de Validao de Categorias
e suas Aplicaes a Problemas de Reconhecimento de Padres, Universidade Federal do Rio de Janeiro, 2002. 13 GARCIA F. Desempenho energtico de um sistema de refrigerao aplicando o con-
trole adaptativo Fuzzy, Simpsio de Ps-Graduao em Engenharia Mecnica, MG, 2002. 14 GOLDBERG E. D. Genetic Algorithms in Search, Optimization, and Machine Lear-
ning, EUA: Addison-Wesley, 121, 1989. 15 GOLDBERG E. D. Genetic Algorithms in Search, Optimization, and Machine Lear-
Referncias
16
131
ning. EUA: Addison-Wesley, 80, 1989. 17 GOLDBARG. Algoritmos evolucionrios na determinao da congurao de custo
mnimo de sistemas de co-gerao de energia com base no gs natural, Pesqui. Oper. 25(2): 231-259, 2005. 18 GREENACRE M., HASTIE T. The geometric interpretation of correspondence analy-
sis, Journal of the American Statistical Association, volume 82, pp. 437-447,1987. 19 HAIR J. F. BLACK W. C., BARRY J., BABIN R. E., ANERSON R. L.. Anlise
Multivariada de Dados, Eds: bookman, 2009. 20 HAIR O. F., BLACK W. C., BARRY J. B., ROLPH A. E., TATHAM R. L. Anlise
Multivariada de Dados, 6, Eds: Bookman,2006. 21 HEIJDEN P. et al. A combined approach to contingency table analysis using corres-
pondence analysis and log-linear analysis. Applied statistics 38, 1989, pp. 249-292. 22 JOHNSON R. A., WICHERN D. W. Applied Multivariate Statistical Analysis, Ed.
6, Eds: Hardcover, 2007. 23 JOHNSON R. A., WICHERN D. Applied Multivariate statistical Analysis, 6 , Eds:
Hardcover, 2008. 24 KELLER, ANNETTE F. K. Fuzzy Clustering with Evolutionary Algorithms, Inter-
national Journal of Intelligent Systems 13, volume 13, pp. 975991, 1998. 25 KLAWONN F., KELLER A. Fuzzy Clustering with Evolutionary Algo-
rithm,nternacional of Intelligent Systems, volume 13,1998. 26 KOZA, J.R. Genetic Programming: On the Programming of Computers by Means of
Natural Selection. [S.l.]: MIT Press, 1992. 27 KOSKO B. Neural networks and Fuzzy systems: a dynamical systems approach to
machine intelligence, Prentice-Hall International, 1992. 28 LEITE, TEIXEIRA. Aplicao de algoritmos genticos na determinao da operao pp.
tima de sistemas hidrotrmicos de potncia, SBA Controle & Automao 17(1): 81-88, 2006. 29
Mahalanobis Distances, International Symposium on Information Processing, China, 2009, pp. 422-427. 30 LIMA O. J. Classicaes Repetidas nos Aspectos Inferenciais em Experimento de
Bernoulli com Erros de Diagnstico, 2009. Tese (Doutorado em Estatstica) - Departamento de Estatstica, Universidade Federal de Minas Gerais, MG. 31 MICHALEWICZ Z., NAZHIYATH G., MICHALEWICZ M. A Note on Usefulness
of Geometrical Crossover for Numerical Optimization Problems, Proceedings of the 5th Annual Conference on Evolutionary Programming, San Diego, CA, 29 February - 3 March. MIT Press, Cambridge, MA, 1996, pp. 305-312.
Referncias
32
132
NUOVO A. G., CATANIA V., PALESI M. The Hybrid Genetic Fuzzy C-Means: a
Reasoned Implementation, International Conference on Fuzzy Systems, Cavtat, Croatia, 2006, pp. 33-38. 33 PALESI A., NUOVO V., MAURIZIO C. The Hybrid Genetic Fuzzy C-Means: a
Reasoned Implementation, International Conference on Fuzzy Systems 7, volume 7, pp. 3338, 2006. 34 PEDRYCZ W., GOMIDE F. Fuzzy Systems Engineering: Toward Human-Centric
Computing, Wiley/IEEE Press, 2007. 35 PEDZYCZ W., GOMIDE F. Fuzzy Systems Engineering: Toward Human-Centric
Computing, Wiley/IEEE Press, 2007. 36 PIRES, Algoritmos Genticos. Aplicao Robtica, Faculdade de Engenharia da
Universidade do Porto, 1998. 37 POLI R., LANGDON W. B., MCPHEE N. F. A Field Guide to Genetic Programming,
Team, R Foundation for Statistical Computing, Vienna, Austria, 2010, ISBN, 3-90005107-0, http://www.R-project.org. 39 40 ROSS T. J. Fuzzy logic with engineering applications 1995, NY McGraw-Hill. ROLLY I., MUKAIDONO M. Redundant Object and Dependency of Domain Attri-
butes in - Goverings of the Universe, FUZZ-IEEE, 2001, pp. 1444-1447. 41 SCHMIDT, MIKLOS F. Fuzzy Clustering as a Means of Selecting Representative
Conformers and Molecular Alignments, J. Chem. Inf. Comput. Sci 43, volume 43, pp. 810818, 2003. 42 YU Y. K., LIU H. C., JENG B. C., YIH J. M. Fuzzy C-Means Algorithm Based on
Standard Mahalanobis Distances, International Symposium on Information Processing 23, volume 23, pp. 422427, 2009. 43 44 ZADEH L. A. Fuzzy Sets, Rev. Information and control, volume 8, pp. 338-353, 1965. ZADEH L. A. Fuzzy sets and systems, Fox J, Ed. System Theory, Brooklyn, NY: