Bases de Dados em Saúde

Especialização em
Informática em Saúde
Base de Dados em Saúde
Atualizado para 5ª edição por
Prof. Dr. LD. Ivan Torres Pisa
Profª. Ma. Josceli Maria Tenório
Autores da 4ª edição
Prof. Dr. LD. Ivan Torres Pisa
Prof. Dr. Fábio Oliveira Teixeira
São Paulo | 2017

SUMÁRIO
BASES DE DADOS EM SAÚDE 4
CAPÍTULO Contextualização conceitual 6
01 Natureza da informação em saúde
Hierarquização, descentralização e municipalização da informação

10
10
Tipos de informação 11
CAPÍTULO INTEGRAÇÃO DE DADOS EM SAÚDE 14
02 Interoperabilidade funcional e semântica
Descoberta de conhecimento e mineração de dados (KDD)

15
15
Gestão do conhecimento 16
Técnicas de mineração de dados 17
CAPÍTULO BASES DE DADOS DO SISTEMA ÚNICO DE SAÚDE (SUS) 21
03 Departamento de Informática do SUS (DATASUS)
Sistemas e aplicativos do SUS

22
24
Tabulação de dados do SUS 3639
CAPÍTULO DADOS INTER-RELACIONADOS DA SAÚDE 40
04 Dados abertos conectados em saúde
Linked open data (LOD)

42
45
Informação inter-relacionada na saúde 47
Redes sociais como bases de dados em saúde 49
* Colaboraram com esse material em suas versões anteriores Frederico Molina Cohrs (Departamento de Medicina Preventiva EPM UNIFESP), Prof. Dr. Domingos Alves (Departamento de Medicina Social, Faculdade de
Medicina de Ribeirão Preto, USP), Adilmo Henrique do Nascimento e Ricardo Takazu Hatae, pós-graduandos no Programa de Pós-graduação em Gestão e Informática em Saúde EPM UNIFESP. Colaborou com essa versão
Fernando Sequeira Sousa, pesquisador em informática em saúde.A todos os colaboradores nossos mais sinceros agradecimentos.
Introdução
Os objetivos desta disciplina incluem apresentar uma contextualização conceitual referente à
formação e análise de bases de dados em saúde, incluindo conceitos e tópicos sobre:
• a natureza da informação em saúde,
• aspectos da hierarquização, descentralização e municipalização da informação,
• tipos de informação,
• integração das bases de dados,
• interoperabilidade funcional e semântica,
• descoberta de conhecimento e mineração de dados em saúde,
• gestão do conhecimento, e
• mineração de dados;
Também vamos apresentar algumas bases de dados do Sistema Único de Saúde (SUS), incluin-
do uma descrição do DATASUS, sistemas e aplicativos do SUS, dados ambulatoriais, cadastros
nacionais, dados epidemiológicos, dados financeiros, dados hospitalares, dados estruturantes,
eventos vitais, dados sociais, regulação, tabulação de dados do SUS, e integração dos sistemas
SUS. Incluímos também no material conceitos e experiências sobre a iniciativa de dados aber-
tos em saúde, incluindo a iniciativa linked open data (LOD), informação inter-relacionada na
saúde e redes sociais como bases de dados em saúde.
Pretendemos com essa disciplina promover no aluno uma visão crítica sobre a utilização e
análise de bases de dados da saúde em suas diferentes vertentes, mas com ênfase nos dados
públicos, por meio de discussões conceituais, comparação de técnicas, resolução de exercícios
e participação em atividades colaborativas
3
Capítulo 1
Bases de dados em saúde
Esta década pertence aos modelos distribuídos; não aos modelos cen-
tralizados. À colaboração, e não ao controle. E aos pequenos dados, e
não ao big data. A verdadeira oportunidade não está nas grandes bases
de dados, mas sim em muitos pequenos dados, descentralizados, que
não se entendem.
Forget big data, small data is the real revolution (goo.gl/2PV2hF)

Rufus Pollock, 2013 (goo.gl/5zmmDa)
Ao realizarmos uma busca na web usando como sentença-chave o título desta disciplina,
“bases de dados em saúde”, observamos um fato curioso é que, até certo ponto, pode confundir
o pesquisador. Os resultados podem ser descritos como sendo de cinco naturezas distintas:
as quatro primeiras relativamente bem conhecidas por profissionais e gestores em saúde, e a
quinta natureza, mais recente e inovadora, sobre a concepção de bases de dados em saúde.
Um primeiro conjunto de resultados diz respeito a bases de dados para pesquisas bibliográficas
e tipicamente aponta para portais web nos quais podemos encontrar referências sobre tópicos
em saúde de maneira sistemática, como bibliotecas virtuais em saúde. Alguns exemplos dessas
bases são PubMed (ncbi.nlm.nih.gov/pubmed), Scielo (scielo.br) e Lilacs (lilacs.bvsalud.org).
Nesse caso o resultado mostrado pelo buscador web efetivamente se refere a bases bibliográficas
de dados, contendo informações diversas sobre literatura técnico-científica sobre saúde
e, assim, sendo muito úteis quando se quer fazer uma revisão bibliográfica sobre um tema
específico em saúde.
Um segundo conjunto de resultados se refere aos dados de saúde propriamente ditos, ou seja,
ao banco ou repositório de dados específicos de uma situação de saúde. Esses dados, em geral
populacionais (referentes à situação de saúde de uma população), podem tratar de morbidade,
demografia, cenários ambientais, serviços de saúde, hospitais etc. Eles podem ter diferentes
níveis de abrangência, como nacional, estadual, municipal ou até coletados para se descrever
uma situação de saúde em microrregiões dentro de um município. Podem ainda ser específicos
ao gênero, à raça ou a outra subdivisão de tipos de uma população de interesse. Essas bases de
dados podem estar disponíveis para consulta como apoio a estudos científicos ou para colabo-
rar no desenvolvimento de sistemas clínicos de apoio à decisão em saúde. Portanto, nesse caso,
as bases de dados em saúde se referem a um banco de dados em saúde.
4
UAB | UNIFESP
Um terceiro conjunto de resultados dessa busca na web são associados aos sistemas de
informação que armazenam e gerenciam dados da saúde, tipicamente dados públicos em
saúde. Esses sistemas de informação podem fornecer os dados brutos ou ainda agregados de
diferentes formas para disponibilizar uma informação específica. Esses sistemas costumam
conter ferramentas computacionais embutidas em sua concepção para a manutenção e
atualização dos dados em saúde, e alguns deles contêm ferramentas de análise dos dados.
Assim, esse conjunto de resultados da busca considera bases de dados em saúde quase que
como um sinônimo de sistemas de informação em saúde.
Um quarto conjunto de resultados indica conteúdos que tratam de dados clínicos, geralmente
descrevendo sistemas hospitalares e sistemas de apoio à decisão. Também descreve uma
formação de bases de dados sobre a assistência ao paciente contendo exames, internações,
prescrições etc. Também podemos identificar nesses resultados conteúdos que apresentam
descrição de bases de dados clínicos usadas para estudos (testes clínicos).
Mais recentemente um quinto conjunto de resultados começou a aparecer na web, represen-

tando uma formação de bases pessoais sobre a saúde do cidadão. Temas como prontuário
pessoal de saúde, uso de dados coletados em redes sociais eletrônicas - abertas ou restritas - e
identificação de perfis do consumidor em saúde estão em ascensão. Em via oposta também
se encontra em ascensão o tema de dados abertos em saúde, no qual o foco está no cidadão
não como gerador primário do dado, mas como consumidor de um dado bruto da saúde até
então restrito a gestores e pesquisadores. Ambas tendências representam uma oportunidade
de formação de novas bases de dados com foco no cidadão, seja considerando seus hábitos e
interações como fonte de dados, seja para aumentar sua capacidade de se informar. Talvez esse
quinto conjunto represente uma quintessência (aristotélica pela sua dinamicidade ou gnóstica
pela sua onipresença) da formação de bases de dados em saúde, reforçando um aspecto pessoal
e íntimo do dado em saúde, agregando significado do ponto de vista do indivíduo.
ATENÇÃO
Diferentes conotações para o conceito “bases de dados em saúde”

estão disponíveis na web:
• bibliográfica: bases bibliográficas de dados em saúde, literatura
especializada, revisões sistemáticas;
• banco de dados: repositório de dados em saúde, dados
populacionais ou individuais, aspectos técnicos do acesso,
gerenciadores de bancos de dados em saúde, padrões de inter-
relacionamento computacional;
• pública: bases oficiais de dados, sistemas SUS, indicadores públicos,
política e legislação sobre o dado em saúde, epidemiologia;
• clínica: sistemas hospitalares, sistemas de apoio à decisão,
prontuário do paciente, exames, testes clínicos;
• pessoal: prontuário pessoal do paciente, redes sociais, dados
abertos em saúde, informação ao paciente.
5
Especialização em Informática em Saúde
Neste curso de especialização em informática em saúde pretendemos introduzir uma parte

desses aspectos da formação de bases de dados em saúde, apresentando conceitos, identifi-
cando fontes de dados e indicando possibilidades de análise. Vale ressaltar que na atividade
diária de planejamento e gerência em saúde são necessários dados inter e extrassetoriais, ge-
rados pelas mais diversas fontes, tais como censos, pesquisas populacionais, estatísticas vi-
tais, produção e utilização de serviços, dentre outras. Portanto, não é nosso objetivo esgotar as
possibilidades e oportunidades de acesso a bases de dados em saúde, mas sim apontar alguns
caminhos e iniciar uma discussão crítica sobre novas oportunidades de formação de bases e de
arcabouço técnico para análises mais complexas.
ATENÇÃO
Alguns programas de computador e marcas comerciais são citados

nesta disciplina apenas como exemplos de ferramentas que podem
ser usadas para apoiar sua análise de bases de dados em saúde.
Há outras soluções disponíveis, gratuitas e pagas, que você deve
buscar. Os autores declaram não terem qualquer relacionamento
com estas empresas, marcas e produtos.
Contextualização conceitual
Inicialmente vale a pena nos aproximarmos de uma definição mais específica de certos concei-
tos importantes que serão discutidos nessa disciplina. O primeiro deles é a definição de dado,
que pode ser caracterizado como uma descrição limitada do real, desvinculada de um referen-
cial explicativo e difícil de ser utilizada como informação por ser ininteligível (Alves, 2009).
Como ilustração podemos pensar na seguinte sequência de dados de um paciente hipotético:

45, f, L10.2, Motuca. Conseguiu decifrar? Observe que esses dados carecem de significado
considerando a maneira como estão apresentados. Para transformá-los em informação
precisamos, então, de um referencial explicativo mínimo. Assim, podemos voltar aos mesmos
dados e associarmos, na sequência as seguintes explicações: idade, sexo, afecção principal,
cidade de origem. Nessa instância associamos ao conteúdo (dado) um significado que nos
possibilita entender a situação do paciente. Essa relação nos ajudará a entender um outro
conceito: informação.
Podemos definir informação como uma descrição mais completa do real associada a um refe-
rencial explicativo sistemático. Podemos dizer que é a representação de fatos da realidade com
base em determinada visão de mundo, mediante regras de simbologia (Knuth, 1996). Repre-
senta, portanto, uma ligação entre fatos da realidade ou ideias de algumas pessoas e ideias ou
conhecimento de outras.
6
UAB | UNIFESP
Talvez você ainda se sinta incomodado com essa explicação porque ao associarmos uma des-
crição aos dados originais você tenha ficado sem entender que doença, em particular, essa
paciente tem. Isso é porque a afecção L10.2 é uma enfermidade que está descrita no Código
Internacional de Doença em sua décima versão (CID10). No caso da paciente em questão te-
mos a codificação que se refere ao capítulo XII desse código, o qual trata de doenças da pele e
do tecido celular subcutâneo e que, por sua vez, tem outras subdivisões as quais vão de L00 a
L99. Finalmente, para essa paciente a afecção descrita está na parte L10 para pênfigos (doenças
bolhosas da pele de uma maneira geral), sendo que L10.2 se refere ao pênfigo foliáceo (ou fogo
selvagem, doença autoimune endêmica em algumas regiões do país). Talvez você já saiba de
tudo isso se for um profissional da área da saúde; talvez não.
SAIBA MAIS
Informação pode ser definida como o resultado do processamento,

manipulação e organização de dados, de tal forma que represente
uma modificação (quantitativa ou qualitativa) no conhecimento
do sistema (pessoa, animal ou máquina) que a recebe. A visão da
informação como mensagem entrou em destaque com a publicação,
em 1948, de uma influente dissertação de Claude Shannon, A
mathematical theory of communication. Conheça mais sobre o
verbete informação na Wikipedia goo.gl/mai3rB.
Esse é um exemplo bastante simples. De uma maneira mais ampla, a compreensão de uma
informação, produzida e disseminada, depende da compreensão do contexto no qual ela
se encontra, e do contexto em que se encontra aquele que a está interpretando e analisan-
do (Knuth,1996). Esse inter-relacionamento é a tarefa (às vezes difícil) da qual você deverá se
ocupar nessa disciplina. Particularmente, vamos tentar uma aproximação mais completa ao
trabalharmos com bases de dados em saúde porque estudaremos esse tema com vistas a um
conhecimento específico, seja ele sobre as condições de saúde de um paciente, seja de uma
população (de um município ou país). Mais ainda, vamos tentar sempre nos acercar de que
o conhecimento adquirido a partir de um dado ou conjunto de dados pode ser utilizado para
avaliarmos determinada situação de saúde (individual ou coletiva).
A partir do conhecimento adquirido podemos fundamentar uma tomada de decisão sobre uma
ação particular a ser realizada ou, até mesmo, utilizar uma avaliação final da situação de saúde
com novos dados, caracterizando esse processo como cíclico e dinâmico, conforme represen-
tado na Figura 1.
7
Situação da saúde
Avaliação dados
informação
conhecimento
decisão
ação
Figura 1 - Esquema de transformação e utilização de um dado para a gestão em saúde. Modificado de Alves (2009).
É possível observar na Figura 1 que existem outros elementos importantes para se chegar a essa
avaliação, como gerar conhecimento para a tomada de decisão sobre uma ação particular a ser
realizada ou, até mesmo, utilizar uma avaliação final da situação de saúde para definir novos
processos de aquisição de novos dados, deixando o ciclo de tarefas, esquematizado aqui, bas-
tante dinâmico. A Figura 2, a seguir, é uma extensão da Figura 1 na sua aproximação de tarefas
mais específicas que envolvem a gestão de dados e informação.
COLETA PROCESSAMENTO DECISÃO E CONTROLE
origem e registro dos dados recebimento e controle análise preliminar dos dados
ordenamento dos
codificação comparação com parâmetros
documentos da coleta
controle da quantidade e pedido de informação identificação e análise das
do conteúdo adicional discrepâncias
transmissão transcrição opções de decisão
classificação e
tabulação
controle de erros e
inconsistência
cálculos básicos
apresentação
Figura 2 - Ciclo de tarefas possíveis que vão da aquisição à tomada de ação a partir de uma base de dados em saúde.
Modificado de Alves (2009).
8
UAB | UNIFESP
A gestão de dados, informação e conhecimento envolve também a responsabilidade pela ga-

rantia das melhores condições técnicas para os processos de coleta, tratamento e disseminação
de informações. A manutenção das bases de dados, bem como a definição e a implantação de
padrões e normas que possibilitam uma comunicação eficiente de informação entre os diver-
sos sistemas digitais, garantem a autenticidade e segurança no armazenamento e transmissão
de informações.
SAIBA MAIS
O termo metadado ou metainformação é comumente usado na

área de bases de dados em saúde. Representa um dado sobre outros
dados. Um item de um metadado pode dizer do que se trata aquele
dado, geralmente uma informação inteligível por um computador.
Os metadados facilitam o entendimento dos relacionamentos e a
utilidade das informações dos dados. Veja mais em goo.gl/tASJjn.
Não vamos nos aprofundar nesses conceitos neste momento. Nosso intuito continua sendo
o de apresentar um panorama geral dos conteúdos que vamos tratar nessa disciplina. Uma
questão importante, entretanto, é que essa disciplina deve servir de conteúdo básico e com-
plementar à disciplina Sistemas de Informação em Saúde, que será apresentada mais adiante.
Dessa maneira, o esquema geral de produção de informação apresentado na Figura 2 contém
os elementos principais de um sistema de informações em saúde (SIS). Um SIS, em sua concep-
ção, deve reunir um instrumental que facilite a construção do conhecimento da realidade, mais
eficiente para o processo de planejamento, gestão e avaliação das ações de saúde. Ou seja, deve
ser uma ferramenta ou um conjunto de ferramentas que concretize, de maneira eficiente, a
transformação do dado para uma avaliação de saúde, como proposto na Figura 1 (Alves, 2009).
Vale a pena apresentar uma terminologia (entre algumas disponíveis) sobre uso e análise de
dados frequentemente mencionada no mercado (Davenport, 2014), conforme Quadro 1.
TERMO INÍCIO SIGNIFICADO ESPECÍFICO

suporte à decisão 1970 Uso da análise de dados para dar suporte à tomada de
decisões (goo.gl/KVDZZH)
suporte aos executivos 1980 Foco na análise de dados para dar suporte ao processo
decisório dos altos executivos
business intelligence 1989 Ferramentas para dar suporte a decisões orientadas por
dados com ênfase em relatórios (goo.gl/vmNh2Y)
Processamento Analítico Online 1990 Software para análise de tabelas de dados
(OLAP) multidimensionais (goo.gl/CK9V66)
epidemic intelligence 1999 Envolve atividades relacionadas à detecção precoce de
epidemias e geração de alertas a partir de análise de dados
de saúde (goo.gl/6lss3l)
business analytics 2005 Foco em análises estatísticas e matemáticas para a tomada
de decisões (goo.gl/samFD8)
big data 2010 Foco em um grande volume de dados não estruturados e em
rápido movimento (goo.gl/1YR6ck)
Quadro 1. Alguns termos frequentemente utilizados para uso e análise de dados (Davenport, 2014, p. 10).
9
Natureza da informação em saúde

Vamos nos ocupar um pouco em pontuar alguns elementos referentes às informações em saú-
de, distinguindo os tipos frequentemente utilizados, com o objetivo de dar subsídios para uma
avaliação da saúde. O enfoque principal aqui nessa seção será o de informações da saúde de
uma população.
Em uma primeira aproximação, mais geral, podemos classificar a informação em saúde confor-
me sua natureza (Alves, 2009):
• Informações estatístico-epidemiológicas: informações que incluem o conhecimento dos

dados de mortalidade e suas causas determinantes, do padrão de morbidade da população
ou da demanda atendida pelos serviços, dos aspectos demográficos, sociais e econômicos
e suas relações com a saúde da população. Incluem-se nesse grupo de dados aqueles que
possibilitam o conhecimento do grau de acesso da população aos serviços, isto é, da produ-
ção e utilização, da qualidade técnica dos procedimentos de saúde prestados e do grau de
satisfação do usuário;
• Informações clínicas: referem-se aos dados clínicos sobre o paciente, desde sua identifica-
ção - problemas de saúde relatados, diagnóstico médico - até exames clínicos, laboratoriais,
radiológicos, gráficos, procedimentos cirúrgicos realizados ou medicamentos prescritos,
dentre outros;
• Informações administrativas: não específicas apenas do setor da saúde, são as de controle

de estoque, materiais, equipamentos, gestão financeira.
O conjunto e a integração das informações clínicas, estatístico-epidemiológicas e administra-

tivas em um mesmo ambiente (computacional, por exemplo), relacionados a partir de regras
lógicas, podem vir a compor um sistema de apoio à decisão em saúde.
Hierarquização, descentralização e
municipalização da informação
No caso geral em que se quer estudar e estabelecer a situação de saúde de uma população,
idealmente a coleta de dados deve ser feita respeitando-se a hierarquização, a descentralização
e a municipalização dos serviços de saúde de acordo com a complexidade das ações e com as
necessidades dos diferentes níveis de gestão do sistema de saúde. Idealmente, também, cada
nível estrutural deve ter um conteúdo mínimo suficiente para cumprir as diretrizes e princípios
do SUS. Obviamente existem outras escalas de dados populacionais inferiores a um município
e, nesses casos, a coleta de dados deve respeitar a intenção da pesquisa original sobre uma
população mais específica.
10
UAB | UNIFESP
É esperado que o município obtenha informações suficientes para a gerência local dos serviços,
remetendo-os, seletivamente, em nível estadual e federal, que detêm os papéis de coordena-
dores e supervisores das ações de saúde. Dessa forma, a constituição de um sistema básico de
informação, de abrangência nacional, deve ter suas fontes de coleta de dados nas instituições
sediadas nos municípios de forma que os dados de interesse estadual ou nacional possam ser
coletados, processados e enviados a esses níveis, sem prejuízo das outras necessidades especí-
ficas de informação reconhecidas pelo município.
Com o avanço da tecnologia os sistemas informatizados rígidos, verticais, nacionais ou es-

taduais podem dar lugar àqueles que captam apenas os dados de interesse, por exemplo, via
arquivos DBF, TXT, JSON, XML ou outros padrões a partir de uma definição prévia da estru-
tura do banco de dados seguindo um modelo de software como serviço (Software as a Service
SaaS). Isso quer dizer que o município poder ter um sistema que englobe uma série de outras
informações, além daquelas exigidas pelo nível estadual ou nacional, processar seus próprios
dados, ter seus relatórios para monitoramento e avaliação, e participar, de maneira eficiente,
do envio da informação aos demais níveis de gerência do SUS.
Assim, sistemas informatizados de controle da produção ambulatorial, hospitalar, laborató-

rios, epidemiológicos, de vigilância sanitária e tantos outros poderiam ser desenvolvidos nessa
nova linha pela instância federal, disponibilizando esses produtos para os municípios. Isso
garantiria, de um lado, que as informações minimamente necessárias para avaliações nacio-
nais estivessem disponíveis e, de outro, que os municípios menores ou com poucos recursos
pudessem trabalhar outros dados de interesse, conforme o perfil epidemiológico ou realidades
específicas.
Tipos de informação
Vamos agora relacionar os principais tipos de dados e informação que estão disponíveis nas
bases de dados em saúde, que devem estar ao alcance da gerência, municipal ou regional,
quando na comparação de municípios de uma mesma região:
• Demográfico/econômico-social e cultural. Os censos populacionais periódicos ou

ocasionais possibilitam conhecer a estrutura de uma população em determinada área geo-
gráfica por sexo, idade, constituindo as “pirâmides de população”, estado civil, religião, na-
cionalidade e outras características sociais, econômicas e culturais. A partir desses dados é
possível gerar análises mais aprimoradas de fenômenos como migração, mortalidade, nup-
cialidade, fertilidade, força de trabalho, capacidade de produção, natalidade, crescimento
e envelhecimento da população, razão de dependência, escolaridade, ramos de atividade,
distribuição urbano-rural, renda etc. Algumas dessas informações estão retidas nos Cader-
nos de Saúde Municipais que vamos estudar mais adiante;
• Eventos vitais. Referem-se ao registro de nascimentos vivos, nascimentos mortos, óbitos,

casamentos, divórcios, adoções, legitimações, reconhecimentos, anulações e separações,
11
isto é, dizem respeito a fatos relacionados com o começo e fim da vida do indivíduo. For-
necem dados importantes para a confecção de vários indicadores, como de mortalidade,
morbidade, vida média ou esperança de vida, cobertura das ações etc;
• Morbidade. Possibilitam o registro das doenças por sexo, idade, procedimentos médicos,
raça, nacionalidade, procedência e outras variáveis de interesse clínico, epidemiológico,
social, econômico e cultural. Fornecem dados, coletados periódica ou ocasionalmente, im-
portantes para o controle das doenças; para a investigação de etiologia e patogenia e da
relação com fatores econômicos, sociais e culturais; para a investigação de eficácia das me-
didas preventivas e terapêuticas; para estudos nacionais e internacionais da distribuição
das doenças; e para o planejamento de serviços destinados à prevenção e cura das doenças.
Compreendem os dados de vigilância epidemiológica, os hospitalares, os ambulatoriais ou
de consultórios, os registros médicos de doenças e acidentes do trabalho, os registros espe-
ciais de doenças ou grupos de risco, de morbidade, seguro social e as informações clínicas
em geral;
• Classificação e codificação. Um exemplo desse tipo de dado é a Classificação Interna-

cional de Doenças (CID), que será apresentada mais adiante, presente na lista de bases do
DATASUS. Vale pontuar aqui que, no caso de dados de morbidade e de mortalidade, exis-
tem tabelas que agrupam as doenças ou eventos segundo as características semelhantes
apresentadas, criando-se a nomenclatura de doenças e sua classificação. Além da padroni-
zação e universalização do diagnóstico, a CID fornece os códigos das doenças para fins clí-
nicos, epidemiológicos e de processamento das informações. Essas tabelas são importantes
e muito utilizadas, como ficou claro no exemplo dado anteriormente no qual se estabeleceu
a afecção de uma paciente como sendo pênfigo foliáceo;
• Avaliação hospitalar. Censo médio diário, percentagem de ocupação, mortalidade hos-

pitalar, necropsia hospitalar, infecção hospitalar e outros. No caso que vamos estudar nas
fontes de informação em saúde dos municípios, esses dados estão geralmente dispersos e
resumidos;
• Produção dos serviços. Especificados por tipo de programa de saúde, fornecem dados
sobre número de consultas produzidas por idade, sexo, tipos de procedimento e outras va-
riáveis de interesse. Possibilitam a construção de indicadores de cobertura populacional e
utilização dos serviços, concentração das atividades por paciente, produtividade, dentre
outros. Referem-se à mensuração de todas as atividades de saúde produzidas passíveis de
quantificação, seja no atendimento individual hospitalar ou ambulatorial, nos serviços de
apoio diagnóstico e terapêutico, seja em relação às práticas coletivas, como ações na comu-
nidade, nas escolas, vigilância sanitária e outras ações de saúde pública;
• Qualidade. Referem-se, principalmente, aos sistemas de avaliação sanitária dos estabe-

lecimentos prestadores de serviços de saúde ou produtores de alimentos, medicamentos,
equipamentos, saneantes etc.; do meio ambiente e do trabalho, em decorrência das ações
de vigilância sanitária ou de pesquisas ocasionais. Possibilita conhecer as condições técni-
12
UAB | UNIFESP
cas de funcionamento dos estabelecimentos, as condições de risco, a qualidade de produtos

como alimentos, medicamentos e outros, a qualidade dos procedimentos médicos e outros,
o percentual de estabelecimentos em desacordo com os padrões técnicos, os problemas do
meio ambiente e do trabalho. Enfim, possibilita conhecer o quadro sanitário do município;
• Administrativos. Gestão financeira/orçamento, folha de pagamento/recursos humanos,

gestão de estoques de materiais de consumo, equipamentos e outros bens patrimoniais,
controle de processos/expediente administrativo, banco de legislação da saúde, documen-
tos e biblioteca, controle de medicamentos, cadastros de estabelecimentos, dentre outros.
Como recurso para o monitoramento e avaliação cabe lembrar a Técnica de Avaliação e
Revisão de Programa e Método do Caminho Crítico (Pert/CPM) (Project Management Ins-
titute, 2013) (podcasts explicativos goo.gl/X51AQc, goo.gl/NB9HA3) e Gráfico de Gantt,
que não é um sistema de informação, mas sim uma técnica de planejamento essencial para
acompanhamento de programas e projetos. Essas técnicas encontram-se hoje informatiza-
das em softwares disponíveis no mercado, possibilitando aos gerentes o armazenamento
de informações completas sobre o andamento dos programas e projetos, problemas, nós
críticos, dentre outras informações. Alguns sistemas de produção ambulatorial e hospitalar
do SUS tais como o Sistema de Informação Ambulatorial do SUS (SIA/SUS), Controle de
Renais Crônicos, Sistema de Informações Hospitalares do SUS (SIH/SUS), dentre outros,
além de fornecerem os indicadores clássicos de saúde representam sistemas de fatura e
pagamento das ações de saúde em todo o território nacional.
13
Capítulo 2
Integração de dados em saúde
Idealmente buscamos uma integração das informações intra, inter e extrassetores/áreas geo-
gráficas/níveis de gerência e de gestão, bem como atender avaliações programáticas, estadual
ou nacionalmente, consideradas prioritárias. Por meio da informática essa integração tende
a ser viabilizada, mas podemos afirmar que ainda é um grande desafio a ser enfrentado. Há
vários aplicativos que têm a função de integrar sistemas para a gerência em saúde, no controle
orçamentário/financeiro, de estoque, produção de atividades, morbidade e mortalidade, uni-
dades ambulatoriais, hospitalares, laboratórios etc. Alguns desses aplicativos foram desenvol-
vidos pelos próprios municípios a partir de suas experiências de gerências municipais.
Contudo, muitas dessas experiências respondem a características locais muito específicas, o

que impede um uso mais amplo, isto é, seu aproveitamento por outros municípios sem reparos
ou adaptações. Não há ainda disponível um aplicativo completo, ideal para todos e que respon-
da a todos os aspectos da gerência, tanto àqueles relativos ao atendimento individual à saúde
quanto àqueles relacionados às ações coletivas.
Merece destaque um programa desenvolvido para o setor público de saúde pela DATASUS, por
ser público, gratuito e por estar disponível na web. Representa uma alternativa para trabalhar
as informações de uma forma mais interativa com o usuário, possibilitando uma atuação mais
integrada em relação aos aspectos operacionais e gerenciais dos serviços de saúde e o aprovei-
tamento de informações específicas locais. Esse programa, que será apresentado mais adiante,
é o TabWin (versão para Microsoft Windows) , que possibilita tabular dados disponíveis na web,
bem como utilizar arquivos de outras bases de dados (DBF, CNV e TXT). Mais recentemente
temos o TabNet (Tab para ambiente web) que apresenta várias das funcionalidades do TabWin.
Possibilita, também, realizar operações aritméticas e estatísticas nos dados de tabelas geradas
ou importadas. É um programa excelente para trabalhar dados de morbidade, mortalidade,
produção, financeiro e tantos outros, os quais podem rapidamente configurar mapas e gráficos
de boa qualidade por regiões e municípios de todo o Brasil.
Esses e outros programas estão citados mais adiante, com suas respectivas referências, na se-
ção que trata de sistemas de tabulação de dados.
14
UAB | UNIFESP
Interoperabilidade funcional e semântica

A informação torna-se ainda mais valiosa quando podemos compartilhá-la entre diferentes
sistemas de informação em saúde. Em um mundo ideal as informações de um determinado
paciente, estabelecimento ou equipamento estariam disponíveis para sistemas autorizados em
todo o território nacional ou internacional. Esse cenário evitaria a duplicidade ou, até mesmo,
a ausência de informação para uma tomada de decisão.
A interoperabilidade na saúde é o mecanismo que garante a comunicação efetiva entre siste-

mas e equipamentos na área da saúde, e tem como pilares padrões internacionais. Podemos
descrever duas qualificações da interoperabilidade (SBIS, 2013):
• Interoperabilidade funcional: a habilidade de dois ou mais sistemas trocarem informações;
• Interoperabilidade semântica: a habilidade da informação compartilhada entre sistemas ser

entendida em nível dos conceitos de domínio formalmente definidos.
Nesse curso de especialização nós teremos a disciplina Padrões de Normatização em Informá-

tica em Saúde, que será apresentada mais adiante, na qual os padrões usados na área da saúde
serão discutidos.
Descoberta de conhecimento e mineração

de dados (KDD)
A denominação knowledge discovery and data mining (KDD), ou descoberta de conhecimento
e mineração de dados, se refere ao processo, na sua forma mais ampla, de definir um conhe-
cimento a partir de bases de dados, enfatizando um alto nível de aplicação de métodos parti-
culares de mineração de dados (KDD, 2016). De fato, representa a junção dos termos extração
de conhecimento de bases de dados (knowledge discovery in databases), que enfatiza que o
conhecimento é o resultado final da descoberta baseada em bases de dados, e do termo mine-
ração de dados (data mining) (goo.gl/lrtRJH), que foca na aplicação de algoritmos específicos
para extrair padrões de dados. KDD, portanto, representa um processo amplo de preparação,
seleção e transformação de dados com incorporação de conhecimento a priori para interpreta-
ção adequada dos resultados da mineração, como procedimentos essenciais para garantir que
um conhecimento útil seja extraído dos dados.
O processo de descoberta de conhecimento descreve tanto os procedimentos gerais pelos quais

a informação é extraída e aglomerada como também descreve a área dedicada a realizar pes-
quisa de inovação nesse processo (Fayyad, 1996). Ainda, há esforços em se oferecer ferramen-
tas de mineração de dados que apoiem os analistas na investigação de tarefas de descoberta
de conhecimento não estruturadas. Descoberta de conhecimento é um termo que representa
15
melhor uma natureza iterativa e orientada ao processo, assim como sua ênfase no desenvolvi-
mento de conhecimento estratégico e domínio de compreensão. Mineração de dados, por outro
lado, é um termo que normalmente descreve uma investigação mais específica em um domínio
de aplicação e representa uma ferramenta que possibilita encontrar regras e relações entre os
dados (Bendoly, 2003).
Especificamente na área da saúde os sistemas de assistência por todo o mundo buscam cada
vez mais atender às necessidades de seus pacientes e aumentar a qualidade dos serviços en-
quanto implementam redução de custos. O foco mundial encontra-se na otimização dos siste-
mas de saúde em prol de uma melhor eficiência operacional. Aliado a isso ocorre um aumento
do volume de dados eletrônicos da saúde, que introduz novos desafios no armazenamento, re-
gistro e na complexidade na estruturação dos dados (Peek, 2013). De fato, há desafios para lidar
com dados da saúde quanto ao seu volume (de terabytes a exabytes de dados para processar), à
sua dinâmica (dados em streaming, processamento em tempo real), ao seu formato (estrutura-
do, não estruturado, texto, multimídia) e à sua incerteza (devido à inconsistência e incompletu-
de, ambiguidade, latência, decepção, modelos de aproximação). A aplicação de KDD na saúde
colabora para solucionar esses desafios. Em síntese, podemos dizer que KDD auxilia a trans-
formar dados e informação em conhecimento, ajudando na tomada de decisões (Pisa, 2013).
Gestão do conhecimento
A adoção de sistemas de gestão empresarial (enterprise resource planning ERP) em organiza-
ções nos últimos 25 anos, e mais recentemente em organizações provedoras de saúde, veio
acompanhada de um enorme aumento na quantidade de dados produzidos e disponíveis para
análise (Bendoly, 2003). No entanto, a relevância desses dados comumente é definida a partir
da examinação de múltiplos problemas simultaneamente e da habilidade de gerar inferências
críticas a um plano estratégico (Berry e Linoff, 1997). Os benefícios contribuem para a inteli-
gência organizacional e subsequentemente à vantagem competitiva global do negócio (Francis,
1997). Portanto, o desafio encontrado pela organização e pelos analistas responsáveis por ma-
nipular tais dados está em sua habilidade em converter as estratégias decorrentes da análise
dos dados em economia de esforço, tempo e dinheiro. Um dos problemas fundamentais da
extração da informação é que os formatos das fontes de dados disponíveis são frequentemente
incompatíveis, requerendo um grande esforço de conversão (Bendoly, 2003).
Do ponto de vista da gestão do conhecimento, os processos de mineração de dados possibi-

litam a criação de uma informação bem definida, transferível. Em contraste, os processos de
descoberta de conhecimento são caracterizados pela recuperação de dados, limpeza de dados,
especificação de critérios e análise de desempenho. Processos de KDD aglomeram informação
inerente da organização por meio de aplicação de técnicas como mineração de dados para a
geração de domínios de conhecimento. Bendoly (2003) apresenta um quadro hierárquico das
relações entre diferentes conceitos e sistemas que colaboram no processo de tomada de deci-
são e que se tornam mais complexos à medida que aumenta a dependência dos domínios de
16
UAB | UNIFESP
conhecimento envolvidos para sua organização. Esse quadro apresenta os seguintes conceitos,
da menor para a maior complexidade:
1. Pesquisa em banco de dados (database query): localização e acesso a registros relevantes

em bancos de dados;
2. Busca por informação (information search): construção de regras relevantes e relaciona-
mentos que descrevem os dados. Por exemplo, podemos utilizar técnicas de mineração de
dados para auxiliar na elaboração dessas regras ou relacionamentos;
3. Descoberta de conhecimento (knowledge discovery): interpretação e integração de múlti-
plas regras e relacionamentos relevantes;
4. Gestão do conhecimento (knowledge management): disseminação de conhecimento inte-
grado e geração de uma política para uso sistemático de informação relevante;
5. Inteligência de negócio (business intelligence): utilização estratégica em toda a organização
de uma política de conhecimento e informação integrados.
Uma aplicação específica de KDD pode ter diferentes objetivos, por exemplo, aqueles deriva-
dos das relações de dependência dos dados, desenvolvimento de previsões e classificação. O
produto final pode ser uma junção de tais informações, organizado em um formato que pode
ser aplicado como conhecimento relevante para planejar uma atividade. No entanto, quando
o processo de KDD possibilita oferecer uma ferramenta de análise em qualquer ponto de ite-
ração, seu resultado se torna aplicável e, geralmente, com impacto direto. Nesse caso, ferra-
mentas de mineração de dados acabam se apresentando como uma solução superior para os
objetivos definidos para sua aplicação. A maior parte da literatura de KDD tem apresentado
foco maior, portanto, na avaliação da eficiência de ferramentas e algoritmos (Bendoly, 2003).
Técnicas de mineração de dados

A mineração de dados é o processo de explorar grandes quantidades de dados à procura de
padrões consistentes, como regras de associação ou sequências temporais, para detectar rela-
cionamentos sistemáticos entre variáveis, identificando, assim, novos subconjuntos de dados.
Esse é um tema presente na área das ciências da computação, mas utiliza técnicas da estatísti-
ca, recuperação de informação, inteligência artificial e reconhecimento de padrões.
Os passos fundamentais de uma mineração bem sucedida a partir de fontes de dados (bancos de
dados, relatórios, registros de acesso, transações etc.) consistem de uma limpeza (consistência,
preenchimento de informações, remoção de ruído e redundâncias etc.) com o propósito de criar
repositórios organizados para fins de análise, como data marts e data warehouses . É a partir
deles que os dados organizados, por exemplo, em colunas, podem ser submetidos ao processo
de mineração. Tipicamente, esse processo não é o final da história: de forma interativa e
cíclica, usando visualização gráfica, um analista refina e conduz o processo até que os padrões
apareçam. Observe que esse conjunto de tarefas parece indicar uma hierarquia, algo que
começa em instâncias elementares (embora volumosas) e termina em um ponto relativamente
concentrado.
17
Assim como o KDD, existem outras metodologias para auxiliar na tarefa de mineração de da-
dos. A metodologia mais utilizada na indústria de mineração de dados (KDnuggets, 2014) é o
Cross Industry Standard for Data Mining (CRISP-DM), um modelo de processo que auxilia a
descrever as principais abordagens utilizadas em mineração de dados para resolver um proble-
ma (Shearer, 2000). Este modelo sugere as principais etapas de um processo de mineração de
dados, desde o entendimento do problema até a entrega da solução, agindo sobre os dados de
forma cíclica e voltando em etapas sempre que necessário..
São seis as etapas sugeridas pelo CRISP-DM, que não seguem necessariamente um fluxo li-
near. Pode-se retornar a uma etapa anterior, ou desde o início dependendo das necessidades.
As seis etapas são:
1. Entendimento do negócio: Primeira etapa do processo, é nela em que o objetivo e neces-

sidades do projeto são compreendidos do ponto de vista do negócio. O conhecimento do
negócio é transformado na definição de um problema de mineração de dados;
2. Entendimento dos dados: coleta e conhecimento dos dados que serão utilizados no pro-
cesso de mineração. Nesta fase também são identificados problemas de qualidade dos da-
dos, descobrir subproblemas e formular hipóteses a partir de informações ocultas;
3. Preparação dos dados: tarefas necessárias para montar a base de dados final utilizada no
processo. Esta etapa pode ser executada diversas vezes e inclui tarefas como tabulação,
seleção, transformação e limpeza de dados e atributos;
4. Modelagem: são escolhidas as técnicas de modelagem que serão aplicadas sobre os dados
(classificação, regressão, clusterização etc), bem como os parâmetros utilizados no modelo.
Dependendo da técnica de modelagem utilizada, é comum voltar às fases anteriores para
corrigir os dados que serão utilizados;
5. Avaliação: ao chegar nesta etapa o modelo (ou modelos) já foram aplicados sobre os dados
preparados, e espera-se que ele mostre algo relevante sob a perspectiva da análise de da-
dos. A avaliação serve justamente para verificar a qualidade do modelo, revisar os passos
executados para construir o modelo e verificar se os objetivos do negócio foram atendidos.
Por vezes verifica-se que algumas necessidades do negócio não foram atendidas, então o
processo volta a fase de entendimento do negócio;
6. Entrega: após a criação do modelo é necessário disponibilizar os resultados para mostrar a
informação e conhecimento adquiridos pela sua aplicação, uma vez que é o usuário final,
como um médico ou gestor de saúde, o consumidor destes resultados, e não o analista de
dados. É comum o uso de relatórios e dashboards, com gráfico interativos e dinâmicos, para
que os usuários finais façam uso dos resultados do modelo.
Um dos propósitos de utilizar mineração de dados é encontrar padrões. Encontrar padrões
requer que os dados brutos sejam sistematicamente “simplificados”, de forma a desconsiderar
aquilo que é específico e privilegiar aquilo que é genérico. Fazemos isso porque não parece
haver muito conhecimento a extrair de eventos isolados. Um provedor de saúde que tenha
realizado assistência a um paciente relacionado a um determinado diagnóstico, em uma única
data, pode apenas significar um caso particular, não indicando uma tendência. Encontrar um
padrão representa, em suma, poder identificar uma tendência no comportamento das variá-
18
UAB | UNIFESP
veis. Além da utilização de técnicas clássicas de estatística, é frequente a utilização de técnicas

de aprendizado de máquina para realizar a identificação dessas tendências nos dados (Monard
e Baranauskas, 2003).
Aprendizado de máquina é uma área da inteligência artificial que lida com problemas de apren-
dizado computacional a fim de adquirir conhecimento de forma automática. Um sistema de
aprendizado tem a função de analisar informações e generalizá-las, para a extração de novos
conhecimentos (Monard e Baranauskas, 2003). Para isso usamos um programa de computa-
dor para automatizar o aprendizado. Há alguns paradigmas para o aprendizado de máquina, a
saber:
• Simbólico: representações simbólicas de um problema por meio da análise de exemplos e

contraexemplos como expressão lógica, árvore de decisão, regras ou rede semântica. Exem-
plo: algoritmos de árvore de decisão como ID3, C4.5, J48;
• Estatístico: utiliza modelos estatísticos para encontrar uma aproximação do conceito indu-
zido. Exemplo: aprendizado bayesiano ;
• Baseado em exemplos: classifica um novo exemplo com base em uma classificação similar
conhecida. Exemplo: raciocínio baseado em caso e método dos vizinhos mais próximos ;
• Conexionista: inspirado no modelo biológico do sistema nervoso. Exemplo: redes neurais

artificiais, deep learning;
• Evolutivo: modelo biológico de aprendizado. Exemplo: neurociência computacional , ana-

logia com a teoria de Darwin.
Há uma série de algoritmos e técnicas que podem ser usados na área de mineração de dados
(goo.gl/IsehcF) como, por exemplo, os algoritmos disponíveis no software livre Weka (goo.gl/
xHzgeA). No entanto, essa disciplina não tem por objetivo apresentar um curso prático e com-
pleto sobre tais técnicas. O objetivo, neste ponto, é ressaltar àqueles que pretendem realizar
análises de bases de dados em saúde que, além da atividade clássica de obter o dado e de re-
lacionar o que for aparente ao pesquisador e gerar gráficos ou relatórios, há outras abordagens
que possibilitam expor padrões não óbvios dos dados. Uma abordagem clássica estatística já
apresenta resultados bastante interessantes, quando bem utilizada. Dizemos isso porque é co-
mum encontrarmos pesquisadores aplicando os mesmos modelos, análise de distribuição e
cálculos de probabilidade em situações cujos resultados não significam nada. O que é pior é
que nem sempre são atendidas as hipóteses de aplicação de tais análises estatísticas. É comum
encontrarmos pesquisadores que menosprezam uma estatística descritiva, bem feita, por acha-
rem demasiadamente simples! Enquanto buscam, por outro lado, aplicar análises estatísticas
mais robustas, mas com pouco domínio ou significado para o problema enfrentado.
Esse mesmo comentário pode ser aplicado com relação à apresentação dos dados e dos
resultados. Há exemplos de pesquisas em bases de dados em saúde bem realizadas, a partir de
fontes confiáveis, com limpeza dos dados, análise estatística adequada, mas que, no momento
19
da apresentação dos resultados, simplesmente perdem sua riqueza, perdem significado para o
gestor ou para o profissional da saúde. Por exemplo, muitas vezes o que interessa para o gestor,
para o profissional da saúde ou mesmo para o cidadão é compreender um fenômeno, e não
identificar pontualmente todos os registros de uma base de dados. Nesses casos recomendamos
sempre que o pesquisador dê uma ênfase maior no paradigma de visualização dos resultados,
ou seja, na entrega do modelo criado, e diminua sua preocupação em apresentar longas
listagens e bancos de dados como resultados, focando naquilo que é mais importante para a
população-alvo do seu estudo. Outras vezes notamos que o que a população-alvo precisa é de,
simplesmente, uma agregação dos dados, seja porque o dado está distribuído em diferentes
bases de dados, seja porque os formatos são originalmente distintos, seja porque apenas o
dado não estava disponível anteriormente de qualquer outra maneira. Assim, a construção
de uma interface amigável, disponível para seu usuário, que forneça um acesso simplificado
a tais dados já cumpre bem seu papel. Existem diversas ferramentas no mercado que fazem
relatórios e dashboards (https://goo.gl/JvLBpL), bastando apenas fazer a conexão e os filtros
na base de dados, como é o caso do Pentaho. Para aqueles que gostam de se aventurar na
programação e criar o próprio sistema de visualização dos dados, uma vasta quantidade de
bibliotecas JavaScript está disponível para implementar softwares web com HTML5 (https://
goo.gl/swhQow)
Portanto, vale sempre uma recomendação: se você for analisar uma base de dados em saúde,
aplique técnica de mineração de dados mais robusta apenas se seus resultados fizerem sen-
tido em sua análise, se as hipóteses de aplicação da técnica forem atendidas e se essa nova
abordagem colaborar para responder à pergunta inicial da sua investigação. E, por fim, tenha
criatividade na busca de uma representação visual dos seus resultados que façam sentido à sua
população-alvo.
20
Capítulo 3
Bases de dados do Sistema Único
de Saúde (SUS)
O material da disciplina Introdução às Ciências da Saúde apresenta a definição do Sistema
Único de Saúde (SUS) no Brasil, mencionando a responsabilidade das três esferas de governo,
seus princípios e níveis de atenção à saúde, e dos serviços de saúde. Considerando as estatís-
ticas apresentadas e a complexidade que o SUS apresenta, é evidente que uma grande quanti-
dade de dados tem sido coletada e que sistemas de informação foram desenvolvidos ao longo
dos anos para dar suporte ao gerenciamento e planejamento das suas ações. A Organização
Mundial de Saúde define os sistemas de informação em saúde (SIS) como tipos particulares
de sistemas de informação cujo propósito é o de selecionar os dados pertinentes aos serviços
de saúde e transformá-los na informação necessária para o processo de decisões, próprio das
organizações e dos indivíduos que planejam, administram, medem e avaliam esses serviços.
De fato, a tecnologia da informação é uma forte aliada para suprir a necessidade de informa-
ção para a tomada de decisão no setor da saúde (Spil et al., 2009). O estudo de Helms, Moore e
Ahmadi (2008) mostra que o uso de SIS promove diferenciais positivos em relação à segurança
do paciente, à eficiência operacional e ao apoio às decisões dos profissionais de saúde.
O desenvolvimento de SIS específicos para o gerenciamento do SUS se deu em meio à busca

por alternativas baseadas no uso de tecnologias da informação e comunicação e o gerencia-
mento de informações na área da saúde para sanar demandas informacionais do setor (Mota,
2009). O campo de atenção à saúde depende fortemente da transferência de informação e os
SIS tornaram-se ferramentas fundamentais no auxílio à memória dos profissionais na atenção
aos pacientes e também como uma ferramenta epidemiológica no planejamento dos cuidados
às populações (Souza Junior, 2012). Assim, os sistemas de informação em saúde no SUS servem
como uma fonte de informação a respeito da qualidade da atenção e sobre como melhorar seus
processos (Starfield, 2002).
A partir das necessidades do setor, a mensuração do estado de saúde da população teve seu
início com o registro sistemático de dados de mortalidade e de sobrevivência, e evoluiu para o
controle das doenças infecciosas e análise da situação sanitária (Souza Junior, 2012). As infor-
mações sobre morbidade, acesso a serviços, qualidade da atenção, condições de vida e fatores
ambientais passaram a ser métricas utilizadas na construção de indicadores de saúde, que se
traduziram em informação relevante para a quantificação e a avaliação das informações em
saúde pelos gestores públicos (Moraes, 1994).
21
Somente na década de 1990 a área assistencial começou a ser uma preocupação dos SIS no SUS
e o foco passou a ser o paciente e as informações que são geradas a partir dos cuidados presta-
dos ao mesmo. É nesse período que a “ideia de integração entre dados clínicos, assistenciais e
administrativos corporificou-se e ganhou centralidade, tendo o paciente como elo aglutinador”
(Santos, 2003, p.86).
De fato, há um consenso sobre a importância central da informação para avaliar o sucesso das
políticas de saúde, que se manifesta não apenas na literatura especializada (Medina, Aquino,
2002; Senna, 2002), como também em relatórios e recomendações de conferências de saúde,
oficinas de trabalho do SUS e eventos de sociedades científicas (Souza Junior, 2012). Assim, in-
formações epidemiológicas, financeiras, orçamentárias, legais, normativas, socioeconômicas,
demográficas e sobre recursos físicos e humanos, oriundas de diversas fontes de dados de qua-
lidade, seriam capazes de revelar a realidade de serviços e ações de saúde e a situação de saúde
da população, evidenciando vantagens e problemas de prioridades e investimentos (Viacava,
2002). Tradicionalmente a informação sobre saúde no Brasil é fragmentada, resultado da ativi-
dade compartimentada das diversas instituições que atuam no setor (Brasil, 1994; Brasil, 2007).
Implantados e operacionalizados em diferentes níveis - municipal, estadual e federal - com
áreas de atuação diversificadas, os SIS tendem a ser inter-relacionados buscando a integração
das informações distribuídas em cada nível e entre eles para melhorar a articulação entre as
organizações estaduais e municipais de saúde e o governo federal. Portanto, a expectativa é
de gerar um grande (multi) sistema de informação com características complexas no qual seus
componentes encontram-se fortemente inter-relacionados. Se, do ponto de vista tecnológi-
co, esse inter-relacionamento ainda se apresenta complexo e trabalhoso ao gestor de saúde e,
mais ainda, para o cidadão (Souza Junior, 2012), do ponto de vista de significado e potencial de
correlação dos dados, esse inter-relacionamento apresenta um grande potencial de utilidade.
É maximizando o potencial dessa ligação dos dados de diferentes naturezas sobre o sistema de
saúde e seus resultados que o cidadão aumenta seu poder analítico e de descrição da realidade
da assistência oferecida no país (Pisa, 2013).
Departamento de Informática do SUS

(DATASUS)
Conforme descrito no portal web do Departamento de Informática do SUS (DATASUS), a infor-
mação é considerada fundamental para a democratização do uso do sistema de saúde e o apri-
moramento de sua gestão. Assim, a informatização das atividades do SUS, dentro de diretrizes
tecnológicas adequadas, torna-se essencial para a descentralização das atividades de saúde e
viabilização do controle social sobre a utilização dos recursos disponíveis.
Para alcançar esses objetivos foi criado o DATASUS. O processamento das contas hospitalares
e ambulatoriais do SUS remonta aos aplicativos implementados pela Empresa de Tecnologia e
22
UAB | UNIFESP
Informações da Previdência Social (DATAPREV), empresa pública de processamento de dados

da Previdência Social (Brasil, 2002). A criação do DATASUS ocorreu de forma concomitante à
criação da Fundação Nacional de Saúde (FUNASA) em 1991, retirando da DATAPREV a função
específica de controle e processamento das contas referentes ao setor de saúde, que passaram à
responsabilidade do Ministério da Saúde, por delegação atribuída à FUNASA por meio de seu
Departamento de Informática.
No início de 1998 foi criado um grupo de trabalho para viabilizar a transferência do DATASUS
para a administração direta no Ministério da Saúde (Brasil, 2002). A importância da informação
para os processos de gestão e formulação de políticas tornou-se evidente, o que levou à amplia-
ção e adaptação da missão do DATASUS em função das demandas do Ministério da Saúde. O
DATASUS ganhou uma nova estrutura organizacional, com a ampliação do seu corpo gerencial
para três coordenações gerais, sendo atribuída a uma delas a função específica de “Fomento
e Cooperação Técnica” com estados e municípios, e estabelecendo-se as competências hoje
presentes na estrutura organizacional do Ministério da Saúde por meio de decreto de 2002. A
partir de 2011, o DATASUS passou a integrar a Secretaria de Gestão Estratégica e Participativa
no Ministério da Saúde.
Ao DATASUS compete, segundo Art. 38 do Decreto Nº 8.065 de 2013 (Brasil, 2013):
1. fomentar, regulamentar e avaliar as ações de informatização do SUS direcionadas à manu-

tenção e ao desenvolvimento do sistema de informações em saúde e dos sistemas internos
de gestão do Ministério da Saúde;
2. desenvolver, pesquisar e incorporar produtos e serviços de tecnologia da informação que
possibilitem a implementação de sistemas e a disseminação de informações para ações de
saúde em consonância com as diretrizes da Política Nacional de Saúde;
3. desenvolver, pesquisar e incorporar produtos e serviços de tecnologia da informação para
atender aos sistemas internos de gestão do Ministério da Saúde;
4. manter o acervo das bases de dados necessários ao sistema de informações em saúde e aos
sistemas internos de gestão institucional;
5. assegurar aos gestores do SUS e aos órgãos congêneres o acesso aos serviços e tecnologia
da informação e bases de dados mantidos pelo Ministério da Saúde;
6. definir programas de cooperação tecnológica com entidades de pesquisa e ensino para
prospecção e transferência de tecnologia e metodologia no segmento de tecnologia da in-
formação em saúde;
7. apoiar os estados, os municípios e o Distrito Federal na informatização das atividades do
SUS;
8. prospectar e gerenciar a rede lógica do Ministério da Saúde;
9. promover o atendimento ao usuário de informática do Ministério da Saúde.
23
Sistemas e aplicativos do SUS

No Portal da Saúde do DATASUS é possível identificar os sistemas e aplicativos disponibiliza-
dos para que os profissionais e gestores da saúde possam gerenciar a informação proveniente
das bases de dados do SUS. No final da página estão os principais sistemas de processamento
de dados do DATASUS, separados de acordo com a natureza. Cada sistema contém a des-
crição sumária, principais objetivos e configuração mínima de equipamento para sua utiliza-
ção. Informações adicionais podem ser obtidas por meio dos núcleos estaduais de fomento e
cooperação técnica do DATASUS. O Quadro 2 apresenta uma lista dos principais sistemas de
informação do SUS, que representam suas bases de dados em saúde disponíveis (nem sempre
publicamente) para análise.
Natureza Sigla Nome

Ambulatorial SIA Sistema de Informações Ambulatoriais
GIL Sistema para Gerenciamento de Informações Locais
e-SUS AB e-SUS Atenção Básica
BPA Magnético Boletim de Produção Ambulatorial
APAC Magnético Sistema de Captação de Dados -Autorização de Procedimento
de Alta Complexidade
DE-PARA SIA Utilização do Cadastro Nacional de Estabelecimentos de Saúde
VERSIA Sistema de Verificação do SIASUS
Cadastro CADSU Sistema de Cadastramento de Usuários do SUS
Nacional
CID-10 Classificação Estatística Internacional de Doenças e Problemas
Relacionados à Saúde - Versão 10
CNES Cadastro Nacional de Estabelecimentos de Saúde
- Repositório de Tabelas
- Bases Territoriais
Epidemiológico SIAB Sistema de Informação da Atenção Básica
SI-PNI Sistema de Informações do Programa Nacional de Imunizações
SISCOLO/SISMAMA Sistema de Informação do Câncer do Colo do Útero e de Mama
HIPERDIA Sistema de Gestão Clínica de Hipertensão Arterial e Diabetes
Mellitus da Atenção Básica
SisPreNatal Sistema de Acompanhamento da Gestante
Financeiro SIOPS Sistema de Informações sobre Orçamento Público em Saúde
SGIF Sistema de Gestão de Informações Financeiras do SUS
SISGERF Sistema de Gerenciamento Financeiro
24
UAB | UNIFESP
Hospitalar HOSPub Sistema Integrado de Informatização de Ambiente Hospitalar

e-SUS Hospitalar Sistema e-SUS Hospitalar
SIHD Sistema de Informações Hospitalares Descentralizado (antes
SIH-SUS)
HEMOVIDA Sistema de Gerenciamento em Serviços de Hemoterapia
BHLWeb Sistema de Gerenciamento e Produção de Bancos de Leite
Humano
SISAIH Sistema Gerador do Movimento das Unidades Hospitalares
CIHA Sistema de Comunicação de Informação Hospitalar e
Ambulatorial
SIGTAP Sistema de Gerenciamento da Tabela de Procedimentos,
Medicamentos, Órteses, Próteses e Materiais Especiais do SUS
Estruturante INTEGRADOR Sistema de Integração dos Sistemas de Informação em Saúde
FORMSUS Criação de Formulários
SISNET Sistema de Controle de Envio de Lotes
Eventos Vitais SIM Sistema de Informações de Mortalidade
SINASC Sistema de Informações de Nascidos Vivos
Social PVC Programa De Volta para Casa
- Bolsa Família
Regulação REDOMENet Relação de Doadores Não Aparentados de Medula Óssea
SNT Sistema Nacional de Transplantes (Tecidos e Órgãos)
SiPNASS Sistema do Programa Nacional de Avaliação de Serviços de
Saúde
SISREG Sistema de Centrais de Regulação
e-SUS-SAMU Serviço de Atendimento Móvel de Urgência (captura de dados)
Autorizador Módulo Autorizador
Quadro 1 - Principais sistemas de informação do SUS. Fonte: Portal da Saúde do DATASUS (http://datasus.saude.gov.br/
informacoes-de-saude/24-sistemas-e-aplicativos).
A concepção de integração sistêmica dos produtos, base para a construção de um sistema na-
cional de informação em saúde, qualifica o avanço na produção e utilização das informações.
É importante ressaltar que a gratuidade na distribuição dos produtos subsidia a construção de
uma parceria na tarefa de informatização do SUS, não cabendo exclusivamente ao DATASUS
a construção de todos os sistemas e aplicativos para acesso às bases de dados do SUS. Gestores
estaduais e municipais também desempenham papel importante na construção de sistemas de
gestão, geralmente complementares ou de apoio local, de acordo com resoluções do DATASUS,
por meio de seus próprios departamentos de informática ou, por vezes, terceirizando seu de-
senvolvimento.
25
Dados do SUS – ambulatoriais

O DATASUS dispõe de programas de processamento de dados, de domínio público, voltados
para a manutenção, administração e gestão de informações sobre o atendimento ambulatorial
do SUS.
Seus principais sistemas são:
• Sistema de Informações Ambulatoriais do SUS (SIASUS) (sia.datasus.gov.br). Os dados

gerados pelo SIASUS nas unidades de atendimento são consolidados e armazenados no
banco de dados nacional de informações ambulatoriais do SUS, que oferece aos gestores de
saúde, pesquisadores e entidades da sociedade, informações sobre capacidade operacional
dos prestadores de serviço (públicos e privados), orçamento e controle dos repasses dos
recursos financeiros, custeio das unidades ambulatoriais e administração das atividades
ambulatoriais em nível nacional. Abrangência: municipal, estadual e federal.
• Gerenciamento de Informações Locais (GIL) (gil.datasus.gov.br). Descontinuado e sendo

substituído pelo e-SUS AB, destinava-se à informatização da rede ambulatorial básica do
SUS auxiliando na administração dos seus processos e fornecendo informações sobre a
morbidade da população atendida, subsidiando os gestores nas tomadas de decisão. Pos-
sibilitava o monitoramento e o planejamento contínuo do sistema de saúde no município.
Esse sistema teve baixa adesão no sistema de saúde. Abrangência: municipal, estadual e
federal.
• e-SUS Atenção Básica (e-SUS AB) (dab.saude.gov.br/portaldab/esus.php). Representa

uma estratégia do Departamento de Atenção Básica para reestruturar as informações da
atenção básica em nível nacional. Esta ação está alinhada com a proposta mais geral de
reestruturação dos sistemas de informação em saúde do Ministério da Saúde, entendendo
que a qualificação da gestão da informação é fundamental para ampliar a qualidade no
atendimento à população. A estratégia e-SUS faz referência ao processo de informatização
qualificada do SUS em busca de um SUS eletrônico (goo.gl/AOqEml). Instituído através da
Portaria nº 1.412, de 10 de julho de 2013 (goo.gl/zVCGb9), o e-SUS AB está sendo implanta-
do pelos municípios em todo território nacional com uma adesão considerável em função
dos benefícios agregados ao sistema e também pelos incentivos/apoio que o Ministério da
Saúde tem proporcionado, até mesmo fornecendo microcomputadores para os municípios
implantarem o e-SUS AB em suas unidades básicas de saúde (UBS). Conforme consta da
portaria, a estratégia e-SUS AB é composta por dois sistemas de software que instrumen-
talizam a coleta dos dados que serão inseridos no SISAB: I - Coleta de Dados Simplificada
(CDS); e II - Prontuário Eletrônico do Cidadão (PEC). Abrangência: municipal e estadual.
• Sistema de Captação de Dados (APAC Magnético) (sia.datasus.gov.br). Sistema descen-

tralizado utilizado mensalmente pelas unidades prestadoras de serviço para transcrição
dos dados referentes aos atendimentos autorizados de alta complexidade (Autorização de
Procedimento de Alta Complexidade – APAC) por paciente. As informações transcritas são
26
UAB | UNIFESP
validadas conforme regras vigentes pelo sistema APAC Magnético e importadas pelo siste-
ma SIASUS, no qual são processadas e validadas. Abrangência: municipal e estadual;
• Boletim de Produção Ambulatorial (BPA Magnético) (sia.datasus.gov.br). Sistema descen-

tralizado utilizado mensalmente pelas unidades prestadoras de serviço para transcrição
dos quantitativos dos atendimentos prestados nos ambulatórios, criticando-os conforme
regras estabelecidas em portarias. Os dados transcritos no sistema BPA Magnético são im-
portados para o sistema SIASUS, no qual são processados e validados. Sua atualização de
versão normalmente é relacionada a alterações nas tabelas do sistema, como publicação
de regras em portarias ou ofícios da Secretaria Nacional de Atenção à Saúde. Abrangência:
municipal e estadual;
• Utilização do Cadastro Nacional de Estabelecimentos de Saúde (DE-PARA SIA) (sia.da-

tasus.gov.br). Sistema descentralizado utilizado mensalmente pelas secretarias municipais
e estaduais de saúde para atualizar as informações sobre estabelecimentos de saúde no
sistema SIASUS. A partir do momento da atualização, o sistema SIASUS passa a considerar
essas informações para validar o orçamento, importar/digitar a produção, calcular o crédito
aos prestadores, emitir os diversos relatórios gerenciais e gerar disquete do banco de dados
nacional. Constitui uma ponte entre o Cadastro Nacional de Estabelecimentos de Saúde
(CNES) em ambiente Windows e o aplicativo em ambiente DOS (SIASUS). Abrangência:
municipal e estadual;
• Sistema de Verificação do SIASUS (VERSIA) (sia.datasus.gov.br). Sistema descentralizado

responsável pela verificação das informações geradas pelo sistema SIASUS por meio de da-
dos referentes ao atendimento dos pacientes, enviados pelas unidades prestadoras de ser-
viço. É utilizado e atualizado mensalmente pelo DATASUS, até mesmo para nova validação
de movimento ambulatorial recebido das secretarias (municipais e estaduais) que operam o
SIASUS. Abrangência: municipal e estadual.
Dados do SUS - cadastros nacionais

É uma série de aplicações voltadas para o cadastramento de informações utilizadas por todos
os programas criados para operacionalizar o atendimento de saúde realizado pelo SUS. Seus
principais sistemas são:
• Sistema de Cadastramento de Usuários do SUS (CADSUS) (cartaonet.datasus.gov.br).

CADSUS possibilita a geração do Cartão Nacional de Saúde (CNS), que facilita a gestão do
SUS e contribui para o aumento da eficiência no atendimento direto ao usuário. O cadas-
tramento permite a construção de um banco de dados para diagnóstico, avaliação, planeja-
mento e programação das ações de saúde. Abrangência: municipal e estadual.
• Classificação Estatística Internacional de Doenças e Problemas Relacionados à Saúde

(CID-10) (http://www.datasus.gov.br/cid10/V2008/cid10.htm). A CID-10 foi conceituada
para padronizar e catalogar as doenças e problemas relacionados à saúde tendo como refe-
27
rência a Nomenclatura Internacional de Doenças estabelecida pela Organização Mundial

de Saúde. Com base no compromisso assumido pelo governo brasileiro, a organização dos
arquivos em meio magnético e sua implementação para disseminação eletrônica foi efetua-
da pelo DATASUS, possibilitando, assim, sua implantação em todo o território nacional nos
registros de morbidade hospitalar e ambulatorial, compatibilizando esses registros entre
todos os sistemas que lidam com morbidade. Essa versão é composta de três volumes: (1)
Lista tabular: apresenta o relatório da Conferência Internacional para a Décima Revisão,
a classificação propriamente dita nos níveis de três e quatro caracteres, a classificação da
morfologia de neoplasias, listas especiais de tabulação para mortalidade e para morbidade,
as definições e os regulamentos da nomenclatura. (2) Manual de instruções: apresenta as
notas sobre a certificação médica e sobre a classificação com maior quantidade de infor-
mações e de material de instrução, e orientações sobre o uso do volume 1, as tabulações e o
planejamento para o uso da CID. (3) Índice alfabético: apresenta o índice propriamente dito
com uma introdução e maior quantidade de instruções sobre seu uso. Abrangência: muni-
cipal, estadual e federal.
• Cadastro Nacional de Estabelecimentos de Saúde (CNES) (cnes.datasus.gov.br). O CNES

visa ser a base para operacionalizar os sistemas de informação em saúde, sendo esses con-
siderados imprescindíveis a um gerenciamento eficaz e eficiente do SUS. Tem como obje-
tivos automatizar todo o processo de coleta de dados feita nos estados e municípios sobre
a capacidade física instalada, os serviços disponíveis e profissionais vinculados aos esta-
belecimentos de saúde, equipes de saúde da família, subsidiando os gestores com dados de
abrangência nacional para efeito de planejamento de ações em saúde; dar transparência à
sociedade por meio de sua página web, de toda a infraestrutura de serviços de saúde, bem
como a capacidade instalada existente e disponível no país; e ser, junto com o CNS, o prin-
cipal elo entre todos os sistemas do SUS. O CNES também oferece o sistema SCNES para
computadores pessoais, que atende a demanda de cadastramento dos estabelecimentos
de saúde privados de porte pequeno. Em 2015 contou com atualização em seu portal web,
ainda em desenvolvimento. Abrangência: municipal, estadual e federal.
• Repositório de Tabelas (http://datasus.saude.gov.br/informacoes-de-saude/publicacoes/

tabelas-nacionais). Ferramenta para o gerenciamento unificado das tabelas de domínio do
SUS, a qual fornece um ambiente que permite a gestão e a disponibilização das tabelas
corporativas gerenciadas ou utilizadas nos sistemas de informação do Ministério da Saúde,
garantindo ao usuário final dessas tabelas o acesso fácil às suas versões. Abrangência: mu-
nicipal, estadual e federal.
• Bases Territoriais (http://datasus.saude.gov.br/bases-territoriais). As páginas web de uni-

dades territoriais contêm arquivos com os municípios e outras unidades territoriais bra-
sileiras, tais como unidades da federação, microrregiões, regionais de saúde etc. Todos os
arquivos estão em formato dBase, podendo ser baixados livremente e importados pelos
diversos softwares que suportam esse formato. Além disso, estão disponíveis arquivos em
formato de conversão e de mapas para uso pelo TabWin. Abrangência: municipal, estadual
e federal.
28
UAB | UNIFESP
Dados do SUS - epidemiológicos

Os dados epidemiológicos do SUS têm por objetivo fundamental apoiar os gestores envolvidos
na gestão e avaliação do risco relativo à ocorrência de surtos ou epidemias na população, ou
ainda, no controle e prevenção de doenças. Seus principais sistemas são:
Sistema de Informação da Atenção Básica (SIAB) (siab.datasus.gov.br). Foi implantado para

o acompanhamento das ações e dos resultados das atividades realizadas pelas equipes do Pro-
grama Saúde da Família (PSF). O SIAB foi desenvolvido como instrumento gerencial dos sis-
temas locais de saúde e incorporou em sua formulação conceitos como território, problema e
responsabilidade sanitária, dentro do contexto de reorganização do SUS no país. Por meio do
SIAB obtêm-se informações sobre cadastros de famílias, condições de moradia e saneamento,
situação de saúde, produção e composição das equipes de saúde. Abrangência: municipal, es-
tadual e federal;
Sistema de Informações do Programa Nacional de Imunizações (SI-PNI) (pni.datasus.gov.

br). SI-PNI é um sistema desenvolvido para possibilitar aos gestores envolvidos no Programa
Nacional de Imunização uma avaliação dinâmica do risco quanto à ocorrência de surtos ou
epidemias a partir do registro dos imunobiológicos aplicados e do quantitativo populacional
vacinado, agregados por faixa etária, período de tempo e área geográfica. Possibilita também o
controle do estoque de imunobiológicos necessário aos administradores que têm a incumbên-
cia de programar sua aquisição e distribuição. Controla as indicações de aplicação de vacinas
de imunobiológicos especiais e seus eventos adversos, dentro dos centros de referências em
imunobiológicos especiais. Abrangência: municipal, estadual e federal;
Sistema de Informação do Câncer do Colo do Útero e de Mama (SISCOLO/SISMAMA) (w3.

datasus.gov.br/siscam/index.php). Sistema informatizado de entrada de dados desenvolvido
pelo DATASUS em parceria com o INCA para auxiliar na estruturação do Viva Mulher (Pro-
grama Nacional de Controle do Câncer do Colo do Útero e de Mama). Coleta e processa infor-
mações sobre identificação de pacientes e laudos de exames citopatológicos e histopatológicos,
fornecendo dados para o monitoramento externo da qualidade dos exames, e assim orientando
os gerentes estaduais do programa sobre a qualidade dos laboratórios responsáveis pela leitura
dos exames no município. O SISCAM também é fundamental para a conferência dos valores
de exames pagos em relação aos dados dos exames apresentados. Abrangência: municipal e
estadual;
Sistema de Gestão Clínica de Hipertensão Arterial e Diabetes Mellitus da Atenção Básica

(HIPERDIA) (hiperdia.datasus.gov.br). Descontinuado, o Hiperdia destinava-se ao cadastra-
mento e acompanhamento de portadores de hipertensão arterial e/ou diabetes mellitus aten-
didos na rede ambulatorial do SUS, permitindo gerar informação para aquisição, dispensação e
distribuição de medicamentos de forma regular e sistemática a todos os pacientes cadastrados.
O sistema enviava dados para o Cartão Nacional de Saúde. Esse sistema foi recentemente des-
continuado pela Secretaria de Atenção Básica, sendo trocado pelo sistema e-SUS AB. Abran-
gência: municipal e federal;
29
Sistema de Acompanhamento da Gestante (SisPreNatal) (http://datasus.saude.gov.br/sis-

temas-e-aplicativos/epidemiologicos/sisprenatal). O SisPreNatal é um software desenvolvido
para acompanhamento adequado das gestantes inseridas no Programa de Humanização no
Pré-natal e Nascimento (PHPN) do SUS. Apresenta o elenco mínimo de procedimentos para
uma assistência pré-natal adequada, ampliando esforços no sentido de reduzir as altas taxas de
morbimortalidade materna, perinatal e neonatal. O SisPreNatal já atendeu mais de 3 milhões
de gestantes em todo o Brasil e está presente em mais de 5 mil municípios. Possivelmente será
descontinuado para ter suas funções agregadas aos novos sistemas do DATASUS; Abrangên-
cia: ambulatorial, municipal, estadual e federal.
Dados do SUS – financeiros

Os aplicativos financeiros desenvolvidos pelo DATASUS têm como finalidade apoiar o SUS
no controle dos orçamentos públicos em saúde (SIOPS) e dos pagamentos aos prestadores de
serviços que realizaram procedimentos ambulatoriais e hospitalares em determinado período
para os estados e municípios (SGIF). Seus principais sistemas são:
• Sistema de Informações sobre Orçamentos Públicos em Saúde (SIOPS) (http://datasus.

saude.gov.br/sistemas-e-aplicativos/financeiros/siops). SIOPS é um sistema disponibili-
zado pela internet que tem por objetivo apurar as receitas totais e os gastos em ações e
serviços públicos de saúde. O preenchimento de dados do SIOPS tem natureza declaratória
e busca manter compatibilidade com as informações contábeis, geradas e mantidas pe-
los estados e municípios, e conformidade com a codificação de classificação de receitas e
despesas, definidos em portarias pela Secretaria do Tesouro Nacional/MF. As informações
coletadas pelo SIOPS são provenientes do setor responsável pela contabilidade do ente
federado, podendo-se utilizar para o preenchimento do SIOPS os dados contábeis ou as
informações dos relatórios e demonstrativos de execução orçamentária e financeira dos
governos estaduais e municipais. Tais informações são inseridas no sistema e transmitidas
eletronicamente para o banco de dados do DATASUS/ MS, gerando indicadores, de forma
automática, a partir das informações declaradas pelos entes federados. Abrangência: mu-
nicipal e estadual;
• Sistema de Gestão de Informações Financeiras do SUS (SGIF) (sgif.datasus.gov.br). O

SGIF é um instrumento de gestão direcionado aos gestores das esferas federal, estadual e
municipal que facilita o controle de todos os desembolsos referentes à parcela do orçamen-
to que visa financiar as ações e serviços em saúde. No que se refere aos atendimentos am-
bulatoriais e hospitalares, viabiliza a emissão de diversos relatórios, geração da declaração
do imposto de renda retido na fonte (DIRF) com o seu respectivo demonstrativo de imposto
de renda e outros. O sistema mantém atualizadas as informações cadastrais dos prestadores
de serviços do SUS por meio da importação dos dados constantes do CNES. Com a atua-
lização cadastral e a importação do faturamento/produção, realizados pelos prestadores
nos procedimentos ambulatoriais e hospitalares, realizam-se no SGIF os descontos bancá-
rios, de pensionistas, judiciais, tributários e outros que darão ensejo à geração das listas de
30
UAB | UNIFESP
credores, as quais dão origem às remessas bancárias pagas diretamente aos prestadores e
estabelecimentos. Abrangência: municipal e estadual;
• Sistema de Gerenciamento Financeiro (SISGERF) (http://sisgerf.datasus.gov.br/). O Mi-

nistério da Saúde decidiu desenvolver o SISGERF para consolidar as funcionalidades exis-
tentes no departamento da Secretaria de Atenção à Saúde, na gerência responsável pelos
repasses de verbas federais aos estados e municípios, pagamentos com recursos do Fundo
de Ações Estratégicas e Compensação (FAEC) aos estados e municípios, créditos pagos di-
retamente aos hospitais universitários do Ministério da Educação e pagamentos de ações
judiciais. Abrangência: municipal, estadual e federal.
Dados do SUS - hospitalares

Os sistemas hospitalares do DATASUS têm como objetivo formar bases de dados clínicos do
SUS, inicialmente com foco no gerenciamento da assistência, mas com potencial de análises
epidemiológicas. Seus principais sistemas são:
• Sistema Integrado de Informatização de Ambiente Hospitalar (HosPub) (hospub.data-

sus.gov.br). Apesar de estar descontinuado pelo DATASUS, o HosPub é um sistema online
multiusuário, desenvolvido em banco de dados relacional, que tem por objetivo suprir as
necessidades dos diversos setores e serviços existentes em uma unidade hospitalar para
atendimento secundário e/ou terciário. Além disso, é uma ferramenta eficaz para prestar
informações que possam subsidiar os diferentes níveis hierárquicos que compõem o SUS,
seja no processo de planejamento, de operação, seja no de controle das ações em saúde.
Seus subsistemas são: arquivo médico (SAME), administração, ambulatório, centro cirúr-
gico, emergência, informações, internação, material (almoxarifado, farmácia), perinatal e
serviços de diagnose e terapia. A iniciativa e-SUS Hospitalar busca assumir e ampliar as
funcionalidades antes oferecidas pelo HosPub. Abrangência: municipal, estadual e federal;
• Sistema e-SUS Hospitalar (www2.datasus.gov.br/ESUSHOSP). O e-SUS Hospitalar é o

novo sistema de gestão hospitalar do DATASUS, desenvolvido em tecnologia web com base
em processos organizados e interligados, incluindo importante ferramenta de workflow,
que auxilia na obtenção dos objetivos de cada entidade. Oferece, de forma organizada, um
prontuário eletrônico para as equipes assistenciais no qual são registrados: sinais vitais,
evoluções, prescrições médicas, prescrições de enfermagem, planejamento terapêutico,
checagem de enfermagem, solicitação de exames, resultados de exames etc. O sistema de
classificação de risco do e-SUS Hospitalar possibilita identificar e registrar a gravidade do
paciente durante o atendimento de forma que a equipe assistencial consiga identificar, por
meio de cores e formulários dinâmicos, a necessidade de priorizar ou não o atendimento
de um determinado paciente em relação a urgências e emergências. O e-SUS Hospitalar
contempla uma ferramenta para a construção de formulários dinâmicos que agregam valor
ao prontuário eletrônico porque possibilita o registro de informações do histórico clínico do
paciente. Também é possível identificar/rastrear toda a medicação do paciente. Oferece um
módulo de agendamento. Abrangência: municipal, estadual e federal;
31
• Sistema de Informações Hospitalares Descentralizado (SIHD) (sihd.datasus.gov.br). An-

tes denominado como Sistema de Informações Hospitalares do SUS (SIH-SUS), processa
informações para efetuar o pagamento dos serviços hospitalares prestados pelo SUS por
meio da captação de dados das Autorizações de Internação Hospitalar (AIH) relativas a
mais de 1,3 milhão de internações/mês. A finalidade do SIHD é registrar todos os aten-
dimentos provenientes de internações hospitalares que foram financiadas pelo SUS e, a
partir desse processamento, gerar relatórios para que os gestores possam fazer os pagamen-
tos dos estabelecimentos de saúde. Além disso, o nível federal recebe mensalmente uma
base de dados de todas as internações autorizadas (aprovadas ou não para pagamento) para
que possam ser repassados às secretarias de saúde os valores de produção de média e alta
complexidade, além dos valores da Central Nacional de Regulação de Alta Complexidade
(CNRAC), do Fundo de Ações Estratégicas e Compensação (FAEC) e de hospitais universi-
tários em suas variadas formas de contrato de gestão. Passou a ser chamado SIHD a partir
de 2004 devido à descentralização do processamento do SIH-SUS. Abrangência: municipal,
estadual e federal;
• Sistema de Gerenciamento em Serviços de Hemoterapia (HEMOVIDA) (http://datasus.

saude.gov.br/sistemas-e-aplicativos/hospitalares/hemovida). Desenvolvido especifica-
mente para bancos de sangue, o HEMOVIDA tem como objetivo informatizar todo o ciclo
de doação de sangue, desde a captação até a distribuição do material, controlando cada
etapa do processo. Permite aos diversos gestores nas esferas federal, estadual e municipal
o pleno acesso aos dados indispensáveis à tomada de decisão quanto ao gerenciamento em
todo o processo do sangue na HEMOREDE. Abrangência: municipal, estadual e federal;
• Sistema de Gerenciamento e Produção de Bancos de Leite Humano (BLHWeb) (http://

datasus.saude.gov.br/sistemas-e-aplicativos/hospitalares/blhweb-sistema-de-gerencia-
mento-e-producao-de-bancos-de-leite-humano). Desenvolvido especificamente para ban-
cos de leite humano, o BLHWeb internaliza procedimentos, diretrizes e normas técnicas
de controle de qualidade e processos de trabalho. Objetiva dinamizar o planejamento, a
gestão e os processos de trabalho na Rede BLH, respondendo à nova demanda da política
nacional de aleitamento materno do Ministério da Saúde, possibilitando um acesso amplo
a todos que se interessem em obter informações acerca dos produtos e processos relaciona-
dos. Abrangência: municipal, estadual e federal;
• Sistema Gerador do Movimento das Unidades Hospitalares (SISAIH) (sihd.datasus. gov.

br). Sistema descentralizado, utilizado mensalmente pelas unidades hospitalares para trans-
crição dos dados das Autorizações de Internações Hospitalares (AIHs) e envio dos dados
às secretarias de saúde. Os dados transcritos nesse sistema são importados para o sistema
SIHD no qual são processados e validados. Abrangência: municipal, estadual e federal;
• Sistema de Comunicação de Informação Hospitalar e Ambulatorial (CIHA) (ciha.data-

sus. gov.br). A CIHA é um sistema de informações em saúde utilizado pelo Ministério da
Saúde e pela Agência Nacional de Saúde Suplementar (ANS) para acompanhar e monitorar
as internações em todas as unidades hospitalares do país, públicas e privadas, integrantes
32
UAB | UNIFESP
ou não do SUS. É um sistema de grande relevância para a sistematização de planos de cui-

dado em saúde. Abrangência: municipal, estadual e federal;
• Sistema de Gerenciamento da Tabela de Procedimentos, Medicamentos, Órteses, Pró-

teses e Materiais Especiais do SUS (SIGTAP) (sigtap.datasus.gov.br). SIGTAP é uma fer-
ramenta de gestão que possibilita o acompanhamento sistemático, até mesmo com série
histórica das alterações realizadas a cada competência, detalhando os atributos de cada
procedimento, compatibilidades e relacionamentos. Oferece a geração de relatórios con-
forme a necessidade do gestor e disponibiliza um informe mensal registrando as principais
alterações realizadas na tabela com as portarias correspondentes publicadas. Abrangência:
municipal, estadual e federal.
Dados do SUS - estruturantes

Nessa categoria estão os sistemas INTEGRADOR, FormSUS SISNET, não classificados nas
outras categorias, e que, por suas funcionalidades, contribuem para a estruturação de informa-
ções no SUS. Suas descrições são:
• Sistema de Integração dos Sistemas de Informação em Saúde (INTEGRADOR) (http://

www2.datasus.gov.br/DATASUS/index.php?area=060605). Aplicação desenvolvida para a
esfera municipal. É responsável pela constituição do banco de dados municipal, composto
pelo Cadastro Nacional de Estabelecimentos de Saúde (CNES), Cadastro de Usuários
do SUS (CADSUS) e informação dos eventos de saúde realizados na rede pelos diversos
sistemas de informatização locais. Prevê a criação de padrões de comunicação entre os
sistemas, em consonância com as deliberações da XII Conferência Nacional de Saúde para
a Política Nacional de Informação e Informática do SUS para a exportação dos dados para
os demais sistemas de informação de saúde, integrando-os para melhor gerenciamento do
SUS. Abrangência: municipal;
• Criação de Formulários (FormSUS) (siteformsus.datasus.gov.br). FormSUS foi desenvolvi-

do para dar agilidade, estruturação e qualidade ao processo de coleta e disseminação de
dados na web. Sua aplicação contribui com as diretrizes da Política Nacional de Informa-
ção e Informática relativas à democratização das informações e à transparência na gestão
pública. Para criar formulários é necessário um cadastro como Gestor de Formulário do
FormSUS. Abrangência: municipal, estadual e federal.
• Sistema de Controle de Envio de Lotes (SISNET) (http://datasus.saude.gov.br/sistemas

-e-aplicativos/estruturantes/sisnet). O SISNET é um sistema integrador e centralizador de
informações gerados pelos sistemas da Secretaria de Vigilância Sanitária (SVS). Ele recebe
via internet e processa estes arquivos, colocando em uma estrutura padronizada e cripto-
grafada. Um módulo chamado “Programa de Exportação e Importação” é responsável por
montar os dados que devem ser transmitidos. Como o formato do arquivo gerado é padro-
nizado, apenas um servidor SISNET atua neste ambiente para receber as informações de
diversos sistemas. Abrangência: federal.
33
Dados do SUS - eventos vitais

O atual quadro demográfico brasileiro resulta de vários fatores como a queda da fecundidade,
a redução da mortalidade infantil, o aumento da esperança de vida e o progressivo envelheci-
mento da população, que geram impactos e novas demandas para o sistema de saúde. Os da-
dos de mortalidade e de nascidos vivos contribuem para o conhecimento dos níveis de saúde
da população e fornecem subsídios para os processos de planejamento, gestão e avaliação de
políticas e ações de atenção à saúde dos diversos segmentos populacionais. Seus sistemas são:
• Sistema de Informações de Mortalidade SIM) (goo.gl/x7YoEX). SIM tem por objetivo ob-
ter regularmente dados sobre mortalidade no país. A partir da criação do SIM foi possível a
captação de dados sobre mortalidade, de forma abrangente, para subsidiar as diversas esfe-
ras de gestão na saúde pública. Com base nessas informações é possível realizar análises de
situação, planejamento e avaliação das ações e programas na área. Abrangência: municipal
e estadual;
• Sistema de Informações de Nascidos Vivos (SINASC) (goo.gl/obV6EH). SINASC foi im-

plantado oficialmente a partir de 1990 com o objetivo de coletar dados sobre os nascimen-
tos informados em todo território nacional e fornecer dados sobre natalidade para todos os
níveis do Sistema de Saúde. Abrangência: municipal, regional, estadual e federal.
Dados do SUS - sociais

São aplicativos voltados para o apoio a programas sociais do governo. O Sistema de Informação
da Atenção Básica (SIAB), descrito anteriormente, visa o acompanhamento das ações e dos
resultados das atividades realizadas pelas equipes do Programa Saúde da Família (PSF). São
também sistemas nessa categoria:
• Programa de Volta Para Casa (PVC) (pvc.datasus.gov.br). PVC é um sistema que auxilia o
Programa De Volta Para Casa cuja intenção é reintegrar socialmente pessoas acometidas
de transtornos mentais, egressas de longas internações, tendo como parte integrante desse
programa o pagamento do auxílio- reabilitação psicossocial. Estima-se em cerca de 15.000
usuários do SUS a população que deve ser beneficiária do auxílio financeiro de que trata
esse programa, sendo favorecida sua reinserção no meio social mais amplo, desde que aten-
didos os requisitos necessários para recebimento desse auxílio. Abrangência: municipal,
estadual e federal;
• Bolsa Família (bolsafamilia.datasus.gov.br). O Bolsa Família é um sistema de informação

que apoia os serviços de acompanhamento às famílias beneficiadas pelo Programa Bolsa
Família, possibilitando o armazenamento de dados relativos ao cumprimento das condicio-
nalidades e acompanhamento nutricional dos membros das famílias no atendimento nas
diversas áreas da unidade. Inclui o Sistema de Vigilância Alimentar Nutricional (SISVAN),
que se destina ao acompanhamento das condições de nutrição e alimentação, e o Brasil
34
UAB | UNIFESP
Sorridente, que se destina a ampliar o atendimento e melhorar as condições de saúde bucal

da população brasileira. Abrangência: municipal, estadual e federal.
Dados do SUS - regulação

Os sistemas de regulação em saúde atendem às funções do SUS voltadas para a busca de otimi-
zação na alocação e distribuição de recursos nas áreas de transplante de órgãos, procedimentos
de alta complexidade, recursos hospitalares e ambulatoriais especializados, serviço móvel de
atendimento de urgência e avaliação de serviços de saúde. Seus principais sistemas são:
• Relação de Doadores Não Aparentados de Medula Óssea (REDOMENet) (goo.gl/Pcd-

d4c). REDOMENet é um software utilizado como estratégia do DATASUS-RJ e do Sistema
Nacional de Transplantes (SNT), em conjunto com REDOME/INCA, para o gerenciamento
das atividades executadas em laboratórios de histocompatibilidade Tipo II desde o cadastro
de doadores até o lançamento das análises de compatibilidades feitas com DNA e sorologia
(tipagens) para futuros transplantes de medula e envio dessas informações ao REDOME/
INCA. Abrangência: municipal, estadual e federal;
• Sistema Nacional de Transplantes (SNT - Órgãos e SNT - Tecidos) (goo.gl/ePRvaP).

Sistema que gerencia a lista de transplantes no Brasil responsável pela lista de espera de
pacientes de órgãos e tecidos (córnea), doação de órgãos de doadores vivos e cadáveres,
e distribuição desses órgãos pelos estados. O SNT também disponibiliza o SNT Tecidos,
que permite o controle e regulação dos diversos bancos de tecidos, possibilitando uma vi-
sualização dos estoques disponíveis e também direcioná-los para onde houver demanda
reprimida. Possibilita também registrar o receptor, o que foi transplantado, quando e por
quem, além de exigir certo nível de acompanhamento póstransplante. Está prevista uma
integração com o SNT Órgãos. Abrangência: estadual e federal;
• Sistema do Programa Nacional de Avaliação de Serviços de Saúde (SiPNASS) (pnass.da-

tasus.gov.br). Sistema que avalia os serviços de saúde por meio de autoavaliações, avaliação
técnica do gestor, pesquisas de satisfação dos usuários, pesquisas de relações e condições
de trabalho e indicadores de saúde. Abrangência: municipal, estadual e federal;
• Sistema de Centrais de Regulação (SISREG) (sisreg.datasus.gov.br). Sistema que possibili-

ta o controle e regulação dos recursos hospitalares e ambulatoriais especializados no nível
municipal, estadual ou regional. Desde 2009 encontra-se disponível a versão III do sistema.
Abrangência: municipal, estadual e regional;
• Módulo Autorizador (autorizador.datasus.gov.br). Sistema que controla a autorização

de laudos de internação e APAC, gerando número de AIH e APAC correspondente.
Abrangência: municipal, estadual e federal;
• Captura de dados para o Serviço de Atendimento Móvel de Urgência (e - S U S - S A M U )

(goo.gl/bB7eAN). Sistema utilizado para registro de ocorrências médicas que decide sobre
35
o envio de uma ambulância baseado na avaliação do médico regulador. Também faz o con-
trole logístico dessas ambulâncias para que o maior número possível de ocorrências seja
atendido no menor espaço de tempo. Abrangência: municipal.
Tabulação de dados do SUS

As ferramentas de tabulação desenvolvidas pelo DATASUS – TabDos, inicialmente, e, depois,-
TabWin e TabNet – objetivam prover a necessidade de gestores, pesquisadores e público inte-
ressado da área da saúde de obterem e analisarem, com rapidez e objetividade, os dados dos
sistemas de informação do SUS. Esses tabuladores permitem selecionar e organizar os dados
conforme o objetivo da pesquisa, bem como associar as tabulações a mapas, possibilitando
visualização e avaliação espacial da informação. Esse é um recurso valioso de apoio a políticas
e ações de saúde. Novas versões do TabWin e do TabNet são periodicamente lançadas. Esses
programas são de distribuição gratuita e estão disponíveis para baixar para seu computador.
As principais fontes de dados para tabulação de dados do SUS são:
• Cadernos de Informações em Saúde (http://tabnet.datasus.gov.br/tabdata/cadernos/

cadernosmap.htm). Representa instrumento essencial para apoiar a gestão da saúde com
conhecimento, qualidade e rapidez a partir da situação da saúde. Essa informação, quando
de fácil acesso e disponível com qualidade, torna-se de grande auxílio para a tomada de de-
cisão em qualquer área de atuação, como planejamento estratégico, setorial, controle e ava-
liação, auditoria, investigação epidemiológica etc. Atualmente já existe grande quantidade
de informações de saúde, com atualização regular, abrangência e coberturas adequadas e
de fácil acesso, porém dispersas em diversos bancos de dados, demandando um esforço
para consolidação das informações necessárias. O Caderno de Informações de Saúde vem
suprir essa dificuldade, reunindo as informações mais atualizadas nas diferentes bases de
dados do Ministério da Saúde e colocando-as à disposição dos gestores de saúde, comuni-
dade de ensino e pesquisa e sociedade em geral;
• Rede Interagencial de Informações para a Saúde (RIPSA) (ripsa.org.br). Congrega institui-

ções responsáveis por informação em saúde no Brasil com o objetivo de produzir subsídios
para políticas públicas de saúde. Apresenta indicadores e dados básicos (IDB) para a saúde
no Brasil com conceitos e critérios, matriz de indicadores, bases de dados IDB, ficha de
qualificação do indicador, tema do ano, folhetos IDB e livro sobre indicadores. Apresenta
também análises e recomendações, metodologia de análise e publicações e resoluções da
RIPSA.
ACOMPANHE
DATASUS mantém presença na web para auxiliar na divulgação de

informação e notícias sobre saúde no Brasil por meio das principais
mídias sociais, como Facebook e Google+. Conheça também
disseminasus.blogspot.com.br.
36
UAB | UNIFESP
A tabulação de dados em saúde geralmente exige combinações de colunas, listas e bases que
levam a uma complexidade de codificação e correlação relativamente altas. Por vezes torna-se
necessário desenvolver algum programa de computador (script, compilado etc.) que possibili-
te realizar as combinações desejadas para determinada análise. Entretanto, há ferramentas já
construídas que buscam facilitar esse tipo de atividade especialmente para quem não é espe-
cializado em programação de computadores. Mesmo sendo de domínio por muitos profissio-
nais, vale apontar algumas ferramentas de apoio disponíveis para a tabulação de dados:
• Planilhas eletrônicas (goo.gl/sfgTe1). Os programas de planilhas eletrônicas são compos-

tos por planilhas com linhas e colunas (uma tabela) para inserção de dados. Esses pro-
gramas são capazes de realizar cálculos complexos e gerar gráficos e diagramas a partir
desses dados. As planilhas eletrônicas também podem ser usadas como um simples banco
de dados com listas que serão incorporadas automaticamente a modelos de documentos.
Pacotes de programas para escritório, que contem processadores de textos e apresentador
de slides, costumam vir também com uma planilha eletrônica em conjunto. Há pacotes de
programas gratuitos e pagos. Os programas mais conhecidos são Microsoft Excel, proprie-
tário, e o OpenOffice Calc para uso gratuito. Também é possível utilizar versões de plani-
lhas eletrônicas na nuvem, como é o caso do Planilhas Google e do Excel Online. EM ambos
é necessário ter uma conta no Google ou Microsoft, respectivamente. Também é possível
utilizá-los em sua versão móvel;
• Sistemas de gerenciamento de banco de dados (SGBD) (goo.gl/tKCKw7). Sistemas SGBD

são programas de computador responsáveis pelo gerenciamento de uma base de dados re-
lacionais. Seu principal objetivo é retirar da aplicação cliente a responsabilidade de geren-
ciar o acesso, a manipulação e a organização dos dados. Um SGBD geralmente disponibiliza
uma interface para que seus clientes possam incluir, alterar ou consultar dados previamen-
te armazenados. Os programas mais conhecidos são Microsoft SQL Server, Oracle, MySQL
PostgreSQL. Apesar de não ser de fato um SGBD, o programa Microsoft Access ainda é
bastante utilizado por gestores em saúde para armazenar e filtrar dados devido a sua fácil
integração com planilhas e editores de texto;
• Bancos de dados não relacionais (NoSQL) (https://goo.gl/f5aU2s). Na última década sur-

giu uma nova abordagem para armazenar dados, diferente do que tem sido feito desde os
anos 60: bancos de dados não relacionais, ou mais popularmente conhecidos como NoS-
QL. Estas soluções surgiram da necessidade de armazenar grandes volumes de dados (Big
Data), principalmente aqueles que não tem um estrutura bem definida (não estruturados)
ou que seja necessário descrever que tipo de relacionamento existe entre os dados. Não é
uma substituição nem uma evolução dos SGBDs existente, mas sim uma alternativa para
armazenar e analisar os dados, que os SGBDs não comportam. Existem diversas aborda-
gens de bancos de dados NoSQL, por exemplo: MongoDB, um banco de dados orientado
a documentos; Cassandra e HBase, orientados a colunas; e Neo4J e Virtuoso, orientados
a grafos. Dados de saúde tem um grande potencial para serem armazenados e explorados
utilizando estas tecnologias.
37
• Ferramentas oficiais do DATASUS (goo.gl/kNp1e5). TabDOS (goo.gl/eCIZlN) ainda se en-

contra disponível para baixar para seu computador. Esse programa, desenvolvido em 1994,
foi disseminado através de CD do SIH-SUS, do CD do SIM, e do CD do SIASUS. A partir de
1996, a versão para Windows, denominada TabWin , também passou a ser distribuída nos
CD-ROMs. Esse programa incorporou uma série de novos recursos em relação ao Tab para
DOS, facilitando ainda mais o trabalho de tabulação e tratamento dos dados. Por fim, foi de-
senvolvida a versão TabNet com a finalidade de possibilitar às equipes técnicas do Minis-
tério da Saúde, das secretarias estaduais e municipais de saúde a realização de tabulações
rápidas sobre os arquivos que constituem os componentes básicos dos sistemas de infor-
mação do SUS dentro de suas intranets ou em suas páginas web. Dados da saúde podem ser
também acessados diretamente na seção Informações de Saúde (TABNET) nas categorias
indicadores de saúde, assistência à saúde, epidemiológicas e morbidade, rede assistencial,
estatísticas vitais, demográficas e socioeconômicas, inquéritos e pesquisas, e saúde suple-
mentar, nesse caso via Portal da ANS (www.ans.gov.br/anstabnet). A maior parte dos dados
disponíveis pela TabNet é, de fato, resultante de análises realizadas pela RIPSA. O manual
do TabNet está disponível no endereço oficial (http://datasus.saude.gov.br/manual-tabnet);
• Análise estatística (goo.gl/HZ8B5z). Há inúmeros softwares para realizar análise estatísti-

ca de dados. Seguem algumas sugestões. Epidata (epidata.dk) é um programa gratuito que
pode ser utilizado para criação dos formulários de dados e inserção de dados no próprio sis-
tema, e também pode analisar dados preexistentes desde que sejam em padrões previstos
pelo sistema. Stata (stata.com) é um programa gratuito para análises estatísticas que fornece
uma suíte completa para análise de dados, gerenciamento de dados e gráficos. Também
pode analisar dados preexistentes desde que sejam em padrões previstos. SPSS (goo.gl/
bjdq73) é um software proprietário (não gratuito) de apoio à tomada de decisão que inclui:
aplicação analítica, data mining, text mining e estatística que transformam os dados em
informações relevantes. Epi Info (goo.gl/CEfzXu) é um software de domínio público criado
pelo Centers for Disease Control and Prevention (CDC), EUA (goo.gl/zZNiXB), voltado à
área da saúde na parte de epidemiologia. Auxilia no gerenciamento e na análise de bancos
de informações individualizados e em constante renovação. Possui versão em português;
banco de dados nativo é o MS Access; interface amigável; aceita bases externas; gera rela-
tórios e gráficos, incluindo mapas geográficos;
• Ferramentas visuais (goo.gl/gnkqQT). Há softwares desenvolvidos com tecnologia avan-

çada que possibilita usar o recurso de arrastar e soltar na análise dos dados. Geralmente são
softwares nos quais se pode conectar com dados em alguns cliques e, em seguida, visuali-
zar e criar painéis interativos com mais alguns cliques. Esse tipo de ferramenta busca dar
suporte à habilidade natural das pessoas de pensarem visualmente. Como exemplos, temos
o Tableau Software (goo.gl/NWOA96), O QlikView (qlik.com/us/), Pentaho (community.
pentaho.com/) e o IBM Watson Analytics (goo.gl/yIQyFQ) (infelizmente o IBM ManyEyes
foi descontinuado em 2015). Todos oferecem versões gratuitas e pagas, e possuem manuais,
livros e vídeos de treinamento para facilitar sua utilização;
38
UAB | UNIFESP
• Mapas da saúde (goo.gl/SGYVZN). Geografia da saúde é a aplicação das informações geo-

gráficas, perspectivas e métodos para o estudo da saúde, das doenças e da assistência mé-
dica, segundo a Wikipedia. Tem uma ligação direta com a epidemiologia e consiste numa
oportunidade de análise de bases de dados em saúde bastante útil aos gestores e consumi-
dores em saúde. Apresenta-se com bastante ascensão devido ao aumento da facilidade no
uso de sistemas de geração de mapas por parte dos geógrafos da saúde. É possível localizar
em páginas web do Ministério da Saúde ou de secretarias estaduais e municipais mapas
analíticos de alguma situação de saúde compostos a partir das bases de dados. Mais re-
centemente tornou-se mais evidente o uso de sistemas de georreferenciamento da saúde
que utilizam redes sociais (colaboração livre, social e solidária) de pessoas. Por vezes são
considerados como “superávits cognitivos colaborativos” na saúde. Como exemplo pode-
mos citar o sistema HealhMap (healthmap.org), que teve início em 2005 para gerar alertas
de doenças, e o sistema Ushahidi (ushahidi.com), que foi usado em 2007 para mapear a
violência no Quênia e problemas de saúde a partir do terremoto no Haiti em 2010. Esse
último representa um sistema que pode ser instalado em um servidor próprio para suportar
a construção de mapas, no nosso caso com foco em saúde, com dados fornecidos direta-
mente pelas pessoas por celular, computador ou mesmo por telefone (voz). Já foi usado para
construção de mais de 60 mil mapas colaborativos, boa parte deles com foco na saúde.
SAIBA MAIS
O livro Indicadores Básicos para a Saúde no Brasil, 2a edição,

2008, ofertado pela RIPSA (goo.gl/rQ6Uvp), mesmo que antigo,
contém um excelente texto para estudo sobre conceitos, matriz de
indicadores e fontes de informação sobre a saúde no Brasil.
39
Capítulo 4
Dados inter-relacionados da saúde
As características tecnológicas e de operação dos sistemas de informação desenvolvidos para o
SUS são heterogêneas: há desde aplicativos que são executados localmente e que foram desen-
volvidos em Clipper com armazenamento em arquivos DBF, tecnologias em desuso atualmen-
te, até sistemas disponíveis na web desenvolvidos com base tecnológica mais robusta, como
mostra uma compilação de Morais e Costa (Morais, 2014). A Tabela 1 desse estudo (goo.gl/
SjPRkH) identifica a linguagem de programação, sistema gerenciador de banco de dados e a
natureza da operação dos principais sistemas do DATASUS. Os autores apontam que ofertar
uma infraestrutura de tecnologia da informação e comunicação adequada para o SUS ainda
é um desafio para a administração pública no Brasil. A falta de padronização e dificuldades
de interoperabilidade são problemas inerentes à implantação de sistemas de informação em
saúde (Hillestad et al., 2005) e a natureza fragmentada das atividades em saúde dificulta a sis-
tematização de seus processos em aplicações (Zahr e Boerma, 2005).
Outro estudo (Souza Junior, 2012) (disponível em goo.gl/wGocLw) muito interessante realizado
em um doutoramento apresentou uma análise no nível de complexidade dos SIS do SUS do
estado de Alagoas. SIS complexos são compreendidos nesse estudo como uma classe especial
de sistemas formados por um grande número de subsistemas heterogêneos, caracterizados por
propriedades coletivas e emergentes, que interagem e influenciam uns aos outros através de
uma diversidade de conexões e laços de retroalimentação com um alto grau de acoplamento
e não linearidade. Nessa perspectiva, os SIS do SUS, compostos por diversos subsistemas que
necessitam interagir e se integrar para atender às demandas informacionais do setor, tiveram
sua complexidade caracterizada. Para tanto foram adotadas propriedades da teoria da com-
plexidade (goo.gl/z8Qd13) como os conceitos de auto-organização, emergência, coevolução,
coadaptação e fractal. O desenho multimétodo da pesquisa foi dividido em três etapas sendo
que na primeira etapa ocorreu o mapeamento das redes formadas pelas integrações dos SIS a
partir de pesquisa documental e questionários; em seguida, empreendeu-se a análise das redes
dos SIS aproximando-as dos conceitos da complexidade e, por último, foram verificadas as
implicações da complexidade dos sistemas para a integração da informação do SUS, colhendo
as opiniões de gestores em entrevistas. Esse estudo também aponta as tecnologias usadas nos
SIS do SUS. Como resultado foram mapeados 72 SIS diferentes e bastante heterogêneos tecno-
logicamente, os quais formaram uma rede densa e bastante inter-relacionada. Sob o ponto de
vista da integração informacional dos SIS, os resultados da pesquisa também revelaram que a
auto-organização tende a diminuir o nível de completude e detalhamento da informação que
circula através de enlaces de sistemas; a coadaptação maximiza o acoplamento dos sistemas,
40
UAB | UNIFESP
criando uma dependência elevada das informações compartilhadas entre eles; a fractalidade
sobrecarrega as informações nos níveis superiores do sistema e gera informações defasadas
entre as esferas de governo; a emergência, por outro lado, ajuda a criar estruturas inovadoras
que integram o sistema complexo. Essa descrição é bastante interessante porque consegue
caracterizar, numericamente, a relevância da integração já existente, suas ligações e a dificul-
dade ainda existente dos gestores em lidar com essas ligações, principalmente devido ao atraso
tecnológico no suporte aos SIS. Sobre os ciclos informacionais estabelecidos entre os sistemas,
os entrevistados (gestores) relataram que consideram salutar a comunicação entre os diversos
SIS, porque unifica e complementa a informação entre eles, permitindo-lhes trabalhá- la em
diferentes sistemas e situações. O gestor explica que os dados armazenados nesses SIS devem
refletir a realidade da situação de saúde e servir até mesmo como referência para outros órgãos,
tais como Agência Nacional de Vigilância em Saúde (ANVISA) e Ministério do Planejamento,
Orçamento e Gestão (MPOG), que usam as informações para alertar os riscos à saúde da po-
pulação e formular orçamentos públicos e repasses financeiros federais do SUS. No entanto,
quando os gestores necessitam acessar uma informação mais apurada, os sistemas não conse-
guem disponibilizá-las de forma totalmente encadeada, a não ser no sistema individualizado
(Souza Junior 2012).
Como exemplo, no ciclo SIHSUS-SISAM1-BPA-SISAIH-SISREG-SIHSUS os SIS não conse-

guem carregar todas as informações que são processadas no sistema de origem para os de
destino. Assim, a informação que serviu para subsidiar a quantidade de procedimentos hospi-
talares regulados pelo SISREG não está totalmente disponível no SIHSUS. Segundo os relatos,
quando os dados da produção mensal do SIHSUS retroalimentam o SISREG para reprogramar
as quantidades de procedimentos, essa informação causa um descompasso entre a quantidade
produzida e a programada (Souza Junior, 2012). Os gestores apontam que uma sala de situação
de saúde seria uma tentativa de englobar todas as informações dos SIS e então poder monito-
rálas em conjunto, porque através dos ciclos dos SIS sabe-se apenas o quanto se atendeu de
internações no SIHSUS, mas não é possível saber quanto havia sido programado para cada
prestador e cada município. Outros exemplos de dificuldade na integração são analisados nes-
se estudo, que vale a pena ser avaliado. Vale ressaltar que salas de situação têm sido desenvol-
vidas ao longo dos anos no Ministério da Saúde e por secretarias de saúde de alguns estados e
municípios, mas depois de algum tempo caem em desuso, não sofrem manutenção ou não são
utilizadas adequadamente.
Por fim, alguns direcionamentos na tentativa de melhorar a integração dos SIS no caso estu-
dado, tendo em vista a presença inerente das suas propriedades complexas, foram descritos
(Souza Junior, 2012):
• Unificação dos sistemas: há um uso exagerado no número de diferentes soluções adotadas

para gerenciar as informações. Muitos SIS realizam a mesma tarefa e lidam com informa-
ções idênticas;
1 Sistema de Informação Ambulatorial Individualizado de Alagoas.
41
• Padronização do modelo de dado: cada sistema possui seu próprio modelo de dado, que,
muitas vezes, não é compatível com o modelo usado em outro SIS, o que dificulta seu inter-
câmbio;
• Atualização do parque tecnológico: necessidade de mais investimentos em redes de

transmissão de dados de alta velocidade e interiorização das TIC para aumentar o alcance
de toda a rede de assistência de saúde da região.
Nosso entendimento é que salas de situação e mecanismos de integração no nível dos sistemas
merecem ser implantados como soluções intermediárias. Mas, de fato, uma solução de integra-
ção no nível do dado, na representação semântica e interoperável de seu significado, merece
ser desenvolvida porque daria longevidade e flexibilidade nas futuras integrações. Esse traba-
lho exige um grande esforço intelectual, cognitivo, computacional e de definição de padrões de
ligação, ainda em curso, queremos acreditar, nos planos do DATASUS. Em 2015 ações plane-
jadas no DATASUS resultaram em avanços nesse esforço de integrar os mais de 400 sistemas
existentes, iniciar a definição de conjunto mínimo de dados (em parceria com o GT3 ABNT/
CEE78IS) e tornar viável uma política de implantação de dados abertos. Por outro lado uma
abordagem, em curso fora do ambiente do DATASUS, mas que já trata de temas da saúde é a
iniciativa de dados abertos conectados e a web semântica, que será apresentada a seguir.
Dados abertos conectados em saúde

Dados sobre a área da saúde são gerados por órgãos oficiais e disponibilizados na web. No en-
tanto, nem sempre esses dados estão disponíveis em um formato de fácil utilização (Dietrich et
al., 2016). Por exemplo, o Cadastro Nacional de Estabelecimentos de Saúde (CNES) representa
uma base oficial que propicia ao gestor o conhecimento da realidade da rede assistencial exis-
tente e suas potencialidades, visando auxiliar no planejamento em saúde, em todos os níveis
de governo, bem como dar maior visibilidade ao controle social a ser exercido pela população.
Os dados do CNES podem ser acessados online na web ou transferidos para um computador
pessoal, mas em formatos de difícil utilização pelo cidadão.
Por outro lado, sistemas abertos estruturados baseados em autodeclaração, como a Plataforma
Lattes CNPq (lattes.cnpq.br) e a Wikipedia (pt.wikipedia.org), representam um esforço coletivo
do cidadão em manter informação organizada e independente. Por fim, sistemas abertos sem
estruturação, incluindo redes sociais eletrônicas, como Twitter (twitter.com) e Facebook (face-
book.com), representam uma fonte de informação mais pessoal e próxima do cidadão. A infor-
mação distribuída nessas bases heterogêneas não está inter-relacionada, ou seja, não apresenta
uma ligação de analogia a partir de um mesmo princípio semântico. Portanto, não há qualquer
facilitação para que processos de descoberta de conhecimento sejam executados de maneira
automatizada.
A iniciativa dados abertos refere-se à publicação e disseminação dos dados e informações pú-
blicas na web, garantindo ao cidadão a liberdade de acesso e reutilização para qualquer pro-
42
UAB | UNIFESP
pósito. Em 2009, a iniciativa dados abertos começou a se tornar visível ao público em geral à
medida que governos como EUA, Reino Unido, Canadá e Nova Zelândia anunciaram a abertu-
ra de suas informações públicas governamentais (Dietrich et al., 2016). No ano de 2011, o Brasil,
por meio da Lei 12.527/2011 (Brasil, 2011), foi inserido formalmente nesse contexto. Atualmente
o governo federal, disponibiliza alguns portais para que todos possam encontrar e acessar os
dados e informações públicas: o Portal Brasileiro de Dados Abertos (dados.gov.br); o Portal da
Transparência (portaltransparencia.gov.br) e o Acesso à Informação (acessoainformacao.gov.
br). Também existem iniciativas similares a nível estadual e municipal.. Apesar destes portais
se apresentarem como uma solução de simples acesso a diferentes bases de dados governa-
mentais, não disponibiliza relacionamento semântico entre elas. Além disso, a consulta destes
dados não é simples de ser realizada pela população em geral devido aos diferentes formatos
e formas de apresentação, e a existência de diversos portais deixa os dados descentralizados..
SAIBA MAIS
Acesse o portal web da Controladoria Geral da União (CGU) sobre

a lei de acesso à informação (www.acessoainformacao.gov.br).
Conheça também o Sistema Eletrônico do Serviço de Informação
ao Cidadão (e-SIC) (esic.gov.br). Neste sistema é possível identificar
como curiosidade que no período de maio de 2012 (início das
solicitações) a dezembro de 2015 houve 7.819 pedidos de informação
ao Ministério da Saúde, totalizando 27.659 perguntas, sendo 47%
sobre participação e controle social em saúde, 14% sobre recursos
humanos em saúde e 9% sobre orçamento. Apenas 4% trataram de
sistemas de informação em saúde.
No portal do DATASUS também existe uma seção de Acesso à Informação (datasus.saude.

gov.br/informacoes-de-saude). Anteriormente citamos os Cadernos de Informações em Saúde,
que reúnem dados de diversos sistemas do SUS. Além dos Cadernos, outras fontes de acesso à
informação de saúde estão disponíveis no site do DATASUS:
• Portal de Saúde Cidadão (portaldocidadao.saude.gov.br/portalcidadao/index.htm): portal

onde os usuários do SUS tem acesso ao seu histórico de saúde e acrescentar dados relativos
a sua saúde, como alergias e vacinas. Além disso, tem uma parte de acesso público, onde é
possível consultar a base do Cartão Nacional de Saúde (CNS);
• Indicadores de Saúde e Pactuações (datasus.saude.gov.br/informacoes-de-saude/tabnet/

indicadores-de-saude): disponibilização de diversos tipos de indicadores, como dados bási-
co, atenção básica, indicadores municipais e formação de recursos humanos. Estes indica-
dores agregam dados provenientes de diversos sistemas do SUS;
• Assistência à Saúde (datasus.saude.gov.br/informacoes-de-saude/tabnet/assistencia-a-

saude): dados de produção hospitalar (SIH), produção ambulatorial (SIA), imunizações,
atenção básica/saúde da família e vigilância alimentar e nutricional;
43
• Epidemiológicas e Morbidade (datasus.saude.gov.br/informacoes-de-saude/tabnet/as-

sistencia-a-saude): disponibliza os dados provenientes dos sistemas do SUS no que tange a
morbidade hospitalar do SUS (SIH), os casos de aids, hanseníase e tuberculose (SINAN), as
doenças e agravos de notificação (SINAN), o programa de controle de esquistossomose, o
estado nutricional (SISVAN), casos de hipertensão e diabetes (HIPERDIA) e câncer de colo
de útero e de mama (SISCOLO/SISMAMA);
• Rede Assistencial (datasus.saude.gov.br/informacoes-de-saude/tabnet/rede-assisten-

cial): consulta aos dados do CNES e Pesquisa Assistência Médico Sanitária;
• Estatísticas Vitais (datasus.saude.gov.br/informacoes-de-saude/tabnet/estatisticas-vi-

tais): estatísticas provenientes principlamente do SIM e do SINASC, como nascidos vivos,
mortalidade e câncer;
• Demográficas e Socioeconômicas (datasus.saude.gov.br/informacoes-de-saude/tabnet/

demograficas-e-socioeconomicas): população residente, educação, trabalho e renda, PIB e
saneamento;
• Inquéritos e Pesquisas (datasus.saude.gov.br/informacoes-de-saude/tabnet/inqueritos-e

-pesquisas): dados de pesquisa relacionadas à saúde no Brasil, como Pesquisa Nacional de
Saúde, Pesquisa Nacional por Amostra de Domicílios e Inquérito de Saúde Bucal;
• Saúde Suplementar (.ans.gov.br/anstabnet/): dados disponibilizados pela Agência Nacio-

nal de Saúde Suplementar (ANS) relativos a diversos sistemas da entidade. É possível con-
sultar beneficiários, operadoras, planos de saúde privados, ressarcimento ao SUS e deman-
das dos consumidores.
• Informações Financeiras (datasus.saude.gov.br/informacoes-de-saude/informacoes-fi-

nanceiras): possibilidade de consultar recursos do SUS (http://www2.datasus.gov.br/DA-
TASUS/index.php?area=0501) e Guias de Autorização de Pagamento (GAP) (http://www2.
datasus.gov.br/DATASUS/index.php?area=0506);
• Transferência e Download de Arquivos (http://datasus.saude.gov.br/informacoes-de-

saude/servicos2/transferencia-de-arquivos): nessa página do DATASUS é possível fazer o
donwloas de arquivos tabulados (TabWin ou Tabnet) com dados de sistemas como SIH, SIA,
SIM, CIHA, SINASC, SISPRENATAL, CNES, Base Territorial e Base Populacional.
São muitas fontes de dados em saúde ou relacionadas disponibilizadas pelo DATASUS. Muitos
destes dados estão desconectados, sendo necessário a análise conjunta de fontes diferentes
para que seja possível encontrar algum relacionamento entre eles. Por exemplo, será que existe
alguma influência do saneamento básico na quantidade de nascidos vivos em algumas cidades
do Brasil? Dadas os principais óbitos por causas evitáveis, será que alguma política pública
pode ser implementada para diminuir estes indicadores de óbitos evitáveis? São perguntas que
uma análise profunda dos dados abertos em saúde podem ajudar a responder.
44
UAB | UNIFESP
Segundo a definição da Open Knowledge Foundation (opendefinition.org), dados são consi-

derados abertos (open data) quando qualquer pessoa pode livremente usá-los, reutilizá-los e
redistribuí-los, estando sujeito, no máximo, à exigência de creditar a sua autoria e compartilhar
na mesma licença. Isso geralmente é satisfeito pela publicação dos dados em formato aberto e
sob uma licença aberta. Em relação a dados abertos do tipo governamental, podemos citar oito
princípios que os norteiam (opengovdata.org):
1. Dados completos. Todos os dados públicos são disponibilizados. Dados são informações
eletronicamente gravadas, incluindo documentos, bancos de dados, transcrições e grava-
ções audiovisuais. Dados públicos são dados que não estão sujeitos a limitações válidas de
privacidade, segurança ou controle de acesso, reguladas por estatutos;
2. Dados primários. Os dados são publicados na forma coletada na fonte, com a mais fina
granularidade possível, e não de forma agregada ou transformada;
3. Dados atuais. Os dados são disponibilizados o mais rapidamente possível para preservar
o seu valor;
4. Dados acessíveis. Os dados são disponibilizados para o público mais amplo possível e para
diferentes propósitos;
5. Dados processáveis por máquina. Os dados são razoavelmente estruturados para possibi-
litar o seu processamento automatizado;
6. Acesso não discriminatório. Os dados estão disponíveis a todos sem que seja necessária
identificação ou registro;
7. Formatos não proprietários. Os dados estão disponíveis em um formato sobre o qual ne-
nhuma entidade tenha controle exclusivo;
8. Dados livres de licenças. Os dados não estão sujeitos a regulações de direitos autorais,
marcas, patentes ou segredo industrial. Restrições razoáveis de privacidade, segurança e
controle de acesso podem ser permitidas na forma regulada por estatutos.
Além desses oito princípios, uma outra visão considerando três outros princípios foi proposta
pelo especialista em políticas públicas e ativista dos dados abertos David Eaves (Eaves, 2009).
Embora o escopo inicial desses três princípios tenha sido o de dados abertos governamentais, a
sua aplicabilidade estende-se a dados abertos de forma geral. São eles: 1. Se o dado não pode ser
encontrado e indexado na web, ele não existe; 2. Se não estiver aberto e disponível em formato
compreensível por máquina, ele não pode ser reaproveitado; 3. Se algum dispositivo legal (lei,
regulamento, norma etc.) não permitir sua replicação, ele não é útil.
Linked open data (LOD)

Tim Berners-Lee, um dos idealizadores da web, mediante a necessidade de conexão semântica
de dados criou e lidera a iniciativa linked open data (LOD) (linkeddata.org) (Bizer et al., 2009)
que visa definir conceitos e princípios técnicos que favoreçam a publicação, conexão e com-
partilhamento de dados presentes em diferentes fontes, estendendo o modelo de ligação de
45
documentos atual para conexão entre dados. Essa iniciativa considera a web como um espaço
global de conexão de dados entre diferentes domínios, como pessoas, empresas, livros, publi-
cações científicas, medicamentos, comunidades online, vídeos etc. Esse modelo trata a web
como uma única base de dados global, combinando diferentes fontes e, a partir de sua integra-
ção, garantindo a extração de conhecimento capaz de resolver problemas particulares (Miguez
et al., 2012). Quanto maior for essa interconexão entre os dados, maiores serão os benefícios
fornecidos para os mecanismos responsáveis pela recuperação de conteúdo. No entanto, nesse
momento pouca pesquisa tem sido realizada considerando bases de dados em português bra-
sileiro, concentrando-se ainda fortemente no idioma inglês.
ATENÇÃO
A iniciativa LOD (linkeddata.org) visa definir conceitos e princípios

técnicos que favoreçam a publicação, conexão e compartilhamento
de dados presentes em diferentes fontes, estendendo o modelo de
ligação de documentos atual para conexão entre dados. Essa iniciativa
considera a web como um espaço global de conexão de dados entre
diferentes domínios, como pessoas, empresas, livros, publicações
científicas, medicamentos, comunidades online, vídeos etc.
No âmbito da saúde, empresas como AstraZeneca (astrazeneca.com), Eli Lilly (lilly.com) e John-
son & Johnson (jnj.com), por exemplo, apostaram no modelo LOD com a intenção de criar fon-
tes de informação inter-relacionadas sobre medicamentos (Jentzsch, 2009). O modelo promo-
vido por essas empresas é parte integrante de uma rede LOD global (datahub.io/organization)
na qual empresas, instituições e governos tornam públicos os seus dados, criando conexões
multidisciplinares ou específicas a um domínio (Bizer et al., 2009). O nó central dessa rede
baseia-se no ambiente DBpedia (dbpedia.org). O domínio da saúde também é representado por
meio de nós com conteúdos utilizados na área da saúde, como exemplos DrugBank (drugbank.
ca), DailyMed (dailymed.nlm.nih.gov) e PubMed (ncbi.nlm.nih.gov/pubmed). Medicamentos,
conceitos, diagnósticos, terminologias, vocabulários e outros contextos da área da saúde estão
gradativamente sendo inter-relacionados, em diferentes projetos, com o objetivo de gerar me-
canismos de busca baseados na web semântica e oferecer melhores serviços de informação ao
cidadão.
A informática em saúde, como área de pesquisa e atuação profissional, encontra na oferta de

dados abertos na web um campo fecundo para o aprimoramento de sistemas e serviços. Pes-
quisas (Pisa, 2013) baseadas em técnicas de descoberta de conhecimento e mineração de dados
(KDD, 2016) com aplicação na área da saúde têm se beneficiado com a inclusão de técnicas de
linguística computacional, processamento de linguagem natural e integração semântica. Como
exemplo, uma estrutura de ligação semântica entre dados abertos da saúde, realizada pelo gru-
po de pesquisa Saúde 360o (saude360.com.br), implementa inter-relacionamento semântico
entre a Wikipedia (tronco DBpedia), o CNES e a Plataforma Lattes do CNPq com foco na saúde.
46
UAB | UNIFESP
Informação inter-relacionada na saúde

Cerca de 49 bilhões de páginas web são responsáveis pela disponibilização de informações aos
usuários por meio de diversos tipos de conteúdo como vídeos, áudios, imagens, notícias, arti-
gos científicos e livros digitalizados (Kunder, 2016). As redes sociais ocupam uma posição de
destaque nesse cenário, uma vez que ambientes como Twitter, Facebook e LinkedIn (linkedin.
com) possuem mecanismos que possibilitam aos usuários estabelecerem redes de relaciona-
mento, sejam essas por afinidades profissionais, de amizade ou interesses em comum, além de
permitir compartilhamento de conhecimento e opiniões sobre diversos temas. O número de
usuários brasileiros presentes no Facebook, por exemplo, já ultrapassou 99 milhões (de um to-
tal de 1,6 bilhão de usuários ativos), alcançando praticamente metade da população brasileira.
Embora a informação disponibilizada na web esteja em expansão, diversificando e democra-

tizando as fontes de conteúdo, os usuários deparam-se com a dificuldade na hora de buscar
conteúdos relacionados de domínio específico como o da área da saúde (Teixeira, 2012). Mais
especificamente, no domínio da saúde destacam-se buscas relacionadas a doenças ou condi-
ções médicas, seguido por recuperação de informações sobre hospitais, profissionais em saúde
e nutrição (Taha et al., 2009).
Atualmente ferramentas como o buscador Google (google.com.br) minimizam tal dificuldade,

porém pesquisas mostraram certa ineficiência para a recuperação de conteúdo relevante à área
da saúde em função do entendimento do usuário (Chang et al., 2006). Mesmo com a evolução
destes buscadores nesses últimos anos, as informações retornadas por tais ferramentas ge-
ralmente não são categorizadas, classificadas ou relacionadas com o propósito de facilitar a
visualização dos dados pelos usuários; apenas são disponibilizadas obedecendo a uma única
formatação que não leva em conta seu relacionamento. A relevância dos dados era tratada
de forma precária, abstendo mecanismos de processamento semântico (Berners-Lee e Kagal,
2008) de linguagem natural, criados para domínios específicos de conhecimento. Esse cenário
de massificação de dados e dificuldade na recuperação de informações sugeriu a criação de
agentes inteligentes, capazes de extrair, processar, localizar e relacionar de forma automática a
informação desejada pelo usuário considerando a utilização de características semânticas, por
exemplo (Miguez, 2012). Recentemente esse cenário começou a evoluir mas ainda está restrito
às grandes empresas de indexação e classificação de conteúdos na web.
Baseado nos diferentes repositórios virtuais disponíveis e a possibilidade de inter-relacioná

-los, consideramos algumas questões interessantes a serem investigadas (Teixeira, 2012):
• O inter-relacionamento de repositórios virtuais heterogêneos facilita, de fato, a recupera-

ção de informação no domínio da saúde?
• Quais repositórios virtuais heterogêneos do domínio da saúde são candidatos naturais à

criação de conexões?
47
• Como o consumidor de informação em saúde se beneficiará dessas conexões?
• Reduzirá o tempo destinado às pesquisas?
• Informação relevante não retornada por ferramentas tradicionais de busca pode ser desta-
cada/recuperada por meio da conexão de repositórios virtuais heterogêneos?
• Qual é o perfil do consumidor de informação em saúde que se beneficiará do modelo linked

open data discutido? Profissional ou público leigo?
• A utilização de vocabulários controlados favorecerá a conexão entre repositórios virtuais

heterogêneos por meio do relacionamento semântico entre termos?
• Quais estratégias são necessárias para relacionar diferentes tipos de linguagem, por
exemplo, técnica e informal?
Temos realizado pesquisas (Pisa, 2013) com o objetivo de estabelecer as bases tecnocientíficas
para incrementar essa integração das bases de dados da área da saúde. Como premissas para
essa nova abordagem podemos citar: apoiar-se na conexão semântica entre dados não estrutu-
rados e oriundos de diferentes fontes de dados do idioma português brasileiro; propor soluções
que visam o relacionamento entre bases de dados da saúde pública; cruzar dados da saúde
para otimização de recursos e direcionamento de políticas públicas. Como exemplos de infor-
mação inter-relacionada podemos citar: localização de hospitais especializados mais próximos
do usuário; localização de profissionais de saúde por especialidades, hospitais ou interesses;
avaliação da opinião de usuários sobre hospitais e profissionais de saúde; correlação entre pro-
fissionais de saúde que estão trabalhando em estabelecimentos de saúde que atuam em suas
especialidades de formação; mapa da migração de profissionais de sua região de formação para
região de atuação; identificação de alertas e temas de saúde discutidos pelo cidadão por região.
Por se tratar de um campo complexo de pesquisa há necessidade de novos desenhos metodo-

lógicos a partir das abordagens clássicas da pesquisa quali-quantitativa, sustentando a meta de
relacionar sistematicamente diferentes bases de dados em benefício da geração de informação
inter-relacionada na área da saúde. Estudos mais recentes, portanto, têm incorporado novas
abordagens de investigação às técnicas clássicas de análise de bases de dados, provenientes
da área da descoberta de conhecimento e mineração e dados (Chakrabarti et al., 2006). Dentre
elas podemos citar técnicas de inteligência artificial para classificação e indexação de dados,
técnicas de mineração de texto para limpeza e categorização de termos, técnicas de mineração
de dados para identificação de padrões, análise estatística para comparação de grupos homo-
gêneos, análise de agrupamentos para gerar hipóteses e relações, e procedimentos de aquisição
de conhecimento do especialista em saúde para gerar condições de contorno para as soluções
propostas.
Do ponto de vista da gestão do conhecimento, os processos de mineração de dados possibi-

litam a criação de uma informação bem definida, transferível. Em contraste, os processos de
descoberta de conhecimento são caracterizados pela recuperação de dados, limpeza de dados,
48
UAB | UNIFESP
especificação de critérios e análise de desempenho. Os processos de KDD aplicados aglome-

ram informação inerente à temática de saúde investigada por meio de aplicação de técnicas
como mineração de dados para a geração de domínios de conhecimento.
Por fim, a informação inter-relacionada na área da saúde pode ser usada para diferentes pro-
pósitos, mas podemos ressaltar em especial seu uso em três eixos dentro da informática em
saúde, sendo (a) informática para a saúde do consumidor, (b) sistemas de apoio à decisão em
saúde, e (c) informática para a gestão em saúde. Esses três eixos representam três escalas de
aplicação da análise de bases de dados em saúde, sendo (a) visão do consumidor, (b) visão do
profissional de saúde, e (c) visão do gestor de saúde. Outras visões também devem fazer parte
de estudos e objetivos de pesquisa, como a visão do pesquisador acadêmico, do estudante, do
editor e publicador de artigos científicos (scientific publisher), do professor em ciências da saú-
de, do técnico hospitalar, do engenheiro biomédico, do enfermeiro, do gestor e da autoridade
de saúde, entre outros (Brittain e Norris, 2000).
Redes sociais como bases de dados em saúde

Nos últimos anos o crescimento da quantidade de informação disponível na web modificou
a forma como os indivíduos buscam conhecimento (Araujo et al. 2012). Além dos conteúdos
disponibilizados pela mídia institucional, os usuários passaram a compartilhar na web seus
conhecimentos, críticas e opiniões em páginas web pessoais, redes sociais, vídeos, áudios, co-
mentários em fóruns, entre outros. Com isso, o uso da web para compartilhar dados tem gerado
inúmeras possibilidades para análises e mineração de dados (Liu, 2010).
Uma das possíveis aplicações da análise desse conteúdo compartilhado é na avaliação de ques-
tões na área da saúde, por exemplo, estabelecer qual o “sentimento” que os usuários apresen-
tam a respeito desse conteúdo, ou seja, a opinião positiva ou negativa expressa sobre ele. As
opiniões são importantes uma vez que indivíduos e organizações são influenciados por elas no
momento de uma tomada de decisão (Liu, 2010). No caso das organizações, realizar pesquisas
ou grupos de discussão com a finalidade de coletar pessoalmente, face a face, opiniões dos
consumidores sobre seus produtos e os de seus concorrentes é uma atividade cada vez menos
comum, uma vez que atualmente existe uma abundância de informações e opinião dos indiví-
duos à disposição na web.
Contudo, antes da existência da web praticamente não havia estudos computacionais a res-
peito de mineração de opinião (Araujo et al., 2012). Com essa expansão da participação dos
usuários nos conteúdos da web expondo seus pensamentos, novos conceitos e metodologias
surgiram para investigação desses conteúdos (Pang e Lee, 2008). Assim, a análise de sentimen-
to tornou-se uma área de pesquisa em processamento de linguagem natural (PLN) e minera-
ção de textos. A análise de sentimento é o estudo computacional de como opiniões, atitudes,
emoções e perspectivas são expressas na linguagem natural (Liu, 2010), podendo ser conside-
rada uma disciplina de estudo interdisciplinar, englobando áreas como psicologia, marketing
e computação.
49
A análise de sentimento pode ser utilizada para identificação e classificação do conteúdo emo-
cional criado pelos usuários nas redes sociais, determinando opiniões positivas, negativas e
neutras, fornecendo, assim, uma polaridade da opinião ou orientação do sentimento (Chew
e Eysenbach, 2010). Em uma visão geral, a análise de sentimento faz o rastreamento de uma
grande quantidade de mensagens sobre um tema pré-selecionado obtendo um relatório com a
opinião de pessoas sobre esse tema (Ohana e Tierney, 2009). Os passos envolvidos nesse pro-
cesso são coleta de dados, classificação e sumarização. A coleta de dados visa apenas buscar
na web conteúdos relacionados ao tema e arquivá-los para análise e classificação. A etapa de
classificação pode ser realizada por meio de técnicas de aprendizagem de máquina, seleção de
palavras ou análise sintática. E, por fim, na sumarização de resultados, as classificações das
diversas opiniões devem ser resumidas e sintetizadas com o intuito de facilitar o seu entendi-
mento. Isso pode ser preparado em forma de texto ou gráfico (Pang e Lee, 2008).
Na literatura existem exemplos da aplicação dessa técnica para diversos temas relacionados à
saúde, como rastrear tendências para saúde pública (Chew e Eysenbach, 2010), avaliar a con-
fiabilidade de reclamações médicas (Vydiswaran et al., 2011), mapear opiniões expressas em
comunidades de saúde online por meio de fóruns de discussão (Yu, 2011), auxiliar em buscas de
artigos em bases de dados de saúde (Zorman e Verlic, 2009), visualizar comentários de saúde
publicados em mídias sociais (Chee, 2008), entre outros. Esses estudos apontam para a rele-
vância de se analisar mensagens de diferentes redes sociais para identificação da opinião de
pacientes e consumidores em saúde sobre suas condições e de sua comunidade, por exemplo,
para identificação de inícios de epidemia ou assistências emergenciais.
Acreditamos que a utilização de representação semântica e métrica de análise de rede social

cada vez mais próximas ao domínio de conhecimento do tema de saúde investigado, aliados ao
arsenal clássico de técnicas de descoberta de conhecimento e mineração de dados (Chakrabarti
et al., 2006), pode gerar um salto qualitativo na análise de bases de dados em saúde. Esse salto
se reflete nos resultados e no impacto para problemas de informação e tomada de decisão na
saúde, tanto para as demandas do gestor e autoridade da saúde como para auxiliar a atividade
do profissional de saúde, mas especialmente para o consumidor de saúde. A demanda por no-
vas técnicas e abordagens em função do fenômeno big data (Peek, 2013) já está colocada para
a saúde há algum tempo em diversas áreas de pesquisa e aplicação.
Portanto, pensamos ser relevante a formação de pesquisadores preparados para lidar de ma-
neira inovadora e criativa com os procedimentos e técnicas da descoberta de conhecimento e
mineração de dados para garantir maior interoperabilidade, capacidade de armazenamento e
representação, tornando a informação em saúde mais útil e transformadora para a sociedade.
Ou seja, que mais profissionais estejam aptos a transformar bases de dados em saúde em bases
de conhecimento úteis, de fácil utilização, de baixo custo e disponíveis para toda a população.
Esse é um comprometimento antigo, que muitos profissionais e áreas já se propuseram a alcan-
çar, mas cujos resultados pouco se refletem em oferecer simplicidade e eficiência no relaciona-
mento da informação em saúde e, consequentemente, em auxiliar diretamente a assistência.
50
Considerações
Finais Alice: Você poderia me dizer, por favor, qual caminho eu devo seguir
a partir daqui? “Gato: Isso depende muito de para onde você quer ir.
“Alice: Eu não me importo muito para onde. “Gato: Então não importa
qual caminho você segue.
Alice no País das Maravilhas (goo.gl/TYVThL)
O Brasil possui grandes bases de dados nacionais, de dados vitais, de morbidade e de produção de
serviços, de abrangência nacional, comparáveis às que existem em diversos países. É produzido
anualmente um grande volume de dados, amplamente disponíveis via internet/web pelo DA-
TASUS/MS cujo aproveitamento deixa ainda a desejar. Parte da argumentação gira em torno da
qualidade dos dados; outra parte é que os dados não são detalhados o suficiente para serem úteis
para apoiar a decisão em saúde, e há, ainda, a falta de treinamento por parte dos gestores no uso
da informação. Nunca é demais lembrar que apenas uma única informação sobre uma só pessoa,
fornecida de maneira incorreta ou inadequada, pode ocasionar um grande estrago.
Para entender a informação em saúde no Brasil, seus componentes, sua função e seu uso torna-
se conveniente também que se conheça um pouco da origem, da evolução e da estrutura atual da
organização das ações de promoção, proteção e recuperação da saúde no país. Essa contextuali-
zação pode auxiliar na compreensão da abrangência e da qualidade dos dados que são gerados,
processados e disponibilizados para as diferentes finalidades de planejamento, gestão, avaliação,
controle social, ensino e pesquisa.
Entretanto, tradicionalmente as informações sobre a área da saúde no Brasil são fragmentadas e

pouco padronizadas, resultado da atividade compartimentalizada das diversas instituições que
atuam no setor. No passado, as estatísticas de morbidade, por exemplo, provinham principalmen-
te de serviços e programas verticais, como materno-infantil, saúde escolar, malária, tuberculose,
hanseníase e controle de poliomielite. Vários bancos de dados existiam e refletiam o panorama
e a tendência de cada evento. Havia problemas, em graus variáveis, de cobertura e de qualidade
das informações. Era também difícil coordenar as informações por eles produzidas. Resultados
decepcionantes apareciam quando dados de diferentes bases eram aglomerados. As inconsistên-
cias acarretavam baixas possibilidades de análise da situação. Consequentemente, havia grande
quantidade de dados, mas esses eram esparsos, e, portanto, não possibilitavam a geração de co-
nhecimento coerente e útil para subsidiar decisões. Apesar das dificuldades da atualidade pode-
mos dizer que houve avanços significativos no gerenciamento da informação em saúde no país
nos últimos 10 anos.
Outro aspecto importante que não foi abordado até aqui, mas que merece ser ressaltado, é a dis-
tinção entre dados primários e secundários em saúde. Pesquisas baseadas na coleta de dados pri-
mários partem de uma pergunta específica a ser respondida, sendo, então, utilizado um conjunto
51
de procedimentos para que todos os dados necessários à análise sejam coletados e armazenados
de forma adequada. Já na pesquisa baseada em dados secundários, a questão que se coloca é
buscar quais perguntas podem ser respondidas considerando a qualidade e a natureza dos dados
disponíveis na base de dados selecionados para a análise. Ora, esse tipo de pesquisa está na base
das atividades que propomos nessa disciplina.
Finalmente, esperamos que esse nosso primeiro contato contenha os elementos do “caminho”
que vamos seguir nessa disciplina, nos municiando de um “mapa” prévio desse “país das mara-
vilhas” (e labiríntico) de dados em saúde para dialogar com o sorridente gato de Cheshire, per-
sonagem de Lewis Carroll, diferentemente da abordagem da ansiosa Alice. Ainda, vale a pena
um breve comentário sobre a frase de Rufus Pollock (2013), citado logo no início desse material.
Houve tempo em que a informática em saúde se estruturou, em relação às bases de dados em
saúde, oficialmente pelos órgãos responsáveis pelo sistema de saúde do país para atender, ini-
cialmente, a uma demanda administrativa, contábil e financeira. A infraestrutura de informática
era precária, de alto custo e acessível a poucos. Podemos dizer que depois dessa fase houve uma
descentralização da coleta dos dados em saúde devido especialmente à evolução da infraestru-
tura das tecnologias da informação e comunicação no país, o que possibilitou um aumento na
quantidade de sistemas, assuntos, pessoas e localidades que participavam dessa coleta de dado.
Em contrapartida, um certo caos aumentou quanto à utilização de linguagens de programação,
plataformas e, especialmente para nosso interesse, no formato do dado, seu significado e política
de uso. Estamos vivendo hoje (não na próxima década; não no próximo ano, mas agora) um novo
passo evolutivo na infraestrutura das tecnologias da informação e comunicação de maneira que
o usuário comum, o cidadão, o paciente, tem um grande poder de consumir e disponibilizar seus
dados em formato eletrônico. Ironicamente o caos sobre os formatos e a integração desses dados
tende a aumentar, mesmo com o advento da web semântica e de outros mecanismos de padro-
nização do dado.
Uma coisa é certa e podemos dizer com convicção: o gestor de antigamente, ou em outra visão, o
analista de dados em saúde simplesmente não sobreviverá se não se atualizar. Novas ferramentas
e novas abordagens são necessárias. Está claro que a análise, independente das diferentes bases
de dados em saúde, gera conhecimento útil que pode ser aplicado. Mas, os fenômenos mais com-
plexos, a ligação entre fenômenos, e geração de conhecimento galgado em técnicas científicas
que colaborem com simulações mais realistas e na tomada de decisão mais eficiente do gestor,
isso tudo depende de novas abordagens. Depende da ligação entre as bases. E todos, incluindo
DATASUS, técnicos do Ministério de Saúde, de secretarias de estado e de municípios, e também
dos geradores de dados, dos profissionais de saúde que atuam nos provedores, todos nós temos
responsabilidade pela evolução na definição, armazenamento, coleta e análise de dados em saú-
de que se tornem realmente úteis ao cidadão em benefício de sua saúde. Afinal, não podemos
nos esquecer porque, em última análise, as bases de dados em saúde são montadas. A saúde e o
bem-estar das pessoas é a motivação final para tal esforço técnico-científico, financeiro e políti-
co. E o cidadão está ficando cada vez mais consciente dessa busca ética que nós, estudantes da
informática em saúde, de qualquer formação básica, assumimos quanto ao bom uso do dado em
saúde. O país precisa e merece uma melhor gestão do dado em saúde, e todos nós temos condi-
ções de promover essa melhoria. Mãos à obra! Bom caminho para todos nós.
52
Referências
Alves D. Curso sobre bases de dados em saúde. Universidade Aberta do Brasil (UAB), 2009.
Disponível em: goo.gl/jbVMG6.
Araújo GD, Sousa FS, Teixeira F, et al. Análise de sentimentos sobre temas de saúde em mídia
social. Journal of Health Informatics, 2012. v.4, n. 3.
Bendoly E. Theory and support for process frameworks of knowledge discovery and data
mining from ERP systems. Information & Management, 2003;40:639-647.
Berners-Lee T, Kagal L. The fractal nature of the semantic web. AI Magazine, 2008 Sep 5.29(3):29.
Berry MJA, Linoff G. Data mining techniques for marketing, sales, and customer support.
Wiley, New York, 1997.
Bizer C, Health T, Berners-Lee T. Linked data - the story so far. International Journal on
Semantic Web and Information Systems, Vol. 5(3), Pages 1-22. DOI: 10.4018/ jswis.2009081901.
BRASIL. Lei no. 12.527, de 18 de novembro de 2011 [Internet]. 2011. Disponível em: http://www.
planalto.gov.br/ccivil_03/_ato2011-2014/2011/lei/l12527.htm.
BRASIL. Presidência da República. Casa Civil. Subchefia para Assuntos Jurídicos. Decreto
no. 8.065 de 7 de Agosto de 2013. Disponível em: http://www.planalto.gov.br/ccivil_03/_
Ato20112014/2013/Decreto/D8065.htm.
BRASIL. Ministério da Saúde. Secretaria Executiva. Departamento de Informática do SUS.

DATASUS Trajetória 1991-2002 / Ministério da Saúde, Secretaria Executiva, Departamento de
Informática do SUS. – Brasília: Ministério da Saúde, 2002. Disponível em: http://bvsms.saude.
gov.br/bvs/publicacoes/trajetoria_datasus.pdf.
BRASIL. Ministério da Saúde. Grupo Especial para a Descentralização. Uso e disseminação de

informações em saúde: subsídios para elaboração de uma política de informações em saúde
para o SUS: relatório final. Rio de Janeiro: Abrasco, 1994.
BRASIL. Conselho Nacional de Secretários de Saúde. Ciência e Tecnologia em Saúde. Brasília:

CONASS, 2007. (Coleção Progestores - Para Entender a Gestão do SUS).
BRASIL. Decreto no 8.065, de 7 de Agosto de 2013. Presidência [da] República Federativa do

Brasil. Casa Civil. Subchefia para Assuntos Jurídicos. Disponível em: http://www.planalto.gov.
br/ccivil_03/_Ato2011-2014/2013/Decreto/D8065.htm.
53
Brittain JM, Norris AC. Delivery of health informatics education and training. Health Library
Review, 2000.17(3):117-128.
Chakrabarti S, et al. Data mining curriculum: a proposal (version 1.0). Intensive Working Group
of ACM SIGKDD Curriculum Committee, Apr 30, 2006. Available from: http:// www.kdd.org/
sites/default/files/CURMay06.pdf.
Chang P, et al. Are Google or Yahoo a good portal for getting quality healthcare web information?.
2006.
Chee B, Karahalios KG, Schatz B. Social visualization of health messages. In: Proceedings of the
Hawaii International Conference on system sciences. IEEE Computer Society. Los Alamitos
(CA) USA, 2009 jan 5-8. p.1-10.
Chew C, Eysenbach G. Pandemics in the age of Twitter: Content analysis of tweets during the
2009 H1N1 outbreak. PLoS ONE, 2010. 29;5(11):e14118.
Davenport TH. Big data no trabalho: derrubando mitos e descobrindo oportunidades. Tradução:
Cristina Yamagami 1 ed. - Rio de Janeiro: Elsevier, 2014.
Dietrich D, et al. Guia de dados abertos - open data handbook [Internet]. Open Data Handbook.
Available from: http://opendatahandbook.org/pt_BR.
Eaves D. The three laws of open government data [Internet]. 2009. Available from: http:// eaves.
ca/2009/09/30/three-law-of-open-government-data/.
Fayyad UM, Piatetsky-Shapiro G, Smyth P. From data mining to knowledge discovery: an

overview. In: Fayyad UM et al. (Eds.). Knowledge discovery in databases, The AAI Press, Menlo
Park, CA, 1996. pp. 1-31.
Francis DB. Your competitors: who will they be? Competitive Intelligence Review 8, 1997, pp.
16–23.
Helms MM, Moore R, Ahmadi M. Information technology and healthcare industry: a swot
analysis. International Journal of Healthcare Information Systems and Informatics, 2008. v. 3,
n. 1. p. 75-92.
Hillestad R, et al. Can electronic medical record systems transform health care? Potential health
benefits, savings, and costs. Health Affairs, 2005. v. 24, n.5. p. 1103-1117.
Jentzsch A, et al. Enabling tailored therapeutics with linked data. Proceedings of the WWW2009
Workshop on Linked Data on the Web (LDOW2009), Madrid, Spain, 2009.
KDD [Internet]. Sig KDD: bringing together the data mining, data science and analytics
community. [cited 2016 Jan 27]. Available from: www.kdd.org.
54
UAB | UNIFESP
KDNUGGETS. What main methodology are you using for your analytics, data mining, or data
science projects? Poll. Disponível em: http://www.kdnuggets.com/polls/2014/analytics-data-
mining-data-science-methodology.html. Acesso em: 27 ago. 2017.
Knuth DE. Selected papers on computer science. Cambridge: Cambridge University Press,
1996. 274 p. p. 1-2.
Kunder M. The size of the World Wide Web [Internet]. 2016 [cited 2016 Jan 28]; Available from:
http://www.worldwidewebsize.com.
Liu B. Sentiment analysis: a multi-faceted problem. IEEE Intell Syst, 2010, 25:1-5.
Medina MG, Aquino R. Avaliando o programa de saúde da família. In: Souza MF (organizador).
Os sinais vermelhos do PSF. São Paulo: Hucitec, 2002. p.135-151.
Miguez PR, et al. Linked data as a tool in the nutrition domain. Nutr. Hosp. vol.27 no. 2. Madrid
mar-abr. 2012.
Monard MC, Baranauskas JA. Conceitos sobre aprendizado de máquina. In: Rezende SO (ed.).
Sistemas inteligentes: fundamentos e aplicações. São Carlos: Manole, 2003. p. 89-114. c. 4.
Moraes IHS. Informações em saúde: da prática fragmentada ao exercício da cidadania. São

Paulo/Rio de Janeiro: Ed. Hucitec e Ass. Brasileira de Pós-Graduação em Saúde Coletiva.
ABRASCO, 1994.
Morais RM, Costa AL. Um modelo para avaliação de sistemas de informação do SUS de
abrangência nacional: o processo de seleção e estruturação de indicadores. Rev. Adm. Pública,
Vol. 48 No. 3. Rio de Janeiro. Maio/Junho 2014.
Mota FRL. Registro de informação sistema de informação em saúde: um estudo das bases
SINASC, SIAB e SIM no estado de Alagoas. 265 f. Belo Horizonte. Tese [Doutorado em Ciência
da Informação] - Escola de Ciência da Informação, Universidade Federal de Minas Gerais,
2009.
Ohana B, Tierney B. Sentiment classification of reviews using SentiWordNet. In: Proceedings

of the 9th IT & T Conference, 2009 Oct 22-3. Dublin, Ireland.
Pang B, Lee L. Opinion mining and sentiment analysis. Found Trends Inf Retr. vol.2, 2008.
Peek N. Big data analytics in biomedicine and health: trends and challenges. Panel on trends.
In: Medinfo 2013 - 14th World Congress on Medical and Health Informatics. Copenhagen,
Denmark.
Pisa IT. Estudos em descoberta de conhecimento e mineração de dados em saúde. São Paulo.
Tese [Livre-Docência] – Universidade Federal de São Paulo. Escola Paulista de Medicina.
Departamento de Informática em Saúde (Disciplina de Informática em Saúde), 2013. Disponível
em ivanpisa.pro.br/livredocencia.
55
Pollock R. Open knowledge foundation blog [homepage na internet]. [Cambridge (UK)]: Ruffus
Polock [2013 Apr] - Forget big data, small data is the real revolution. 2013 Apr 22. Available from:
goo.gl/2PV2hF.
Project Management Institute. A guide to the project management body of knowledge: PMBOK
Guide. Newtown Square: Project Management Institute, 2013.
Santos AC. Sistema de informações hospitalares do Sistema Único de Saúde: documentação

do sistema para auxiliar o uso das suas informações. Rio de Janeiro. Dissertação [Mestrado] -
Escola Nacional de Saúde Pública Sergio Arouca, 2009. Disponível em: bvssp.icict.fiocruz.br/
pdf/25618.pdf.
SBIS. Sociedade Brasileira de Informática em Saúde. Manual de Certificação para Sistemas de

Registro Eletrônico (S-RES). Versão 4.1. 2013. Disponível em: goo.gl/4rpAip.
Senna MCM. Equidade e política de saúde: algumas reflexões sobre o Programa Saúde da
Família. Cadernos de Saúde Pública, 2002;18(Suplemento): 203-211.
Shearer C. The CRISP-DM model: the new blueprint for data mining. Journal of data
warehousing, v. 5, n. 4, p. 13–22, 2000.
Spil TAM, Lerouge C, Trimmer K, et al. IT adoption and evaluation in healthcare: Evolutions and
insights in theory, methodology, and practice. International Journal of Healthcare Information
Systems and Informatics, 2009. v.4,Issue 3.
Souza Júnior MF. Integração informacional entre sistemas de Informação em saúde na ótica da
complexidade: O caso do Sistema Único de Saúde no Estado de Alagoas. Tese [Doutorado em
Administração]. Universidade Federal do Alagoas, 2012.
Starfield B. Atenção primária: equilíbrio entre necessidades de saúde, serviços e tecnologia.

Brasília: UNESCO, Ministério da Saúde; 2002.
Taha J, Sharit J, Czaja S. Use of and satisfaction with sources of health information among older
internet users and nonusers. The Gerontologist; 2009.
Teixeira F, et al. Inter-relacionamento de dados presentes em repositórios virtuais heterogêneos

do domínio da saúde. In: XIII Congresso Brasileiro de Informática em Saúde, 2012 Nov. Curitiba,
PR, 2012. p.1-6.
Viacava F. Informações em saúde: a importância dos inquéritos populacionais. Ciência & Saúde
Coletiva. Rio de Janeiro, 2002. v.7,n.4,p.607-621.
Vydiswaran VGV, Zhai CX, Roth D. Gauging the internet doctor: ranking medical claims based
on community knowledge. In: Proceedings of the 2011 workshop on data mining for medicine
and healthcare; 2011 Aug 21-4. San Diego (CA), USA.
56
UAB | UNIFESP
YU B. The emotional world of health online communities. Proceedings of the 2011 iConference.
New York, NY, USA: ACM; 2011. Acesso em 25 de fevereiro de 2012. p. 806-7. Disponível em:
doi.acm.org/10.1145/1940761.1940914.
Zahr A, Boerma TCA. Health information systems: the foundations of public health. Bulletin
of the World Health Organization, n. 83, 2005. p. 578-583. Available at: who.int/ bulletin/
volumes/83/8/en/.
Zorman M, Verlic M. Explanatory approach for evaluation of machine learning-induced

knowledge. J Int Med Res; vol.37(5). 2009:1543-51.
57

Bases de Dados em Saúde

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Bases de Dados em Saúde

Enviado por

Direitos autorais:

Formatos disponíveis

Especialização em

São Paulo | 2017

CAPÍTULO Contextualização conceitual 6

01 Natureza da informação em saúde

Hierarquização, descentralização e municipalização da informação

CAPÍTULO INTEGRAÇÃO DE DADOS EM SAÚDE 14

02 Interoperabilidade funcional e semântica

Descoberta de conhecimento e mineração de dados (KDD)

Técnicas de mineração de dados 17

CAPÍTULO BASES DE DADOS DO SISTEMA ÚNICO DE SAÚDE (SUS) 21

03 Departamento de Informática do SUS (DATASUS)

Sistemas e aplicativos do SUS

Tabulação de dados do SUS 3639

CAPÍTULO DADOS INTER-RELACIONADOS DA SAÚDE 40

04 Dados abertos conectados em saúde

Linked open data (LOD)

Informação inter-relacionada na saúde 47

Redes sociais como bases de dados em saúde 49

• a natureza da informação em saúde,

• aspectos da hierarquização, descentralização e municipalização da informação,

• integração das bases de dados,

• interoperabilidade funcional e semântica,

• descoberta de conhecimento e mineração de dados em saúde,

Forget big data, small data is the real revolution (goo.gl/2PV2hF)

Mais recentemente um quinto conjunto de resultados começou a aparecer na web, represen-

Diferentes conotações para o conceito “bases de dados em saúde”

Neste curso de especialização em informática em saúde pretendemos introduzir uma parte

Alguns programas de computador e marcas comerciais são citados

Como ilustração podemos pensar na seguinte sequência de dados de um paciente hipotético:

Informação pode ser definida como o resultado do processamento,

COLETA PROCESSAMENTO DECISÃO E CONTROLE

transmissão transcrição opções de decisão

A gestão de dados, informação e conhecimento envolve também a responsabilidade pela ga-

O termo metadado ou metainformação é comumente usado na

TERMO INÍCIO SIGNIFICADO ESPECÍFICO

Natureza da informação em saúde

• Informações estatístico-epidemiológicas: informações que incluem o conhecimento dos

• Informações administrativas: não específicas apenas do setor da saúde, são as de controle

O conjunto e a integração das informações clínicas, estatístico-epidemiológicas e administra-

Com o avanço da tecnologia os sistemas informatizados rígidos, verticais, nacionais ou es-

Assim, sistemas informatizados de controle da produção ambulatorial, hospitalar, laborató-

• Demográfico/econômico-social e cultural. Os censos populacionais periódicos ou

• Eventos vitais. Referem-se ao registro de nascimentos vivos, nascimentos mortos, óbitos,

• Classificação e codificação. Um exemplo desse tipo de dado é a Classificação Interna-

• Avaliação hospitalar. Censo médio diário, percentagem de ocupação, mortalidade hos-

• Qualidade. Referem-se, principalmente, aos sistemas de avaliação sanitária dos estabe-

cas de funcionamento dos estabelecimentos, as condições de risco, a qualidade de produtos

• Administrativos. Gestão financeira/orçamento, folha de pagamento/recursos humanos,

Contudo, muitas dessas experiências respondem a características locais muito específicas, o

Interoperabilidade funcional e semântica

A interoperabilidade na saúde é o mecanismo que garante a comunicação efetiva entre siste-

• Interoperabilidade funcional: a habilidade de dois ou mais sistemas trocarem informações;

• Interoperabilidade semântica: a habilidade da informação compartilhada entre sistemas ser

Nesse curso de especialização nós teremos a disciplina Padrões de Normatização em Informá-

Descoberta de conhecimento e mineração

O processo de descoberta de conhecimento descreve tanto os procedimentos gerais pelos quais

Do ponto de vista da gestão do conhecimento, os processos de mineração de dados possibi-

1. Pesquisa em banco de dados (database query): localização e acesso a registros relevantes

Técnicas de mineração de dados

1. Entendimento do negócio: Primeira etapa do processo, é nela em que o objetivo e neces-

veis. Além da utilização de técnicas clássicas de estatística, é frequente a utilização de técnicas

• Simbólico: representações simbólicas de um problema por meio da análise de exemplos e

• Conexionista: inspirado no modelo biológico do sistema nervoso. Exemplo: redes neurais

• Evolutivo: modelo biológico de aprendizado. Exemplo: neurociência computacional , ana-