Você está na página 1de 8

1

PROCESSAMENTO DE DADOS ESTRUTURADOS (XML)


Antonio Gerson Vieira Melo (melo.gerson@gmail.com)
Felipe Ribeiro Camargo (felype93@hotmail.com)
Tpicos Avanados de TI Jos Henrique T. C. Sbrocco

Resumo. Este artigo tem com objetivo mostrar as definio de XML, como uma
linguagem de marcao, suas principais aplicaes, e caractersticas como o
compartilhamento de dados. E apresentar alguns conceitos bsicos e a terminologia
comum usados na descrio das linguagens de marcao.
Palavras-Chaves: XML, Linguagem de Marcao.

1 Definio

XML a sigla para Extensible Markup Language, que significa em portugus


Linguagem Extensvel de Marcao Genrica. uma recomendao para gerar
linguagens de marcao para necessidades especiais. XML capaz de descrever
diversos tipos de dados, e seu objetivo principal a facilidade de compartilhamento de
informaes atravs da Internet. recomendada pela

W3C para a criao de

documentos com dados organizados hierarquicamente, tais como textos, banco de dados
ou desenhos vetoriais. A linguagem XML classificada como extensvel porque permite
definir os elementos de marcao.
Entre linguagens baseadas em XML incluem-se XHTML (formato para pginas
Web), SDMX ,SMIL, MathML (formato para expresses matemticas), NCL, XBRL,
XSIL e SVG (formato grfico vetorial). A principal caracterstica do XML de criar
uma infraestrutura nica para diversas linguagens.
XML uma tecnologia simples que tem ao seu redor outras tecnologias que a
complementam e a fazem muito maior e com possibilidades muito mais amplas. XML
representa uma maneira distinta de fazer as coisas, cuja principal novidade consiste em

permitir compartilhar. XML tambm permite ao programador e aos suportes dedicar


seus esforos s tarefas importantes quando trabalha com os dados, j que algumas
tarefas trabalhosas como a validao destes ou o percorrido das estruturas corre a cargo
da linguagem e est especificado pelo padro.
O que define formalmente quais elementos e quais combinaes possveis so
permitidas dentro de um documento XML o "schema", ou seja, esquema. Existem
novos esquemas propostos ao W3C, dentre eles estando o DCD (Document Content
Description), que provm a mesma funcionalidade dos DTDs, e que, pelo fato de
linguagens esquema serem extensveis, os desenvolvedores podem aument-los com
informaes adicionais, tais como regras de apresentao, tornando essas novas
linguagens esquema mais poderosas que os DTDs.

1.1 Linguagem de Marcao

Linguagem de marcao um agregado de cdigos que podem ser aplicados a


dados ou textos para serem lidos por computadores ou pessoas. Por exemplo, o HTML
uma linguagem de marcao para organizar e formatar um website, j o XML tem o
mesmo conceito, mas para padronizar uma sequncia de dados com o objetivo de
organizar, separar o contedo e integr-lo com outras linguagens.
Linguagens de marcao so utilizadas para definir formatos, maneiras de exibio
e padres dentro de um documento qualquer. Normalmente, elas no possuem qualquer
estrutura de controle como as linguagens de programao tradicionais (por exemplo,
comandos condicionais ou de repetio). Dessa forma, elas servem basicamente para
definir como um determinado contedo ser exibido na tela ou como os dados estaro
estruturados ao trafegar entre os diferentes mdulos de um sistema.
As linguagens de marcao se utilizam do conceito de marcador ou tag, que j
trazem algum significado e que quando forem visualizados por algum sistema que as
reconhea, iro saber como o contedo deve ser exibido. Por exemplo, suponha que se
queira deixar todas as palavras comeadas pela letra A em negrito. Para executar essa
operao em HTML, seria necessrio colocar as palavras comeadas por esta letra entre
os smbolos <b> e </b>, sendo que esses smbolos so um exemplo de marcadores
vlidos na linguagem.

2 Caractersticas

O XML traz uma sintaxe bsica que pode ser utilizada para compartilhar
informaes entre diferentes computadores e aplicaes. Quando combinado com outros
padres, torna possvel definir o contedo de um documento separadamente de seu
formato, tornando simples para reutilizar o cdigo em outras aplicaes para diferentes
propsitos.
Portanto, uma das suas principais caractersticas sua portabilidade, pois, por
exemplo, um banco de dados pode escrever um arquivo XML para que outro banco
consiga l-lo.

3 Composio de um documento XML

Um documento XML composto pelos seguintes tipos de marcao (a maioria


deles tambm suportada por HTML e XHTML):

Elementos,

Atributos,

Comentrios, no mesmo formato de HTML e XHTML.

Figura 1.1 fonte http://www.tecmundo.com.br/programacao/1762-o-que-e-xml-.htm

4 Aplicao

O XML tem por objetivo trazer flexibilidade e poder s aplicaes Web. Dentre os
benefcios para desenvolvedores e usurios temos:

Buscas mais eficientes;


Desenvolvimento de aplicaes Web mais flexveis. Isso inclui integrao de
dados de fontes completamente diferentes, de mltiplas aplicaes; computao
e manipulao local dos dados; mltiplas formas de visualizao e atualizao

granulares do contedo.
Distribuio dos dados via rede de forma mais comprimida e escalvel.
Padres abertos.

Alguns dos propsitos do XML so: auxiliar os sistemas de informao no


compartilhamento de dados (especialmente via internet), codificar documentos e inserir
seriais nos dados comparando o texto com o de outras linguagens baseadas em

serializao. Quando voc recebe atualizaes vindas de uma assinatura de RSS, isso s
foi possvel porque a fonte em questo disponibilizou um arquivo XML que pode
fornecer o feed ao programa que fez a leitura instalado em seu computador.
Publicao de dados

Representao organizada de um conjunto de dados estruturados ou


semiestruturados em um documento texto (documento .xml);

Intercmbio de dados e mensagens

Troca de informaes entre softwares

No linguagem de programao

No possui comandos pr-definidos que permitem escrever programas,


exemplos: IF, WHILE, FOR;

No linguagem de consulta;

No possui comandos de acesso a um BD;

No retorna dados;

Atualmente praticamente impossvel a procura em mltiplos bancos de dados e


incompatveis. O XML permite que tais dados possam ser facilmente combinados. Essa
combinao seria feita via software em um servidor intermedirio, estando os bancos de
dados na extremidade da rede.
Os dados poderiam ser distribudos para outros servidores ou clientes para que
fizessem o processamento, a agregagem e a distribuio.
Os dados XML recebidos por um cliente so analisados e podem ser editados e
manipulados de acordo com o interesse do usurio. Ao contrrio de somente visualizar
os dados, os usurios podem manipul-los de vrias formas. Os recursos disponveis do
Document Object Model (DOM) permitem que os dados sejam manipulados via scripts
ou outra linguagem de programao.
A separao da interface visual dos dados propriamente ditos permite a criao
de aplicaes mais poderosas, simples e flexveis.
Os dados recebidos por um usurio podem ser visualizados de diferentes formas
uma vez que o XML define somente os dados e no o visual. A interpretao visual

poderia ser dada de vrias maneiras diferentes, de acordo com as aplicaes. Os


recursos de CSS e XSL permitem essas formas particulares de visualizao.
Os dados podem ser atualizados de forma granular, evitando que uma pequena
modificao no conjunto de dados implique na busca do documento inteiro novamente.
Dessa forma, somente os elementos modificados seriam enviados pelo servidor para o
cliente. Atualmente, uma modificao em um item de dados acarreta na necessidade de
atualizao da pgina inteira.
O XML tambm permite que novos dados sejam adicionados aos j existentes,
sem a necessidade de reconstruo da pgina.
Assim como o HTML, o XML, por ser um formato baseado em texto aberto,
pode ser distribudo via HTTP sem necessidade de modificaes nas redes existentes.
Devido ao fato dos documentos XML separarem completamente os dados da
forma com a qual so visualizados, autores de aplicaes de visualizao de dados
podem torn-las muito poderosas e interativas, permitindo ao usurio visualizar os
dados da forma que lhe agrade. Dessa forma, a interatividade, em termos, no
dependeria tanto da comunicao cliente servidor, mas sim seria feita "offline",
reduzindo o trfego do link com o servidor.
A compresso de documentos XML fcil devido natureza repetitiva das tags
usadas para definir a estrutura dos dados. A necessidade de compresso dependente da
aplicao e da quantidade de dados a serem movidos entre clientes e servidores. Os
padres de compresso do HTTP 1.1 podem ser usados para o XML.
Os mecanismos de ligao de dados e folhas de estilos podem ser usados para
organizar os dados XML em uma apresentao visual, e para adicionar interatividade. A
ligao de dados (data binding) um aspecto do HTML Dinmico (DHTML), a qual
move itens individuais de dados de uma fonte de informao (por exemplo XML) para
uma apresentao HTML, permitindo que o HTML seja usado como um modelo de
exibio de dados XML. Isso parecido com uma ligao de mensagens em
processamento de palavras.
O XSL (Extensible Stylesheet Language) pode adicionar poderes ainda maiores
esse processo. Uma folha de estilos XSL contm instrues de como retirar
informao de um documento XML e transform-la para outro formato, como o HTML.
Essa transformao feita de forma declarativa, e no via scripts. E mais, o XSL usa o
XML como sua sintaxe, o que evita que autores de documentos XML tenham que
aprender outro tipo de linguagem de marcao de dados.

Os Cascade Style Sheets (CSSs) tambm podem ser usados para dados XML, s
que de estrutura mais simplificada, e so usuais em tais situaes. Entretanto, os CSSs
no provm uma estrutura de apresentao que se difere da estrutura da fonte de dados.
Com o XSL, possvel gerar estruturas de apresentao (em HTML, por exemplo) que
so bem diferentes das estruturas de dados originais dos documentos XML, como
mostrado a seguir.

Referncias

Fonte: PORTAL EDUCAO - Cursos Online: Mais de 1000 cursos online com
certificado
http://www.portaleducacao.com.br/educacao/artigos/31639/linguagem-demarcacao#ixzz33cUuForg
GUIMARES, C. Introduo a Linguagens de Marcao: HTML, XHTML,
SGML, XML. Instituto de Computao - Unicamp

Você também pode gostar