Escolar Documentos
Profissional Documentos
Cultura Documentos
Tecnologia de Internet
ÍNDICE
2. Regras de Construção………………………………………. 3
3.1 SAX……………………………………………………………. 11
3.2 O DOM………………………………………………………... 11
4. Conclusão……………………………………………………………. 13
5. Bibliografia…………………………………………………………… 14
HTML e XML são primos. Eles derivam da mesma inspiração, o SGML. Ambos
identificam elementos em uma página e ambos utilizam sintaxes similares. Se você é
familiar com HTML, também o será com o XML. A grande diferença entre HTML e XML
é que o HTML descreve a aparência e a ações em uma página na rede enquanto o
XML não descreve nem aparência e ações, mas sim o que cada trecho de dados é ou
representa. Em outras palavras, o XML descreve o conteúdo do documento.
Como o HTML, o XML também faz uso de tags (palavras encapsuladas por sinais '<' e
'>') e atributos (definidos com name="value"), mas enquanto o HTML especifica cada
sentido para as tags e atributos (e frequentemente a maneira pela qual o texto entre
eles será exibido em um navegador), o XML usa as tags somente para delimitar
trechos de dados, e deixa a interpretação do dado a ser realizada completamente para
a aplicação que o está lendo. Resumindo, enquanto em um documento HTML uma tag
<p> indica um parágrafo, no XML essa tag pode indicar um preço, um parâmetro, uma
pessoa, ou qualquer outra coisa que se possa imaginar (inclusive algo que não tenha
nada a ver com um p como por exemplo autores de livros).
Os arquivos XML são arquivos texto, mas não são tão destinados à leitura por um ser
humano como o HTML é. Os documentos XML são arquivos texto porque facilitam que
os programadores ou desenvolvedores "debuguem" mais facilmente as aplicações, de
forma que um simples editor de textos pode ser usado para corrigir um erro em um
arquivo XML. Mas as regras de formatação para documentos XML são muito mais
rígidas do que para documentos HTML. Uma tag esquecida ou um atributo sem aspas
torna o documento inutilizável, enquanto, que no HTML isso é tolerado. As
especificações oficiais do XML determinam que as aplicações não podem tentar
adivinhar o que está errado em um arquivo (no HTML isso acontece), mas sim devem
parar de interpretá-lo e reportar o erro.
2. REGRAS DE CONSTRUÇÃO
As regras de sintaxe da XML são bastante simples, mas devem ser seguidas
rigorosamente pelos interpretadores. Deste modo, estes programas podem ser menos
complexos, evitando situações de interpretação ambígua. Sendo uma linguagem
baseada em etiquetas, os documentos em XML têm que respeitar rigorosamente as
regras de construção de elementos e atributos.
Exemplo:
<mensagem>
<de>Liliana Costa</de>
<para>Nuno Peixoto</para>
</mensagem>
As três linhas seguintes contêm três elementos filhos de mensagem (de, para e
assunto). Cada um destes elementos poderia ter outros sub-elementos e assim
sucessivamente.
O documento termina com o fecho do elemento raiz.
<raiz>
<filho>
<neto>...</neto>
</filho>
</raiz >
<x>Incorrecto
<x>Correcto</x>-
<x><y>Incorrecto</x></y>
<x><y>Correcto</y></x>
<Mensagem>Errado</mensagem>
<mensagem>Correcto </mensagem>
<Mensagem>Correcto </Mensagem>
<mensagem numero="13">
2.2.SECÇÕES CDATA
Todo o texto de um documento XML é interpretado durante a leitura do ficheiro, para
permitir a detecção de inícios e fins de etiquetas.
Existem alguns caracteres que são ilegais em XML, pois a sua utilização gera
documentos com interpretações ambíguas. Estes caracteres têm que ser substituídos
por entidades referenciais (começadas pelo carácter "&" e terminadas pelo carácter
";").Os caracteres ilegais XML são “<” e “&” que devem ser substituídos por < e
& respectivamente. Existem outros caracteres, que apesar de não serem ilegais,
também devem ser substituídos para evitar dificuldades de leitura, sendo>, e " que
devem ser substituídos por > ' e " respectivamente.
Exemplo:
O CDATA permite definir secções de texto do documento XML que não são
interpretadas, e que portanto não restringem a utilização de caracteres ilegais. Uma
secção CDATA começa com "<![CDATA[" e termina com "]]>":
Exemplo:
<script>
<![CDATA[
then return 1;
else
return 0;
]]>
</script
As secções CDATA não podem conter outras secções CDATA, ou seja, não podem
conter as sequências de caracteres "<![CDATA[" ou "]]>"
A sequência "]]>" também não pode ter espaços nem mudanças de linha no seu
interior.
O objectivo de uma Document Type Definition (DTD) é construir uma gramática que
define a estrutura e elementos válidos de um tipo de documento XML. Os documentos
que respeitam essa DTD dizem-se válidos. A DTD é efectuada numa linguagem própria
com sintaxe própria, diferente do XML. O documento XML pode conter uma DTD
embebida ou usar uma referência externa.
<?xml version="1.0"?>
<mensagem>
<de>Liliana Costa</de>
<para>Nuno Peixoto
</para>
</mensagem>
<!ELEMENT de (#PCDATA)>
A linguagem XML Schema, também conhecida por XML Schema Definition (XSD), é
uma alternativa à DTD, mas as suas regras sintácticas são baseadas nas da XML. Por
este motivo, a XML Schema é uma aplicação da XML que descreve a estrutura de um
documento.
Tipo “simple”:
A utilização de DTD tem tendência a ser substituída por XML Schema, porque esta
última apresenta várias vantagens:
É extensível;
É mais expressiva que a DTD;
É escrita em XML;
Suporta tipos de dados;
Suporta espaços de nomes.
<shiporder orderid="889923"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:noNamespaceSchemaLocation="shiporder.xsd">
<orderperson>John Smith</orderperson>
<shipto>
<name>Ola Nordmann</name>
<address>Langgt 23</address>
<city>4000 Stavanger</city>
<country>Norway</country>
</shipto>
<item>
<title>Empire Burlesque</title>
<note>Special Edition</note>
<quantity>1</quantity>
<price>10.90</price>
</item>
<item>
<quantity>1</quantity>
<price>9.90</price>
</item>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="shiporder">
<xs:complexType>
<xs:sequence>
<xs:element name="shipto">
<xs:complexType>
<xs:sequence>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:complexType>
<xs:sequence>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
3. MODELOS DE PROCESSAMENTO
A escolha do modelo de processamento num programa XML não depende só das suas
características, depende também da funcionalidade disponível na biblioteca de
programação utilizada.
3.1 SAX
3.2 DOM
comentários. Os dois tipos mais comuns são elementos e texto. Utilizando o DOM é
possível criar nós, remover nós, alterar o seu conteúdo e percorrer o nó
hierarquicamente (pai, filhos e irmãos). O principal problema deste modelo de
processamento é que necessita de bastante memória, o que pode ser impeditivo de
manipular documentos de grande dimensão. Por este motivo, o DOM é sobretudo
utilizado em aplicações cliente orientadas a utilizador, que tipicamente correm em
máquinas com poucos problemas de memória.
4. CONCLUSÃO
5.BIBLIOGRAFIA
http://www.inf.ufsc.br/~gauthier/EGC6006/material/Aula%202/Introducao%20
e%20Sintaxe%20do%20XML.pdf
http://www.tutoriaisweb.com/abrir.php?acao=visitar&id=786
http://www.gta.ufrj.br/grad/00_1/miguel/link3.htm
http://pt.wikipedia.org/wiki/XHTML