Escolar Documentos
Profissional Documentos
Cultura Documentos
TEI
TEI
O TEI foi criado em 1987 por um consórcio das associações académicas Association
for Computers and the Humanities (ACH), Association for Computational
Linguistics (ACL) e Association for Literary and Linguistic Computing (ALLC), que o
propuseram como o resultado da pesquisa efetuada para desenvolver um esquema de
metadados que desse cabal resposta à colocação em linha de textos digitais, nos seus
múltiplos formatos. Apesar de ser um dos primeiros formatos a ser desenvolvido neste
âmbito, este esquema de meta informação continua a ser utilizado na atualidade[1].
Desenvolvido com o objetivo de criar e “to develop guidelines for encoding machine-
readable texts in the humanities and social sciences”[2], fomentando a preparação e
troca de textos eletrónicos, foi inicialmente definido como um SGML DTD (Document
Type Definition). Porém, atualmente, apresenta a vantagem de importar e exportar a
informação para os formatos MARC[3], apresentando-se como “an international and
interdisciplinary standard that enables libraries, museums, publishers, and individual
scholars to represent a variety of literary and linguistic texts for online research,
teaching, and preservation”[4].
O TEI é constituído por um conjunto de etiquetas, com uma sintaxe própria que
descreve a estrutura e os elementos do documento eletrónico e do exemplar impresso
que lhe deu origem. Nesse sentido, é reconhecido como “um padrão internacional para
representar todo tipo de textos literários e linguísticos para pesquisa e
ensino online”[5].
Dado que, por um lado, cada língua possui conjunto próprio de acentos e carateres
especiais (diacríticos) e, por outro, a codificação de carateres é essencial para que os
dados possam circular através de vários sistemas sem que sejam corrompidos, a
disponibilização de textos eletrónicos em linha exigiu a sua normalização. Por esse
motivo, o desenvolvimento do TEI obedece à norma ISO 10646[7], que define o
conjunto universal de caratéres.
– Descrição bibliográfica;
– Descrição de codificação;
– Descrição de revisão.[11]
<teiHeader>
<fileDesc> <!– … –> </fileDesc>
<encodingDesc> <!– … –> </encodingDesc>
<profileDesc> <!– … –> </profileDesc>
<revisionDesc> <!– … –> </revisionDesc>
</teiHeader>
<teiHeader>
<fileDesc>
<titleStmt> … </titleStmt>
<publicationStmt> … <publicationStmt>
<sourceDesc> … <sourceDesc>
</fileDesc>
</teiHeader>
– Poemas;
– Drama;
Existem várias bibliotecas digitais que implementaram o TEI, como por exemplo
o Perseus e a Bibliothèques Virtuelles Humanistes. Está vocacionado para reutilização
da informação, pois como linguagem estruturada e normalizada permite a construção
de algoritmos para trabalhar a informação.