Você está na página 1de 8

Aula de 5 de setembro de 2011

1. Elaboração de recursos linguísticos


“Uma inscrição de hieróglifos apresenta o
aspecto de um verdadeiro caos; nada está
no seu lugar; falta lógica em tudo; os
objetos os mais opostos na natureza se
encontram em contato imediato e produzem
alianças monstruosas: no entanto, regras
invariáveis, combinações bem pensadas,
uma marcha calculada e sistemática
incontestavelmente dirigiram a mão que
traçou esse quadro, aparentemente tão
desordenado; esses caracteres tão
diversificados nas suas formas,
frequentemente tão contrários na sua
expressão material, são nada menos que os
sinais que servem para anotar um sentido
regular de idéias, exprimem um sentido
fixo, seguido, e constituem assim um
verdadeiro sistema de escrita” (J. F.
Champollion, Precisões do sistema
hieróglifo dos antigos Egípcios, 1824).

1.1.5. Elaboração de uma ortografia

A noção de ortografia está intimamente ligada ao conceito de sistema de escrita


(“writing systems”, “écriture”).

De acordo com o dicionário francês “Le Petit Robert”, um sistema de escrita é uma
“representação da palavra e do pensamento por meio de sinais”, definição que se pode
considerar particularmente geral.

Uma definição um pouco mais abrangente nos é dada por “representação visual da
linguagem por um sistema de sinais gráficos”, conforme figura no livro “L´Aventure

MultiCib
1
des écritures: naissances”1, publicado pela Biblioteca Nacional da França, em 1997.
Essa definição tem o mérito de não limitar os sistemas de escrita, como ocorre muito
frequentemente, aos sistemas a base de letras ou de figuras (“pictogramas”). E introduz
uma noção que será encontrada frequentemente, a noção de “sinal gráfico”, e da sua
materialização em suportes os mais variados: pedra, terra seca ou cozida, papiro, papel,
microfilme e mais recentemente suportes óticos ou magnéticos.

É a invenção dos sistemas de escrita que marca a passagem da pré-história à história.


Desnecessário sublinhar a importância cultural dessa invenção fundamental.

A título de cultura geral, vale observar que os primeiros sistemas de escrita nasceram
quase que simultâneamente na Mesopotâmia (em torno de 3400 A. C.) e no Egito (em
torno de 3200 A. C.). Os habitantes da Mesopotâmia adoraram uma escritura
cuneiforme e os egípcios estabeleceram um complexo sistema de hieróglifos (os mais
usuais comportando mais de 700 símbolos), que será decifrado somente no início do
século XIX por Jean-François Champollion. Há, na literatura, textos muito interessantes
sobre a história e os distintos sistemas de escritura. De uma forma esquemática,
podemos considerar que há 3 tipos de sistemas de escritura: os sistemas ideográficos, os
sistemas silábicos e os sistemas alfabéticos. Na prática, são encontrados muitos
exemplos de combinação desses 3 sistemas.

Nos sistemas ideográficos, “cada sinal representa um objeto (pictograma) ou uma idéia
(ideograma)”. Em teoria (e pela sua própria função), um pictograma ou um ideograma
pode ser compreendido por pessoas que não falem a mesma língua e que “traduzirão”
cada sinal na sua própria língua. No entanto, essa afirmação supõe que haja pelo menos
uma parte da cultura em comum.

É por isso que os hieróglifos puderam ser utilizados por outras civilizações além da
egípcia e os chineses “impuseram” uma parte do seu sistema de escrita a outros povos
por eles colonizados. Para tomar em conta a necessidade de transcrever cada vez mais
palavras, esses sistemas de escrita evoluiram em um sentido fonético: utilizam-se

1
Sob a direção de Anne Zali e Annie Berthier

MultiCib
1
ideogramas de palavras existentes para exprimir sons (e não mais a significação) das
novas palavras.

Nos sistemas silábicos, “cada sinal representa um som”. Um sistema de escrita silábica
compreende em média 80 a 120 sinais. Os sistemas puramente silábicos são raros:
podemos citar nessa categoria o inuit ou cherokee, mas também os kana, um dos
sistemas de escrita do japonês.

Um alfabeto é uma coleção de sinais gráficos que representam sons vocais em uma
língua ou grupo de línguas. Dito de outra forma, “cada sinal representa um som
decomposto” e vários sinais (letras ou caracteres) são necessários para representar um
som. Os principais alfabetos compreendem uma trentena de sinais, o que representa um
desempenho incrível quando se imagina a diversidade de línguas e, além disso, das
idéias e emoções que podem ser expressas a partir deles.

Mesmo que não tenhamos muita consciência, os sistemas de escrita alfabéticos


necessitam também de uma representação visual quando se quer distinguir, por
exemplo, os homônimos (palavras de pronúncia idêntica, mas de sentido diferente);
desse modo, em francês “vers, vert, verre, vair” não se distinguem pela grafia – que não
é portanto simplesmente a ‘representação de um som composto”, mas também um meio
de distinção de significado.

Embora certo número de línguas possa partilhar o mesmo alfabeto, elas podem utilizar
de forma diferente certos sinais, por exemplo, através de pronúncia diferente (“u” em
francês ou em inglês), sem falar das inúmeras variantes permitidas pelo acréscimo de
sinais específicos (diacríticos) que modificam a pronúncia de uma letra ou grupo de
letras. Não devemos também esquecer - por ser evidente demais – que um bom número
de palavras não é escrito como elas são pronunciadas.

Para muitos, os sistemas de escrita alfabéticos são considerados o ápice da evolução da


escrita: em se “liberando” da escrita por pictogramas ou ideogramas, as civilizações

MultiCib
1
indo-européias aparecem como civilizações do conceito, em oposição às civilizações
simbólicas ou emblemáticas do Extremo Oriente. Jean-Jacques Rousseau escreveu que
“estas três maneiras de escrever respondem exatamente aos três diversos estados sob os
quais se podem considerar os homens reunidos em uma nação. A pintura de objetos
conviria aos povos selvagens; os sinais de palavras e de preposições aos povos bárbaros
e o alfabeto aos povos policiados”. Pode-se discordar de Rousseau, é claro.

1.1.5.1. Unidades fundamentais de um sistema de escrita

Os grafemas são a unidade fundamental de um dado sistema de escrita. Segundo


o tipo de sistema, o grafema se realiza visualmente ou foneticamente de diversas
maneiras que podem ser resumidas como segue:

Alfabeticos: um grafema = uma letra.


Silábicos: um grafema = uma sílaba
Ideogramas: um grafema = um caracter = uma idéia, uma palavra, um composto
ideo-fonético, etc.

1.1.6. Características dos sistemas de escrita

1.1.6.1. Sentido

Mesmo que nos pareça incongruente, habituados que estamos a escrever da esquerda
para a direita e horizontalmente, todos os sistemas de escritura não operam dessa
maneira. O árabe, por exemplo, se escreve da direita para a esquerda e o chinês pode ser
escrito horizontal ou verticalmente. No entanto, a linha reta, horizontal ou vertical, é a
norma, o que simplifica muito o trabalho dos programadores, tanto para a saída de
dados como para a sua exibição em tela.

1.1.6.2. Presença de diacríticos

De acordo com o “Petit Robert”, define-se diacrítico como “um sinal gráfico (ponto,
acento, cedilha) atuando sobre uma letra ou sinal fonético, e destinado a modificar seu

MultiCib
1
valor ou a impedir a confusão entre homógrafos”. Em francês, os acentos das palavras
“à”, “dû”, “où” são os sinais diacríticos nos quais se pensa, mas há muitos outros
diacríticos de outros sistemas de escrita. Se, no alfabeto latino, os sinais diacriticos são
frequentemente colocados sobre a letra que eles qualificam, pode-se também, noutros
sistemas de escrita, encontrá-los embaixo ou ao lado da letra, havendo casos em que
pode ter diversos diacríticos ao mesmo tempo embaixo e acima do caracter.

Nos jogos de caracteres, os diacríticos serão definidos “com ou sem espaço”,


dependendo do seu uso em combinação com outro caractere (geralmente digitado
depois) ou não. Noutros termos, deve-se representar separadamente os diacríticos e os
caracteres aos quais eles se aplicam ou deve-se representar o conjunto caracter +
diacrítico? Não há uma resposta única, e certas normas interditam frequentemente a
utilização combinada de caracteres “com espaço” (ou seja, a tendência é pela
representação do conjunto caracter + diacrítico). De aparência menor, este problema não
deve ser subestimado. Unicode por exemplo, jogo de caracteres universal, não quis
disciplinar os códigos separados dos diacríticos de um lado, de caracteres de outro e
aqueles que preferem codificar as letras com o(s) seu(s) diacrítico(s) que podem ser
acrescentados, e oferecer várias soluções e vários níveis de utilização segundo escolhas
feitas em uma implementação. Dito isto, a razão histórica para esse “não engajamento”
(assegurar a compatibilidade entre Unicode e certos jogos de caracteres que o
precederam) não tem mais sentido hoje.

1.1.6.3. Ligaduras e outras características

Embora possamos deixar aos puristas de tipografia o cuidado de dissertar sobre a


ausência de pequenas maiúsculas acentuadas ou de meio-espaço na maioria dos jogos de
caracteres, o problema de ligaduras não deve ser subestimado. A ligadura consiste por
ocasião da impressão de certos caracteres, em fazer uma ligação entre tais caracteres.
Em francês, por exemplo, pode-se usar a ligadura em “fi”, em “ffi” ou em “ct”. No
entanto, as ligaduras não podem ser consideradas como caracteres integrais. É preciso
simplesmente que o software que manipula caracteres possa associar duas letras

MultiCib
1
sucessivas de modo a que o glyphe2 dessa associação seja único (e não a simples
combinação de dois glyphes correspondendo às letras indicadas).

Enfim, certos sistemas de escrita compreendem letras maiúsculas e minúsculas (como


no alfabeto latino) enquanto que outros – ditos monocamerais – ignoram essa noção,
como de certa maneira, o alfabeto árabe.

1.1.6.4. Características de transcrição das línguas

A transcrição de linguas é um ponto particularmente espinhoso, porque torna a


utilização dos jogos de caracteres ainda mais complexa. Em certas línguas, não se
imprime vogais, ou quando se faz isso serve para dar um sentido específico ao texto
transcrito (um valor poético no caso do hebreu, por exemplo). Em outros sistemas, o
sentido de um ideograma varia de acordo com a língua (como ocorre com o tripé
chinês-japonês-coreano), o que causa problemas os mais diversos.

De fato, esquecemos frequentemente que a transcrição de uma língua não é uma simples
operação fonética, mas também um processo intelectual (que explica, por exemplo. a
existência de homônimos). Depois do surgimento da etimologia, ciência que se interessa
às origens e à evolução das palavras, numerosas tentativas foram feitas para fabricar
alfabetos fonéticos internacionais, que se apoiariam unicamente sobre os sons
fisicamente emitidos para transcrever os sistemas de escrita. Mas essas transcrições
puramente fonéticas são reservadas aos especialistas, mesmo se algumas são codificadas
e representadas por jogos de caracteres específicos! Voltaremos a esse assunto em outro
momento.

Os estudos fonológicos e tonológicos conduzem a um sistema de transcrição da língua


que representa correctamente os sons úteis, e isto da maneira mais econômica possível.
Permite escrever até 90 % o que se pronuncia, sem refinamento fonético, o suficiente
para ter a tentação de se privilegiar apenas a notação fonológica, passando-se assim por
cima de estudos ortográficos. No entanto, estes últimos tornam-se verdadeiramente
2
Um glyphe ou glyfo é uma forma de representar um caracter.

MultiCib
1
indispensáveis para dotar uma lígua de um sistema convencional, capaz de ter em conta
o conjunto das necessidades de expressão escrita dos falantes. Com efeito,
contrariamente à notação fonológica (que reflete apenas os sons úteis da língua) uma
ortografia bem concebida deverá também incluir as notações das relações gramaticais e
das idéias. Consideremos, para o francês, os seguintes exemplos:
a) /ɛǀ ʃăt/

b) elle chante (ela canta)


c) elles chantent (elas cantam)

A frase (a) apresenta a notação fonológica que corresponde tanto à frase (b) como à
frase (c). Se o francês se escrevesse unicamente com uma notação fonológica, não
haveria nenhuma maneira de distinguir aqui o singular do plural, tal como o permite a
convenção ortográfica.

Consideremos outro exemplo em sango, uma língua que distingue um tom alto, um tom
médio e um tom baixo. Numa notação fonológica, estes tons são respectivamente
notados com um acento agudo [á], um mácron [ā] e um acento grave [à], mas estes
acentos não se encontram nos equipamentos correntes na África Central. Uma ortografia
destina-se, no entanto, ao uso de um vasto público, e a língua deve poder ser escrita
tanto à mão como à máquina, ou no computador. É por esta razão que é necessário
elaborar uma convenção ortográfica que comporte um conjunto de regras que permitam
escrever a língua de maneira mais prátiica.

O quadro seguinte mostra as diferentes etapas necessárias à elaboração de uma


ortografia otimizada e estável para uma língua, neste caso para o sango:

MultiCib
1
É de notar que a transcrição fonética reflete a pronúncia das palavras tal como elas são
registradas no gravador. Ela é, portanto, própria à investigação linguística, mas
demasiado minuciosa para servir de base a uma ortografia corrente, destinada ao grande
público. A notação fonológica da segunda coluna só retém os sons úteis, os fonemas e,
desta forma, torna-se mais propícia para servir de base a uma ortografia corrente. Mas, a
marcação de todos os tons constitui um obstáculo para uma escrita prática e uma leitura
rápida. Além disso, os símbolos diacríticos utilizados para diferenciar os tons (acento
agudo, mácron e acento grave) não estão disponíveis em todas as máquinas e só podem
ser correctamente escritos no computador, fato que não está ao alcance de todos os
utilizadores de uma língua menos favorecida. A convenção ortográfica da terceira
coluna permite economizar 47 % da frequência dos tons, e de escrevê-los com o trema e
o acento circunflexo, dois símbolos que figuram na tecla livre na maioria dos teclados
ocidentais das máquinas de escrever e dos computadores utilizados na África Central.
Apesar disto, com esta convenção subsistem 53 % da frequência dos tons para
transcrever com acentos. Para reduzir ainda mais a taxa de frequência, efetuamos uma
reforma ortográfica cujos resultados se encontram na quarta coluna.

Esta nova convenção permite economizar 53% da frequência dos tons num texto. Nessa
fase, podemos dizer que o sango (ou sahngo) está finalmente dotado de uma ortografia
otimizada e estável.

MultiCib
1

Você também pode gostar