Linguística Comparada Tipologia

LINGUÍSTICA
PARA O ENSINO SUPERIOR 9
LINGUÍSTICA
COMPARADA
e TIPOLOGIA
GIULIA BOSSAGLIA
CAPÍTULO
1
As línguas do mundo
@Famílias linguísticas do mundo

Como para as línguas do mundo, não há um número definido de famílias lin-
guísticas – talvez, aliás, seja mais difícil chegar a um consenso com relação a
um aproximado número de famílias que a um aproximado número de línguas:
há, de fato, estimativas que vão de poucas dezenas a centenas de famílias lin-
guísticas. Isso se deve ao fato de que reconstruir uma família de línguas é uma
operação muito mais complexa que calcular o número das línguas existentes,
tanto do ponto de vista teórico quanto metodológico (no que diz respeito à
comprovação da existência de relação genética entre línguas comparadas).
Sem querer discutir os detalhes dessa complexa questão, o objetivo desta se-
ção é apresentar algumas das principais famílias linguísticas que não foram
abordadas na introdução sobre línguas do mundo feita no Capítulo 1, nem nos
Capítulos 5 (línguas da África) ou 6 (línguas das Américas).
Eurásia
Além das famílias indo-europeia e sino-tibetana, há outras importantes fa-
mílias linguísticas na Eurásia. Uma é a família uralo-altaica (do nome dos
montes Urais, na Rússia, e Altai, na China, que delimitam uma ampla região
em que suas línguas são faladas). Na verdade, é bastante controverso que se
trate de uma única família, e é mais aceita, hoje em dia, a divisão entre família
urálica, por um lado, e família macroaltaica, por outro. A família urálica com-
preende línguas faladas da Europa centro-oriental até a Rússia setentrional.
Na Europa, húngaro, estoniano e finlandês compõem o grupo ugro-fínico da
Giulia Bossaglia 3
família. Línguas urálicas são faladas por aproximadamente 25 milhões de pes-
soas hoje em dia.
Figura 1: Família urálica (fonte: lewis, 2009).
Não há consenso completo sobre a composição da família altaica. Alguns es-

tudiosos defendem que ela seja composta pelos grupos túrcico, tungúsico,
mongólico, coreano e japonês, outros assumem que só os primeiros três estão
geneticamente relacionados entre si, e que coreano e japônico constituem fa-
mílias separadas. Aqui, coreano e japônico serão tratados como famílias sepa-
radas, mas independentemente da perspectiva que se adote com relação à clas-
sificação das línguas altaicas, é oportuno apresentar cada um desses grupos.
Figura 2: Família altaica: grupo túrcico (fonte: LEWIS, 2009).
O grupo túrcico possui uma extensão geográfica notável, da Turquia até a Rús-
sia norte-oriental. As línguas túrcicas são faladas hoje em dia por cerca de 120
4 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

milhões de pessoas, 40% das quais são falantes de turco (PERELTSVAIG, 2012,
p. 86). Dentre as cerca de quarenta línguas do grupo, mencionam-se aqui o
turcomeno (Turcomenistão), o cazaque (Cazaquistão), o azeri (Azerbaijão), o
quirguiz (Quirguistão) e o uigur (falado na China).
Figura 3: Família altaica: grupo mongólico (fonte: lewis, 2009).
Cerca de 5 milhões de pessoas falam línguas do grupo mongólico, sendo que

aproximadamente 50% é falante de mongol. Outras línguas mongólicas são
faladas em regiões da China e da Rússia próximas à Mongólia. Perto da região
do Cáucaso, os cerca de 290 mil habitantes da República da Calmúquia falam
o calmuco, outra língua do grupo.
Figura 4: Família altaica: grupo tungúsico (fonte: lewis, 2009).
As línguas da família tungúsica são faladas por grupos muito pequenos de

pessoas, espalhados pela Sibéria. No total, esse grupo conta com pouco mais
Giulia Bossaglia 5
de 50 mil falantes, correndo, portanto, fortes riscos de extinção. O manchu,
que foi uma das línguas principais do grupo, hoje em dia é falado por apenas
poucas dezenas de pessoas (pereltsvaig, 2012, p. 212).
Figura 5: Família japônica (fonte: lewis, 2009).
Dos cerca de 130 milhões de falantes de línguas japônicas, mais de 120 mi-
lhões falam japonês, enquanto as demais línguas da família são faladas por
comunidades menores — algumas são consideradas simples dialetos do japo-
nês. Existem posições divergentes sobre uma possível relação entre a família
japônica e a coreana.
Figura 6: Família coreana (fonte: lewis, 2009).
A família é composta apenas pelo coreano, que é então uma língua isolada,
falada por cerca de 50 milhões de pessoas principalmente nas Coreias, mas
também na China, Japão e Rússia.

Outras famílias linguísticas da Eurásia são as caucasianas. O Cáucaso se des-
taca por uma significativa diversidade linguística (em uma área geografica-
mente não muito extensa). São três as famílias caucasianas: caucasiana norte-
-ocidental (cf. o georgiano, entre várias outras línguas), caucasiana do sul ou
kartveliana (abcásio, entre outras) e caucasiana norte-oriental (lezgui, entre
outras). Trata-se de famílias linguísticas, a que pertencem cerca de 11 milhões
de falantes, muito antigas e diferentes do ponto de vista tipológico.
Figura 7: Famílias caucasianas (fonte: lewis, 2009).
No Sudeste asiático, encontram-se as famílias austroasiática — que com-

preende cerca de 170 línguas, com aproximadamente 100 milhões de falan-
tes, espalhadas entre Índia, Vietnã e Malásia continental (principais línguas:
vietnamita, mon, khmer) — e a tai-kadai, com aproximadamente 80 milhões
de falantes (principais línguas: tailandês, laociano).
Figura 8: Família austroasiática (fonte: lewis, 2009).
Giulia Bossaglia 7
Figura 9: Família tai-kadai (fonte: lewis, 2009).
Na parte centro-meridional da Índia e no Sri Lanka, são faladas as línguas

dravídicas (cerca de 230 milhões de falantes), como tâmil, kânnada, télugu,
malayalam. No Paquistão, cerca de 2 milhões de pessoas falam o brahui, que
também pertence a essa família.
Figura 10: Família dravídica (fonte: lewis, 2009).
Oceania
Uma das famílias linguísticas mais ameaçadas do planeta está na Oceania: a
família australiana. Os efeitos da colonização foram particularmente letais
para as comunidades aborígenes, e estima-se que para as cerca de 380 línguas
da família o número de falantes gire em torno de 40 mil.

Figura 11: Família australiana (fonte: lewis, 2009).
Américas
Como se explica no Capítulo 6, a classificação genética das línguas nativas das
Américas é bastante complicada e até hoje controversa. Mencionam-se, portan-
to, apenas algumas das muitíssimas famílias classificadas para esse continente.
A família esquimó-aleutina compreende as línguas inuit, yupik, inuktikut e inupia-
tun, faladas por cerca de 90 mil pessoas entre Canadá, EUA, Groenlândia e Rússia.
De acordo com a classificação greenberguiana (cf. Figura 12), a família es-
quimó-aleutina faria parte da macrofamília euroasiática (junto com as famí-
lias indo-europeia e sino-tibetana, portanto).
Figura 12: Família esquimó-aleutina (fonte: lewis, 2009).
Giulia Bossaglia 9
Dentro da controversa macrofamília dené-caucasiana, entraria a (reconhe-
cida) família na-dené da América do Norte, que compreende as línguas ata-
baskanas, como tlingit (Alaska e Canadá), navajo e apache (Califórnia e Méxi-
co norte-ocidental).
As principais famílias da América central são a uto-asteca (principal língua:
nahuatl), oto-mangueana (mixteco, zapoteco, entre outras), maia (maia, tsot-
sil, entre outras), mixe-zoqueana (mixe e zoque são as línguas principais). Em
sua maioria, essas línguas são faladas no México, mas também estão presen-
tes no Sudoeste dos EUA.
Figura 13: Macrofamílias linguísticas das Américas de acordo com Greenberg (1987).
GREENBERG, J. H. (1987). Language in the Americas. Stanford: Stanford University Press.

LEWIS, M. W. (2009). GeoCurrent. The People, Places & Languages shaping Current Events. Disponível
em: <http://www.geocurrents.info/cultural-geography/linguistic-geography/world-maps-of-
-language-families>. Acesso em: 09 mar. 2020.
PERELTSVAIG, A. (2012). Languages of the world: An introduction. Cambridge: Cambridge University
Press.
@história da escrita, sistemas de escrita

Com o termo “escrita” entende-se o processo (e seu resultado) de registrar a
língua sobre algum tipo de suporte físico, para que esta se torne visível — a
língua falada não o é.

No mundo contemporâneo, a escrita é algo extremamente corriqueiro. Todos
os dias, bilhões de pessoas leem e/ou escrevem placas de trânsito, cartazes,
mensagens nas telas dos celulares, dos computadores, livros, jornais, rótulos,
cardápios etc. Com poucos anos de idade, as pessoas aprendem a decifrar e
utilizar os caracteres de diversos sistemas de escrita em diferentes lugares do
mundo (cada vez mais, os governos dos países visam alfabetizar a totalidade
da população). Entretanto, a escrita não é nada “corriqueira”, e muito mudou
nas vidas das comunidades humanas após a invenção dessa tecnologia. Nas
próximas seções, serão esboçadas noções relativas ao surgimento da escrita,
às tipologias de sistemas de escrita e à sua evolução histórica.
1. Um pouco de história
As mais antigas atestações da escrita remetem ao final do IV milênio aEC e são
as tábuas de Uruk, antiga cidade suméria (no atual Iraque). Sumérios, assírios,
acadianos e elamitas foram as grandes civilizações do Crescente Fértil, que
viveram durante muito tempo em uma situação de intenso contato histórico e
cultural. Tratava-se, obviamente, de civilizações agrícolas, que desenvolveram
grandes comunidades urbanas e que precisavam da escrita para diversos fins
práticos, antes que literários ou caligráficos: contabilidade (por exemplo, em
atividades como construção de grandes obras — templos, palácios, pontes,
obras de irrigação — para as quais os responsáveis tivessem que prestar con-
ta ao poder central), fixação de leis, comunicação entre cidades diferentes etc.
As tábuas de Uruk são pequenas tábuas de argila seca, que contêm atestações
do sistema de escrita conhecido como cuneiforme. Esse nome evoca a típica
forma de “cunha” (do latim cuneus) de seus caracteres, porque eram marca-
dos com uma ferramenta pontiaguda, enquanto a argila estava ainda fresca, e
na tábua ficavam signos com essa forma.
Todas as civilizações mencionadas — e, não muito distante do Crescente Fértil,
em territórios que pertencem hoje à Turquia, a civilização hitita — se serviam
desse sistema de escrita para escrever suas línguas, que tinham procedências
genéticas diversas: a língua suméria e o elamita eram línguas isoladas, o as-
sírio e o acadiano línguas semíticas da família afro-asiática (como o árabe),
o hitita era uma língua indo-europeia. Fica claro, portanto, que o sistema de
escrita utilizado por uma comunidade linguística tem relação com o contexto
histórico-cultural daquela comunidade, e não necessariamente com a família
linguística à qual pertence sua língua.
Giulia Bossaglia 11
O fato de todas essas civilizações do antigo Oriente Médio utilizarem o mesmo
sistema de escrita foi utilizado como prova de uma monogênese (i.e., uma ori-
gem única) da escrita, que teria sido inventada pelos sumérios e transmitida
por difusão cultural para outras civilizações antigas. Na Figura 1, apresenta-se
uma cronologia dos principais sistemas de escrita da antiguidade, tentando
também dar uma ideia (ainda que bastante aproximada) das recíprocas posi-
ções geográficas das civilizações:
Figura 1: Cronologia da escrita na antiguidade (adaptado de damerow, 1999, p. 4, e coulmas, 1996).
Como se vê, a escrita cuneiforme suméria foi rapidamente passada para a civi-
lização elamita (atual Irã) no começo do III milênio aEC, enquanto, na mesma
época, a escrita aparecia, em forma de hieróglifos, no antigo Egito. Na segun-
da metade do III milênio aEC, a escrita é encontrada na civilização de Harap-
pa (do nome de um de seus principais centros urbanos), no Vale do rio Indo
(atual Paquistão). Na virada para o II milênio aEC, surgiram os hieróglifos da
civilização minoica na ilha de Creta (o sistema de escrita conhecido como “Li-
near A”, ainda não decifrado), enquanto a escrita cuneiforme era utilizada pe-
los hititas. O ancestral do alfabeto fenício deve ter sido criado pouco depois,
por volta de 1800 aEC, e foi a partir do alfabeto fenício que mais tarde foi cria-
do o alfabeto grego, em torno do começo do I milênio aEC (o alfabeto latino foi
criado a partir dele: as primeiras atestações remetem ao VI séc. aEC). A mais
antiga escrita chinesa atestada, conhecida como escrita dos “ossos oracula-
res” — inscrições religiosas achadas em escápulas de boi e ovelha e em cascos

de tartaruga —, remete aproximadamente a 1300 aEC, mas pela convenciona-
lização dos caracteres utilizados acredita-se que a escrita tenha surgido bas-
tante antes (provavelmente, por volta do começo II milênio aEC). Sistemas de
escrita meso americanos, como o maia e o asteco, se desenvolveram bastante
mais tarde, por volta do V séc. aEC — pouquíssimos documentos sobrevive-
ram à invasão dos colonizadores espanhóis no séc. XVI.
É claro que na área do Crescente Fértil e do Mediterrâneo em geral seria mais
fácil defender a ideia de uma monogênese da escrita e de sua difusão por trans-
missão cultural, pois todas as civilizações dessas regiões estiveram em inten-
sas e prolongadas relações econômicas e culturais; ainda, há registros de con-
tatos entre civilizações da Mesopotâmia e do Vale do Indo. Entretanto, tanto a
China quanto a Mesoamérica não se encaixam nessa hipótese. Apesar de ser
certo que a cuneiforme suméria se difundiu por transmissão cultural para as
diferentes civilizações que adotaram tal sistema na Mesopotâmia e em regiões
limítrofes, para outros sistemas de escrita, como os hieróglifos egípcios e a es-
crita chinesa, não há registros de fases iniciais de seu desenvolvimento — eles
aparecem, nas atestações mais antigas que se tem, como sistemas já avança-
dos. Independentemente da possibilidade de obter mais informações acerca
disso, não há dúvida de que a hipótese mais plausível para o surgimento da
escrita seja aquela de uma poligênese (i.e., “muitas gêneses” vs. a ideia de uma
única; na verdade, houve poucas gêneses independentes, e mais transmissões
culturais: rogers, 2005, p. 4), em lugares diferentes, o mais antigo dos quais foi
aquele da escrita cuneiforme suméria no final do IV milênio aEC.
Entretanto, fica por explicar como e por que a escrita começou. Não é de to-
dos os sistemas da antiguidade (cf. escrita chinesa e hieróglifos egípcios) que
se tem atestações dos estágios mais primitivos, i.e., da protoescrita. Com este
termo (do grego prótos “primeiro” + “escrita”), entende-se o conjunto de re-
cursos visuais utilizados para comunicação e armazenamento de informação,
mas também decoração, próprios de muitas grandes civilizações do passado:
decorações em vasilhas e outros manufatos, tábuas de argila e selos indicando
propriedade, cordas com nós (o sistema de contabilidade inca, o quipu) etc.
Geralmente, a protoescrita se caracteriza como mais pictórica e icônica que os
sistemas de escrita propriamente ditos, e, efetivamente, a evolução “natural”
dos sistemas de escrita segue sempre um caminho que parte de estágios mais
icônicos para se tornar cada vez mais arbitrário, e nunca vice-versa (cf. seção
2). Em outros termos, o que se considera protoescrita é um sistema de signos
gráficos para o armazenamento de algum tipo de informação, mas não neces-
Giulia Bossaglia 13
sária e sistematicamente relacionado com a representação visual da língua —
muito pelo contrário, a interpretação linguística dos signos gráficos deve ter
ocorrido só em um segundo momento.
Muitas das tábuas de argila de Uruk são documentos que atestam transa-
ções de natureza econômico-administrativa, relacionadas com a construção
de grandes obras (templos, principalmente) e o gerenciamento dos recursos
materiais e humanos. Os ancestrais dessas famosas tábuas foram pequenas
fichas de argila de formatos e tamanhos diferentes de acordo com o tipo de
bem ou medida que representavam (esféricas para azeite, cônicas e achatadas
para diferentes medidas de cevada, cilíndricas e redondas para animais do-
mésticos etc.: SCHMANDT-BESSERAT, 2014; SCHMANDT-BESSERAT; ERARD,
2008) e eram utilizadas para registrar bens, entre o VIII e o IV milênio aEC.
Para fazer contabilidade, não era estritamente necessária a mediação da lín-
gua, e por isso os estudiosos têm se concentrado cada vez mais na análise de
como se desenvolveram os grafemas para os números (para hipóteses sobre
a coevolução da capacidade de fazer cálculos e o letramento: ROBSON, 2007;
CHRISOMALIS, 2009). Estes seriam o elo de ligação entre a protoescrita e a
escrita propriamente dita: a partir de uma representação icônica em que uma
quantia x de um objeto y corresponde à repetição x vezes de um desenho de
y, chega-se, graças a um processo de abstração, a uma notação mais arbitrária
que associa o desenho de y a um símbolo para a quantia x, como mostra o
exemplo da Figura 2:
Figura 2: Exemplo de desenvolvimento dos grafemas para números.

Para armazenar a informação “cinco vacas”, em um estágio inicial (protoescri-
ta), desenhavam-se cinco vacas, sendo o grau de iconicidade máximo. Com o
passar do tempo, essa representação icônica foi substituída por outra, mais ar-
bitrária e econômica, em que ao desenho de uma vaca se associava um símbolo
indicando a quantidade “cinco”. A partir desse estágio intermediário, os grafe-
mas (detalhes sobre este termo na seção 2) para “vaca” e para “cinco” adqui-
rem independência: o primeiro, representando a palavra “vaca”, e o segundo, o
número “cinco” — assim começaria a escrita, entendida como sistema de signos
com o fim de representar entidades (abstratas) da língua (palavras, mas tam-
bém: morfemas, sílabas, fonemas) e do pensamento (números).
2. Sistemas de escrita: definição, tipos, evolução

Por “sistema de escrita”, entende-se um conjunto de signos gráficos utilizados
para representar de forma sistemática unidades da língua, no intuito de regis-
trar/armazenar informações e mensagens. Em um paralelismo terminológico
com a distinção entre fone e fonema, as menores unidades de escrita são os
grafes, enquanto os grafemas são os grafes ou grupos de grafes que represen-
tam unidades linguísticas (i.e., abstratas) de algum tipo — podem ser unida-
des de som, unidades morfológicas ou semânticas. Grafemas se transcrevem
utilizando os símbolos “<” e “>”. Por exemplo, o grafema <lh> do português
escrito é formado por dois grafes (l, h), que pertencem ao alfabeto latino, mas
representa uma única unidade linguística: o fonema /ʎ/; <s>, <ç>, <ss>, <x>,
e <z> podem ser considerados alógrafos do grafema para o fonema /s/, como
em sapo, aço, assar, máximo e paz; a palavra nhoque compreende seis grafes
<n, h, o, q, u, e>, mas apenas quatro grafemas <nh>, <o>, <qu>, <e>, um para
cada fonema da palavra /ˈɲɔki/.
Dependendo do tipo de unidade linguística à qual correspondem os grafemas
de um sistema de escrita, ele será um sistema cenêmico (do antigo grego ke-
nós “vazio”) ou plerêmico (do grego pléres “cheio”). Os sistemas cenêmicos
são sistemas cujos grafemas representam unidades de som apenas (são “es-
vaziados” de significado), como os alfabetos fonéticos e silábicos, enquanto os
sistemas plerêmicos, como os ideográficos, logográficos e logosilábicos, pos-
suem grafemas que representam unidades linguísticas de significado, lexical
ou gramatical, e não apenas de som.
Em seus estágios mais antigos, a escrita cuneiforme suméria era um sistema
de tipo logográfico (do grego lógos “palavra”), i.e., plerêmico: cada grafema
Giulia Bossaglia 15
correspondia a uma palavra, principalmente nomes concretos, e mantinha
um razoável grau de iconicidade, como se mostra na Figura 3 (adaptada de
COULMAS, 1996, p. 100):
ave
peixe
asno
andar
grão
boi
Figura 3: Alguns grafemas sumérios em estágio arcaico da escrita cuneiforme.
A iconicidade dos grafemas acima permite que o significado (mas não o som!)
das palavras que eles representam seja facilmente interpretado também por
quem não conhece absolutamente nada da língua suméria.
Um sistema de escrita que consegue representar principalmente nomes con-
cretos é, claramente, limitado. Para ampliar o número de lexemas representá-
veis, era comum a cuneiforme suméria combinar mais grafemas. Por exemplo,
a palavra “comer” era escrita combinando os grafemas “boca” e “pão”:
+ =
boca pão comer
Preste-se atenção para o fato de que o que é combinado são os significados,

mas não os sons das duas palavras — o som da palavra “comer” não é fruto da
combinação dos sons de “boca” e “pão”.
Ainda, os grafemas que representavam determinadas palavras passaram a re-
presentar palavras de significado derivado ou próximo, mas de som diferente: o
grafema para a palavra “arado” (em sumério apin) começou a ser utilizado para
o verbo “lavrar” (uru), e mais tarde para “lavrador” (COULMAS, 1996, p. 101).

Aos poucos, portanto, esse sistema plerêmico foi se “esvaziando”, também de-
vido à mudança de suporte em que a cuneiforme era escrita. As tábuas de
Uruk, de fato, eram pequenas e quadradas, e escritas de baixo para cima, segu-
rando-as em uma mão. Quando começaram a ser utilizados suportes maiores
e retangulares, os grafemas subiram uma rotação de eixo, como se mostra na
Figura 4 (adaptada de COULMAS, 1996, p. 100):
A B C
ave
peixe
asno
andar
grão
boi
Figura 4: Evolução da cuneiforme suméria.
Na coluna B, são apresentados os grafemas da cuneiforme suméria após a ro-

tação de eixo, que, como se pode observar, reduziu o grau de iconicidade dos
grafemas. Na coluna C, mostra-se a evolução que os mesmos grafemas tiveram
na cuneiforme utilizada pelos assírios — civilização que se desenvolveu cerca
de 1.000 anos mais tarde que a suméria —, e os grafemas mostram ter perdido
toda a iconicidade com relação às palavras que originariamente representavam
na cuneiforme suméria. De fato, na cuneiforme assíria, os grafemas estão repre-
sentando sílabas, ou seja, o sistema cuneiforme se tornou um sistema cenêmico.
Já depois da rotação de eixo dos grafemas na cuneiforme suméria, eles tinham
começado a assumir, de vez em quando, uma função “fonética”: o grafema para
a palavra ti “flecha” era utilizado para escrever a palavra til “vida”, e assim por
diante. Assim, a perda de iconicidade dos grafemas com relação ao significa-
do das palavras que eles representavam impulsionou a evolução do sistema
cuneiforme para um sistema cenêmico de tipo silabográfico.
Sistemas de tipo cenêmico são mais econômicos, por serem arbitrários: eles
precisam de uma quantidade limitada de grafemas para representar os sons
Giulia Bossaglia 17
da língua, mas podem ser combinados de maneira (potencialmente) ilimitada
para escrever todas as palavras existentes ou que serão eventualmente criadas
na língua. Por sua vez, sistemas plerêmicos são menos econômicos, pois cada
grafema tende a representar palavras ou morfemas, com maiores custos (na
escrita e na leitura) para a ampliação do conjunto de palavras representáveis.
Comparando o inventário grafêmico da cuneiforme nas muitas civilizações
que a utilizaram ao longo dos quatro milênios aEC, observa-se uma progres-
siva diminuição dos grafemas pertencentes ao sistema: de cerca de 2.000 na
suméria, a 800-700 na assírio-babilônia, a pouco mais que 100 na elamita, 41
na persa (VI-IV sécs. aEC), só para dar alguns exemplos.
Uma evolução parecida se observa no sistema de escrita logográfica chinesa,
como se pode ver comparando a escrita dos ossos oraculares (1400 aEC) com
seus desenvolvimentos mais recentes:
1400 aEC 1100 aEC 220 aEC 200 aEC 1950 EC
cavalo
ver
chuva
Figura 5: Evolução da escrita chinesa (adaptado de XIAO; TREIMAN, 2012).
Como na evolução da cuneiforme suméria, a escrita chinesa também perdeu

iconicidade ao longo do tempo — paralelamente, os grafemas ampliaram seu
leque funcional, afastando-se da simples representação dos significados das
palavras que representavam originalmente através da aquisição de novos va-
lores, até o uso fonético: o moderno grafema 马, na primeira linha da tabela
reportada na Figura 5, que representava a palavra ma3 “cavalo” (o número
indica o tipo de tom) no II milênio aEC, hoje, além de manter esse valor, é uti-
lizado em combinação com outro grafema (妈) para escrever a palavra ma1
“mãe”, servindo apenas com função fonética (indica o segmento [ma]). O ver-
bo “ver” era escrito com um signo muito semelhante a um olho, e “chuva” por
meio de um signo que lembra uma nuvem da qual caem gotas — dificilmente
podem-se reconhecer esses conceitos nas formas dos modernos grafemas,
que, inclusive, podem ser utilizados com outros valores semânticos, ou tam-
bém apenas como complementos fonéticos.

O próprio alfabeto latino não foge a esse processo, no que diz respeito à sua
história. Ele deriva do alfabeto grego, por sua vez desenvolvido do alfabeto fe-
nício, de origem semítica (do ponto de vista linguístico, pertencente à família
afro-asiática). As letras desse alfabeto possuíam os nomes semíticos das enti-
dades que seus grafemas originariamente representavam de forma icônica: a
primeira letra chamava-se ’alp (cf. grego alfa) “boi”, e sua forma correspondia
a uma cabeça de boi estilizada; bet (cf. grego beta) “casa”, e tinha uma forma
quadrada representando a estrutura básica de uma habitação; a letra digg
“peixe” possuía essa forma etc.:
’alp bet digg

’ b d
Figura 6: Alguns caracteres do alfabeto protossinaítico
(fonte: https://www.omniglot.com/writing/protosinaitc.htm).
O <A> do alfabeto latino nada é senão o desenvolvimento de um desenho de

uma cabeça de boi, e o mesmo vale para o <B>, o <D>, e todos os outros gra-
femas que o compõem. Nenhum usuário do alfabeto latino hoje seria capaz
de reconhecer nesses grafemas esses significados originários, e o mesmo vale
para os usuários dos alfabetos fenício e grego: em todos estes sistemas de
escrita, os grafemas são associados a unidades de som de maneira arbitrária.
O fato de todos os sistemas de escrita evoluírem de mais plerêmicos (mais
icônicos) para mais cenêmicos (mais arbitrários) demonstra, novamente, que
a arbitrariedade é vantajosa para o manuseio de um sistema de signos (nes-
se caso, gráficos) — decorando um número restrito de grafemas arbitrários,
pode ser escrito um número (potencialmente) altíssimo de palavras. Em um
sistema em que cada grafema corresponde a uma palavra, é previsível que o
número de grafemas tenda a aumentar à medida que o léxico da língua se ex-
pande. Contudo, um número demasiado alto de grafemas não seria facilmente
manuseável (desgastante do ponto de vista tanto da leitura quanto da escrita)
e, de fato, sistemas plerêmicos tendem a desenvolver estratégias arbitrárias
também (por exemplo, o uso fonético/cenêmico de grafemas que também têm
valor plerêmico, como vimos com ma1 na escrita chinesa contemporânea).
Giulia Bossaglia 19
CHRISOMALIS, S. (2009). The origins and coevolution of literacy and numeracy. The Cambridge han-
dbook of literacy, v. 59, p. 59–74.
COULMAS, F. (1996). The Blackwell encyclopedia of writing systems (p. 469). Oxford: Blackwell.
DAMEROW, P. (1999). The Origins of Writing as a Problem of Historical epistemology. (versão pré-
-publicação, em https://www.mpiwg-berlin.mpg.de/Preprints/P114.PDF; acesso em: 09 mar.
2020).
ROBSON, E. (2007). Literacy, numeracy, and the state in early Mesopotamia. Literacy and the State in
the Ancient Mediterranean. Accordia Research Institute, London, p. 37-50.
ROGERS, H. (2005). Writing systems: A linguistic approach. Oxford: Blackwell.
SCHMANDT-BESSERAT, D. (2014). The evolution of writing. University of Texas at Austin, 25. (http://
sites.utexas.edu/dsb/tokens/the-evolution-of-writing/; acesso em: 09 mar. 2020)
SCHMANDT-BESSERAT, D.; ERARD, M. (2008). Origins and forms of writing. Handbook of research on
writing: History, society, school, individual, text, p. 7-22.
XIAO, W.; TREIMAN, R. (2012). Iconicity of simple Chinese characters. Behavior research methods, 44
(4), p. 954-60. (https://link.springer.com/article/10.3758/s13428-012-0191-3; acesso em: 09
mar. 2020).

CAPÍTULO
2
Dois olhares
sobre as línguas:
sistema e diassistema
@ símbolo, ícone, índice

Uma das caraterísticas do signo linguístico é a arbitrariedade (ou seja, falta de
motivação) da relação entre o significado e o significante: não há uma razão
lógica ou natural pela qual ao significado de “recipiente cilíndrico utilizado
para beber líquidos etc.” em português esteja associado o significante “copo”.
Em todas as línguas naturais, a grande maioria das palavras corresponde a
signos arbitrários, mas há exceções.
O linguista americano Charles Sanders Peirce (1839-1914) foi um dos princi-
pais teóricos da semiótica (do grego seméion “signo”), a ciência que estuda os
signos. Com base no tipo de relação existente entre significado e significante,
Peirce distinguiu três tipos de signos: ícone, índice e símbolo.
Os ícones (do grego eikón “imagem”) são signos em que há uma relação de se-
melhança entre significante e significado. No jogo “pedra-papel-tesoura”, por
exemplo, os três gestos feitos com a mão para veicular o significado de “pe-
dra”, “papel” e “tesoura” imitam as formas desses objetos. Portanto, os ícones
são signos motivados (i.e., não arbitrários): o significado “tesoura” é associado
ao gesto com indicador e médio esticados, imitando as lâminas dessa ferra-
menta. No âmbito linguístico, o exemplo mais claro de ícones é o das onoma-
topeias, palavras que imitam sons da realidade (au au imita o latido de um ca-
chorro, tic tac o som de um relógio, cof cof a tosse etc.) e que, portanto, tendem
a ser parecidas no nível interlinguístico. Podem ser ícones também palavras
que não são onomatopeias, mas como elas imitam algum som, como o verbo
inglês to cough ([kɒf]) “tossir”, mas também, de alguma forma, palavras como
Giulia Bossaglia 21
os numerais do tipo de dezenove, cujo significado (“ideia de 19”) mantém uma
relação de semelhança com a soma de dez e nove, facilmente reconhecível no
significante (mas atenção: dez e nove não deixam de ser palavras arbitrárias!).
Os índices são signos motivados também, mas a relação entre significado e
significante é de proximidade física ou metafórica, logo, lógica, de causa-efei-
to. Pegadas no chão são índice da passagem de alguém — inclusive, a partir da
forma ou profundidade, quem vir as pegadas pode inferir que tipo de ser ou
veículo as deixou; o arco-íris é índice de que choveu; a fumaça é índice de fogo
— se ela for muito grande, de incêndio; se for pequena, de cigarro, e assim por
diante. Algumas categorias de palavras, como os advérbios de tempo e lugar,
os pronomes pessoais e os demonstrativos, podem ser assimiladas a índices,
por seus “significados” serem atrelados (i.e., manterem relação de proximida-
de) ao contexto específico da enunciação — em linguística são chamados, não
por acaso, de dêiticos (do grego déiknumi “indicar”). O advérbio ontem indica
dias diferentes se for pronunciado em 1 ou 2 de janeiro; aqui, falado em São
Paulo, indica um lugar diferente se for pronunciado em João Pessoa; quando
tratamos por tu ou você pessoas diferentes, esses pronomes têm valores dife-
rentes. É claro, portanto, que o valor que os dêiticos assumem varia de acordo
com os contextos específicos em que são utilizados. Por razões de precisão, é
importante sublinhar uma diferença entre signos linguísticos que são ícones
e signos que são índices: nos primeiros, a relação de semelhança existe efeti-
vamente entre significante e significado, entretanto, nos dêiticos a relação de
proximidade existe entre o signo como um todo (significado e significante) e
seu referente no mundo real. De fato, a relação entre o significante ontem e o
significado “dia logo anterior a hoje”, entre aqui e “este lugar”, e entre tu/você
e “segunda pessoa singular” etc. é completamente arbitrária — mas não a re-
lação desses signos com as entidades (lugar, tempo, pessoas) que designam
no momento da enunciação.
Os símbolos são, na distinção do Peirce, os únicos signos arbitrários, em que
a relação entre significado e significante não é motivada. Um exemplo por ex-
celência é o semáforo: não há uma razão pela qual a essas cores específicas
estejam associadas as respectivas ações, e todos (oxalá!) aprendemos que
vermelho significa “parar”, verde “seguir” etc. Os grafemas do nosso alfabeto
também são símbolos: o fonema /a/ ser representado graficamente por <A,
a> e o /f/ por <F, f> é fruto de uma convenção — poderia perfeitamente dar-se
o contrário, se a convenção fosse outra. A grande maioria das palavras nas lín-
guas naturais é composta por símbolos, por óbvias razões de economicidade.

Na linguística, o termo iconicidade (também: motivação) se opõe a arbi-
trariedade: ícones e índices são, portanto, signos icônicos; símbolos são
signos arbitrários.
É importante saber que, ao longo do tempo, signos icônicos podem se tor-
nar arbitrários. Os signos ♀ e ♂ utilizados na biologia para indicar os sexos
biológicos “feminino” e “masculino”, respectivamente, para nós são símbolos
como as letras do alfabeto, mas antigamente, no mundo romano, eles eram
ícones: ♀ representava o espelho da deusa do amor Vênus, sendo o espelho
o acessório culturalmente associado à vaidade feminina; enquanto ♂ repre-
sentava escudo e lança do deus da guerra Marte, pois a guerra era uma ativi-
dade culturalmente associada à masculinidade, assim como as características
de força, violência etc. Hoje em dia, ninguém pensa em Vênus e Marte quando
vê esses signos, que portanto passaram de icônicos a arbitrários.
De forma parecida, os números árabes originariamente não eram símbolos,
mas ícones (a quantidade numérica correspondia à quantidade de ângulos
detectáveis em cada dígito); as letras do alfabeto latino se originaram a partir
de ícones (o <A>, por exemplo, do desenho de uma cabeça de boi, o <E> da
figura estilizada de uma pessoa...) etc.
Fica claro, portanto, que a oposição entre iconicidade e arbitrariedade está
também associada a fatores culturais de determinadas comunidades de falan-
tes e sistemas linguísticos específicos.
Outro exemplo da evolução de icônico para arbitrário nas línguas pode ser
observado na diferença entre a atribuição de gênero gramatical em algumas
palavras: português, espanhol e italiano atribuem gênero masculino à palavra
“sol” e feminino à “lua” (o sol ~ a lua; el sol ~ la luna; il sole ~ la luna); o con-
trário se observa em alemão e lituano (die Sonne ~ der Mond; Saule ~ Menulis;
literalmente “a sol”, “o lua”). Essa diferença não é nada surpreendente, pois as
línguas atribuem o gênero gramatical de forma arbitrária na grande maioria
dos casos: não há uma razão pela qual copo seja uma palavra de gênero mas-
culino e cadeira feminino (não é o mesmo com as palavra pai e mãe, ou ho-
mem e mulher, às quais o gênero masculino e feminino é atribuído de maneira
icônica, por semelhança entre sexo biológico e gênero gramatical; mas esses
são casos muito menos frequentes nas línguas). À primeira vista, portanto,
poderíamos pensar que português, espanhol, italiano e alemão e lituano sim-
plesmente atribuem o gênero gramatical às palavras “sol” e “lua” de forma
arbitrária, assim como o fazem com muitas outras palavras.
Giulia Bossaglia 23
Entretanto, é possível recuperar uma motivação (i.e., iconicidade) na diferen-
ça de atribuição de gênero para “sol” e “lua” nessas línguas. Não por acaso as
línguas em que ao sol é atribuído gênero masculino são línguas originárias do
sul da Europa, e aquelas que lhe atribuem gênero feminino do norte. Há uma
diferença climático-ambiental entre essas regiões do continente europeu que
faz com que o sol seja o elemento mais “forte” (a força era iconicamente asso-
ciada ao sexo masculino) no sul, e muito menos no norte (a fraqueza era iconi-
camente associada ao sexo feminino). Então, nas culturas primitivas originárias
dessas áreas, o sexo das divindades associadas a esses elementos foi escolhido
de forma icônica de acordo com a força (masculino) vs. fraqueza (feminino) des-
ses elementos nos respectivos ambientes. Vestígio dessa diferença é a diferen-
te atribuição de gênero gramatical para “sol” e “lua” nas línguas mencionadas.
Obviamente, nenhum falante nativo dessas línguas hoje tem consciência de tal
origem icônica (a não ser que se interesse por essas questões ou que alguém lhe
conte em uma aula...) e declina “sol” e “lua” pelo gênero masculino ou feminino
da mesma forma como declina “copo”, “cadeira”, “ônibus”, “pedra” etc.
Um dado interessante sobre a relação entre iconicidade e arbitrariedade pro-
vém da história dos sistemas de escrita, que se originaram todos como siste-
mas icônicos, evoluindo para parcial ou completamente arbitrários ao longo
do tempo — a evolução inversa nunca se deu (cf. @sistemas de escrita).
@ fonemas, fones, alofones

Aprofunda-se aqui a oposição entre os conceitos de fone, a menor unidade
sonora de uma língua, e fonema, a menor unidade da língua dotada de valor
distintivo — i.e., capaz de distinguir palavras de significado diferente. Soman-
do as pronúncias das palavras ‘porto’ [ˈpoɾtʊ] / [ˈpoʀtʊ] / [ˈpoɻtʊ] / [ˈpoχtʊ] /
‘posto’ [ˈpostʊ], obtêm-se cinco sequências fônicas diferentes, todas diferen-
ciadas pelo som (i.e., fone) situado no meio da sequência, entre a vogal tônica
[o] e a consonante [t] (em linguística, os fones são transcritos entre colche-
tes). Entretanto, às cinco diferentes sequências fônicas não correspondem
cinco diferentes palavras: [ˈpoɾtʊ] / [ˈportʊ] / [ˈpoɻtʊ] / [ˈpoχtʊ] são todas rea-
lizações distintas da mesma palavra ‘porto’, e [ˈpostʊ] de ‘posto’. Logo, os fones
[ɾ, r, ɻ, χ] não são fonemas, por não serem capazes de distinguir palavras de
significado diferente, mas são realizações distintas (tecnicamente, alofones:
do grego allós “diferente, outro” + phoné “som”) de um mesmo fonema /R/,
que se opõe ao fonema /s/, formando o par mínimo ‘porto ~ posto’, e também
‘caro ~ caço’, ‘arco ~ asco’ etc. (fonemas se transcrevem entre barras).

Ainda, na pronúncia de ‘porto’ e ‘posto’, existe uma diferença entre o primeiro
e o segundo ‘o’, devido à natureza tônica do primeiro, mas não do segundo,
realizado como [ʊ] (um pouco mais alto, frouxo e menos posterior que [o]).
Isso acontece porque a posição do segundo ‘o’ logo após a sílaba tônica da
palavra (sua porção mais “forte”) “enfraquece” sua pronúncia. Esses efeitos
fonéticos da realização do ‘o’ não lhe tiram o status de fonema: /o/ é capaz
de distinguir os pares mínimos ‘porto ~ parto’, ‘porto ~ porta’ etc. Ademais,
nenhum falante percebe facilmente a diferença fonética entre [o] e [ʊ], não só
por ela ser efetivamente pequena, mas sobretudo por existir, na mente dele,
o fonema /o/, que tem o efeito, na percepção dos sons, de deixar em segundo
plano a diferença concreta entre [o] e [ʊ].
De fato, frente à estabilidade dos fonemas na mente dos falantes de uma lín-
gua, os fones “flutuam”, não só, por exemplo, de dialeto para dialeto (cf. a di-
ferença entre as pronúncias ‘pr[o]blema’ e ‘pr[ɔ]blema’, ‘b[e]leza’ e ‘b[ɛ]leza’,
‘m[e]nino’ e ‘m[i]nino’ etc.), mas também dentro de um mesmo idioleto (do
grego ídios “privado, próprio” + légein “falar”), ou seja, a “língua” de um mes-
mo indivíduo. Nenhum falante pronuncia sempre da mesma idêntica maneira
os fonemas da sua língua, mas sim, todos os falantes dessa língua compar-
tilham as mesmas representações abstratas desses sons, que guiam tanto a
produção dos fones, quanto sua percepção (‘m[i]nino’ não é percebida como
palavra de significado diferente de ‘m[e]nino’, porque tanto [i] como [e] nessa
palavra correspondem, na mente de um falante de português brasileiro, ao
mesmo fonema /e/).
@negação pas (linguística diacrônica vs. sincrônica)

Tome-se como exemplo a história da evolução da negação pas, “não”, em fran-
cês, esquematizada abaixo:
(1) Je ne marche pas

Eu neg ando passo
‘Eu não ando (nem um) passo’ = ‘Eu não ando’
(2) Je ne veux/sais/mange/crois pas

Eu neg1 quero/sei/como/creio neg2
‘Eu não quero/sei/como/creio nem um passo’ = ‘Eu não quero/sei/como/creio’
(3) Je mange pas

Eu como neg
‘Eu não como’
Giulia Bossaglia 25
Nos três exemplos acima, são esquematizados os três estágios de evolução
(o termo técnico para esse processo, em linguística, é gramaticalização) da
negação pas na língua francesa. A palavra pas, antes de se transformar em
negação, significava apenas “passo” em francês — de fato, ainda existe com
este significado (faire un faux pas “dar um passo em falso”). Com este sig-
nificado específico, pas era utilizado com verbos que indicam movimento
humano, como marcher “andar”. Em casos como (1), pas era utilizado con-
comitantemente com a negação ne, e, por seu significado indicar uma enti-
dade de pequena dimensão, com o tempo se perdeu a conotação específica
de “espaço percorrido cada vez que se estende ou se põe um pé adiante do
outro”, e pas foi reinterpretado como simples reforço da negação ne: ‘nem
um passo’ = ‘nem um pouco’. No italiano, aconteceu o mesmo, mas com ou-
tra palavra que indica algo pequeno, a palavra mica “migalha” (ou brisa,
“migalha” também, em algumas variedades regionais do Norte): Non hai
mica capito “você não entendeu” (< “você não entendeu nem uma migalha”,
“você não entendeu nada”). Perdendo-se a especificidade semântica da pa-
lavra pas, ela começou a ser utilizada como reforço da negação ne também
quando o verbo não indicava o movimento humano, como em (2). De fato,
nesse segundo estágio, pas não é reforço da negação, mas parte dela: em
vez de ficar antes do verbo, a negação em francês se “divide” em uma parte
anterior e outra posterior ao verbo — em português brasileiro, existe tam-
bém esse uso “duplo” da negação (isto eu não faço não). No francês falado
contemporâneo, por fim, o valor de negação pode ser codificado por pas
apenas, como mostra o exemplo (3) (cf. português brasileiro faço não). Essa
breve descrição da história da negação pas em francês é um exemplo de
olhar diacrônico sobre o sistema linguístico: ao longo do tempo, acontece-
ram algumas mudanças que levaram o sistema do francês contemporâneo
a ter uma nova unidade (uma nova peça de xadrez) — a negação pas. As
mudanças afetaram uma configuração do sistema anterior, em que pas não
era negação.
Na perspectiva sincrônica, ao contrário, o linguista analisaria a negação pas
como um elemento do sistema do francês em oposição a todos os outros ele-
mentos presentes em tal sistema em uma determinada época, mas se fosse
olhar para outro ponto do tempo, por exemplo anterior à época em que pas
se gramaticalizou como negação, poderia achar outro sistema do francês, no
qual a negação pas não existe, sendo, dentro de tal sistema, um outro tipo de
elemento (um substantivo).

@relações sintagmáticas e paradigmáticas
Relações entre signos

Os signos são os elementos que implementam, através de suas relações recí-
procas, a estrutura do sistema linguístico.
Para entender melhor a natureza de tais relações, tome-se como exemplo
a frase O carteiro entrega a encomenda. Nela, cada elemento possui uma
ligação específica com os outros que aparecem dentro da frase: o e carteiro
manifestam concordância de gênero gramatical e número, assim como a
e encomenda; o verbo entrega está flexionado na 3ª pessoa singular, con-
cordando com seu sujeito, que também é flexionado no número singular
etc. Trata-se, portanto, de relações que cada elemento tem com os outros
elementos presentes em um enunciado. Por essa razão, são chamadas de
relações “em presença” ou sintagmáticas (do grego sýn “junto com” + tás-
sein “ordenar, organizar”) e podem ser representadas no eixo horizontal,
no qual, inclusive, a todos os elementos é atribuída uma posição específica,
que não pode ser modificada (o asterisco no começo da frase indica sua
agramaticalidade):
o ----- carteiro ----- entrega ----- a ----- encomenda

* carteiro ----- o ----- a ----- entrega ----- encomenda
Relações sintagmáticas
As relações sintagmáticas não são as únicas que existem entre os signos.

Os elementos presentes na frase acima estabelecem relações de outro tipo
com elementos que estão ausentes dessa frase — trata-se das relações que
Saussure chama de “em ausência” ou associativas (ou, com um termo in-
troduzido posteriormente e mais consolidado na tradição, paradigmáticas,
do grego para “do lado” + déiknunai “mostrar”). As relações paradigmáti-
cas são relações de substituição: na frase acima, pode-se substituir o por
um, este, aquele ou os, uns etc.; carteiro por homem, indivíduo, professor
ou ainda carteiros, homens, mulheres etc.; entrega por dá, perde, quebra,
entregam, entregou etc. As substituições possíveis não são aleatórias, mas
têm a ver com elementos associados entre si dentro de uma mesma classe
paradigmática — por serem relações “em ausência”, elas são representá-
veis no eixo vertical, e não no horizontal, onde se distribuem as relações
“em presença”:
Giulia Bossaglia 27
o carteiro entrega a encomenda
este homem dá esta coisa
aquele filho entregam aquela objeto
os mulher leva as presentes
uns professor rouba umas carta
a carteiros entregou o pacote
... ... ... ... ...
* come *o * carteiro * pessoa * fazer
* para * com * feliz * porque * para
Relações paradigmáticas ou associativas
Como se pode observar no quadro acima, as relações em ausência também

respondem a restrições ditadas pelas regras de cada sistema linguístico: ar-
tigos e demonstrativos, por exemplo, compartilham algumas propriedades
entre si — entrando assim dentro do “paradigma” dos determinantes —, mas
não com os verbos ou com as preposições (cf. a agramaticalidade de come ou
para, na primeira coluna), que pertencem a outros paradigmas.
Os elementos constitutivos do sistema linguístico adquirem um valor não só
em decorrência de seus significados específicos, mas também por suas rela-
ções com os outros elementos dentro do sistema. As relações sintagmáticas
funcionam na organização dos elementos quando combinados para a produ-
ção de enunciados. As relações paradigmáticas definem o valor dos signos
quanto a suas classes de pertencimento (por exemplo, nomes vs. verbos vs.
determinantes etc.) e quanto a seus significados específicos (cf. a diferença
entre entregar, dar e roubar).
As relações de oposição entre elementos distintos permeiam a concepção de
sistema linguístico também em níveis em que os elementos da estrutura são
“menores” que o signo. Os alofones [ɾ, r, ɻ, χ] estão em relação paradigmática
entre si para a realização do fonema /R/ (quando este se encontra em coda si-
lábica), ou seja, cada um pode substituir o outro na pronúncia da palavra ‘por-
to’ sem que o significado seja alterado, pois no sistema do português não exis-
te nenhuma oposição de valor entre [ɾ, r, ɻ, χ]. Por outro lado, a substituição de
[s] no lugar de um dos alofones levaria a uma mudança de significado, porque
existe oposição fonêmica entre /s/ e /R/ em português (porto ~ posto).
@Interface entre níveis

Frequentemente, fenômenos linguísticos pertencentes a determinado nível
podem influenciar elementos em outros — trata-se, portanto, de fenômenos

de interface. Em latim, os substantivos eram flexionados por gênero, número
(como em português) e caso (ou seja, função sintática: sujeito, objeto direto,
objeto indireto etc.) da palavra dentro da frase: -us e -um, por exemplo, eram
respectivamente desinências de nominativo (i.e., sujeito) e acusativo (objeto
direto) masculino singular (por razões de espaço e de simplicidade, o exem-
plo envolve apenas esses dois casos, mas o latim possuía um sistema que di-
ferenciava desinências de acordo com cinco diferentes classes de declinação
e para seis casos distintos, com marcas específicas para os números singular
e plural, e os gêneros feminino, masculino e neutro). Independentemente da
posição que a palavra ocupasse dentro da frase, sua função sintática se manti-
nha clara e constante, devido à presença de tais marcas flexionais:
“Paulo ama Mário” (não vice-versa) “Mário ama Paulo” (não vice-versa)
Paulus amat Marium. Marius amat Paulum.
Marium amat Paulus. Paulum amat Marius.
Amat Marium Paulus. Amat Paulum Marius.
Amat Paulus Marium. Amat Marius Paulum.
Paulus Marium amat. Marius Paulum amat.
Marium Paulus amat Paulum Marius amat.
No latim tardio, [s] e [m] em final de palavra já não eram pronunciados mais,
ou eram pronunciados de uma maneira muito enfraquecida. Devido a esse
fato, que afetava o nível fonético-fonológico, criou-se ambiguidade na distin-
ção das desinências de caso: Paulus amat Marium virava Paulu amat Mariu (e
todas as respectivas alternativas de posição), de maneira que não seria possí-
vel distinguir sujeito e objeto direto na frase. Uma mudança no nível fonético-
-fonológico havia transformado, portanto, a morfologia da língua, que já não
codificava de maneira clara a categoria flexional de caso. De fato, foi assim que
essa categoria flexional se perdeu na transição do latim para as línguas româ-
nicas, que retêm marcas morfológicas de caso apenas nos pronomes pessoais
(cf. eu sujeito, me objeto direto etc.). A perda das marcas morfológicas de caso
fez com que já não fosse possível entender “se era o Paulo que amava o Mário
ou vice-versa”, ou seja, as funções sintáticas das palavras. Portanto, as línguas
românicas tiveram que desenvolver outra estratégia para desambiguar essas
funções, através da fixação de uma ordem sintática básica de tipo svo (Sujeito
– Verbo – Objeto): assim, o sujeito é colocado como regra antes do verbo, e o
objeto direto depois (ordens diferentes desta requerem realizações prosódi-
cas específicas); consequentemente, a interpretação default (i.e., automática)
Giulia Bossaglia 29
de Paulo ama Mário é que Paulo é o sujeito da frase — para dizer que é o Mário
que ama Paulo, é preciso alterar a ordem dos nomes na frase. Assim, algo que
afetou o nível fonético-fonológico de uma língua chegou a ter consequências
no nível sintático de suas línguas filhas, passando por modificações no nível
morfológico.
A mudança que levou à perda do sistema latino de marcação morfológica de
caso nas línguas românicas, como se viu, pode ser descrita como algo que
aconteceu inteiramente devido a dinâmicas de mudança dentro do sistema
linguístico, em diferentes níveis. Contudo, ficar em uma perspectiva interna
não dá conta de explicar as razões de tal mudança. Em outros termos, dizer
que a mudança aconteceu internamente ao sistema corresponde a uma abs-
tração, que separa as realizações concretas das regras do sistema (a perda de
[s] e [m] final foi algo que aconteceu na pronúncia dos falantes de latim tardio,
ou seja, aconteceu fora do sistema, fora da langue).

CAPÍTULO
3
A linguística
histórico-comparada
@ sobre opção de reconstruir um protofonema

diferente de todos os fonemas atestados
Nem sempre reconstruir um protofonema diferente de dois fonemas ates-
tados é a opção a ser descartada. Por exemplo, os fonemas a e i em grego
antigo e latim correspondem ora a a, ora a i no sânscrito: gre.ant. ágo, lat.
ago, sscr. ájami “conduzir”; gre.ant. dís, lat. bis, sscr. dvís “dois”; mas gre.ant.
patér, lat. pater, sscr. pitár. Neste caso, os protofonemas *a e *i são recons-
truídos para os cognatos que manifestam todos as mesmas vogais, e outro
protofonema vocálico *ə2 para os casos em que grego e latim possuem a, e
sscr. i (*a > a, *i > i, *ə2> a, i).
@grupos da famílias indo-europeia

A família indo-europeia é composta por nove grupos que possuem línguas
vivas atualmente (itálico, celta, germânico, albanês, helênico, eslavo, báltico,
armênio, indo-iraniano), mais dois grupos (anatólico e tocariano) formados
apenas por línguas extintas.
O mapa abaixo mostra a distribuição geográfica atual dos grupos de línguas
indo-europeias vivas e há dois símbolos que indicam as regiões onde exis-
tiram as línguas dos dois grupos extintos. Depois, fornecem-se informações
muito sucintas sobre esses diferentes grupos da família.
Giulia Bossaglia 31
Grupo itálico
As línguas extintas desse grupo eram todas antigas línguas faladas na Penín-
sula Italiana (por essa razão, o nome do grupo); entre elas, algumas das prin-
cipais foram o osco-umbro, o falisco e o latim. As línguas itálicas vivas hoje em
dia são todas filhas do latim: português, espanhol, catalão, francês, provençal,
italiano, romanche (ou ladino), sardo, romeno, entre outras, são conhecidas
como línguas neolatinas ou românicas.
Grupo céltico
Este grupo conta, hoje em dia, com poucas línguas faladas na Irlanda, Escócia,
Gales e, na França, na região da Bretanha: irlandês, manês (falado na ilha de
Man), gaélico escocês, bretão, córnico e gaulês. Antigamente, línguas desse
subgrupo da família eram faladas em uma região da Europa que se estendia
da Península Ibérica até a hodierna Turquia.

Grupo germânico
As línguas vivas deste grupo compreendem inglês, alemão, holandês, dinamar-
quês, sueco, norueguês, islandês, entre outras. Fora da Europa, uma das línguas
germânicas mais notáveis é o afrikaans, língua que se desenvolveu na África do
Sul a partir de um dialeto do holandês, que chegou lá entre os sécs. XVII-XVIII
com um grupo de colonos calvinistas conhecidos como bôeres.
Muitas línguas antigas desse grupo deixaram atestações: as mais antigas são as
do gótico, língua falada pelos Godos entre os sécs. V e VIII na Europa oriental
(entre Romênia e Turquia, aproximadamente), que nos chegaram através de uma
famosa tradução da Bíblia feita por um bispo de nome Wúlfila no V séc.
Grupos albanês, helênico, armênio

Albanês, grego e armênio são três línguas isoladas dentro da família indo-eu-
ropeia, ou seja, constituem grupo sozinhas, sem terem “línguas irmãs” (aten-
ção: uma língua isolada dentro de uma família não deixa de ter relações de
parentesco com as demais da família, diferentemente das línguas isoladas
stricto sensu, como o basco, para as quais não é comprovada nenhuma relação
genética com outras línguas).
Grupo eslavo
O grande grupo eslavo compreende as línguas balcânicas esloveno, croata, sér-
vio, bósnio, montenegrino, macedônio, búlgaro e, da Europa central até a Russia,
o tcheco, eslovaco, polonês, bielo-russo, ucraniano, russo. A língua eslava mais
antiga é o antigo eslavo eclesiástico, língua literária atestada a partir do séc. X.
Grupo báltico
Lituano e letão são as línguas bálticas faladas hoje em dia. Devido a razões
de contato, as línguas desse grupo apresentam muitas afinidades com as do
grupo eslavo. Não há atestações de línguas mais antigas.
Grupo indo-iraniano
Este grande grupo da família pode ser dividido em três subgrupos: indo-ário,
iraniano e nuristano (este último, muito pequeno). Pertencem ao grupo indo-
-ário o híndi, o bengali, o romani (línguas dos ciganos, faladas em muitos paí-
Giulia Bossaglia 33
ses europeus, com ênfase na área balcânica), entre muitas outras. O sânscrito
é a língua mais antiga do subgrupo indo-ário. O subgrupo iraniano é o mais
ocidental, e compreende o farsi (persa moderno), o curdo, o osseto, entre ou-
tras línguas. A mais antiga língua do subgrupo iraniano é o avéstico ou zend,
língua dos textos sagrados da religião zoroastriana (o Avesta). As três línguas
nuristanas vivas hoje em dia são faladas no atual Afeganistão.
Grupo anatólico
O nome do grupo deriva de Anatólia, antigo nome da Turquia, a região onde
antigamente eram faladas estas línguas indo-europeias. Entre elas, a principal
é o hitita, língua da importante civilização que viveu entre II e I milênio aEC, e
que foi decifrado só no começo do séc. XX.
Grupo tocariano
No começo do século XX, foram descobertos documentos budistas no Turques-
tão chinês (ou Xinjang), atestando duas línguas irmãs conhecidas como tocá-
rio A e tocário B e reconhecidas depois como indo-europeias. O tocário, língua
indo-europeia mais oriental, apresenta características em comum com muitas
línguas ocidentais da família (grego, latim, línguas germânicas, hitita) — isto
teve consequências muito importantes para o reconhecimento de traços lin-
guísticos mais arcaicos (por isso, conservados nas periferias ocidental e orien-
tal) em oposição a traços inovadores achados em línguas centrais da família.
@mudança vs. analogia

A mudança é algo inerente a todas as línguas naturais, em todos os níveis de
análise linguística. Às vezes, as mudanças sofridas por uma língua são tão pro-
fundas que levam à formação de novas línguas: de variedades diferentes do
latim falado em diversas regiões do antigo império romano do Ocidente de-
senvolveram-se as línguas românicas, por exemplo.
Há muitos e diversos mecanismos que regulam a forma como as línguas mu-
dam, e, ainda, as mudanças que afetam um nível de análise podem ter conse-
quências em outros — é o caso das mudanças fonéticas que levaram o latim
vulgar a perder, progressivamente, o sistema de marcação morfológica de
caso (@interface entre níveis).

Uma força que age sobre as línguas levando-as a mudar é o fenômeno conhe-
cido como “analogia”. As mudanças que acontecem por analogia são fruto da
influência de algum outro elemento dentro do sistema, que age como “mode-
lo”, e que é imitado. Geralmente, os elementos que agem como modelo para fe-
nômenos analógicos pertencem a paradigmas regulares, mais simples e mais
frequentes, logo, mais disponíveis na mente dos falantes.
O pretérito imperfeito, no italiano antigo, possuía, na 1ª pessoa singular, uma
desinência em -a, sendo formalmente idêntico à forma de 3ª singular (como
acontece em português): ita. ant. amava “eu/ele amava”, aveva “eu/ele tinha”
etc. A partir do século XV, a desinência de 1ª pessoa singular foi progressiva-
mente mudada para -o, com a resultante oposição morfológica entre 1ª e 3ª
pessoa: amavo “eu amava” ~ amava “ele amava”, avevo “eu tinha” ~ aveva “ele
tinha”. Essa mudança foi fruto de um processo analógico, e o “modelo” foi a opo-
sição entre as desinências de 1ª (-o) e 3ª (-a) pessoa singular no paradigma do
presente indicativo: amo “eu amo” ~ ama “ele ama”, ho “eu tenho” ~ ha “ele tem”.
Processos analógicos estão na base de alguns “erros” que os falantes cometem.
Em fase de aquisição da linguagem, é comum as crianças produzirem formas
erradas criadas com base em modelos muito frequentes no sistema linguís-
tico: plurais como cãos por “cães” e limãos por “limões” derivam da sobrege-
neralização do -s dos paradigmas regulares; crianças que estão adquirindo o
inglês produzem formas de pretérito como he goed “ele foi” (forma correta: he
went, pretérito do verbo to go), pois nos verbos regulares –(e)d é o sufixo de
pretérito (to love “amar”, pretérito he loved “ele amou”). Não só as crianças em
fase de aquisição da linguagem produzem formas desviantes devido a fatores
analógicos: pense-se como, no português falado (até no português falado cul-
to), é cada vez mais comum o uso do infinitivo flexionado no lugar do futuro do
subjuntivo, em construções como se eu ver isso (forma correta: se eu vir isso),
se ele pôr isso (forma correta: se ele puser isso). Esse erro é fruto da influência
que os verbos dos paradigmas regulares, que possuem formas idênticas para
infinitivo flexionado e futuro do subjuntivo, exercitam na mente dos falantes,
que tendem então a “regularizar” os paradigmas irregulares — o verbo ver,
assim como ser, estar, querer, poder, fazer, etc. possui alomorfismo do radical
nos dois modos: ver ~ vir, estar ~ estiver, querer ~ quiser, poder ~ puder, fazer
~ fizer etc. Nada impede que “erros” como esses um dia se tornem uma nova
regra do português, ou de uma língua dele derivada — no inglês contemporâ-
neo, por exemplo, afirmou-se o plural regular em -s para palavras como cow
“vaca” e eye “olho”, que no inglês antigo pertenciam a declinações cujo sufixo
Giulia Bossaglia 35
de plural continha uma consoante nasal (plurais originais: kine, eyen/eyne vs.
novos plurais “regularizados” cows, eyes).
A analogia, portanto, é um dos mecanismos que governam a mudança linguís-
tica. O linguista americano Edgar Howard Sturtevant (1875-1952) dá o nome
a um paradoxo muito famoso na linguística histórica, o “paradoxo de Sturte-
vant”, e que diz respeito à mudança e à analogia. Ele afirma que a mudança fo-
nética é regular, mas produz irregularidades, enquanto a analogia é irregular,
mas produz regularidades.
Assumir que a mudança fonética é regular significa assumir que ela ocorre em
todas as palavras que apresentam o contexto fonológico que desencadeia essa
mudança. Pode-se observar isso no paradigma do presente do indicativo do
verbo negare “negar” no italiano antigo:
Italiano antigo
1ªsg niego [ˈnjego]
2ªsg nieghi [ˈnjegi]
3ªsg niega [ˈnjega]
1ªpl neghiamo [neˈgjamo]
2ªpl negate [neˈgate]
3ªpl niegano [ˈnjegano]
O paradigma mostra alomorfismo no radical: na 1ª, 2ª, 3ª pessoa singular e

na 3ª plural o radical é nieg-, enquanto na 1ª e 2ª pessoa plural é neg-. Esta
irregularidade no presente do indicativo do verbo negare se produziu devido
à ocorrência regular da mudança fonética conhecida como “ditongação româ-
nica”: um originário e breve latino, quando em sílaba aberta e tônica, virou di-
tongo (ie) em italiano. Assim, na 1ª e 2ª plural não se dá a ditongação, porque
o e não está em sílaba tônica, como mostra a transcrição fonética. A mudança
fonética se aplicou regularmente em todos os contextos em que havia as con-
dições que a condicionavam, e não ocorreu onde não havia, deixando, assim, o
paradigma mais irregular.
No italiano contemporâneo, contudo, esse paradigma foi regularizado através
de um processo analógico:
Italiano contemporâneo
1ªsg nego [ˈnego]
2ªsg neghi [ˈnegi]

3ªsg nega [ˈnega]
1ªpl neghiamo [neˈgjamo]
2ªpl negate [neˈgate]
3ªpl negano [ˈnegano]
O modelo para a extensão do radical sem ditongação foram outros paradig-

mas em diferentes modos e tempos do mesmo verbo, como o infinitivo negare,
o particípio negato, o gerúndio negando, o pretérito perfeito (negai, negasti,
negò, negammo, negaste, negarono: o mesmo alomorfe em todas as seis pes-
soas verbais) etc., que não apresentam o ditongo no radical. A analogia, por-
tanto, produziu uma regularidade, eliminando o alomorfismo do radical no
presente indicativo do verbo negare, e deixando todos os paradigmas, consis-
tentemente, com o radical neg- apenas.
Contudo, no italiano contemporâneo existem casos como aquele do verbo se-
dere “sentar-se”, que manifesta o alomorfismo do radical provocado pela mes-
ma mudança que o criou no paradigma do verbo negare do italiano antigo:
Italiano contemporâneo
1ªsg siedo [ˈsjedo]
2ªsg siedi [ˈsjedi]
3ªsg siede [ˈsjede]
1ªpl sediamo [seˈdjamo]
2ªpl sedete [seˈdete]
3ªpl siedono [ˈsjedono]
No paradigma acima, observa-se a ocorrência regular da ditongação, e a con-

sequente irregularidade no presente indicativo do verbo sedere, que apre-
senta os alomorfes sed- e sied- para o morfema lexical. Como negare, o verbo
sedere nos demais paradigmas modotemporais apresenta majoritariamente o
alomorfe sed-, entretanto, o processo analógico não foi desencadeado.
Este pequeno exemplo do italiano explica bem o paradoxo de Sturtevant. A
mudança fonética é regular, pois ocorre sistematicamente em todas as pala-
vras que apresentam o contexto fonológico que a condiciona; contudo, após
uma mudança fonética, os paradigmas de uma língua podem se tornar irregu-
lares. A analogia, por sua vez, apesar de produzir regularidade nos paradig-
mas, é irregular, pois não ocorre sistematicamente.
Giulia Bossaglia 37
@ Lei das palatais
A lei das palatais explicou a aparente não correspondência fonética entre os siste-
mas vocálicos do antigo grego e do latim, compostos por cinco vogais breves (a, e,
i, o, u), em oposição àquele do sânscrito, composto por apenas três (a, i, u):
Sânscrito Grego ant. Latim

a a a
- e e
i i i
- o o
u u u
Tal discrepância era tradicionalmente explicada pela suposta perfeição e

maior antiguidade do sânscrito, ao refletir, em seu sistema trivocálico, outros
níveis em que seriam observadas as estruturas tripartidas no indo-europeu
(três gêneros gramaticais, três números, três tempos etc.). Contudo, mesmo
assumindo o preconceito de que o sânscrito refletisse o vocalismo mais antigo
e, portanto, mais próximo à protolíngua, não era possível achar padrões de
correspondências fonéticas coerentes que pudessem explicar o desenvolvi-
mento das duas novas vogais do grego e do latim.
O avanço coincidiu com a ampliação de escopo da análise dos dados compara-
tivos, ou seja, a observação não apenas dessas vogais, mas delas junto com as
oclusivas velares do latim e do grego, que mostravam corresponder, em sâns-
crito, ora a uma oclusiva velar, ora a uma africada palatal ([tʃ ], indicada por
convenção com c). Observando juntos esses dois fenômenos aparentemente
sem relação recíproca, obtém-se um novo quadro de correspondências:
Sânscrito Grego ant. Latim

ka ka ka
ca ke ke
ci ki ki
ka ko ko
ku ku ku
Nestas novas correspondências, vê-se que o sscr. apresenta a consoante palatal

na frente do a que corresponde a gre./lat. e, e na frente de i (que corresponde
também a i nas outras línguas). Nos demais casos, o sscr. apresenta uma corres-
pondência quase perfeita com grego e latim: a única diferença é sscr. ka : gre./

lat. ko. Em geral, observam-se as correspondências vocálicas: a : a, a: e, i : i, a : o,
u: u. Cruzando essas correspondências com a alternância entre k e c no sscr., foi
possível reconstruir o percurso que levou ao sistema trivocálico do sscr.:
Protoindo- palatalização e, o > a Sânscrito

-iraniano
*ka *ka *ka ka
*ke *ce *ca ca
*ki *ci *ci ci
*ko *ko *ka ka
*ku *ku *ku ku
Reconstrói-se para a protolíngua do grupo indo-iraniano (ao qual pertence o

sânscrito) um sistema de cinco vogais breves, igual ao do grego e do latim — o
estágio mais antigo é, portanto, um estágio pentavocálico, mantido em grego e
latim. As vogais mais anteriores e e i condicionaram a palatalização da oclusi-
va velar (processo de assimilação: a consoante velar, que é fonema posterior, é
articulada mais anteriormente, no palato duro, devido ao efeito de vogais an-
teriores). Uma segunda mudança aconteceu depois da palatalização: as vogais
e e o da protolíngua se fundiram com a, e *ce e *ko passaram, respectivamente,
a ca e ka no sânscrito. A lei das palatais demonstrou, em primeiro lugar, que o
sânscrito não era a língua mais perfeita da família e que seu sistema trivocá-
lico era fruto de uma inovação a partir de um anterior pentavocálico — prova
definitiva de que o sânscrito não era mais antigo que o grego e o latim. Além
disso, foi um exemplo da importância, no nível metodológico, de fundar qual-
quer generalização apenas nos dados comparativos, e que, ainda, é desejável
que o olhar do linguista não fique limitado a um fenômeno específico (neste
caso, o sistema vocálico), mas amplie seu escopo para outros domínios (as
consoantes) que podem fornecer novas soluções para a reconstrução. A lei
das palatais mostra também a importância de saber reconstruir as mudanças
linguísticas na ordem cronológica certa: hipotetizando que a convergência de
e e o para a tivesse acontecido antes da palatalização, o sscr. apresentaria *ka,
*ka, *ci, *ka, *ku, o que não é verificado nos dados.
@Lei de Verner
No quadro abaixo, mostra-se como a lei de Verner explica a aparente discre-
pância nos reflexos de pie *t no gótico, que, em vez de serem ambos th ([θ]),
como a lei de Grimm prevê, são ora th, ora d:
Giulia Bossaglia 39
pie Protogermânico Retração do acento th > d Gótico
para a 1ª sílaba
*bhrāt́ er *brāt́ her não não bróthar
*pə2tḗr *fəthḗr sim sim fádar
No gót. bróthar, que procede do protogerm. *brā́ ther < pie *bhrā́ ter, o acento
tônico da palavra se encontrava na primeira sílaba já no pie e no protogermâ-
nico; portanto, th, o reflexo fricativo de *t, se manteve. Já em palavras como
gót. fádar, em vez de th há d [d]: no pie, a palavra é reconstruída com acento
na segunda sílaba, *pə2tḗr. No protogermânico, reconstrói-se uma aplicação
regular da lei de Grimm, que leva ao esperado th: *fəthḗr; em seguida, ocorreu
a retração do acento para a primeira sílaba, que acabou alterando a fricativa
th para d: fádar. A lei de Verner, portanto, conseguiu “consertar” os erros que
Grimm, no início do século, tinha cometido devido ao rudimentarismo teórico
e metodológico da disciplina àquela altura.

CAPÍTULO
4
A tipologia linguística
@ história da tipologia
Em 1660, era publicada a Grammaire générale et raisonnée (“Gramática geral e
razoada”), conhecida também simplesmente como “Gramática de Port-Royal”, do
nome do mosteiro de Port-Royal-des-Champs (não longe de Paris) ao qual per-
tenciam seus autores Claude Lancelot e Antoine Arnauld. Nesta obra, em que
se vê uma forte influência do racionalismo cartesiano, é possível encontrar as
raízes mais antigas da reflexão sobre universais linguísticos, tão importantes
em âmbito tipológico: de fato, a Gramática de Port-Royal é uma gramática da
língua francesa que tem como objetivo mais geral explicar “as razões daquilo
que é comum a todas as línguas”. As línguas, de acordo com a obra, são meios
para “explicar o pensamento através de signos”, e o pensamento (a “razão”) é
uma faculdade universal do homem. Logo, devem existir princípios universais
da linguagem, da qual as línguas são apenas realizações particulares. Assim,
na Gramática de Port-Royal, a língua francesa e seus princípios são tomados
como ponto de partida para deduzir os princípios da linguagem em geral (e
de todas as línguas). Essa abordagem dedutiva ao estudo das propriedades
universais da linguagem é assimilável à noção de gramática universal introdu-
zida por Noam Chomsky três séculos mais tarde, e é muito distante, do ponto
de vista teórico e metodológico, da tipologia moderna. Contudo, é significativo
individualizar, já na Gramática de Port-Royal, o interesse por princípios e res-
trições universais da linguagem humana.
O interesse tipológico recebeu um forte impulso ao longo dos sécs. XVII-
-XIX, graças à chamada “linguística missionária”, que se desenvolveu pelo
encontro de missionários europeus com línguas muito “exóticas”, surgin-
Giulia Bossaglia 41
do a exigência de conciliar a ideia de uma substancial unidade das línguas
como expressões da mente humana com a grandíssima variação interlin-
guística existente. Uma das respostas oriundas dessa exigência foi aquela
do alemão Wilhelm von Humboldt (1767-1835) que, em sua obra Über die
Verschiedenheit des menschlichen Sprachbaus und seinen Einfluss auf die geis-
tige Entwicklung des Menschengeschlechts “Sobre a diferença na estrutura
linguística humana e sua influência sobre o desenvolvimento intelectual da
humanidade” (publicada em 1836), defendia que as estruturas das línguas
refletem o espírito de suas comunidades de falantes, e que, portanto, a di-
versidade linguística fosse um espelho das diversidades intelectuais e es-
pirituais das culturas humanas. Longe de ser uma abordagem objetiva ao
estudo das línguas, é sem dúvida importante, no pensamento humboldtiano,
a ideia de que é necessário conhecer as particularidades das demais línguas
humanas para chegar aos princípios mais gerais da linguagem, que é organi-
zada de acordo com regras específicas.
Na primeira metade do século XIX, enquanto se desenvolviam os estudos
comparativistas na Europa, surgiram também as primeiras classificações das
línguas em “tipos”, com base em critérios morfológicos: os irmãos Friedrich
(1772-1829) e August Schlegel (1767-1845) classificavam as línguas em or-
gânicas, com estrutura (línguas indo-europeias) e não orgânicas (todas as ou-
tras). Essa classificação identificava línguas “sem estrutura” como o chinês,
línguas “com afixos” como o turco, e línguas “com flexão” como latim e grego
(“sintéticas”) ou o francês (“analítica”). Nas classificações em tipos morfológi-
cos da primeira metade do século XIX — Franz Bopp e Jacob Grimm também
se dedicaram a esse tipo de estudo —, havia uma forte relação entre critérios
genéticos e tipológicos: os tipos, que eram concebidos como imutáveis ao lon-
go da diacronia, eram associados a famílias linguísticas específicas — não sur-
preende que à família linguística indo-europeia fosse atribuído o tipo “mais
perfeito”, de acordo com certo ideologismo que caracterizou o surgimento dos
estudos linguísticos na Europa da época, e que se refletiram nessas classifica-
ções das línguas de natureza avaliativa.
O verdadeiro precursor da tipologia moderna é para todos os efeitos o alemão
Georg von Gabelentz (1840-1893). Sinólogo, fortemente influenciado pelos
desenvolvimentos das ciências naturais que caracterizaram a segunda meta-
de do século XIX (como muitos contemporâneos dele: pense-se em August
Schleicher, por exemplo), Gabelentz publicava, em 1891, a obra Die Sprach-
wissenschaft “Linguística”, da qual é particularmente programático e famoso

o seguinte trecho, não apenas porque nele se encontra, pela primeira vez, a
denominação “tipologia” para a disciplina:
Mas que conquista seria se pudéssemos confrontar uma língua e dizer-lhe

“Você tem tais e tais propriedades específicas e portanto tais e tais ulteriores
propriedades e tal e tal caráter geral” — se pudéssemos, como atrevidos bo-
tânicos têm de fato tentado, construir a tília inteira a partir da sua folha. Se se
pudesse dar o nome a uma criança ainda não nascida, eu escolheria tipologia*
(GABELENTZ, 2016 [1891], p. 510).
Como se observa pela analogia adotada, Gabelentz se inspirava no modelo cien-

tífico da botânica pós-darwinista, que visava classificações holísticas (do grego
hólos “tudo”), ou seja, que descrevessem as plantas em sua totalidade, e não
apenas em partes específicas: o objetivo da tipologia, de acordo com Gabelentz,
era “construir a tília inteira a partir da sua folha”. Gabelentz foi o primeiro,
ainda, a observar a possível existência de implicações entre propriedades das
línguas, de acordo com os princípios da correlação das partes — há relações
específicas entre as partes de um todo — e da subordinação dos caracteres —
as relações entre partes e propriedades são de natureza hierárquica: algumas
influenciam outras —, elaborados e aplicados pelo paleontólogo George Cuvier
(1769-1832) no estudo de fósseis. Assim, emergia, na obra de Gabelentz, a con-
cepção preditiva da tipologia linguística: a partir da observação de uma pro-
priedade de uma língua, deveria ser possível prever outras que a caracterizam
(cf. as correlações de parâmetros sintáticos, ou os universais implicacionais).
Com Gabelentz acabou, ainda, a tipologia “avaliativa”, que havia caracterizado
as classificações em tipos morfológicos durante a primeira metade do século
XIX, e a concepção da imutabilidade dos tipos linguísticos ao longo do tempo.
O autor também reforçou a necessidade de refinar a metodologia da disciplina
e introduziu o uso de questionários linguísticos para a coleta de dados.
Na transição entre os sécs. XIX e XX, os estudos de Franz Boas (1858-1942,
etnoantropólogo), Edward Sapir (1884-1939) e Benjamin Lee Whorf (1897-
-1941) se focaram principalmente nas línguas ameríndias, revelando a neces-
sidade de repensar as categorias da tradição linguística ocidental, construída
a partir das línguas indo-europeias, e ampliando os horizontes da compara-
ção interlinguística.
E é a partir de extensos trabalhos de comparação interlinguística que o ame-
ricano Joseph Greenberg (1915-2001) fundou a tipologia linguística moder-
na. Greenberg foi um dos linguistas mais controversos da história da linguís-
Giulia Bossaglia 43
tica. Na esteira dos estudos que, a partir do começo do séc. XX, buscaram
comprovar a hipótese monogenética das línguas, Greenberg havia passado
décadas aplicando métodos de comparação massiva aos demais continentes,
chegando às classificações genéticas das línguas da África e das Américas e,
mais em geral, a um amplo (ainda que nem sempre necessariamente profun-
do) conhecimento de línguas muito diferentes entre si. Em 1963, era publi-
cado o ensaio Some universals of grammar with particular reference to the
order of meaningful elements “Alguns universais da gramática com particular
referência à ordem dos elementos significativos”. Nele, Greenberg formulava
45 universais linguísticos, a partir da análise de uma amostra de 30 línguas
selecionadas em todos os continentes (Europa: basco, sérvio, galês, norue-
guês, neogrego, italiano, finlandês; Ásia: turco, burushaski, hebraico, híndi,
kannada, japonês, tailandês, birmanês, malayo; África: iorubá, suaíli, fulani,
massai, songhai, nubiano, berbere; Oceania: maori, luritja; Américas: qué-
chua, chipcha, maia, zapoteco, guarani).
A partir da classificação das línguas da amostra com base na ordem de sujei-
to, verbo e objeto direto (os “elementos significativos”), Greenberg formu-
lou universais sintáticos e morfológicos, absolutos e implicacionais. Inde-
pendentemente da validade deles hoje em dia — algumas correlações entre
parâmetros sintáticos não são mais tidas como efetivas, por exemplo — e
do viés areal e genético da amostra utilizada — predominância de línguas
europeias e indo-europeias — foi graças a esta obra que a concepção de uni-
versal linguístico mudou do simples conceito de “propriedade obrigatória
em todas as línguas” para ponto de partida ao medir as diferenças entre as
línguas naturais.
A tipologia greenberguiana se configurou como uma disciplina de orientação
empírica, indutiva, requerendo, assim, extensos trabalhos de comparação in-
terlinguistíca antes da formulação das generalizações (de maneira comple-
tamente contrária, portanto, à abordagem dedutiva do gerativismo chomsk-
yano, que vinha se desenvolvendo nos mesmos anos). Os estudos tipológicos
atuais, que se beneficiam de avanços teóricos, metodológicos e até tecnológi-
cos posteriores a Greenberg, continuam, contudo, na esteira dessa abordagem
empírica e baseada nos dados que ele iniciou.
*Original: Aber welcher Gewinn wäre es auch, wenn wir einer Sprache auf den
Kopf zusagen dürften: Du hast das und das Einzelmerkmal, folglich hast du die
und die weiteren Eigenschaften und den und den Gesammtcharakter! — wenn
wir, wie es kühne Botaniker wohl versucht haben, aus dem Lindenblatte den

Lindenbaum construiren konnten. Dürfte man ein ungeborenes Kind taufen, ich
würde den Namen Typologie wählen.
Von der Gabelentz G. Die Sprachwissenschaft. Gunter Narr; 2016 [1891]. Disponível em: <http://
langsci-press.org/catalog/book/97>. Acesso em: 10 mar. 2020.
@ tipologia areal
1. Introdução
Por tipologia areal, entende-se o estudo de padrões linguísticos específicos de
determinadas “áreas linguísticas” — de alguma maneira, é algo híbrido entre
a tipologia e a linguística areal, resultando, de fato, em uma disciplina bastan-
te controversa.
A primeira definição de “área linguística” remete ao linguista russo Nikolay
Trubetzkoy (1890-1938), que, no final dos anos 1920, cunhou o termo Spra-
chbund (termo alemão que significa “liga linguística”). Uma Sprachbund ou
área/liga linguística (também “área de convergência”) é uma área geográfica
em que existem comunidades que falam línguas que não possuem relação ge-
nética muito próxima entre si (pertencem a famílias linguísticas diferentes ou
a grupos diferentes dentro de uma mesma família) e que, devido a razões de
contato, acabaram compartilhando um conjunto de traços tipológicos que as
diferenciam das línguas irmãs nas respectivas famílias e, em geral, daquelas
que não são faladas naquela área geográfica.
Uma longa série de tentativas de definir melhor os critérios necessários para
a definição de área linguística se sucederam até tempos bastante recentes (cf.
CAMPBELL, 2006 para uma discussão detalhada), levando apenas, na verda-
de, à constatação de que o conceito de Sprachbund é bastante controverso.
Antes de examinar alguns dos principais problemas, será ilustrada sintetica-
mente a Sprachbund balcânica.
2. Sprachbund balcânica
A liga linguística balcânica é uma das mais estudadas na literatura — foi a
partir da observação de fortes semelhanças entre as línguas balcânicas que
Trubetzkoy chegou a formular o próprio conceito de Sprachbund.
Os Balcãs, como área geográfica, apresentam uma forte fragmentação política.
O mapa abaixo mostra alguns dos países em que se falam línguas considera-
das parte da Sprachbund.
Giulia Bossaglia 45
O conjunto das línguas que têm sido incluídas na Sprachbund compreende
(VAUX, 2002):
a) albanês (indo-europeia; grupo albanês);
b) neogrego (indo-europeia; grupo helênico);
c) romani (indo-europeia; grupo iraniano);
d) arromeno, romeno e romeno meglesita (falado na Grécia setentrional e na
Macedônia), judeu-espanhol (indo-europeia; grupo itálico);
e) búlgaro, macedônio, servo-croata meridional (indo-europeia; grupo eslavo);
f) turco (altaica; grupo túrcico).
Estudiosos diferentes têm proposto conjuntos um pouco diferentes de lín-
guas, com base nos traços por elas compartilhados — por exemplo, alguns
excluem o turco, o romani ou outras línguas.
São muitos os traços que, na literatura, são associados à Sprachbund balcâni-
ca, ainda que com graus diferentes de segurança. A seguir ilustram-se alguns
dos principais:
a) presença de [ə] como vogal tônica (albanês, romeno, búlgaro, alguns dia-
letos do macedônio, servo-croata, alguns dialetos do romani, turco);
b) vocalismo de cinco vogais /i, e, a, o, u / sem contrastes de quantidade (vo-
gal longa vs. breve), abertura ou nasalidade;
c) redução do sistema de marcação de caso morfológico, através do sincretis-
mo entre genitivo e dativo (grego, albanês, romeno, búlgaro, macedônio):
isto significa que a expressão da posse (“casa do Pedro”) e do beneficiário
(“dei o livro ao Pedro”) são codificados, nestas línguas, através de uma
única forma;

d) futuro analítico formado por um auxiliar que corresponde a uma forma
reduzida (às vezes, invariável) do verbo “querer” (grego, albanês, romeno,
macedônio, búlgaro, servo-croata, romani): “quero fazer” = “farei, vou fa-
zer”, “quero ir” = “irei”, etc.;
e) artigo definido posposto (albanês, romeno, macedônio, búlgaro, servo-
-croata meridional): alb. gur “pedra” ~ guri “a pedra”, rom. fecior “rapaz” ~
feciorul “o rapaz”, búlg. voda “água” ~ vodata “a água” (tomic, 2006, p. 18);
f) perda do infinitivo, substituído por um complemento oracional de modo
finito (grego, macedônio, búlgaro, servo-croata, romani, albanês, romeno):
em vez de “quero fazer”, as línguas balcânicas usam formas como “quero
que faço”;
g) comparativo adjetival de tipo analítico (grego, albanês, romeno, búlgaro,
macedônio, romani, turco): formas analíticas como “mais grande”, “mais
bom” são utilizadas em vez de formas sintéticas “maior”, “melhor”;
h) empréstimos lexicais e de expressões idiomáticas: várias palavras compar-
tilhadas pelas línguas da Sprachbund não estão presentes em fases antigas
das mesmas, sugerindo que tenham sido introduzidas devido a contato e a
partir de fontes diferentes (muitas, do turco, mas outras línguas dentro da
área têm sido identificadas como fontes de alguns empréstimos).
Com base no número de traços compartilhados, alguns autores têm proposto
uma distinção entre membros mais centrais da Sprachbund (muitos traços
compartilhados), mais periféricos (poucos traços compartilhados), membros
marginais (pouquíssimos traços “balcânicos”), até o turco, que, de acordo com
alguns linguistas, teria apenas o papel de língua “doadora”, i.e., fonte de em-
préstimos lexicais:
i. membros centrais: macedônio, búlgaro, arromeno, romeno meglesita,
albanês;
ii. membros periféricos: romeno, neogrego, romani, servo-croata meridional;
iii. membros marginais: servo-croata padrão;
iv. língua “doadora”: turco.
Para comprovar a existência de uma área de convergência não é suficiente
a identificação de traços linguísticos compartilhados, mas é necessário (1)
provar que as línguas convergiram devido a contato e não a eventual rela-
ção genética; (2) provar que os traços desenvolvidos pelas línguas da área
sejam devidos a contato, e não a tendências tipológicas universais. Em outros
termos, é necessário comprovar a situação prolongada e intensa de contato
histórico-cultural que levou às mudanças nas línguas envolvidas.
Giulia Bossaglia 47
No caso da Sprachbund balcânica, esse contato é documentado desde a anti-
guidade, a partir do império romano do Oriente (cf. coesão/identidade cul-
tural em oposição ao do Ocidente) e, em seguida, com o império bizantino.
Um novo período de unificação cultural da área balcânica foi, a partir do séc.
XVII, o império otomano, que continuou mantendo a coesão da região, ainda
que culturalmente diferente (neste período se intensificou bastante, inclu-
sive, a influência lexical que o turco teve nas demais línguas). No estudo de
fenômenos areais, portanto, é sempre necessário examinar muitos fatores
extralinguísticos, não sendo suficiente a simples análise dos dados linguís-
ticos. São fatores deste tipo que favorecem ou bloqueiam os fenômenos de
empréstimo linguístico e, mais em geral, a transmissão de traços linguísticos
entre comunidades linguísticas diferentes. O contato, de fato, nem precisa ser
propriamente geográfico, sendo suficiente o contato cultural, fator que, em
tempos recentes, é impulsionado de maneira exponencial pelos novos meios
de comunicação — pense-se na quantidade de empréstimos lexicais do inglês
introduzidos no português, sem que houvesse contato geográfico com os EUA.
Algumas áreas linguísticas estudadas na literatura são a área linguística eu-
ropeia (conhecida como Standard Average European “Europeu médio padrão”
HASPELMATH, 1998; 2001), também conhecida como “área de Carlos Mag-
no”; a área báltica (DAHL; KOPTJEVSKAJA-TAMM, 2001); a área linguística
mesoamericana (CAMPBELL et al., 1986); a área linguística do litoral ameri-
cano norte-ocidental (LEER, 1991); a área etiópica (FERGUSON, 1970; TOSCO,
2000), entre várias outras.
3. Problemas
Como se antecipou, o conceito de Sprachbund, além de complexo, é bastante
controverso, e vários problemas relativos aos critérios a serem adotados para
a identificação de áreas linguísticas têm sido levantados.
Além de uma ou outra diferença, as muitas e diversas definições de Spra-
chbund envolvem, como critérios: (i) o número de línguas e/ou famílias; (ii) o
número de traços linguísticos; (iii) a definição dos limites da área geográfica
a ser considerada, entre outros problemas mais específicos (cf. CAMPBELL,
2006 para uma resenha detalhada de todos).
Com relação ao número de línguas, muitos autores propõem um mínimo de
três, argumentando que admitir como área linguística uma situação de con-

tato entre apenas duas corresponderia a reduzir o conceito de Sprachbund
a uma simples situação de contato entre línguas. Contudo, seria necessário,
para defender esse argumento, providenciar evidências das diferenças entre
fenômenos de contato entre duas vs. três línguas, evidências que até agora
não foram achadas ou apresentadas. Um número mínimo de famílias também
é proposto por alguns linguistas. Contudo, esse tipo de restrição não é com-
pletamente fundado: se é verdade que os traços compartilhados não devem
proceder de relação genética entre as línguas que os compartilham, também é
verdade que línguas com relação de parentesco entre si podem compartilhar
traços por contato também. O fato de famílias diferentes estarem presentes
dentro de uma Sprachbund simplesmente garantir um maior grau de segu-
rança em descartar a influência de fatores genéticos no compartilhamento de
traços, por si, não é um critério realmente crucial.
O número de traços linguísticos compartilhados pelas línguas de uma suposta
Sprachbund também é objeto de debate — alguns defendem que um único
traço é suficiente, outros que muitos. Apesar de um único traço compartilhado
ser, efetivamente, insuficiente (haveria áreas linguísticas em qualquer lugar!),
como se viu para as línguas e famílias, a definição de um número mínimo não
deixa de ser uma operação um tanto arbitrária, revelando quão problemático
é esse critério.
Arbitrário também é chegar a uma delimitação clara e precisa das fronteiras
geográficas da Sprachbund, pois os traços se transmitem por difusão, um
processo gradual. Diferentes autores propõem que essas fronteiras devem
corresponder a feixes de isoglossas (do grego iso “igual” + glóssa “língua”:
em linguística, são linhas imaginárias que unem pontos no espaço geográ-
fico em que são achados os mesmos traços linguísticos); entretanto, surge
o problema de como determinar quais isoglossas vão formar esses feixes,
e se é realmente necessário que as isoglossas formem feixes (ou seja, que
alguns traços sejam atestados juntos em todos os pontos da área, ou não),
para serem consideradas fronteiras da Sprachbund. Relacionada com este
problema é a distinção entre centro e periferia das áreas de convergência:
o centro corresponderia aos lugares em que as isoglossas formam feixes de
maneira mais compacta, e as periferias menos. Contudo, ao longo da diacro-
nia, novos centros irradiadores de traços podem surgir dentro de uma mes-
ma área geográfica/linguística/cultural, o que desafia bastante a ideia de
que possam ser determinados claramente (e em caráter definitivo) o centro
e a periferia da Sprachbund.
Giulia Bossaglia 49
Existem vários outros problemas relacionados com o conceito de Sprachbund
e que não serão aprofundados aqui. Como sugere Campbell (2006, p. 21), é
oportuno que os esforços direcionados à definição de área linguística sejam
melhor aproveitados para entender a história de empréstimos e outros fenô-
menos específicos de difusão linguística, sem insistir nas tentativas de recor-
tar Sprachbünde nos mapas.
CAMPBELL, L. (2006). Areal linguistics: A closer scrutiny. In: Linguistic Areas. London: Palgrave
Macmillan, p. 1-31.
____; KAUFMAN, T.; SMITH-STARK, T. C. (1986). Meso-America as a linguistic area. Language, p.
530-570.
DAHL, Ö.; KOPTJEVSKAJA-TAMM, M. (Eds.) (2001). The Circum-Baltic languages: typology and
contact (Vol. 54). Amsterdam-Philadelphia: John Benjamins Publishing.
FERGUSON, C. A. (1970). The Ethiopian language area. Journal of Ethiopian Studies, 8 (2), p.
67-80.
HASPELMATH, M. (1998). How young is standard average European. Language sciences, 20 (3),
p. 271-287.
____ (2001). The European linguistic area: Standard Average European. In: Language typology
and language universals, p. 1492-1510. Berlin: de Gruyter.
LEER, J. (1991). Evidence for a Northern Northwest Coast language area: Promiscuous number
marking and periphrastic possessive constructions in Haida, Eyak, and Aleut. In: Internatio-
nal journal of American linguistics, 57 (2), p. 158-193.
TOMIC, O. M. (2006). Balkan Sprachbund morpho-syntactic features (Vol. 67). Springer Science
& Business Media.
TOSCO, M. (2000). Is There an “Ethiopian Language Area”? In: Anthropological Linguistics, p.
329-365.
VAUX, B. (2002). There was and wasn’t a Balkan Sprachbund. Paper presented at AIEA, Würz-
burg. (https://www.academia.edu/181211/There_was_and_there_wasn_t_a_Balkan_Spra-
chbund; acesso em: 10 mar. 2020).
@WALS
O WALS Online — World Atlas of Language Structures Online “Atlas mundial
online das estruturas linguísticas” (https://wals.info/; a versão impressa foi
publicada em 2005) é fruto do trabalho do Max Planck Institute for Evolu-
tionary Anthropology “Instituto Max Planck de Antropologia Evolucionista”
(https://www.eva.mpg.de/index.html) de Leipzig, na Alemanha.
O WALS é uma extensa e articulada base de dados sobre propriedades estru-
turais das línguas naturais em todos os níveis de análise linguística. Os dados
foram coletados por um conjunto de 55 autores (listados na seção Authors, cf.
Figura 1), em pesquisas tipológicas independentes, cada uma focada na des-
crição de um traço específico.

Figura 1: Homepage do WALS Online.
Na Figura 1, realçou-se o menu do site, que compreende bases de dados dife-

rentes: além da página inicial (Home), há uma base de dados de traços linguís-
ticos (Features), de capítulos explicativos de cada traço (Chapters), de línguas
que aparecem no WALS (Languages), das referências bibliográficas (Referen-
ces) e dos autores (Authors).
Features
Os dados do WALS são organizados de acordo com 192 traços (Features), que di-
zem respeito a diversos níveis de análise linguística (fonologia, morfologia, sinta-
xe, léxico) e categorias lexicais (nomes, pronomes, adjetivos, verbos, adposições).
Figura 2: WALS – página Features.
Giulia Bossaglia 51
Cada traço possui nome e código de identificação próprios. Na tabela em que
todos os traços são listados (cf. Figura 2), são indicados também: a autoria do
estudo relativo ao traço; o nível de análise linguística ou a categoria lexical
envolvida; o número de línguas que compõem a amostra do estudo. Por exem-
plo, o código 1A identifica o traço “Inventários consonantais”, estudo desen-
volvido por Ian Maddieson (nível: Fonologia), a partir de uma amostra de 563
línguas. O botão Values “Valores”, na última coluna da tabela de apresentação
dos traços, permite acessar os detalhes da classificação das línguas de acordo
com o traço:
Figura 3: WALS – Features > Values
Para o traço 1ª “Inventários consonantais”, os valores utilizados para a clas-

sificação das 563 línguas da amostra são ‘pequeno’ (89 línguas), ‘moderada-
mente pequeno’ (122 línguas), ‘médio’ (201), ‘moderadamente amplo’ (94),
‘amplo’ (57), como se pode verificar na Figura 3. A opção Go to map “Ir para o
mapa” permite acessar o mapa que mostra a distribuição geográfica das lín-
guas analisadas para o estudo do traço 1A (clicando em cada círculo, é possí-
vel ver o nome da respectiva língua) na Figura 4.
A visualização da distribuição dos traços no espaço geográfico é de grande
relevância para o entendimento de fenômenos areais, que podem revelar algo
da história das línguas. Com relação ao traço 1A, observa-se que a maior con-
centração de línguas com inventários consonantais restritos se acha na região
do Pacífico (incluindo a Nova Guiné), na América do Sul e no Leste da América
do Norte. Como observa Maddieson, o grau de afinidade tipológica entre lín-

Figura 4: WALS – Mapa para o traço 1A.
guas de Nova Guiné e Austrália com relação a esse traço poderia sugerir ser
ele originário da época em que estas duas ilhas eram ligadas por uma ponte de
terra que permitiu um mais ágil povoamento da Austrália e que, por volta de
7000 anos aEC, ficou submersa, acabando com a facilidade de contato entre
tais comunidades linguísticas. As línguas das duas ilhas reteriam, então, um
traço tipológico areal muito antigo.
O WALS permite não só a exploração de traços específicos, mas também de
combinações de mais traços ao mesmo tempo. É possível, por exemplo, com-
binar o traço 1A com os traços 2A Vowel quality inventories “Inventários de
qualidade vocálica”, referente ao número de vogais das línguas consideran-
do apenas as oposições de qualidade (ou seja: ā e ă contam como uma única
vogal, porque se diferenciam por quantidade — ā longo e ă breve — e não
qualidade), e 13A Tone “Tone”, referente à presença ou à ausência de tom com
valor fonológico nas línguas (Figuras 5, 6, 7).
Giulia Bossaglia 53
Figura 5: Combinação dos traços 1A, 2A e 13A.
Como os três traços foram estudados com base em amostras um pouco dife-
rentes (1A: 563 línguas, 2A: 564 línguas, 13A: 527 línguas), os resultados que
se obtêm dizem respeito apenas a línguas compartilhadas pelas três amostras
— neste caso, 520. A Figura 6 mostra o mapa da combinação dos traços 1A,
2A e 13A.
Figura 6: Mapa da combinação dos traços 1A, 2A e 13A.
A legenda do mapa é reportada na Figura 7, onde os valores foram organi-

zados em ordem decrescente do tipo de combinação mais atestada entre as

520 línguas consideradas, até as combinações logicamente possíveis, mas
não atestadas. Na primeira linha da tabela, indica-se a ordem de apresen-
tação dos traços: Vowel quality inventories (2A) — Tone (13A) — Consonant
inventories (1A). Assim, o padrão mais frequente na amostra desse estudo
é Average (5-6) / No tones / Moderately small, das 48 línguas que apresen-
tam inventários vocálicos médios (Average), compostos por 5-6 qualidades
diferentes, ausência de tom com valor fonológico e inventários consonan-
tais moderadamente pequenos. No mapa da Figura 6, essas línguas são si-
nalizadas com o quadradinho verde claro. Como mostra o mapa na Figura
8, nenhuma das línguas europeias da amostra apresenta o padrão mais fre-
quente, atestado principalmente no sudeste asiático, Nova Guiné, Austrália
e na América do Sul (línguas europeias como basco, grego, búlgaro, entre
outras, apresentam o segundo padrão mais frequente, que se diferencia do
primeiro por ter um inventário consonantal médio, e não moderadamente
pequeno). Na legenda, clicando no + à esquerda de cada padrão de combi-
nação dos três traços, é possível ver quais são as línguas específicas que a
ele pertencem (entre elas, por exemplo: hebraico, afro-asiática; koyra chini,
nilo-saariana; garo, sino-tibetana; guarani, tupi-guarani; wari’, txapakura;
hixkaryana, karib).
À medida que se desce na legenda, os padrões se caracterizam como mais
raros, presentes em um número cada vez menor de línguas. Um padrão pouco
frequente é Small (2-4) / No tones / Moderadamente amplo: inventário vo-
cálico pequeno (entre 2 e 4 vogais), ausência de tom fonológico, inventário
consonantal moderadamente amplo. A distribuição das 12 línguas (entre elas:
berbere, afro-asiática; malgaxe, austronesiana) que o apresentam é mostrada
na Figura 9 — cerca de 50% destas línguas se encontra na América do Norte
ocidental.
No fundo da legenda, quatro combinações logicamente possíveis entre os
valores dos três traços combinados não são atestadas em nenhuma das
línguas da amostra. Eles, são todos caracterizados por um inventário vo-
cálico pequeno (2-4 vogais), sistema de tom complexo e qualquer tipo de
inventário consonantal (menos o “pequeno”, que forma, igualmente, um
padrão muito raro, apresentado por apenas duas línguas). Informações
como estas são relevantes para entender quais preferências são manifes-
tadas pelas línguas naturais, e quais implicações podem talvez existir en-
tre traços distintos.
Giulia Bossaglia 55
Figura 7: Legenda do Mapa da combinação dos traços 1A, 2A e 13A.

Figura 8: Distribuição do padrão Average (5-6) / No tones / Moderately small.
Figura 9: Distribuição do padrão Small (2-4) / No tones / Moderadamente amplo.
Como as Figuras 8 e 9 mostram, é possível obter mapas personalizados, es-

colhendo quais traços (ou padrões de combinações de traços) mostrar. Isso
é possível utilizando o menu Legend “Legenda”, onde se pode escolher quais
ícones serão ou não visualizados no mapa, como na Figura 10, que é o mapa
do traço 1A (cf. Figura 4):
Giulia Bossaglia 57
Figura 10: Menu de seleção Legenda.
Diferentemente da Figura 4, no menu do mapa foi desselecionado o ícone

(vermelho) das línguas com inventário consonantal amplo (Large): assim, no
mapa só aparecem os ícones (azul escuro, azul claro, branco, cor de rosa) das
línguas com inventários consonantais pequeno, moderadamente pequeno,
médio e moderadamente grande.
Ao lado do menu Legenda, o menu Icon size (“tamanho do ícone”) permite au-
mentar ou diminuir os ícones no mapa (formas e cores deles podem também
ser alteradas pelo pesquisador), e é possível (Show/hide Labels) “mostrar ou
esconder as etiquetas” dos nomes das línguas representadas pelos ícones.
Debaixo dos mapas, para quase todos os traços é possível consultar exemplos
retirados de algumas línguas das amostras utilizadas. Na Figura 11, é repor-
tado o quadro de exemplos para o traço 81A Order of Subject, Object and Verb
“Ordem de Sujeito, Objeto e Verbo”:
Figura 11: Exemplos do traço 81A – Ordem de Sujeito, Objeto e Verbo.

Os exemplos são apresentados com glosa e tradução, e correspondem aos seis
valores possíveis (e atestados) de ordem de s, o e v nas línguas da amostra
(para este traço, estudado por Matthew S. Dryer, 1377): sov (japonês), svo
(mandarim), vso (cebuano, austronesiana; irlandês), osv (nadëb), ovs (hi-
xkaryana), vos (nias, austronesiana).
Chapters
Nesta seção, são consultáveis os capítulos que dizem respeito a cada traço
linguístico presente no WALS. Os capítulos apresentam um padrão fixo, que
inclui uma breve introdução sobre o traço em estudo, a especificação dos va-
lores para ele pertinentes (por exemplo, para o 81A: svo, sov, vso etc.) com
o link para o respectivo mapa, exemplos comentados, observações sobre a
distribuição geográfica dos valores e comentários sobre questões teóricas re-
levantes associadas ao traço ou levantadas pelos resultados do estudo. Fre-
quentemente, há referência cruzada para outros capítulos do WALS, e são
sempre indicadas ulteriores referências bibliográficas.
Um dos aspectos mais interessantes e importantes do WALS é seu caráter in-
terativo e colaborativo. Em cada capítulo, é possível ter acesso a uma seção de
comentários que usuários registrados podem compartilhar com os autores
dos estudos/capítulos, como tem feito o professor Henry Davis para o capítu-
lo 81A (cf. Figura 12):
Figura 12: Seção de Comentários no Capítulo 81A – Ordem de s, o e v.
Clicando na seção realçada em vermelho, pode-se acessar o texto completo do

comentário e das eventuais respostas de editores e autores do WALS ou de ou-
Giulia Bossaglia 59
tros usuários. Geralmente, nos comentários são sinalizados erros, levantadas
questões relacionadas à análise dos dados ou aos resultados dos estudos etc.
Os comentários mais recentes aos capítulos são linkados (Latest Comments)
diretamente na homepage do WALS (lado direito). Assim, o atlas se mantém
sempre aberto a possíveis correções e edições, além de ser a base de inúmeras
discussões de natureza tipológica — que podem ser aproveitadas, também,
pelos “espectadores”.
Languages
Esta base de dados compreende uma ampla variedade de informações sobre
todas as línguas presentes nas amostras do WALS, a saber: filiação genéti-
ca (família, grupo dentro da família), área geográfica onde a língua é falada
(macroárea, latitude, longitude, países). Clicando no nome de uma língua, ace-
de-se à página a ela dedicada. Além das informações mencionadas, pode-se
consultar a lista dos traços linguísticos que foram examinados nela, e seus
valores. Na Figura 13, apresenta-se uma amostra da página da língua guarani.
Esta língua aparece em 137 amostras (sobre as 192 utilizadas para os 192
traços presentes no WALS). Na Figura 14, vê-se que ela possui o valor “mo-
deradamente pequeno” no que diz respeito ao traço 1A, “médio” para o 2A e
“médio” para o 3A (proporção entre consonantes e vogais). Na coluna Sources,
são indicadas as “fontes” utilizadas para recuperar informações sobre a língua
em questão.
Figura 13: Página da língua guarani no WALS.

Figura 14: Exemplo de traços do guarani.
Todas as referências bibliográficas dos estudos que compõem o WALS (cerca

de sete mil fontes entre livros, artigos e outros documentos) são consultáveis
na seção References.
O WALS é, portanto, uma ferramenta valiosa para a pesquisa tipológica. Por
um lado, é uma fonte confiável e constantemente submetida a revisão de da-
dos tipológicos coletados em amplas amostras de línguas, por meio de diver-
sificadas investigações de especialistas. Por outro, pode ser utilizado como
base para novas investigações, devido à possibilidade de reutilizar de maneira
original (por exemplo, selecionando novas combinações de traços) os dados
nele disponíveis.
@glosa
É muito comum que se pergunte aos linguistas quantas línguas falam, e igual-
mente comum que a resposta deixe os leigos decepcionados. De acordo com
uma definição “pop”, linguista seria a pessoa que sabe analisar toda a sintaxe
de uma língua sem saber falar nem sequer ‘bom dia’ na mesma. Há algo de
verdadeiro nessa piada: ainda que a proficiência em muitas línguas diferentes
seja sem dúvida algo valioso para um linguista, ele estuda as línguas em uma
perspectiva mais ampla, focada no entendimento de como sistemas complexos
de comunicação funcionam e de quais categorias e mecanismos (universais e
Giulia Bossaglia 61
específicos) governam a linguagem humana. Todo linguista, e especialmente o
tipólogo, deveria ser capaz de analisar, em princípio, todas as línguas (vivas e
mortas), e para isso não é necessário saber se comunicar por meio delas, mas
saber reconhecer nelas as categorias e os mecanismos da linguagem. A glosa
(do grego glóssa “língua”) é uma ferramenta muito útil para os linguistas que
queiram ter acesso a dados de línguas que não conhecem, pois consiste em
um tipo de tradução muito específica: a tradução dos morfemas — por essa
razão, a glosa em linguística é conhecida também com a denominação de “tra-
dução morfêmica interlinear”.
Imagine-se que um tipólogo brasileiro se depare com as seguintes frases, de
diferentes línguas (exemplos adaptados de DRYER, 2013):
a) japonês John ga tegami o yonda.

b) chinês Zhāngsān shōudǎole yifēng xìn.

c) irlandês Léann na sagairt na leabhair.

d) nadëb Awad kalapéé hapuh.
Uma simples tradução desses exemplos para português, como se mostra abai-
xo, não seria suficiente para o linguista brasileiro fazer qualquer tipo de aná-
lise deles:

“John leu a carta.”

“Zhangsan recebeu a carta.”

“Os padres leem os livros.”

“O menino vê o jaguar.” Qual é o tipo morfológico das línguas acima? Não é

dado saber, pois a tradução fornece apenas o significado global da frase. Qual
é a ordem de sujeito, verbo e objeto nessas línguas? Apenas os nomes pró-
prios John e Zhangsan são reconhecíveis nas traduções, e saber que o sujeito
das frases transitivas a) e b) fica na primeira posição não é, igualmente, infor-
mação suficiente.

Por isso se faz necessária uma tradução mais precisa, que indique claramente
ao linguista o significado de cada palavra — quais morfemas há e em que or-
dem eles se distribuem ao longo das palavras.
Para ler ou fazer uma glosa, é necessário ter em mente a distinção entre mor-
fema — a unidade mínima de significado de uma língua, de natureza tanto
lexical quanto gramatical (logo, abstrata) — e morfe — unidade mínima que
pode ser segmentada em uma palavra, por ser o veículo (concreto) de pelo
menos um morfema (a palavra casa contém três morfemas: um morfema le-
xical veiculado pelo morfe {cas}, mais dois morfemas gramaticais, gênero fe-
minino e número singular, veiculados pelo morfe {a}; não se pode segmentar
essa palavra como {ca} + {sa}, por exemplo, porque nem {ca} nem {sa} estão
veiculando morfemas).
A glosa é dividida em vários níveis, que correspondem cada um a uma linha
diferente, abaixo daquela do exemplo na língua original. O primeiro nível é
aquele em que o exemplo é segmentado em morfes, por meio de hífens:

John ga tegami o yon-da

Zhāngsān shōudǎo-le yi-fēng xìn.

léann na sagairt na leabhair

awad kalapéé hapuh
“O menino vê o jaguar.”
O exemplo do japonês contém 6 morfes (5 palavras); o do chinês, 6 morfes

(4 palavras); o do irlandês, 5 morfes (5 palavras); e o do nadëb, 3 morfes (3
palavras).
No segundo nível, coloca-se a tradução morfêmica interlinear propriamente
dita: seguindo a segmentação em morfes, para cada um deles são indicados
os morfemas correspondentes (logo, o mesmo número de hífens e espaços
brancos entre palavras deve ser achado em ambos os níveis). Para auxiliar a
legibilidade da glosa, os níveis da segmentação mórfica e morfêmica devem
manter o alinhamento palavra por palavra:
Giulia Bossaglia 63
John ga tegami o yon-da
John subj carta obj ler-pst

Zhāngsān shōudǎo-le yi-fēng xìn
Zhangsan receber-pst um-class carta

léann na sagairt na leabhair
ler.pres det.pl padre.pl det.pl livro.pl

awad kalapéé hapuh
jaguar menino ver.ind
“O menino vê o jaguar.”

Como se pode ver, a tradução morfêmica dos exemplos acima se serve de algu-
mas abreviações (subj, obj, pst, class, pres, det, pl, ind), de símbolos (o hífen
que segmenta os morfes, o ponto ‘.’) e de palavras (carta, ler, livro, menino,
jaguar etc.).
As Leipzig Glossing Rules (“Regras de Leipzig para a glosa”), elaboradas conjun-
tamente pelos Departamentos de Linguística do Instituto Max Planck de An-
tropologia Evolucionista e da Universidade de Leipzig (Alemanha), são tidas
como modelo internacional que, idealmente, todo linguista deveria seguir no
que diz respeito às abreviaturas e aos símbolos utilizados nas glosas, para fa-
vorecer e facilitar a comunicação científica entre todos os linguistas do mundo.
De acordo com as regras de Leipzig, as abreviaturas em versalete indicam
morfemas gramaticais. Nos exemplos acima, há, portanto: subj = sujeito; obj
= objeto (direto); pst = passado; class = classificador; pres = (tempo) pre-
sente; det = determinante; pl = plural; ind = (modo) indicativo. Os morfemas
lexicais são, simplesmente, traduzidos pelas palavras (carta, ler, receber, um,
padre, livro, menino, jaguar, ver).
O hífen, como se antecipou, serve para separar morfes; o ponto ‘.’ é utilizado
para separar morfemas que pertencem a um mesmo morfe: o verbo irlandês
léann, por exemplo, é formado por um único morfe que veicula ao mesmo
tempo o morfema lexical “ler” e o morfema flexional de tempo presente (cf.
em português, um verbo como foi, que contém, todos juntos, os morfemas le-

xical “ser” e os gramaticais de modo, tempo, pessoa/número); o verbo nadëb
hapuh veicula, dentro do mesmo morfe, o morfema lexical “ver” e o gramatical
de modo indicativo etc.
Às vezes, na tradução de algum morfema lexical, pode ser necessário utilizar
mais do que uma palavra na língua de chegada. Neste caso, as diferentes pala-
vras que traduzem aquele morfema lexical são separadas por um underscore
‘_’, como no exemplo abaixo:
italiano Giorgio imburra il pane.

Giorgio imburr-a il pan-e
Giorgio passar_manteiga_em-pres.ind.3s det.m.s pão-m.s.
“Giorgio passa manteiga no pão.”
O verbo italiano imburrare não tem um verbo equivalente específico em portu-

guês e precisa ser traduzido, portanto, com a perífrase “passar manteiga em”.
Sem o ‘_’ separando cada uma das palavras da perífrase, se criaria confusão na
tradução interlinear, pois se perderia a correspondência entre a segmentação
em morfes e palavras dos dois níveis. [Observe-se, no exemplo acima, a gran-
de quantidade de morfemas que, em italiano, podem ser veiculados por um
mesmo morfe: o morfe {a} veicula, ao mesmo tempo, os morfemas de tempo
presente, modo indicativo, 3S = 3ª pessoa singular, o morfe {il} também veicula
três morfemas (determinante, m = gênero masculino e s = número singular)].
Graças às glosas, portanto, o linguista pode analisar línguas que não conhece
em diferentes níveis. Nos exemplos a) – d), por exemplo, é possível observar
diferenças nos tipos morfológicos: o japonês e o chinês aparentam um grau mí-
nimo de fusão (cada morfe veicula apenas um morfema), enquanto o irlandês e,
em menor grau, o nadëb apresentam fusão (um morfe pode veicular mais mor-
femas ao mesmo tempo). Ainda, de acordo com as glosas, as frases em irlandês
e nadëb aparentam grau mínimo de síntese (a palavra é formada por um único
morfe), enquanto o chinês e o japonês apresentam também palavras formadas
por dois morfes. No nível sintático, também é possível observar que as quatro
línguas possuem ordem dos constituintes básicos diferentes: o japonês é língua
sov, o chinês svo, o irlandês vso e o nadëb osv, e que, por exemplo, o numeral
precede o nome em chinês e o determinante precede o nome em irlandês, etc.
Vale lembrar que é sempre o linguista que decide qual é a melhor maneira de
fazer a glosa de algum exemplo que ele precise mostrar: se a frase Giorgio im-
burra il pane é utilizada como exemplo para mostrar a ordem svo do italiano,
a seguinte versão da glosa pode ser suficiente:
Giulia Bossaglia 65
Giorgio imburra il pane
Giorgio passa_manteiga_em det pão
Neste caso, nenhum morfe no interior das palavras é segmentado, já que

a finalidade da glosa é mostrar a ordem dos constituintes, e não caracte-
rísticas morfológicas da língua. Também, o linguista poderia nem glosar
como det a palavra il, mas simplesmente fornecer sua tradução na língua
de chegada, pois essa informação não faria diferença na detecção da ordem
dos constituintes:

Giorgio imburra il pane
Giorgio passa_manteiga_em o pão
É claro, portanto, que o grau de profundidade e granularidade de uma glosa

dependerá do objetivo do linguista que a faz. Aqui, foram ilustrados o funcio-
namento e as regras mais básicas para a construção e leitura das glosas, mas
uma lista completa e atualizada das regras de Leipzig (junto com uma lista
maior de abreviações) pode ser consultada em: https://www.eva.mpg.de/lin-
gua/pdf/Glossing-Rules.pdf (em inglês).
DRYER, Matthew S. (2013). Order of Subject, Object and Verb. In: ____; HASPELMATH, Martin (Eds.).
The World Atlas of Language Structures Online. Leipzig: Max Planck Institute for Evolutionary Anthro-
pology. <https://wals.info/chapter/81>; acesso em: 10 mar. 2020.
@ alinhamentos de caso mais raros

No alinhamento tripartido, três marcas diferentes são atribuídas a a, s e o; no
alinhamento ativo-estativo, por outro lado, s recebe ora a mesma marca de
a, ora a mesma marca de o, dependendo de seu grau de agentividade — os
verbos intransitivos, de fato, podem selecionar tanto sujeitos semanticamente
agentivos (correr, pular, nadar etc.), quanto não agentivos (morrer, cair, cho-
rar etc.).
As línguas podem apresentar marcas de caso nos nomes plenos e nos prono-
mes, ou apenas nos pronomes (como o português), e o tipo de alinhamento
apresentado na marcação dos nomes plenos pode (ainda que muito raramen-
te) ser diferente do alinhamento apresentado no sistema pronominal (exem-
plos de COMRIE, 2013):

pitjantjara (pama-nyungan; Austrália)
a) tjitji a nu
menino.abs ir pass
S
“O menino foi”
b) minyma-ngku tjitji nya ngu

mulher-erg menino.abs ver
A O
“A mulher viu o menino”
c) ngayu-lu a nu
1sg-nom ir pass
S
“Eu fui”
d) ngayu-lu tjitji nya ngu

1sg-nom menino.abs ver pass
A O
“Eu vi o menino”
e) tjitji-ngku ngayu-nya nya ngu

menino-erg 1sg-acus ver pass
A O V
“O menino me viu”
No pitjantjara, os nomes plenos (em a) e b): tjitji, minyma) são flexionados de

acordo com um alinhamento de caso de tipo ergativo-absolutivo, enquanto os
pronomes (ngayu, nos outros exemplos) seguem um sistema de flexão de caso
de tipo nominativo-acusativo. Os dois tipos de alinhamento se “misturam”
dentro da mesma frase, quando nomes plenos e pronomes coocorrem, como
nas frases d) e e), onde aparecem dentro da mesma frase morfemas de caso
nominativo e absolutivo, e de ergativo e acusativo, respectivamente.
O alinhamento de caso não é algo referente apenas à flexão nominal. Em
algumas línguas, ele é marcado na flexão de pessoa/número do verbo, que
pode concordar então ou com a, ou com s, ou com o. O alinhamento no-
minativo-acusativo é então aquele que distingue um tipo de marcação de
pessoa/numero para a e s, e outro para o, como em tawala (oceânica; Pa-
pua Nova-Guiné), em que a e s são marcados com o mesmo prefixo {i-} no
verbo, enquanto o com outra marca, o sufixo {-ya} (exemplos adaptados de
SIEWIERSKA, 2013):
Giulia Bossaglia 67
tawala
i-bowi-ye-ya
3SG.A-rejeitar-tr-3SG.O
“Ele o rejeitou”
apo i-na-nae
fut 3SG.S-pot-ir
“Ele poderá ir”
Consequentemente, o alinhamento ergativo-absolutivo no verbo será aquele

que marcará s e o da mesma maneira, em oposição a a, como em konjo (mala-
yo-polinesiana ocidental; Indonésia), através das marcas {-i} (s e o) e {na-} (a):
konjo
na-peppe’-i Amir asung-ku
3SG.A-bater-3SG.O Amir cachorro-1sg

“Amir bateu o meu cachorro” (lit. “ele-bateu-ele Amir cachorro-meu”)
a’-lampa-i Amir
intr-ir-3SG.S Amir
“Amir vai”
O alinhamento de tipo nominativo-acusativo representa cerca de 56% das

línguas da amostra do WALS (traço 100A), enquanto o ergativo-absolutivo
apenas 5%. Aproximadamente 22% das línguas não apresentam marcas mor-
fológicas de pessoa/número no verbo, enquanto o 17% restante apresentam
alinhamentos de tipo tripartido, ativo-estativo ou de outra natureza (alinha-
mentos, estes, muito mais raros e marcados que os outros).

CAPÍTULO
4
As línguas da África
@tons flutuantes
Em bambara (banto), a palavra káfé “café” possui tom ascendente (´) em
ambas as sílabas. Quando a palavra é utilizada junto com o artigo defini-
do posposto, caracterizado por um tom descendente (`), esse tom flutua
(i.e., se transfere) para a última sílaba da palavra, se une a seu tom ascen-
dente e forma um tom ascendente-descendente (^): káfê “o café”. Isto pode
não acontecer com todas as palavras, como se vê no exemplo abaixo (de
HYMAN, 2008), da língua aghem (grupo ‘banto dos pastos’, irmão do grupo
banto; Camarões):
fú “rato” → fú kíà “seu rato” → fú kín “este rato”

wó “mão” → wó kìà “sua mão” → wó ↓ kín “esta mão”
As duas palavras fú e wó se distinguem por a primeira não carregar nenhum

tom flutuante (fú: apenas tom ascendente), e a segunda carregar um tom flu-
tuante descendente, fora da sílaba que a compõe (wó `: tom ascendente na
sílaba + flutuante descendente). Quando as duas palavras são seguidas pelo
pronome possessivo de 2ª pessoa singular kìà, caracterizado por dois tons
descendentes (``), acontecem coisas distintas dependendo da presença ou não
do tom flutuante: o tom ascendente de fú vai se estender à primeira sílaba do
pronome possessivo, que de kìà (``) passa a kíá (´`); o tom flutuante de wó, por
outro lado, impede que isso aconteça ao pronome possessivo, que permanece
inalterado em sua estrutura tonal (``). Uma ulterior confirmação de que exista
esse tom flutuante se obtém observando que, quando a palavra wó é seguida
pelo artigo definido kín, o tom ascendente deste sofre um leve abaixamen-
Giulia Bossaglia 69
to (indicado por ↓) por efeito do tom flutuante descendente (`) — o que não
acontece com a palavra fú, que não possui esse tom “escondido”.
@ Línguas crioulas
5. As línguas crioulas e o português

O termo crioulo (fr. créole, esp. criollo) é o diminutivo de cria, e começou a ser
usado no séc. XVII para designar primeiro os escravos africanos e mais tarde
os brancos nascidos nas diferentes colônias. Finalmente, o termo passou a
ter significado mais geral de “nativo” das colônias. Todas as línguas crioulas
são, portanto, línguas de contextos que já foram coloniais, e onde se deu o
encontro entre línguas muito diferentes entre si — as línguas europeias dos
colonizadores e as línguas dos lugares colonizados (mais aquelas dos escra-
vos utilizados nesses processos de colonização). As línguas crioulas, portanto,
possuem uma comunidade de falantes nativos, como as demais línguas vivas,
mas delas se diferenciam por serem línguas “de contato”, ou seja, que não se
originaram de uma língua ancestral, mas do contato entre línguas diferentes
(@línguas de contato).
Quando comunidades que falam línguas muito diferentes entram em conta-
to entre si (por exemplo, em contextos comerciais e econômicos de vários
tipos, contextos fronteiriços de convivência interétnica, de colonização e até
de guerra), em ausência de uma língua franca que possa ser utilizada para a
comunicação, podem surgir códigos rudimentares e misturados, em que uma
das línguas é a fonte principal para o léxico (i.e., é a língua “lexificadora”),
e outra/outras são as fontes principais para a ‘estrutura’ das frases. No iní-
cio, trata-se mesmo de sistemas muito pouco ‘linguísticos’, que se baseiam
mais em gestos combinados com umas poucas palavras — tais sistemas são
chamados jargões. Se a situação de contato linguístico se prolongar, o jar-
gão pode adquirir uma série de características mais ‘linguísticas’, como, por
exemplo, desenvolver um pouco de morfologia (geralmente próxima do tipo
isolante), ampliar seu léxico (não necessariamente com palavras novas, mas
conferindo novos significados a itens lexicais já disponíveis) etc. Esse tipo de
código pré-linguístico é chamado de pidgin (palavra de étimo incerto, talvez
originada da pronúncia chinesa de inglês business “negócios”) ou pidgin-jar-
gão. O pidgin-jargão também pode continuar a evoluir, ficando cada vez mais
parecido a uma língua “normal” (i.e., não de contato), adquirindo caracterís-

ticas gramaticais mais complexas e capazes de codificar um amplo leque de
distinções semânticas e gramaticais — nesse caso, o código vira um pidgin
estendido. Quando surge uma segunda geração de falantes nativos de um pid-
gin ou de um pidgin estendido, ele pode ser considerado um crioulo (ou língua
crioula), pois passou por um processo de nativização (ou crioulização). Isto
ocorre, obviamente, dependendo de fatores históricos e sociais de cada con-
texto de colonização — os mesmos fatores dos quais dependem a sorte das
línguas crioulas, que podem virar línguas oficiais ou ficar como basiletos em
oposição ao acroleto (que normalmente é a língua do colonizador), ou sim-
plesmente desaparecer.
No mapa abaixo, apresenta-se a distribuição geográfica das principais línguas
de contato do mundo, de acordo com os dados do APiCs – Atlas of Pidgin and
Creole language structure online “Atlas das estruturas linguísticas dos pidgins
e crioulos” (o correspondente do WALS, mas para línguas de contato; https://
apics-online.info/; MICHAELIS et al., 2013):
As principais línguas de contato que têm o português como língua lexifi-

cadora são, na África ocidental, diferentes variedades do crioulo cabo-ver-
diano (Santiago, Brava e São Vicente), o crioulo da Guiné-Bissau, o crioulo
casamancês (Senegal), o são-tomense, o angolar (Ilha de São Tomé), o prin-
cipense e o fá d’ambô (Guiné equatorial); na Ásia meridional, o indo-portu-
guês (Diu, na Índia), o korlai (perto de Mumbai) e o ‘português do Sri Lanka’;
no Sudeste asiático, o papiá kristang (Malacca, Singapura, Kuala Lumpur) e
o ‘português de Jakarta’ (Java). Sua distribuição é destacada no mapa abaixo
(fonte: APiCs).
Giulia Bossaglia 71
Na África ocidental, portanto, os crioulos de base portuguesa se formaram
pelo contato do português com praticamente as mesmas línguas africanas
que, no Brasil, se mantiveram em contato com essa língua ao longo de mui-
tos séculos (@crioulos de base portuguesa). Semelhanças estruturais entre os
crioulos de base portuguesa e o pbv poderiam então comprovar a influência
que as línguas africanas tiveram sobre o português brasileiro.
@crioulos de base portuguesa

O APiCs online — Atlas of Pidgin and Creole Language Structure online “Atlas
online das estruturas linguísticas de pidgins e crioulos” (https://apics-online.
info/) é um projeto parecido com o WALS (de fato, está também associado ao
Instituto Max Planck de Antropologia Evolucionária de Leipzig), mas focado
nas línguas de contato. A plataforma online do APiCs é organizada de maneira
muito parecida à da plataforma do WALS: são consultáveis dados sobre 130
traços próprios das línguas de contato, há capítulos explicativos para cada tra-
ço, com exemplos e mapas (estes podem ser “montados” de acordo com os
interesses e objetivos do pesquisador, exatamente como no WALS). Ainda,
no APiCs constam pequenas, mas detalhadas apresentações para cada língua
presente no Atlas, com informações não apenas linguísticas (estrutura geral
da língua e suas principais características), mas também históricas e sociolin-
guísticas. Uma interessante seção do site compara os dados para 48 traços lin-
guísticos nas amostras do APiCs em oposição às do WALS (as dimensões das
amostras do APiCs são, obviamente, muito mais reduzidas): assim, o linguista
pode observar dados interessantes sobre possíveis características próprias só
de línguas de contato e não das demais línguas humanas, e vice-versa.

Apresentam-se aqui, apenas a título exemplificativo, alguns dados relativos
às línguas crioulas que têm como língua lexificadora o português, a partir da-
quelas que constam no APiCs. Trata-se de 14 línguas distintas, para três ma-
croáreas geográficas:
1. África ocidental: crioulos cabo-verdianos de São Vicente, Santiago e Brava;
kriyol da Guiné-Bissau; crioulo de Casamansa (Senegal); crioulo são-to-
mense, angolar (São Tomé e Príncipe); crioulo principense, fá d’Ambô (ilha
de Ano Bom);
2. Ásia meridional: crioulo indo-português da ilha de Diu (no litoral norte-o-
cidental da Índia); crioulo de Korlai (Maarastra, Índia); crioulo português
do Sri Lanka;
3. Sudeste asiático: papiá kristang (Singapura); crioulo de Batávia (em Jacar-
ta, hoje extinto).
Ordem de Sujeito, Verbo, e Objeto e

correlação do sintagma adposicional
Todos os crioulos mencionados acima apresentam ordem svo (ordem que é
a mais frequente para as línguas de contato em geral), menos o crioulo de
Korlai, em que domina a ordem sov, mas também é admitida a svo, e o crioulo
português do Sri Lanka, que é apenas sov — de fato, a única língua crioula
com ordem exclusiva sov no APiCs. Nestes dois casos, a ordem dominante não
é aquela da língua lexificadora, o que é bastante insólito para línguas crioulas.
Muito interessante também, nos crioulos de base portuguesa da Ásia meridio-
nal, é a presença de posposições, fato que mostra que o sintagma adposicional
segue as previsões da ordem sov, ou seja, das línguas indianas que entraram
em contato com o português. O crioulo de Diu apresenta majoritariamente
preposições, mas também posposições e circumposições (a adposição se colo-
ca antes e depois do sn que rege); o crioulo de Korlai se serve principalmente
de posposições, mas também de preposições; o português do Sri Lanka possui
apenas posposições. Sintagmas adposicionais diferentes de preposicionais
são bastante raros na amostra do APiCs.
Verbos seriais
Verbos seriais de diferentes tipos estão presentes nos crioulos de base portu-
guesa. No papiá kristang, por exemplo, o verbo “ir” bai (< vai) é usado como
Giulia Bossaglia 73
verbo serial para indicar a direção do movimento; o mesmo se observa no
crioulo de Casamansa; no crioulo são-tomense, um verbo intransitivo na pri-
meira posição indica a maneira do movimento, por sua vez codificado pelo
verbo ba “ir”:
(papiá kristang)
Eli ja andá bai casa.
3sg pfv andar ir casa
“Ele foi para casa” (lit.: “Ele andou ir casa”)
(crioulo de Casamansa)
Joŋ koré (i) bay Sicor.
John correr (3sg) ir Zinguinchor
“John correu para Ziguinchor” (lit.: “John correu (ele) ir Ziguinchor”)
(são-tomense)
Nansê ka subli ba obô ê!
2pl ipfv subir ir floresta pcl
“Vocês vão subindo para a floresta!” (lit. “Vocês subam vão para a floresta!”)
Além de verbos seriais que indicam direcionalidade do movimento, há outros

que indicam instrumento, como o verbo toma “pegar” no exemplo abaixo, que
poderia ser traduzido como uma preposição (toma nabádja “com a faca”):
(crioulo cabo-verdiano de Santiago)

E toma nabádja e da kunpanheru na odju.
3sg pegar faca 3sg dar companheiro em olho
“Ele esfaqueou o olho do companheiro com a faca” (lit.: “Ele pegou a faca ele deu ao com-
panheiro no olho”)
A gramaticalização do verbo serial “dar” como preposição que introduz um

item com papel semântico de beneficiário ou recipiente também é bastante
atestada nos crioulos de base portuguesa:
(fá d’Ambô)
A ska fe wan xadyi da na-namay.
3gen prog fazer art casa dar art-família
“Eles estavam construindo uma casa para a família” (lit.: “Eles estavam construindo uma
casa dar a família)
(angolar)
Ngêi ka pega kwa e ra m.
quem fut pegar coisa dem dar 1sg
“Quem pegará isso para mim?” (lit.: “Quem pegará esta coisa dar mim?”)

(crioulo português do Sri Lanka)
Aka tudu etus faya lo-daa.
isso tudo 3PL.M fazer FUT-dar
“Isso tudo eles farão para você” (lit.: “Isso tudo eles farão dar”)
Possíveis atividades sobre crioulos de base portuguesa

Propõem-se aqui algumas atividades de aprofundamento sobre crioulos de
base portuguesa, com base no APiCs. As orientações fornecidas para a consul-
ta do WALS podem ser utilizadas também no APiCs, pois as duas plataformas
compartilham uma organização quase idêntica.
a. Utilize o APiCs para escrever um relatório completo sobre os traços com-
partilhados por todas as línguas crioulas que têm o português como língua
lexificadora.
b. Explore os valores apresentados pelos crioulos de base portuguesa para
o traço 101 Position of standard negation “Posição da negação canônica”.
Compare os resultados com os dados de português brasileiro e europeu.
Lembre que a origem da dupla negação no português brasileiro é por al-
guns autores remetida à influência do contato com línguas africanas. Os
dados do APiCs parecem confirmar ou não essa hipótese?
c. Escolha os traços compartilhados pelos crioulos de base portuguesa da
África ocidental e compare-os com aqueles de outras línguas de contato da
mesma região, mas de língua lexificadora diferente, com o objetivo de inves-
tigar a influência das línguas de substrato na formação de suas gramáticas.
Abreviações utilizadas
3gen genitivo de 3ª pessoa
dem demonstrativo
pfv a aspecto perfectivo
ipfv aspecto imperfectivo
pcl partícula discursiva (valor exclamativo)
prog forma progressiva
art artigo
MICHAELIS, S. M.; MAURER, Ph.; HASPELMATH, M.; HUBER, M. (Eds.) (2013). Atlas of Pidgin and
Creole Language Structures Online. Leipzig: Max Planck Institute for Evolutionary Anthropology.
Giulia Bossaglia 75
CAPÍTULO
6
As línguas indígenas
do Brasil
@ macrofamílias linguísticas e hipótese monogenética

Em 1905, o italiano Alfredo Trombetti (1866-1929) publicava a obra L’uni-
tà d’origine del linguaggio “A unidade da origem da linguagem”, em que pela
primeira vez era sugerida a hipótese de uma única origem para as línguas
humanas (hipótese monogenética), mas não com base no conto da Torre de
Babel — ideia que havia permeado, em diferentes maneiras, a reflexão lin-
guística desde a Idade Média até o começo do séc. XIX. Trombetti observava
que fortes semelhanças entre línguas que não pertenciam às mesmas famílias
fossem muito mais interessantes para um linguista que aquelas observadas
entre línguas de uma mesma família — por exemplo, ele havia apontado para
a quase homonímia dos pronomes de 1ª e 2ª pessoa singular nas famílias in-
do-europeia e urálica (grupo ugro-fínico, especificamente).
A ideia que fundamenta a hipótese monogenética para a origem das línguas
é a hipótese monogenética para a origem da nossa espécie de matriz darwi-
niana: como a nossa espécie se desenvolveu a partir de um único grupo de
indivíduos na África, é plausível imaginar que a língua que esse grupo falava
seja a protolíngua de todas as línguas que mais tarde se diferenciaram. As-
sim, existiria relação genética entre todas as famílias linguísticas, só que tão
antiga, logo, distante, que a detecção das semelhanças entre suas línguas é
extremamente difícil.
Joseph Greenberg (1915-2001) foi um dos primeiros linguistas, junto com o
norte-americano Morris Swadesh (1909-1967), a dedicar-se à comprovação
sistemática de relações genéticas distantes entre línguas do mundo, seguido
nisso pelo aluno Merritt Ruhlen (1944-).
Giulia Bossaglia 77
Do ponto de vista metodológico, a comprovação de relações genéticas distan-
tes se baseou na comparação de cognatos, mas de maneira diferente daquela
do método histórico-comparativo. O método inaugurado por Greenberg para
este fim é o da “comparação massiva”, ou seja, comparação de poucos cogna-
tos em muitas línguas — o exato contrário do método histórico-comparativo,
que visa comparar o maior número possível de cognatos em um número res-
trito de línguas.
Duas técnicas combinadas (desenvolvidas e aperfeiçoadas por Swadesh) au-
xiliam a comparação massiva: a glotocronologia, método probabilístico que
visa estabelecer a idade aproximada das famílias linguísticas (com base no
pressuposto de que, durante um determinado período, línguas que possuem
relação genética retêm uma porcentagem regular de vocabulário básico com-
partilhado; por exemplo, 86% do léxico durante 1000 anos), e a léxico-estatís-
tica, outro método estatístico que mede a distância genética entre línguas com
base em seus léxicos básicos (com base no pressuposto de que há uma razão
constante no tempo para a mudança no vocabulário básico).
Swadesh dá o nome também a uma lista (“lista de Swadesh”) de palavras bá-
sicas (ou melhor: conceitos básicos aos quais devem corresponder palavras
de vocabulário básico em todas as línguas humanas) a serem comparadas nas
muitas línguas analisadas para o estudo das relações genéticas distantes. A
lista de Swadesh compreende 100 conceitos básicos, mas são utilizadas tam-
bém versões mais reduzidas dela (aproximadamente, 40 itens):
eu um cão osso nariz peitos morrer dizer fumaça preto

você dois piolho gordura boca coração matar sol fogo noite
nós grande árvore ovo dente fígado nadar lua cinza quente
este longo semente corno língua beber voar estrela queimar frio
aquele pequeno folha cauda garra comer andar água trilha cheio
quem mulher raiz pluma pé morder vir chuva montanha novo
o quê homem latido pelo joelho ver deitar pedra vermelho bom
não pessoa pele cabeça mão ouvir sentar areia verde redondo
todo peixe carne ouvido barriga saber estar terra amarelo seco
muitos ave sangue olho pescoço dormir dar nuvem branco nome
Quadro 1: Lista de Swadesh.
Com base nesse tipo de lista, coletam-se os cognatos em um número muito

alto de línguas e, com base neles, procede-se à classificação destas em famílias
e macrofamílias.

Tome-se como exemplo de aplicação do método acima descrito a lista de cog-
natos para “mão” em 12 línguas diferentes, indicadas cada uma por uma letra
do alfabeto (RUHLEN, 1994, p. 9-10):
Língua “mão”
A lāmh
B ranka
C ręka
D ruka
E hænd
F hānd
G hant
H mɪnə
I mano
J mæ̃ n
K mano
L te
A transcrição das palavras cognatas é feita seguindo um critério mais fonético

que ortográfico, para que possam resultar mais evidentes eventuais corres-
pondências sonoras. A partir das formas fonéticas das palavras comparadas, o
linguista irá agrupar as 12 línguas — para o exemplo acima, seriam possíveis
5 agrupamentos:
Ao observar quais línguas correspondem às letras, observa-se que os agru-

pamentos achados “fazem sentido”: A = irlandês; B = lituano; C = polonês; D
= russo; E = inglês; F = dinamarquês; G = alemão; H = romeno; I = italiano; J =
francês; K = espanhol; L = japonês.
Menos o japonês, todas as línguas são indo-europeias, mas pertencem a gru-
pos diferentes. O irlandês, única língua celta, compõe grupo sozinha; no grupo
II, estão juntas uma língua báltica e duas eslavas, i.e., de grupos muito próxi-
Giulia Bossaglia 79
mos dentro da família; no grupo III, são reunidas três línguas germânicas; no
IV, as quatro línguas itálicas (do subgrupo românico).
Obviamente, esse procedimento precisa ser repetido para mais palavras. É
possível que, para outro conceito, os agrupamentos entre as línguas A-L resul-
tem diferentes, mas quanto mais próximas geneticamente forem as línguas,
mais vezes ficarão juntas no mesmo agrupamento. No exemplo acima, a ma-
neira como o irlandês e o japonês ficam isolados em grupos específicos é dife-
rente: o japonês, do ponto de vista genético, é uma língua muito mais distante
das dos grupos II-IV, e ficará “isolado” mais frequentemente que o irlandês,
dentro desta pequena amostra de línguas.
Através dessa metodologia, portanto, Greenberg e, posteriormente, Ruhlen,
chegaram a classificar as línguas do mundo em apenas 12 macrofamílias,
como se mostra na Figura 1:
Figura 1: Macrofamílias do mundo, de acordo com Greenberg

[adaptada de https://web.archive.org/web/20180706111717/ http://www.merrittruhlen.com/].
Como se pode ver, nessa proposta, o basco não seria uma língua isolada, mas
pertenceria à macrofamília dené-caucasiana (junto com algumas línguas cau-
casianas, algumas da China e as da família na-dené, na América do Norte); as
famílias indo-europeia, sino-tibetana e uralo-altaica formariam a macrofamí-

lia euro-asiática; as quatro famílias originárias da África são mantidas como
independentes; as línguas das Américas são organizadas em apenas três ma-
crofamílias (classificação, esta, muito controversa ainda hoje, diferentemente
da classificação das línguas da África, que o foi no começo, mas foi mais tarde
reconhecida como válida).
As principais críticas a esse tipo de estudos têm como alvo a insuficiência me-
todológica da comparação lexical para a reconstrução das raízes do léxico de
uma “protoprotolíngua” cuja existência é fixada tão remotamente no tempo
(por volta de 100 mil anos aEC). Efetivamente, métodos de comparação lexical
são sempre um tanto problemáticos, devido ao caráter tão instável do nível
lexical, até para a aplicação dentro de uma mesma família.
RUHLEN, M. (1994). The origin of language: tracing the evolution of the mother tongue. Hoboken: Wiley.
@ alinhamento de caso ativo-estativo

Na língua karajá (karajá; Pará, Tocantins, Goiás, Mato Grosso), observa-se um
alinhamento de caso na flexão verbal de pessoa/número de tipo ativo-estativo
(cf. Cap. 4):
karajá (maia, 2006)

a. tori r-i-wa-toruny-re
branco 3sg.a-trans-1sg.o-empurrar-pass
“O homem branco me empurrou” (lit. “branco ele-me-empurrou”)
b. dearã wa-bina-reri
1sg 1sg.s-doente-pres
“Eu estou doente”
c. dearã ar-õ-rõ-kre
1sg 1sg.s-trans-dormir-fut
“Eu vou dormir”
d. dearã benora ar-i-my-kre

1sg tucunaré 1sg.a-trans-pegar-fut
“Eu vou pegar tucunaré”
Nos verbos das frases a.-d. acima, aparecem marcas flexionais relativas a a, o,
e s. Em a., no verbo transitivo “empurrar” é especificada a direcionalidade da
ação (de um agente de 3ª pessoa singular para um paciente/objeto direto de
1ª singular); em b., além do pronome pessoal sujeito dearã, um morfema fle-
xional de 1ª pessoa singular com função de s aparece no verbo. O morfema em
questão é, para a. e b., o mesmo afixo {wa}, que se diferencia do afixo {ar} usa-
Giulia Bossaglia 81
do, em d., para marcar no verbo “pegar” a função de agente de seu sujeito (na
1ª pessoa singular). Até esse ponto, portanto, o sistema de alinhamento no
verbo aparenta ser de tipo ergativo-absolutivo, diferenciando-se {ar} para a, e
{wa} para s e o. Entretanto, na frase c., s é codificado com a mesma marca de a,
configurando-se, assim, uma “cisão” na maneira de codificar esta função sintá-
tica no karajá. O fato de s poder ser codificado como a ou como o depende de
fatores de natureza semântica: na frase b., s “está doente”, ou seja, é sujeito de
um verbo que indica um estado e que seleciona um sujeito semanticamente
não agentivo (aliás, que está sofrendo uma condição médica). Essa proprieda-
de semântica aproxima s a o, que corresponde ao papel semântico de Pacien-
te — por esta razão, o karajá codifica s com a mesma marca morfológica. Na
frase c., por outro lado, o verbo intransitivo “dormir” é percebido como mais
agentivo (“ativo”), como mostra, inclusive, a presença de um morfema de tran-
sitividade ({õ}) que aparece também nos verbos transitivos “de verdade” (cf.
a. e d., o morfe {i}). s, na frase c., não está padecendo de alguma condição, e por
esta razão é percebido como mais próximo de um a — a marca de flexão de
pessoa/número no verbo, portanto, é a mesma. Esse tipo de alinhamento per-
tence a um fenômeno mais amplo observável nas línguas naturais, conhecido
como split intransitivity “intransitividade cindida”, relacionado com o fato de
os verbos intransitivos poderem selecionar sujeitos tanto agentivos (correr,
nadar etc.; são os verbos “inergativos”) como não agentivos (cair, morrer etc.;
são os verbos “inacusativos”). Esta diferença semântica em muitas línguas se
manifesta em níveis diferentes. No português, por exemplo, apenas verbos
inacusativos (i.e., com s semanticamente parecido com o) podem ser usados
em construções participiais absolutas como Morto o papa, elegeu-se outro,
enquanto os inergativos não: *Nadados os atletas, a competição acabou.

Giulia Bossaglia 83
A linguística comparada (ou linguística histórico-comparada) correspon-
de ao estudo da história das línguas em seu desenvolvimento diacrô-
nico. Línguas diferentes são comparadas com o intuito de investigar as
relações de “parentesco” de umas com as outras para identificar as fa-
mílias linguísticas e reconstruir as protolínguas que as originaram.
Já a tipologia linguística compara as línguas, mas com objetivos e mé-

todos muito diferentes. O nome “tipologia” foi adotado da botânica na
segunda metade do século XIX por Georg von der Gabelentz e descreve
bem o primeiro objetivo da disciplina: classificar as línguas humanas em
“tipos” de acordo com características estruturais específicas, com o in-
tuito de descobrir princípios universais que regem o funcionamento das
línguas humanas.
São essas duas disciplinas comparativas que Giulia Bossaglia apresenta

aos estudantes de Letras/Linguística brasileiros na coleção “Linguística
para o ensino superior”. E o faz com propriedade e capacidade de levar
os leitores a aplicarem os métodos ao conhecimento das línguas africa-
nas e indígenas em sua relação com o português brasileiro. Sem dúvida,
uma obra que permitirá aprofundar e enriquecer o conhecimento e a
pesquisa no cenário acadêmico das Letras no Brasil.

Linguística Comparada Tipologia

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Linguística Comparada Tipologia

Enviado por

Direitos autorais:

Formatos disponíveis

LINGUÍSTICA

PARA O ENSINO SUPERIOR 9

@Famílias linguísticas do mundo

Figura 1: Família urálica (fonte: lewis, 2009).

Não há consenso completo sobre a composição da família altaica. Alguns es-

Figura 2: Família altaica: grupo túrcico (fonte: LEWIS, 2009).

4 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

Figura 3: Família altaica: grupo mongólico (fonte: lewis, 2009).

Cerca de 5 milhões de pessoas falam línguas do grupo mongólico, sendo que

Figura 4: Família altaica: grupo tungúsico (fonte: lewis, 2009).

As línguas da família tungúsica são faladas por grupos muito pequenos de

Figura 5: Família japônica (fonte: lewis, 2009).

Figura 6: Família coreana (fonte: lewis, 2009).

6 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

Figura 7: Famílias caucasianas (fonte: lewis, 2009).

No Sudeste asiático, encontram-se as famílias austroasiática — que com-

Figura 8: Família austroasiática (fonte: lewis, 2009).

Na parte centro-meridional da Índia e no Sri Lanka, são faladas as línguas

Figura 10: Família dravídica (fonte: lewis, 2009).

8 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

Figura 12: Família esquimó-aleutina (fonte: lewis, 2009).

GREENBERG, J. H. (1987). Language in the Americas. Stanford: Stanford University Press.

@história da escrita, sistemas de escrita

10 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

Figura 1: Cronologia da escrita na antiguidade (adaptado de damerow, 1999, p. 4, e coulmas, 1996).

12 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

Figura 2: Exemplo de desenvolvimento dos grafemas para números.

14 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

2. Sistemas de escrita: definição, tipos, evolução

Figura 3: Alguns grafemas sumérios em estágio arcaico da escrita cuneiforme.

boca pão comer

Preste-se atenção para o fato de que o que é combinado são os significados,

16 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

Figura 4: Evolução da cuneiforme suméria.

Na coluna B, são apresentados os grafemas da cuneiforme suméria após a ro-

1400 aEC 1100 aEC 220 aEC 200 aEC 1950 EC

Figura 5: Evolução da escrita chinesa (adaptado de XIAO; TREIMAN, 2012).

Como na evolução da cuneiforme suméria, a escrita chinesa também perdeu

18 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

’alp bet digg

O <A> do alfabeto latino nada é senão o desenvolvimento de um desenho de

20 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

@ símbolo, ícone, índice

22 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

@ fonemas, fones, alofones

24 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

@negação pas (linguística diacrônica vs. sincrônica)

(1) Je ne marche pas

(2) Je ne veux/sais/mange/crois pas

(3) Je mange pas

26 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

Relações entre signos

o ----- carteiro ----- entrega ----- a ----- encomenda

As relações sintagmáticas não são as únicas que existem entre os signos.

Como se pode observar no quadro acima, as relações em ausência também

@Interface entre níveis

28 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

30 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

@ sobre opção de reconstruir um protofonema

@grupos da famílias indo-europeia

32 LINGUÍSTICA COMPARADA E TIPOLOGIA para o ensino superior

Grupos albanês, helênico, armênio

@mudança vs. analogia