Escolar Documentos
Profissional Documentos
Cultura Documentos
Linguística Comparada Tipologia
Linguística Comparada Tipologia
LINGUÍSTICA
COMPARADA
e TIPOLOGIA
GIULIA BOSSAGLIA
CAPÍTULO
1
As línguas do mundo
Eurásia
Além das famílias indo-europeia e sino-tibetana, há outras importantes fa-
mílias linguísticas na Eurásia. Uma é a família uralo-altaica (do nome dos
montes Urais, na Rússia, e Altai, na China, que delimitam uma ampla região
em que suas línguas são faladas). Na verdade, é bastante controverso que se
trate de uma única família, e é mais aceita, hoje em dia, a divisão entre família
urálica, por um lado, e família macroaltaica, por outro. A família urálica com-
preende línguas faladas da Europa centro-oriental até a Rússia setentrional.
Na Europa, húngaro, estoniano e finlandês compõem o grupo ugro-fínico da
Giulia Bossaglia 3
família. Línguas urálicas são faladas por aproximadamente 25 milhões de pes-
soas hoje em dia.
O grupo túrcico possui uma extensão geográfica notável, da Turquia até a Rús-
sia norte-oriental. As línguas túrcicas são faladas hoje em dia por cerca de 120
Giulia Bossaglia 5
de 50 mil falantes, correndo, portanto, fortes riscos de extinção. O manchu,
que foi uma das línguas principais do grupo, hoje em dia é falado por apenas
poucas dezenas de pessoas (pereltsvaig, 2012, p. 212).
Dos cerca de 130 milhões de falantes de línguas japônicas, mais de 120 mi-
lhões falam japonês, enquanto as demais línguas da família são faladas por
comunidades menores — algumas são consideradas simples dialetos do japo-
nês. Existem posições divergentes sobre uma possível relação entre a família
japônica e a coreana.
A família é composta apenas pelo coreano, que é então uma língua isolada,
falada por cerca de 50 milhões de pessoas principalmente nas Coreias, mas
também na China, Japão e Rússia.
Giulia Bossaglia 7
Figura 9: Família tai-kadai (fonte: lewis, 2009).
Oceania
Uma das famílias linguísticas mais ameaçadas do planeta está na Oceania: a
família australiana. Os efeitos da colonização foram particularmente letais
para as comunidades aborígenes, e estima-se que para as cerca de 380 línguas
da família o número de falantes gire em torno de 40 mil.
Américas
Como se explica no Capítulo 6, a classificação genética das línguas nativas das
Américas é bastante complicada e até hoje controversa. Mencionam-se, portan-
to, apenas algumas das muitíssimas famílias classificadas para esse continente.
A família esquimó-aleutina compreende as línguas inuit, yupik, inuktikut e inupia-
tun, faladas por cerca de 90 mil pessoas entre Canadá, EUA, Groenlândia e Rússia.
De acordo com a classificação greenberguiana (cf. Figura 12), a família es-
quimó-aleutina faria parte da macrofamília euroasiática (junto com as famí-
lias indo-europeia e sino-tibetana, portanto).
Giulia Bossaglia 9
Dentro da controversa macrofamília dené-caucasiana, entraria a (reconhe-
cida) família na-dené da América do Norte, que compreende as línguas ata-
baskanas, como tlingit (Alaska e Canadá), navajo e apache (Califórnia e Méxi-
co norte-ocidental).
As principais famílias da América central são a uto-asteca (principal língua:
nahuatl), oto-mangueana (mixteco, zapoteco, entre outras), maia (maia, tsot-
sil, entre outras), mixe-zoqueana (mixe e zoque são as línguas principais). Em
sua maioria, essas línguas são faladas no México, mas também estão presen-
tes no Sudoeste dos EUA.
Figura 13: Macrofamílias linguísticas das Américas de acordo com Greenberg (1987).
1. Um pouco de história
As mais antigas atestações da escrita remetem ao final do IV milênio aEC e são
as tábuas de Uruk, antiga cidade suméria (no atual Iraque). Sumérios, assírios,
acadianos e elamitas foram as grandes civilizações do Crescente Fértil, que
viveram durante muito tempo em uma situação de intenso contato histórico e
cultural. Tratava-se, obviamente, de civilizações agrícolas, que desenvolveram
grandes comunidades urbanas e que precisavam da escrita para diversos fins
práticos, antes que literários ou caligráficos: contabilidade (por exemplo, em
atividades como construção de grandes obras — templos, palácios, pontes,
obras de irrigação — para as quais os responsáveis tivessem que prestar con-
ta ao poder central), fixação de leis, comunicação entre cidades diferentes etc.
As tábuas de Uruk são pequenas tábuas de argila seca, que contêm atestações
do sistema de escrita conhecido como cuneiforme. Esse nome evoca a típica
forma de “cunha” (do latim cuneus) de seus caracteres, porque eram marca-
dos com uma ferramenta pontiaguda, enquanto a argila estava ainda fresca, e
na tábua ficavam signos com essa forma.
Todas as civilizações mencionadas — e, não muito distante do Crescente Fértil,
em territórios que pertencem hoje à Turquia, a civilização hitita — se serviam
desse sistema de escrita para escrever suas línguas, que tinham procedências
genéticas diversas: a língua suméria e o elamita eram línguas isoladas, o as-
sírio e o acadiano línguas semíticas da família afro-asiática (como o árabe),
o hitita era uma língua indo-europeia. Fica claro, portanto, que o sistema de
escrita utilizado por uma comunidade linguística tem relação com o contexto
histórico-cultural daquela comunidade, e não necessariamente com a família
linguística à qual pertence sua língua.
Giulia Bossaglia 11
O fato de todas essas civilizações do antigo Oriente Médio utilizarem o mesmo
sistema de escrita foi utilizado como prova de uma monogênese (i.e., uma ori-
gem única) da escrita, que teria sido inventada pelos sumérios e transmitida
por difusão cultural para outras civilizações antigas. Na Figura 1, apresenta-se
uma cronologia dos principais sistemas de escrita da antiguidade, tentando
também dar uma ideia (ainda que bastante aproximada) das recíprocas posi-
ções geográficas das civilizações:
Como se vê, a escrita cuneiforme suméria foi rapidamente passada para a civi-
lização elamita (atual Irã) no começo do III milênio aEC, enquanto, na mesma
época, a escrita aparecia, em forma de hieróglifos, no antigo Egito. Na segun-
da metade do III milênio aEC, a escrita é encontrada na civilização de Harap-
pa (do nome de um de seus principais centros urbanos), no Vale do rio Indo
(atual Paquistão). Na virada para o II milênio aEC, surgiram os hieróglifos da
civilização minoica na ilha de Creta (o sistema de escrita conhecido como “Li-
near A”, ainda não decifrado), enquanto a escrita cuneiforme era utilizada pe-
los hititas. O ancestral do alfabeto fenício deve ter sido criado pouco depois,
por volta de 1800 aEC, e foi a partir do alfabeto fenício que mais tarde foi cria-
do o alfabeto grego, em torno do começo do I milênio aEC (o alfabeto latino foi
criado a partir dele: as primeiras atestações remetem ao VI séc. aEC). A mais
antiga escrita chinesa atestada, conhecida como escrita dos “ossos oracula-
res” — inscrições religiosas achadas em escápulas de boi e ovelha e em cascos
Giulia Bossaglia 13
sária e sistematicamente relacionado com a representação visual da língua —
muito pelo contrário, a interpretação linguística dos signos gráficos deve ter
ocorrido só em um segundo momento.
Muitas das tábuas de argila de Uruk são documentos que atestam transa-
ções de natureza econômico-administrativa, relacionadas com a construção
de grandes obras (templos, principalmente) e o gerenciamento dos recursos
materiais e humanos. Os ancestrais dessas famosas tábuas foram pequenas
fichas de argila de formatos e tamanhos diferentes de acordo com o tipo de
bem ou medida que representavam (esféricas para azeite, cônicas e achatadas
para diferentes medidas de cevada, cilíndricas e redondas para animais do-
mésticos etc.: SCHMANDT-BESSERAT, 2014; SCHMANDT-BESSERAT; ERARD,
2008) e eram utilizadas para registrar bens, entre o VIII e o IV milênio aEC.
Para fazer contabilidade, não era estritamente necessária a mediação da lín-
gua, e por isso os estudiosos têm se concentrado cada vez mais na análise de
como se desenvolveram os grafemas para os números (para hipóteses sobre
a coevolução da capacidade de fazer cálculos e o letramento: ROBSON, 2007;
CHRISOMALIS, 2009). Estes seriam o elo de ligação entre a protoescrita e a
escrita propriamente dita: a partir de uma representação icônica em que uma
quantia x de um objeto y corresponde à repetição x vezes de um desenho de
y, chega-se, graças a um processo de abstração, a uma notação mais arbitrária
que associa o desenho de y a um símbolo para a quantia x, como mostra o
exemplo da Figura 2:
Giulia Bossaglia 15
correspondia a uma palavra, principalmente nomes concretos, e mantinha
um razoável grau de iconicidade, como se mostra na Figura 3 (adaptada de
COULMAS, 1996, p. 100):
ave
peixe
asno
andar
grão
boi
A iconicidade dos grafemas acima permite que o significado (mas não o som!)
das palavras que eles representam seja facilmente interpretado também por
quem não conhece absolutamente nada da língua suméria.
Um sistema de escrita que consegue representar principalmente nomes con-
cretos é, claramente, limitado. Para ampliar o número de lexemas representá-
veis, era comum a cuneiforme suméria combinar mais grafemas. Por exemplo,
a palavra “comer” era escrita combinando os grafemas “boca” e “pão”:
+ =
A B C
ave
peixe
asno
andar
grão
boi
Giulia Bossaglia 17
da língua, mas podem ser combinados de maneira (potencialmente) ilimitada
para escrever todas as palavras existentes ou que serão eventualmente criadas
na língua. Por sua vez, sistemas plerêmicos são menos econômicos, pois cada
grafema tende a representar palavras ou morfemas, com maiores custos (na
escrita e na leitura) para a ampliação do conjunto de palavras representáveis.
Comparando o inventário grafêmico da cuneiforme nas muitas civilizações
que a utilizaram ao longo dos quatro milênios aEC, observa-se uma progres-
siva diminuição dos grafemas pertencentes ao sistema: de cerca de 2.000 na
suméria, a 800-700 na assírio-babilônia, a pouco mais que 100 na elamita, 41
na persa (VI-IV sécs. aEC), só para dar alguns exemplos.
Uma evolução parecida se observa no sistema de escrita logográfica chinesa,
como se pode ver comparando a escrita dos ossos oraculares (1400 aEC) com
seus desenvolvimentos mais recentes:
cavalo
ver
chuva
Giulia Bossaglia 19
CHRISOMALIS, S. (2009). The origins and coevolution of literacy and numeracy. The Cambridge han-
dbook of literacy, v. 59, p. 59–74.
COULMAS, F. (1996). The Blackwell encyclopedia of writing systems (p. 469). Oxford: Blackwell.
DAMEROW, P. (1999). The Origins of Writing as a Problem of Historical epistemology. (versão pré-
-publicação, em https://www.mpiwg-berlin.mpg.de/Preprints/P114.PDF; acesso em: 09 mar.
2020).
ROBSON, E. (2007). Literacy, numeracy, and the state in early Mesopotamia. Literacy and the State in
the Ancient Mediterranean. Accordia Research Institute, London, p. 37-50.
ROGERS, H. (2005). Writing systems: A linguistic approach. Oxford: Blackwell.
SCHMANDT-BESSERAT, D. (2014). The evolution of writing. University of Texas at Austin, 25. (http://
sites.utexas.edu/dsb/tokens/the-evolution-of-writing/; acesso em: 09 mar. 2020)
SCHMANDT-BESSERAT, D.; ERARD, M. (2008). Origins and forms of writing. Handbook of research on
writing: History, society, school, individual, text, p. 7-22.
XIAO, W.; TREIMAN, R. (2012). Iconicity of simple Chinese characters. Behavior research methods, 44
(4), p. 954-60. (https://link.springer.com/article/10.3758/s13428-012-0191-3; acesso em: 09
mar. 2020).
Giulia Bossaglia 21
os numerais do tipo de dezenove, cujo significado (“ideia de 19”) mantém uma
relação de semelhança com a soma de dez e nove, facilmente reconhecível no
significante (mas atenção: dez e nove não deixam de ser palavras arbitrárias!).
Os índices são signos motivados também, mas a relação entre significado e
significante é de proximidade física ou metafórica, logo, lógica, de causa-efei-
to. Pegadas no chão são índice da passagem de alguém — inclusive, a partir da
forma ou profundidade, quem vir as pegadas pode inferir que tipo de ser ou
veículo as deixou; o arco-íris é índice de que choveu; a fumaça é índice de fogo
— se ela for muito grande, de incêndio; se for pequena, de cigarro, e assim por
diante. Algumas categorias de palavras, como os advérbios de tempo e lugar,
os pronomes pessoais e os demonstrativos, podem ser assimiladas a índices,
por seus “significados” serem atrelados (i.e., manterem relação de proximida-
de) ao contexto específico da enunciação — em linguística são chamados, não
por acaso, de dêiticos (do grego déiknumi “indicar”). O advérbio ontem indica
dias diferentes se for pronunciado em 1 ou 2 de janeiro; aqui, falado em São
Paulo, indica um lugar diferente se for pronunciado em João Pessoa; quando
tratamos por tu ou você pessoas diferentes, esses pronomes têm valores dife-
rentes. É claro, portanto, que o valor que os dêiticos assumem varia de acordo
com os contextos específicos em que são utilizados. Por razões de precisão, é
importante sublinhar uma diferença entre signos linguísticos que são ícones
e signos que são índices: nos primeiros, a relação de semelhança existe efeti-
vamente entre significante e significado, entretanto, nos dêiticos a relação de
proximidade existe entre o signo como um todo (significado e significante) e
seu referente no mundo real. De fato, a relação entre o significante ontem e o
significado “dia logo anterior a hoje”, entre aqui e “este lugar”, e entre tu/você
e “segunda pessoa singular” etc. é completamente arbitrária — mas não a re-
lação desses signos com as entidades (lugar, tempo, pessoas) que designam
no momento da enunciação.
Os símbolos são, na distinção do Peirce, os únicos signos arbitrários, em que
a relação entre significado e significante não é motivada. Um exemplo por ex-
celência é o semáforo: não há uma razão pela qual a essas cores específicas
estejam associadas as respectivas ações, e todos (oxalá!) aprendemos que
vermelho significa “parar”, verde “seguir” etc. Os grafemas do nosso alfabeto
também são símbolos: o fonema /a/ ser representado graficamente por <A,
a> e o /f/ por <F, f> é fruto de uma convenção — poderia perfeitamente dar-se
o contrário, se a convenção fosse outra. A grande maioria das palavras nas lín-
guas naturais é composta por símbolos, por óbvias razões de economicidade.
Giulia Bossaglia 23
Entretanto, é possível recuperar uma motivação (i.e., iconicidade) na diferen-
ça de atribuição de gênero para “sol” e “lua” nessas línguas. Não por acaso as
línguas em que ao sol é atribuído gênero masculino são línguas originárias do
sul da Europa, e aquelas que lhe atribuem gênero feminino do norte. Há uma
diferença climático-ambiental entre essas regiões do continente europeu que
faz com que o sol seja o elemento mais “forte” (a força era iconicamente asso-
ciada ao sexo masculino) no sul, e muito menos no norte (a fraqueza era iconi-
camente associada ao sexo feminino). Então, nas culturas primitivas originárias
dessas áreas, o sexo das divindades associadas a esses elementos foi escolhido
de forma icônica de acordo com a força (masculino) vs. fraqueza (feminino) des-
ses elementos nos respectivos ambientes. Vestígio dessa diferença é a diferen-
te atribuição de gênero gramatical para “sol” e “lua” nas línguas mencionadas.
Obviamente, nenhum falante nativo dessas línguas hoje tem consciência de tal
origem icônica (a não ser que se interesse por essas questões ou que alguém lhe
conte em uma aula...) e declina “sol” e “lua” pelo gênero masculino ou feminino
da mesma forma como declina “copo”, “cadeira”, “ônibus”, “pedra” etc.
Um dado interessante sobre a relação entre iconicidade e arbitrariedade pro-
vém da história dos sistemas de escrita, que se originaram todos como siste-
mas icônicos, evoluindo para parcial ou completamente arbitrários ao longo
do tempo — a evolução inversa nunca se deu (cf. @sistemas de escrita).
Giulia Bossaglia 25
Nos três exemplos acima, são esquematizados os três estágios de evolução
(o termo técnico para esse processo, em linguística, é gramaticalização) da
negação pas na língua francesa. A palavra pas, antes de se transformar em
negação, significava apenas “passo” em francês — de fato, ainda existe com
este significado (faire un faux pas “dar um passo em falso”). Com este sig-
nificado específico, pas era utilizado com verbos que indicam movimento
humano, como marcher “andar”. Em casos como (1), pas era utilizado con-
comitantemente com a negação ne, e, por seu significado indicar uma enti-
dade de pequena dimensão, com o tempo se perdeu a conotação específica
de “espaço percorrido cada vez que se estende ou se põe um pé adiante do
outro”, e pas foi reinterpretado como simples reforço da negação ne: ‘nem
um passo’ = ‘nem um pouco’. No italiano, aconteceu o mesmo, mas com ou-
tra palavra que indica algo pequeno, a palavra mica “migalha” (ou brisa,
“migalha” também, em algumas variedades regionais do Norte): Non hai
mica capito “você não entendeu” (< “você não entendeu nem uma migalha”,
“você não entendeu nada”). Perdendo-se a especificidade semântica da pa-
lavra pas, ela começou a ser utilizada como reforço da negação ne também
quando o verbo não indicava o movimento humano, como em (2). De fato,
nesse segundo estágio, pas não é reforço da negação, mas parte dela: em
vez de ficar antes do verbo, a negação em francês se “divide” em uma parte
anterior e outra posterior ao verbo — em português brasileiro, existe tam-
bém esse uso “duplo” da negação (isto eu não faço não). No francês falado
contemporâneo, por fim, o valor de negação pode ser codificado por pas
apenas, como mostra o exemplo (3) (cf. português brasileiro faço não). Essa
breve descrição da história da negação pas em francês é um exemplo de
olhar diacrônico sobre o sistema linguístico: ao longo do tempo, acontece-
ram algumas mudanças que levaram o sistema do francês contemporâneo
a ter uma nova unidade (uma nova peça de xadrez) — a negação pas. As
mudanças afetaram uma configuração do sistema anterior, em que pas não
era negação.
Na perspectiva sincrônica, ao contrário, o linguista analisaria a negação pas
como um elemento do sistema do francês em oposição a todos os outros ele-
mentos presentes em tal sistema em uma determinada época, mas se fosse
olhar para outro ponto do tempo, por exemplo anterior à época em que pas
se gramaticalizou como negação, poderia achar outro sistema do francês, no
qual a negação pas não existe, sendo, dentro de tal sistema, um outro tipo de
elemento (um substantivo).
Giulia Bossaglia 27
o carteiro entrega a encomenda
este homem dá esta coisa
aquele filho entregam aquela objeto
os mulher leva as presentes
uns professor rouba umas carta
a carteiros entregou o pacote
... ... ... ... ...
* come *o * carteiro * pessoa * fazer
* para * com * feliz * porque * para
Relações paradigmáticas ou associativas
“Paulo ama Mário” (não vice-versa) “Mário ama Paulo” (não vice-versa)
Paulus amat Marium. Marius amat Paulum.
Marium amat Paulus. Paulum amat Marius.
Amat Marium Paulus. Amat Paulum Marius.
Amat Paulus Marium. Amat Marius Paulum.
Paulus Marium amat. Marius Paulum amat.
Marium Paulus amat Paulum Marius amat.
No latim tardio, [s] e [m] em final de palavra já não eram pronunciados mais,
ou eram pronunciados de uma maneira muito enfraquecida. Devido a esse
fato, que afetava o nível fonético-fonológico, criou-se ambiguidade na distin-
ção das desinências de caso: Paulus amat Marium virava Paulu amat Mariu (e
todas as respectivas alternativas de posição), de maneira que não seria possí-
vel distinguir sujeito e objeto direto na frase. Uma mudança no nível fonético-
-fonológico havia transformado, portanto, a morfologia da língua, que já não
codificava de maneira clara a categoria flexional de caso. De fato, foi assim que
essa categoria flexional se perdeu na transição do latim para as línguas româ-
nicas, que retêm marcas morfológicas de caso apenas nos pronomes pessoais
(cf. eu sujeito, me objeto direto etc.). A perda das marcas morfológicas de caso
fez com que já não fosse possível entender “se era o Paulo que amava o Mário
ou vice-versa”, ou seja, as funções sintáticas das palavras. Portanto, as línguas
românicas tiveram que desenvolver outra estratégia para desambiguar essas
funções, através da fixação de uma ordem sintática básica de tipo svo (Sujeito
– Verbo – Objeto): assim, o sujeito é colocado como regra antes do verbo, e o
objeto direto depois (ordens diferentes desta requerem realizações prosódi-
cas específicas); consequentemente, a interpretação default (i.e., automática)
Giulia Bossaglia 29
de Paulo ama Mário é que Paulo é o sujeito da frase — para dizer que é o Mário
que ama Paulo, é preciso alterar a ordem dos nomes na frase. Assim, algo que
afetou o nível fonético-fonológico de uma língua chegou a ter consequências
no nível sintático de suas línguas filhas, passando por modificações no nível
morfológico.
A mudança que levou à perda do sistema latino de marcação morfológica de
caso nas línguas românicas, como se viu, pode ser descrita como algo que
aconteceu inteiramente devido a dinâmicas de mudança dentro do sistema
linguístico, em diferentes níveis. Contudo, ficar em uma perspectiva interna
não dá conta de explicar as razões de tal mudança. Em outros termos, dizer
que a mudança aconteceu internamente ao sistema corresponde a uma abs-
tração, que separa as realizações concretas das regras do sistema (a perda de
[s] e [m] final foi algo que aconteceu na pronúncia dos falantes de latim tardio,
ou seja, aconteceu fora do sistema, fora da langue).
Giulia Bossaglia 31
Grupo itálico
As línguas extintas desse grupo eram todas antigas línguas faladas na Penín-
sula Italiana (por essa razão, o nome do grupo); entre elas, algumas das prin-
cipais foram o osco-umbro, o falisco e o latim. As línguas itálicas vivas hoje em
dia são todas filhas do latim: português, espanhol, catalão, francês, provençal,
italiano, romanche (ou ladino), sardo, romeno, entre outras, são conhecidas
como línguas neolatinas ou românicas.
Grupo céltico
Este grupo conta, hoje em dia, com poucas línguas faladas na Irlanda, Escócia,
Gales e, na França, na região da Bretanha: irlandês, manês (falado na ilha de
Man), gaélico escocês, bretão, córnico e gaulês. Antigamente, línguas desse
subgrupo da família eram faladas em uma região da Europa que se estendia
da Península Ibérica até a hodierna Turquia.
Grupo eslavo
O grande grupo eslavo compreende as línguas balcânicas esloveno, croata, sér-
vio, bósnio, montenegrino, macedônio, búlgaro e, da Europa central até a Russia,
o tcheco, eslovaco, polonês, bielo-russo, ucraniano, russo. A língua eslava mais
antiga é o antigo eslavo eclesiástico, língua literária atestada a partir do séc. X.
Grupo báltico
Lituano e letão são as línguas bálticas faladas hoje em dia. Devido a razões
de contato, as línguas desse grupo apresentam muitas afinidades com as do
grupo eslavo. Não há atestações de línguas mais antigas.
Grupo indo-iraniano
Este grande grupo da família pode ser dividido em três subgrupos: indo-ário,
iraniano e nuristano (este último, muito pequeno). Pertencem ao grupo indo-
-ário o híndi, o bengali, o romani (línguas dos ciganos, faladas em muitos paí-
Giulia Bossaglia 33
ses europeus, com ênfase na área balcânica), entre muitas outras. O sânscrito
é a língua mais antiga do subgrupo indo-ário. O subgrupo iraniano é o mais
ocidental, e compreende o farsi (persa moderno), o curdo, o osseto, entre ou-
tras línguas. A mais antiga língua do subgrupo iraniano é o avéstico ou zend,
língua dos textos sagrados da religião zoroastriana (o Avesta). As três línguas
nuristanas vivas hoje em dia são faladas no atual Afeganistão.
Grupo anatólico
O nome do grupo deriva de Anatólia, antigo nome da Turquia, a região onde
antigamente eram faladas estas línguas indo-europeias. Entre elas, a principal
é o hitita, língua da importante civilização que viveu entre II e I milênio aEC, e
que foi decifrado só no começo do séc. XX.
Grupo tocariano
No começo do século XX, foram descobertos documentos budistas no Turques-
tão chinês (ou Xinjang), atestando duas línguas irmãs conhecidas como tocá-
rio A e tocário B e reconhecidas depois como indo-europeias. O tocário, língua
indo-europeia mais oriental, apresenta características em comum com muitas
línguas ocidentais da família (grego, latim, línguas germânicas, hitita) — isto
teve consequências muito importantes para o reconhecimento de traços lin-
guísticos mais arcaicos (por isso, conservados nas periferias ocidental e orien-
tal) em oposição a traços inovadores achados em línguas centrais da família.
Giulia Bossaglia 35
de plural continha uma consoante nasal (plurais originais: kine, eyen/eyne vs.
novos plurais “regularizados” cows, eyes).
A analogia, portanto, é um dos mecanismos que governam a mudança linguís-
tica. O linguista americano Edgar Howard Sturtevant (1875-1952) dá o nome
a um paradoxo muito famoso na linguística histórica, o “paradoxo de Sturte-
vant”, e que diz respeito à mudança e à analogia. Ele afirma que a mudança fo-
nética é regular, mas produz irregularidades, enquanto a analogia é irregular,
mas produz regularidades.
Assumir que a mudança fonética é regular significa assumir que ela ocorre em
todas as palavras que apresentam o contexto fonológico que desencadeia essa
mudança. Pode-se observar isso no paradigma do presente do indicativo do
verbo negare “negar” no italiano antigo:
Italiano antigo
1ªsg niego [ˈnjego]
2ªsg nieghi [ˈnjegi]
3ªsg niega [ˈnjega]
1ªpl neghiamo [neˈgjamo]
2ªpl negate [neˈgate]
3ªpl niegano [ˈnjegano]
Italiano contemporâneo
1ªsg nego [ˈnego]
2ªsg neghi [ˈnegi]
Italiano contemporâneo
1ªsg siedo [ˈsjedo]
2ªsg siedi [ˈsjedi]
3ªsg siede [ˈsjede]
1ªpl sediamo [seˈdjamo]
2ªpl sedete [seˈdete]
3ªpl siedono [ˈsjedono]
Giulia Bossaglia 37
@ Lei das palatais
A lei das palatais explicou a aparente não correspondência fonética entre os siste-
mas vocálicos do antigo grego e do latim, compostos por cinco vogais breves (a, e,
i, o, u), em oposição àquele do sânscrito, composto por apenas três (a, i, u):
@Lei de Verner
No quadro abaixo, mostra-se como a lei de Verner explica a aparente discre-
pância nos reflexos de pie *t no gótico, que, em vez de serem ambos th ([θ]),
como a lei de Grimm prevê, são ora th, ora d:
Giulia Bossaglia 39
pie Protogermânico Retração do acento th > d Gótico
para a 1ª sílaba
*bhrāt́ er *brāt́ her não não bróthar
*pə2tḗr *fəthḗr sim sim fádar
No gót. bróthar, que procede do protogerm. *brā́ ther < pie *bhrā́ ter, o acento
tônico da palavra se encontrava na primeira sílaba já no pie e no protogermâ-
nico; portanto, th, o reflexo fricativo de *t, se manteve. Já em palavras como
gót. fádar, em vez de th há d [d]: no pie, a palavra é reconstruída com acento
na segunda sílaba, *pə2tḗr. No protogermânico, reconstrói-se uma aplicação
regular da lei de Grimm, que leva ao esperado th: *fəthḗr; em seguida, ocorreu
a retração do acento para a primeira sílaba, que acabou alterando a fricativa
th para d: fádar. A lei de Verner, portanto, conseguiu “consertar” os erros que
Grimm, no início do século, tinha cometido devido ao rudimentarismo teórico
e metodológico da disciplina àquela altura.
@ história da tipologia
Em 1660, era publicada a Grammaire générale et raisonnée (“Gramática geral e
razoada”), conhecida também simplesmente como “Gramática de Port-Royal”, do
nome do mosteiro de Port-Royal-des-Champs (não longe de Paris) ao qual per-
tenciam seus autores Claude Lancelot e Antoine Arnauld. Nesta obra, em que
se vê uma forte influência do racionalismo cartesiano, é possível encontrar as
raízes mais antigas da reflexão sobre universais linguísticos, tão importantes
em âmbito tipológico: de fato, a Gramática de Port-Royal é uma gramática da
língua francesa que tem como objetivo mais geral explicar “as razões daquilo
que é comum a todas as línguas”. As línguas, de acordo com a obra, são meios
para “explicar o pensamento através de signos”, e o pensamento (a “razão”) é
uma faculdade universal do homem. Logo, devem existir princípios universais
da linguagem, da qual as línguas são apenas realizações particulares. Assim,
na Gramática de Port-Royal, a língua francesa e seus princípios são tomados
como ponto de partida para deduzir os princípios da linguagem em geral (e
de todas as línguas). Essa abordagem dedutiva ao estudo das propriedades
universais da linguagem é assimilável à noção de gramática universal introdu-
zida por Noam Chomsky três séculos mais tarde, e é muito distante, do ponto
de vista teórico e metodológico, da tipologia moderna. Contudo, é significativo
individualizar, já na Gramática de Port-Royal, o interesse por princípios e res-
trições universais da linguagem humana.
O interesse tipológico recebeu um forte impulso ao longo dos sécs. XVII-
-XIX, graças à chamada “linguística missionária”, que se desenvolveu pelo
encontro de missionários europeus com línguas muito “exóticas”, surgin-
Giulia Bossaglia 41
do a exigência de conciliar a ideia de uma substancial unidade das línguas
como expressões da mente humana com a grandíssima variação interlin-
guística existente. Uma das respostas oriundas dessa exigência foi aquela
do alemão Wilhelm von Humboldt (1767-1835) que, em sua obra Über die
Verschiedenheit des menschlichen Sprachbaus und seinen Einfluss auf die geis-
tige Entwicklung des Menschengeschlechts “Sobre a diferença na estrutura
linguística humana e sua influência sobre o desenvolvimento intelectual da
humanidade” (publicada em 1836), defendia que as estruturas das línguas
refletem o espírito de suas comunidades de falantes, e que, portanto, a di-
versidade linguística fosse um espelho das diversidades intelectuais e es-
pirituais das culturas humanas. Longe de ser uma abordagem objetiva ao
estudo das línguas, é sem dúvida importante, no pensamento humboldtiano,
a ideia de que é necessário conhecer as particularidades das demais línguas
humanas para chegar aos princípios mais gerais da linguagem, que é organi-
zada de acordo com regras específicas.
Na primeira metade do século XIX, enquanto se desenvolviam os estudos
comparativistas na Europa, surgiram também as primeiras classificações das
línguas em “tipos”, com base em critérios morfológicos: os irmãos Friedrich
(1772-1829) e August Schlegel (1767-1845) classificavam as línguas em or-
gânicas, com estrutura (línguas indo-europeias) e não orgânicas (todas as ou-
tras). Essa classificação identificava línguas “sem estrutura” como o chinês,
línguas “com afixos” como o turco, e línguas “com flexão” como latim e grego
(“sintéticas”) ou o francês (“analítica”). Nas classificações em tipos morfológi-
cos da primeira metade do século XIX — Franz Bopp e Jacob Grimm também
se dedicaram a esse tipo de estudo —, havia uma forte relação entre critérios
genéticos e tipológicos: os tipos, que eram concebidos como imutáveis ao lon-
go da diacronia, eram associados a famílias linguísticas específicas — não sur-
preende que à família linguística indo-europeia fosse atribuído o tipo “mais
perfeito”, de acordo com certo ideologismo que caracterizou o surgimento dos
estudos linguísticos na Europa da época, e que se refletiram nessas classifica-
ções das línguas de natureza avaliativa.
O verdadeiro precursor da tipologia moderna é para todos os efeitos o alemão
Georg von Gabelentz (1840-1893). Sinólogo, fortemente influenciado pelos
desenvolvimentos das ciências naturais que caracterizaram a segunda meta-
de do século XIX (como muitos contemporâneos dele: pense-se em August
Schleicher, por exemplo), Gabelentz publicava, em 1891, a obra Die Sprach-
wissenschaft “Linguística”, da qual é particularmente programático e famoso
Giulia Bossaglia 43
tica. Na esteira dos estudos que, a partir do começo do séc. XX, buscaram
comprovar a hipótese monogenética das línguas, Greenberg havia passado
décadas aplicando métodos de comparação massiva aos demais continentes,
chegando às classificações genéticas das línguas da África e das Américas e,
mais em geral, a um amplo (ainda que nem sempre necessariamente profun-
do) conhecimento de línguas muito diferentes entre si. Em 1963, era publi-
cado o ensaio Some universals of grammar with particular reference to the
order of meaningful elements “Alguns universais da gramática com particular
referência à ordem dos elementos significativos”. Nele, Greenberg formulava
45 universais linguísticos, a partir da análise de uma amostra de 30 línguas
selecionadas em todos os continentes (Europa: basco, sérvio, galês, norue-
guês, neogrego, italiano, finlandês; Ásia: turco, burushaski, hebraico, híndi,
kannada, japonês, tailandês, birmanês, malayo; África: iorubá, suaíli, fulani,
massai, songhai, nubiano, berbere; Oceania: maori, luritja; Américas: qué-
chua, chipcha, maia, zapoteco, guarani).
A partir da classificação das línguas da amostra com base na ordem de sujei-
to, verbo e objeto direto (os “elementos significativos”), Greenberg formu-
lou universais sintáticos e morfológicos, absolutos e implicacionais. Inde-
pendentemente da validade deles hoje em dia — algumas correlações entre
parâmetros sintáticos não são mais tidas como efetivas, por exemplo — e
do viés areal e genético da amostra utilizada — predominância de línguas
europeias e indo-europeias — foi graças a esta obra que a concepção de uni-
versal linguístico mudou do simples conceito de “propriedade obrigatória
em todas as línguas” para ponto de partida ao medir as diferenças entre as
línguas naturais.
A tipologia greenberguiana se configurou como uma disciplina de orientação
empírica, indutiva, requerendo, assim, extensos trabalhos de comparação in-
terlinguistíca antes da formulação das generalizações (de maneira comple-
tamente contrária, portanto, à abordagem dedutiva do gerativismo chomsk-
yano, que vinha se desenvolvendo nos mesmos anos). Os estudos tipológicos
atuais, que se beneficiam de avanços teóricos, metodológicos e até tecnológi-
cos posteriores a Greenberg, continuam, contudo, na esteira dessa abordagem
empírica e baseada nos dados que ele iniciou.
*Original: Aber welcher Gewinn wäre es auch, wenn wir einer Sprache auf den
Kopf zusagen dürften: Du hast das und das Einzelmerkmal, folglich hast du die
und die weiteren Eigenschaften und den und den Gesammtcharakter! — wenn
wir, wie es kühne Botaniker wohl versucht haben, aus dem Lindenblatte den
@ tipologia areal
1. Introdução
Por tipologia areal, entende-se o estudo de padrões linguísticos específicos de
determinadas “áreas linguísticas” — de alguma maneira, é algo híbrido entre
a tipologia e a linguística areal, resultando, de fato, em uma disciplina bastan-
te controversa.
A primeira definição de “área linguística” remete ao linguista russo Nikolay
Trubetzkoy (1890-1938), que, no final dos anos 1920, cunhou o termo Spra-
chbund (termo alemão que significa “liga linguística”). Uma Sprachbund ou
área/liga linguística (também “área de convergência”) é uma área geográfica
em que existem comunidades que falam línguas que não possuem relação ge-
nética muito próxima entre si (pertencem a famílias linguísticas diferentes ou
a grupos diferentes dentro de uma mesma família) e que, devido a razões de
contato, acabaram compartilhando um conjunto de traços tipológicos que as
diferenciam das línguas irmãs nas respectivas famílias e, em geral, daquelas
que não são faladas naquela área geográfica.
Uma longa série de tentativas de definir melhor os critérios necessários para
a definição de área linguística se sucederam até tempos bastante recentes (cf.
CAMPBELL, 2006 para uma discussão detalhada), levando apenas, na verda-
de, à constatação de que o conceito de Sprachbund é bastante controverso.
Antes de examinar alguns dos principais problemas, será ilustrada sintetica-
mente a Sprachbund balcânica.
2. Sprachbund balcânica
A liga linguística balcânica é uma das mais estudadas na literatura — foi a
partir da observação de fortes semelhanças entre as línguas balcânicas que
Trubetzkoy chegou a formular o próprio conceito de Sprachbund.
Os Balcãs, como área geográfica, apresentam uma forte fragmentação política.
O mapa abaixo mostra alguns dos países em que se falam línguas considera-
das parte da Sprachbund.
Giulia Bossaglia 45
O conjunto das línguas que têm sido incluídas na Sprachbund compreende
(VAUX, 2002):
a) albanês (indo-europeia; grupo albanês);
b) neogrego (indo-europeia; grupo helênico);
c) romani (indo-europeia; grupo iraniano);
d) arromeno, romeno e romeno meglesita (falado na Grécia setentrional e na
Macedônia), judeu-espanhol (indo-europeia; grupo itálico);
e) búlgaro, macedônio, servo-croata meridional (indo-europeia; grupo eslavo);
f) turco (altaica; grupo túrcico).
Estudiosos diferentes têm proposto conjuntos um pouco diferentes de lín-
guas, com base nos traços por elas compartilhados — por exemplo, alguns
excluem o turco, o romani ou outras línguas.
São muitos os traços que, na literatura, são associados à Sprachbund balcâni-
ca, ainda que com graus diferentes de segurança. A seguir ilustram-se alguns
dos principais:
a) presença de [ə] como vogal tônica (albanês, romeno, búlgaro, alguns dia-
letos do macedônio, servo-croata, alguns dialetos do romani, turco);
b) vocalismo de cinco vogais /i, e, a, o, u / sem contrastes de quantidade (vo-
gal longa vs. breve), abertura ou nasalidade;
c) redução do sistema de marcação de caso morfológico, através do sincretis-
mo entre genitivo e dativo (grego, albanês, romeno, búlgaro, macedônio):
isto significa que a expressão da posse (“casa do Pedro”) e do beneficiário
(“dei o livro ao Pedro”) são codificados, nestas línguas, através de uma
única forma;
Giulia Bossaglia 47
No caso da Sprachbund balcânica, esse contato é documentado desde a anti-
guidade, a partir do império romano do Oriente (cf. coesão/identidade cul-
tural em oposição ao do Ocidente) e, em seguida, com o império bizantino.
Um novo período de unificação cultural da área balcânica foi, a partir do séc.
XVII, o império otomano, que continuou mantendo a coesão da região, ainda
que culturalmente diferente (neste período se intensificou bastante, inclu-
sive, a influência lexical que o turco teve nas demais línguas). No estudo de
fenômenos areais, portanto, é sempre necessário examinar muitos fatores
extralinguísticos, não sendo suficiente a simples análise dos dados linguís-
ticos. São fatores deste tipo que favorecem ou bloqueiam os fenômenos de
empréstimo linguístico e, mais em geral, a transmissão de traços linguísticos
entre comunidades linguísticas diferentes. O contato, de fato, nem precisa ser
propriamente geográfico, sendo suficiente o contato cultural, fator que, em
tempos recentes, é impulsionado de maneira exponencial pelos novos meios
de comunicação — pense-se na quantidade de empréstimos lexicais do inglês
introduzidos no português, sem que houvesse contato geográfico com os EUA.
Algumas áreas linguísticas estudadas na literatura são a área linguística eu-
ropeia (conhecida como Standard Average European “Europeu médio padrão”
HASPELMATH, 1998; 2001), também conhecida como “área de Carlos Mag-
no”; a área báltica (DAHL; KOPTJEVSKAJA-TAMM, 2001); a área linguística
mesoamericana (CAMPBELL et al., 1986); a área linguística do litoral ameri-
cano norte-ocidental (LEER, 1991); a área etiópica (FERGUSON, 1970; TOSCO,
2000), entre várias outras.
3. Problemas
Como se antecipou, o conceito de Sprachbund, além de complexo, é bastante
controverso, e vários problemas relativos aos critérios a serem adotados para
a identificação de áreas linguísticas têm sido levantados.
Além de uma ou outra diferença, as muitas e diversas definições de Spra-
chbund envolvem, como critérios: (i) o número de línguas e/ou famílias; (ii) o
número de traços linguísticos; (iii) a definição dos limites da área geográfica
a ser considerada, entre outros problemas mais específicos (cf. CAMPBELL,
2006 para uma resenha detalhada de todos).
Com relação ao número de línguas, muitos autores propõem um mínimo de
três, argumentando que admitir como área linguística uma situação de con-
Giulia Bossaglia 49
Existem vários outros problemas relacionados com o conceito de Sprachbund
e que não serão aprofundados aqui. Como sugere Campbell (2006, p. 21), é
oportuno que os esforços direcionados à definição de área linguística sejam
melhor aproveitados para entender a história de empréstimos e outros fenô-
menos específicos de difusão linguística, sem insistir nas tentativas de recor-
tar Sprachbünde nos mapas.
CAMPBELL, L. (2006). Areal linguistics: A closer scrutiny. In: Linguistic Areas. London: Palgrave
Macmillan, p. 1-31.
____; KAUFMAN, T.; SMITH-STARK, T. C. (1986). Meso-America as a linguistic area. Language, p.
530-570.
DAHL, Ö.; KOPTJEVSKAJA-TAMM, M. (Eds.) (2001). The Circum-Baltic languages: typology and
contact (Vol. 54). Amsterdam-Philadelphia: John Benjamins Publishing.
FERGUSON, C. A. (1970). The Ethiopian language area. Journal of Ethiopian Studies, 8 (2), p.
67-80.
HASPELMATH, M. (1998). How young is standard average European. Language sciences, 20 (3),
p. 271-287.
____ (2001). The European linguistic area: Standard Average European. In: Language typology
and language universals, p. 1492-1510. Berlin: de Gruyter.
LEER, J. (1991). Evidence for a Northern Northwest Coast language area: Promiscuous number
marking and periphrastic possessive constructions in Haida, Eyak, and Aleut. In: Internatio-
nal journal of American linguistics, 57 (2), p. 158-193.
TOMIC, O. M. (2006). Balkan Sprachbund morpho-syntactic features (Vol. 67). Springer Science
& Business Media.
TOSCO, M. (2000). Is There an “Ethiopian Language Area”? In: Anthropological Linguistics, p.
329-365.
VAUX, B. (2002). There was and wasn’t a Balkan Sprachbund. Paper presented at AIEA, Würz-
burg. (https://www.academia.edu/181211/There_was_and_there_wasn_t_a_Balkan_Spra-
chbund; acesso em: 10 mar. 2020).
@WALS
O WALS Online — World Atlas of Language Structures Online “Atlas mundial
online das estruturas linguísticas” (https://wals.info/; a versão impressa foi
publicada em 2005) é fruto do trabalho do Max Planck Institute for Evolu-
tionary Anthropology “Instituto Max Planck de Antropologia Evolucionista”
(https://www.eva.mpg.de/index.html) de Leipzig, na Alemanha.
O WALS é uma extensa e articulada base de dados sobre propriedades estru-
turais das línguas naturais em todos os níveis de análise linguística. Os dados
foram coletados por um conjunto de 55 autores (listados na seção Authors, cf.
Figura 1), em pesquisas tipológicas independentes, cada uma focada na des-
crição de um traço específico.
Features
Os dados do WALS são organizados de acordo com 192 traços (Features), que di-
zem respeito a diversos níveis de análise linguística (fonologia, morfologia, sinta-
xe, léxico) e categorias lexicais (nomes, pronomes, adjetivos, verbos, adposições).
Giulia Bossaglia 51
Cada traço possui nome e código de identificação próprios. Na tabela em que
todos os traços são listados (cf. Figura 2), são indicados também: a autoria do
estudo relativo ao traço; o nível de análise linguística ou a categoria lexical
envolvida; o número de línguas que compõem a amostra do estudo. Por exem-
plo, o código 1A identifica o traço “Inventários consonantais”, estudo desen-
volvido por Ian Maddieson (nível: Fonologia), a partir de uma amostra de 563
línguas. O botão Values “Valores”, na última coluna da tabela de apresentação
dos traços, permite acessar os detalhes da classificação das línguas de acordo
com o traço:
guas de Nova Guiné e Austrália com relação a esse traço poderia sugerir ser
ele originário da época em que estas duas ilhas eram ligadas por uma ponte de
terra que permitiu um mais ágil povoamento da Austrália e que, por volta de
7000 anos aEC, ficou submersa, acabando com a facilidade de contato entre
tais comunidades linguísticas. As línguas das duas ilhas reteriam, então, um
traço tipológico areal muito antigo.
O WALS permite não só a exploração de traços específicos, mas também de
combinações de mais traços ao mesmo tempo. É possível, por exemplo, com-
binar o traço 1A com os traços 2A Vowel quality inventories “Inventários de
qualidade vocálica”, referente ao número de vogais das línguas consideran-
do apenas as oposições de qualidade (ou seja: ā e ă contam como uma única
vogal, porque se diferenciam por quantidade — ā longo e ă breve — e não
qualidade), e 13A Tone “Tone”, referente à presença ou à ausência de tom com
valor fonológico nas línguas (Figuras 5, 6, 7).
Giulia Bossaglia 53
Figura 5: Combinação dos traços 1A, 2A e 13A.
Como os três traços foram estudados com base em amostras um pouco dife-
rentes (1A: 563 línguas, 2A: 564 línguas, 13A: 527 línguas), os resultados que
se obtêm dizem respeito apenas a línguas compartilhadas pelas três amostras
— neste caso, 520. A Figura 6 mostra o mapa da combinação dos traços 1A,
2A e 13A.
Giulia Bossaglia 55
Figura 7: Legenda do Mapa da combinação dos traços 1A, 2A e 13A.
Giulia Bossaglia 57
Figura 10: Menu de seleção Legenda.
Chapters
Nesta seção, são consultáveis os capítulos que dizem respeito a cada traço
linguístico presente no WALS. Os capítulos apresentam um padrão fixo, que
inclui uma breve introdução sobre o traço em estudo, a especificação dos va-
lores para ele pertinentes (por exemplo, para o 81A: svo, sov, vso etc.) com
o link para o respectivo mapa, exemplos comentados, observações sobre a
distribuição geográfica dos valores e comentários sobre questões teóricas re-
levantes associadas ao traço ou levantadas pelos resultados do estudo. Fre-
quentemente, há referência cruzada para outros capítulos do WALS, e são
sempre indicadas ulteriores referências bibliográficas.
Um dos aspectos mais interessantes e importantes do WALS é seu caráter in-
terativo e colaborativo. Em cada capítulo, é possível ter acesso a uma seção de
comentários que usuários registrados podem compartilhar com os autores
dos estudos/capítulos, como tem feito o professor Henry Davis para o capítu-
lo 81A (cf. Figura 12):
Giulia Bossaglia 59
tros usuários. Geralmente, nos comentários são sinalizados erros, levantadas
questões relacionadas à análise dos dados ou aos resultados dos estudos etc.
Os comentários mais recentes aos capítulos são linkados (Latest Comments)
diretamente na homepage do WALS (lado direito). Assim, o atlas se mantém
sempre aberto a possíveis correções e edições, além de ser a base de inúmeras
discussões de natureza tipológica — que podem ser aproveitadas, também,
pelos “espectadores”.
Languages
Esta base de dados compreende uma ampla variedade de informações sobre
todas as línguas presentes nas amostras do WALS, a saber: filiação genéti-
ca (família, grupo dentro da família), área geográfica onde a língua é falada
(macroárea, latitude, longitude, países). Clicando no nome de uma língua, ace-
de-se à página a ela dedicada. Além das informações mencionadas, pode-se
consultar a lista dos traços linguísticos que foram examinados nela, e seus
valores. Na Figura 13, apresenta-se uma amostra da página da língua guarani.
Esta língua aparece em 137 amostras (sobre as 192 utilizadas para os 192
traços presentes no WALS). Na Figura 14, vê-se que ela possui o valor “mo-
deradamente pequeno” no que diz respeito ao traço 1A, “médio” para o 2A e
“médio” para o 3A (proporção entre consonantes e vogais). Na coluna Sources,
são indicadas as “fontes” utilizadas para recuperar informações sobre a língua
em questão.
@glosa
É muito comum que se pergunte aos linguistas quantas línguas falam, e igual-
mente comum que a resposta deixe os leigos decepcionados. De acordo com
uma definição “pop”, linguista seria a pessoa que sabe analisar toda a sintaxe
de uma língua sem saber falar nem sequer ‘bom dia’ na mesma. Há algo de
verdadeiro nessa piada: ainda que a proficiência em muitas línguas diferentes
seja sem dúvida algo valioso para um linguista, ele estuda as línguas em uma
perspectiva mais ampla, focada no entendimento de como sistemas complexos
de comunicação funcionam e de quais categorias e mecanismos (universais e
Giulia Bossaglia 61
específicos) governam a linguagem humana. Todo linguista, e especialmente o
tipólogo, deveria ser capaz de analisar, em princípio, todas as línguas (vivas e
mortas), e para isso não é necessário saber se comunicar por meio delas, mas
saber reconhecer nelas as categorias e os mecanismos da linguagem. A glosa
(do grego glóssa “língua”) é uma ferramenta muito útil para os linguistas que
queiram ter acesso a dados de línguas que não conhecem, pois consiste em
um tipo de tradução muito específica: a tradução dos morfemas — por essa
razão, a glosa em linguística é conhecida também com a denominação de “tra-
dução morfêmica interlinear”.
Imagine-se que um tipólogo brasileiro se depare com as seguintes frases, de
diferentes línguas (exemplos adaptados de DRYER, 2013):
Uma simples tradução desses exemplos para português, como se mostra abai-
xo, não seria suficiente para o linguista brasileiro fazer qualquer tipo de aná-
lise deles:
Giulia Bossaglia 63
a) japonês John ga tegami o yonda.
John ga tegami o yon-da
John subj carta obj ler-pst
“John leu a carta.”
Como se pode ver, a tradução morfêmica dos exemplos acima se serve de algu-
mas abreviações (subj, obj, pst, class, pres, det, pl, ind), de símbolos (o hífen
que segmenta os morfes, o ponto ‘.’) e de palavras (carta, ler, livro, menino,
jaguar etc.).
As Leipzig Glossing Rules (“Regras de Leipzig para a glosa”), elaboradas conjun-
tamente pelos Departamentos de Linguística do Instituto Max Planck de An-
tropologia Evolucionista e da Universidade de Leipzig (Alemanha), são tidas
como modelo internacional que, idealmente, todo linguista deveria seguir no
que diz respeito às abreviaturas e aos símbolos utilizados nas glosas, para fa-
vorecer e facilitar a comunicação científica entre todos os linguistas do mundo.
De acordo com as regras de Leipzig, as abreviaturas em versalete indicam
morfemas gramaticais. Nos exemplos acima, há, portanto: subj = sujeito; obj
= objeto (direto); pst = passado; class = classificador; pres = (tempo) pre-
sente; det = determinante; pl = plural; ind = (modo) indicativo. Os morfemas
lexicais são, simplesmente, traduzidos pelas palavras (carta, ler, receber, um,
padre, livro, menino, jaguar, ver).
O hífen, como se antecipou, serve para separar morfes; o ponto ‘.’ é utilizado
para separar morfemas que pertencem a um mesmo morfe: o verbo irlandês
léann, por exemplo, é formado por um único morfe que veicula ao mesmo
tempo o morfema lexical “ler” e o morfema flexional de tempo presente (cf.
em português, um verbo como foi, que contém, todos juntos, os morfemas le-
Giulia Bossaglia 65
italiano Giorgio imburra il pane.
Giorgio imburra il pane
Giorgio passa_manteiga_em det pão
“Giorgio passa manteiga no pão.”
a) tjitji a nu
menino.abs ir pass
S
“O menino foi”
c) ngayu-lu a nu
1sg-nom ir pass
S
“Eu fui”
Giulia Bossaglia 67
tawala
i-bowi-ye-ya
3SG.A-rejeitar-tr-3SG.O
“Ele o rejeitou”
apo i-na-nae
fut 3SG.S-pot-ir
“Ele poderá ir”
konjo
a’-lampa-i Amir
intr-ir-3SG.S Amir
“Amir vai”
@tons flutuantes
Em bambara (banto), a palavra káfé “café” possui tom ascendente (´) em
ambas as sílabas. Quando a palavra é utilizada junto com o artigo defini-
do posposto, caracterizado por um tom descendente (`), esse tom flutua
(i.e., se transfere) para a última sílaba da palavra, se une a seu tom ascen-
dente e forma um tom ascendente-descendente (^): káfê “o café”. Isto pode
não acontecer com todas as palavras, como se vê no exemplo abaixo (de
HYMAN, 2008), da língua aghem (grupo ‘banto dos pastos’, irmão do grupo
banto; Camarões):
Giulia Bossaglia 69
to (indicado por ↓) por efeito do tom flutuante descendente (`) — o que não
acontece com a palavra fú, que não possui esse tom “escondido”.
@ Línguas crioulas
Giulia Bossaglia 71
Na África ocidental, portanto, os crioulos de base portuguesa se formaram
pelo contato do português com praticamente as mesmas línguas africanas
que, no Brasil, se mantiveram em contato com essa língua ao longo de mui-
tos séculos (@crioulos de base portuguesa). Semelhanças estruturais entre os
crioulos de base portuguesa e o pbv poderiam então comprovar a influência
que as línguas africanas tiveram sobre o português brasileiro.
Verbos seriais
Verbos seriais de diferentes tipos estão presentes nos crioulos de base portu-
guesa. No papiá kristang, por exemplo, o verbo “ir” bai (< vai) é usado como
Giulia Bossaglia 73
verbo serial para indicar a direção do movimento; o mesmo se observa no
crioulo de Casamansa; no crioulo são-tomense, um verbo intransitivo na pri-
meira posição indica a maneira do movimento, por sua vez codificado pelo
verbo ba “ir”:
(papiá kristang)
Eli ja andá bai casa.
3sg pfv andar ir casa
“Ele foi para casa” (lit.: “Ele andou ir casa”)
(crioulo de Casamansa)
Joŋ koré (i) bay Sicor.
John correr (3sg) ir Zinguinchor
“John correu para Ziguinchor” (lit.: “John correu (ele) ir Ziguinchor”)
(são-tomense)
Nansê ka subli ba obô ê!
2pl ipfv subir ir floresta pcl
“Vocês vão subindo para a floresta!” (lit. “Vocês subam vão para a floresta!”)
(fá d’Ambô)
A ska fe wan xadyi da na-namay.
3gen prog fazer art casa dar art-família
“Eles estavam construindo uma casa para a família” (lit.: “Eles estavam construindo uma
casa dar a família)
(angolar)
Ngêi ka pega kwa e ra m.
quem fut pegar coisa dem dar 1sg
“Quem pegará isso para mim?” (lit.: “Quem pegará esta coisa dar mim?”)
Abreviações utilizadas
3gen genitivo de 3ª pessoa
dem demonstrativo
pfv a aspecto perfectivo
ipfv aspecto imperfectivo
pcl partícula discursiva (valor exclamativo)
prog forma progressiva
art artigo
MICHAELIS, S. M.; MAURER, Ph.; HASPELMATH, M.; HUBER, M. (Eds.) (2013). Atlas of Pidgin and
Creole Language Structures Online. Leipzig: Max Planck Institute for Evolutionary Anthropology.
Giulia Bossaglia 75
CAPÍTULO
6
As línguas indígenas
do Brasil
Giulia Bossaglia 77
Do ponto de vista metodológico, a comprovação de relações genéticas distan-
tes se baseou na comparação de cognatos, mas de maneira diferente daquela
do método histórico-comparativo. O método inaugurado por Greenberg para
este fim é o da “comparação massiva”, ou seja, comparação de poucos cogna-
tos em muitas línguas — o exato contrário do método histórico-comparativo,
que visa comparar o maior número possível de cognatos em um número res-
trito de línguas.
Duas técnicas combinadas (desenvolvidas e aperfeiçoadas por Swadesh) au-
xiliam a comparação massiva: a glotocronologia, método probabilístico que
visa estabelecer a idade aproximada das famílias linguísticas (com base no
pressuposto de que, durante um determinado período, línguas que possuem
relação genética retêm uma porcentagem regular de vocabulário básico com-
partilhado; por exemplo, 86% do léxico durante 1000 anos), e a léxico-estatís-
tica, outro método estatístico que mede a distância genética entre línguas com
base em seus léxicos básicos (com base no pressuposto de que há uma razão
constante no tempo para a mudança no vocabulário básico).
Swadesh dá o nome também a uma lista (“lista de Swadesh”) de palavras bá-
sicas (ou melhor: conceitos básicos aos quais devem corresponder palavras
de vocabulário básico em todas as línguas humanas) a serem comparadas nas
muitas línguas analisadas para o estudo das relações genéticas distantes. A
lista de Swadesh compreende 100 conceitos básicos, mas são utilizadas tam-
bém versões mais reduzidas dela (aproximadamente, 40 itens):
Giulia Bossaglia 79
mos dentro da família; no grupo III, são reunidas três línguas germânicas; no
IV, as quatro línguas itálicas (do subgrupo românico).
Obviamente, esse procedimento precisa ser repetido para mais palavras. É
possível que, para outro conceito, os agrupamentos entre as línguas A-L resul-
tem diferentes, mas quanto mais próximas geneticamente forem as línguas,
mais vezes ficarão juntas no mesmo agrupamento. No exemplo acima, a ma-
neira como o irlandês e o japonês ficam isolados em grupos específicos é dife-
rente: o japonês, do ponto de vista genético, é uma língua muito mais distante
das dos grupos II-IV, e ficará “isolado” mais frequentemente que o irlandês,
dentro desta pequena amostra de línguas.
Através dessa metodologia, portanto, Greenberg e, posteriormente, Ruhlen,
chegaram a classificar as línguas do mundo em apenas 12 macrofamílias,
como se mostra na Figura 1:
Como se pode ver, nessa proposta, o basco não seria uma língua isolada, mas
pertenceria à macrofamília dené-caucasiana (junto com algumas línguas cau-
casianas, algumas da China e as da família na-dené, na América do Norte); as
famílias indo-europeia, sino-tibetana e uralo-altaica formariam a macrofamí-
b. dearã wa-bina-reri
1sg 1sg.s-doente-pres
“Eu estou doente”
c. dearã ar-õ-rõ-kre
1sg 1sg.s-trans-dormir-fut
“Eu vou dormir”
Nos verbos das frases a.-d. acima, aparecem marcas flexionais relativas a a, o,
e s. Em a., no verbo transitivo “empurrar” é especificada a direcionalidade da
ação (de um agente de 3ª pessoa singular para um paciente/objeto direto de
1ª singular); em b., além do pronome pessoal sujeito dearã, um morfema fle-
xional de 1ª pessoa singular com função de s aparece no verbo. O morfema em
questão é, para a. e b., o mesmo afixo {wa}, que se diferencia do afixo {ar} usa-
Giulia Bossaglia 81
do, em d., para marcar no verbo “pegar” a função de agente de seu sujeito (na
1ª pessoa singular). Até esse ponto, portanto, o sistema de alinhamento no
verbo aparenta ser de tipo ergativo-absolutivo, diferenciando-se {ar} para a, e
{wa} para s e o. Entretanto, na frase c., s é codificado com a mesma marca de a,
configurando-se, assim, uma “cisão” na maneira de codificar esta função sintá-
tica no karajá. O fato de s poder ser codificado como a ou como o depende de
fatores de natureza semântica: na frase b., s “está doente”, ou seja, é sujeito de
um verbo que indica um estado e que seleciona um sujeito semanticamente
não agentivo (aliás, que está sofrendo uma condição médica). Essa proprieda-
de semântica aproxima s a o, que corresponde ao papel semântico de Pacien-
te — por esta razão, o karajá codifica s com a mesma marca morfológica. Na
frase c., por outro lado, o verbo intransitivo “dormir” é percebido como mais
agentivo (“ativo”), como mostra, inclusive, a presença de um morfema de tran-
sitividade ({õ}) que aparece também nos verbos transitivos “de verdade” (cf.
a. e d., o morfe {i}). s, na frase c., não está padecendo de alguma condição, e por
esta razão é percebido como mais próximo de um a — a marca de flexão de
pessoa/número no verbo, portanto, é a mesma. Esse tipo de alinhamento per-
tence a um fenômeno mais amplo observável nas línguas naturais, conhecido
como split intransitivity “intransitividade cindida”, relacionado com o fato de
os verbos intransitivos poderem selecionar sujeitos tanto agentivos (correr,
nadar etc.; são os verbos “inergativos”) como não agentivos (cair, morrer etc.;
são os verbos “inacusativos”). Esta diferença semântica em muitas línguas se
manifesta em níveis diferentes. No português, por exemplo, apenas verbos
inacusativos (i.e., com s semanticamente parecido com o) podem ser usados
em construções participiais absolutas como Morto o papa, elegeu-se outro,
enquanto os inergativos não: *Nadados os atletas, a competição acabou.