Você está na página 1de 561

DEFESA DE TESE

SCHERRE, Maria Marta Pereira. Reanálise da concordância nominal em


português.Tese de Doutorado em Lingüística. Rio de Janeiro, Faculdade
de Letras, UFRJ, 1988. Em dois volumes, com 555p. mimeo.

______________________________________________________________
ORIENTADOR: PROFESSOR DOUTOR ANTHONY JULIUS NARO - UFRJ

______________________________________________________________
PROFESSORA DOUTORA DINAH MARIA ISENSEE CALLOU - UFRJ

______________________________________________________________
PROFESSOR DOUTOR MARCO ANTÔNIO DE OLIVEIRA - UFMG

______________________________________________________________
PROFESSOR DOUTOR FERNANDO LUIZ TARALLO - UNICAMP/PUC-SP

______________________________________________________________
PROFESSOR DOUTOR EMMANOEL M.DA S. T. J. DOS SANTOS - UFRJ

DEFENDIDA A TESE

CONCEITO:

EM: __/__/1988
REANÁLISE DA CONCORDÂNCIA NOMINAL EM PORTUGUÊS

POR

MARIA MARTA PEREIRA SCHERRE

VOLUME I

DEPARTAMENTO DE LINGÜÍSTICA E FILOLOGIA

FACULDADE DE LETRAS

UNIVERSIDADE FEDERAL DO RIO DE JANEIRO

RIO DE JANEIRO, 1º SEMESTRE DE 1988


REANÁLISE DA CONCORDÂNCIA NOMINAL EM PORTUGUÊS

POR

MARIA MARTA PEREIRA SCHERRE

DEPARTAMENTO DE LINGÜÍSTICA E FILOLOGIA

Tese de Doutorado em Lingüística

apresentada à Coordenação dos

Cursos de Pós-Graduação da
Faculdade de Letras da Universidade

Federal do Rio de Janeiro. Orientador:

Professor Doutor Anthony Julius Naro.

RIO DE JANEIRO, 1º SEMESTRE DE 1988


A meu companheiro,

Lessa;

a meus filhos,

Paula e Rafael;

a meus pais,

Tãozinho (in memoriam) e Maria.


A Anthony J. Naro, pela orientação segura, precisa e amiga;

aos colegas e amigos do Projeto Censo, pelas discussões e críticas


enriquecedoras;

ao Projeto Censo, pelo acesso ao banco de dados;

à Vera Lúcia Paredes Pereira da Silva, pelas discussões frutíferas e


pelo apoio amigo;

à Denise Novo de Oliveira, pela participação ativa no levantamento,


revisão e codificação dos dados e pela leitura do texto;

à Maria Elisabeth Dias Pereira, pela digitação deste trabalho, de forma


cuidadosa, minuciosa e incansável;

à Maria Sônia Dias Pereira, pelo auxílio meticuloso no manuseio de


arquivos de dados;

à Ivone Isidoro Pinto, pelo auxílio precioso e eficiente na digitação e


revisão do texto;

à Maria das Graças Dias Pereira, pelas valiosas críticas à redação


deste trabalho;

à Elizabeth Ferreira Barros, pela leitura cuidadosa e pela revisão da


tradução das notas;

à Aleria Cavalcante Lage, Gerson Luiz Sales e Luciana Araújo Rocha,


pelo auxílio no levantamento, codificação e reclassificação de dados;

ao Departamento de Lingüística e Filologia da UFRJ, pelo apoio


recebido;

ao Laboratório Nacional de Computação Científica do CNPq e a toda a


sua equipe, pelos excelentes serviços computacionais;

ao CNPq, pelo auxílio prestado através de bolsas de Pesquisador e de


Iniciação Científica;

a todos os meus familiares, pelo estímulo constante;

a todos os meus amigos, por me ouvirem pacientemente;

a todas as demais pessoas ou entidades que contribuíram, direta ou


indiretamente, para a realização deste trabalho,

agradeço.
SINOPSE

Variáveis lingüísticas subjacentes às tendências

sistemáticas da variação na concordância de

número entre os elementos do sintagma nominal

em Português. Princípio universal de motivação

externa. Relação entre variação e mudança.

Variação inerente. Influência de variáveis sociais

não convencionais.
SUMÁRIO v

LISTA DE QUADROS E TABELAS vii


LISTA DE SÍMBOLOS E ABREVIATURAS xiv

1 - INTRODUÇÃO 15

2 - OS DADOS LINGÜÍSTICOS 20

2.1 - Introdução 20
2.2 - Constituição da amostra 21
2.3 - Processo de coleta e armazenamento dos dados 27
2.4 - Caracterização dos dados 29

3 - PRESSUPOSTOS TEÓRICOS 33

4 - CONSIDERAÇÕES ADICIONAIS SOBRE ASPECTOS


TEÓRICOS 41

4.1 - Sobre o Funcionalismo no arcabouço teórico da


Gramática Gerativa 41
4.2 - Sobre o Funcionalismo fora do arcabouço teórico da
Gramática Gerativa 45

4.2.1 - O Princípio da Iconicidade 47


4.2.2 - O Princípio da Economia 48
4.2.3 - O Princípio do Fluxo de Informação Preferido e
o Princípio da Topicidade 49
4.2.4 - O Princípio da Baixa Tensão 52

5 - SUPORTE QUANTITATIVO 55

6 - ANÁLISE DAS VARIÁVEIS LINGÜÍSTICAS 61

6.1 - Introdução 61
6.2 - Análise atomística 62

6.2.1 - Introdução 62
6.2.2 - Saliência fônica 64
6.2.3 - Três variáveis relacionadas: Posição linear,
Classe gramatical e Marcas precedentes 142
6.2.4 - Contexto fonético/fonológico seguinte 247
6.2.5 - Função sintática do SN 257
6.2.6 - Traços mórficos, semânticos e estilísticos, do
substantivo e/ou do adje tivo 265
6.2.7 - Conclusão 277

6.3 - Análise não atomística 281

6.3.1 - Introdução 281


6.3.2 - A pluralidade do contexto 283
6.3.3 - Buscando novas explicações 302
6.3.4 - Conclusão 358

6.4 - Conclusão 376


vi

7 - O PAPEL DO PROCESSAMENTO NA VARIAÇÃO


LINGÜÍSTICA 378

7.1 - Introdução 378


7.2 - Evidências da força do processamento no uso
lingüístico 381

7.2.1 - No Espanhol 381


7.2.2 - No Inglês 383
7.2.3 - No Francês 387
7.2.4 - No Quechua 389
7.2.5 - No Crioulo Caboverdiano 391
7.2.6 - No Português do Brasil 392

7.3 - Conclusão 416

8 - RELAÇÃO ENTRE VARIAÇÃO E MUDANÇA 426

8.1 - Introdução 426


8.2 - Sobre a configuração de variáveis sociais 427

8.2.1 - O comportamento de variáveis sociais na


variação lingüística estável 427
8.2.2 - O comportamento de variáveis sociais na
mudança em progresso 428
8.2.3 - Sobre o cruzamento de variáveis sociais 432

8.3 - Reflexões sobre a mudança em progresso 433


8.4 - Posições controversas sobre a concordância de
número no português popular brasileiro 436
8.5 - Sobre os resultados de variáveis sociais 444
8.6 - Sobre resultados de variáveis lingüísticas 461

8.6.1 - Saliência fônica 464


8.6.2 - Posição do elemento no SN 472

8.7 - Conclusão 482

9 - NOVAS PERSPECTIVAS DE INFLUÊNCIAS SOCIAIS 485

9.1 - Introdução 485


9.2 - Caracterização das variáveis não convencionais 486
9.3 - Metodologia de mensuração das variáveis não
convencionais 488
9.4 - Resultados das variáveis convencionais e não
convencionais 490
9.5 - Conclusão 506

10 - CONCLUSÃO 509

11 - NOTAS 525

12 - REFERÊNCIAS BIBLIOGRÁFICAS 546


vii

LISTA DE QUADROS E TABELAS

Quadro 2.2.1 - Características sociais dos falantes adultos


femininos 25

Quadro 2.2.2 - Características sociais dos falantes adultos


masculinos 26

Quadro 2.2.3 - Características sociais das crianças 27

Tabela 6.2.2.1 - Processos morfofonológicos de formação do


plural de todos os dados dos adultos 79

Tabela 6.2.2.2 - Tonicidade da sílaba dos itens lexicais


singulares de todos os dados dos adultos 80

Tabela 6.2.2.3 - Número de sílabas dos itens lexicais singulares


de todos os dados dos adultos 81

Tabela 6.2.2.4 - Processos morfofonológicos de formação do


plural dos substantivos, adjetivos e categorias
substantivadas dos dados dos adultos 83

Tabela 6.2.2.6 - Processos morfofonológicos de formação do


plural dos substantivos, adjetivos e categorias
substantivadas dos adultos por escolarização 86

Tabela 6.2.2.7 - Tonicidade da sílaba do item lexical singular


dos substantivos, adjetivos e categorias
substantivadas dos adultos por escolarização 89

Tabela 6.2.2.8 - Cruzamento de processos e tonicidade nos


substantivos, adjetivos e categorias
substantivadas dos adultos: percentagens 92

Tabela 6.2.2.9 - Cruzamento de processos e tonicidade nos


substantivos, adjetivos e categorias
substantivadas dos adultos: probabilidades 93

Tabela 6.2.2.10 - Sobreposição entre processos e tonicidade nos


substantivos, adjetivos e categorias
substantivadas nos dados dos adultos 94
viii

Tabela 6.2.2.11 - Diferenças probabilísticas entre os processos


não regulares e o processo regular em função
da presença ou ausência da variável
Tonicidade 96

Tabela 6.2.2.12 - Processos e escolarização: comparação entre


os resultados de Scherre (1978) e Guy (1981a) 100

Tabela 6.2.2.13 - Processos e escolarização: comparação entre


os nossos resultados e os de Guy (1981a) 103

Tabela 6.2.2.14 - Processos e escolarização: comparação entre


os nossos resultados do primário e ginasial e
os de Braga (1977) 107

Tabela 6.2.2.15 - Processos e escolarização: comparação entre


os nossos resultados do colegial e os de Braga
(1977) e Scherre (1978) 108

Quadro 6.2.2.16 - Distribuição das marcas de plural nos itens não


regulares 110

Tabela 6.2.2.17 - Sobre a análise da concordância 112

Tabela 6.2.2.18 - Processos: sobre a fronteira de morfema 119

Tabela 6.2.2.19 - Tonicidade: sobre a fronteira de morfema 121

Tabela 6.2.2.20 - Sobre os regulares em -ão 125

Tabela 6.2.2.21 - Relação entre itens regulares e itens duplos 128

Tabela 6.2.2.22 - Relação entre itens regulares e itens em -l 129

Tabela 6.2.2.23 - Relação entre itens regulares e itens em -R 130

Tabela 6.2.2.24 - Relação entre itens regulares e itens em -ão 132

Tabela 6.2.2.25 - Relação entre itens regulares e itens em -S 133

Tabela 6.2.2.26 - Análise final de processos e tonicidade dos


substantivos, adjetivos e categorias
substantivadas dos adultos por escolarização 139
ix

Quadro 6.2.3.1 - Exemplos de posição linear do elemento no SN 144

Quadro 6.2.3.2 - Exemplos de classe gramatical dos elementos


no SN 150

Tabela 6.2.3.3 - Distribuição dos dados dos falantes adultos em


função da classe gramatical e da posição dos
elementos no SN 154

Tabela 6.2.3.4 - Sobre o efeito paralelo da posição em todos os


Sns de três ou mais elementos dos falantes
adultos 156

Tabela 6.2.3.5 - Cruzamento de posição e classe gramatical em


Sns de três ou mais elementos dos dados dos
falantes adultos 157

Tabela 6.2.3.6 - Cruzamento de posição e classe gramatical em


todos os dados dos falantes adultos 158

Tabela 6.2.3.7 - Cruzamento de posição e classe gramatical em


todos os dados das crianças 158

Tabela 6.2.3.8 - Paralelo entre posição e classe gramatical em


todos os dados 159

Tabela 6.2.3.9 - Relação entre possessivo, quantificador e


posição 160

Tabela 6.2.3.10 - Primeira posição do SN e classe gramatical 164

Tabela 6.2.3.11 - Segunda posição do SN e classe gramatical 166

Quadro 6.2.3.12 - Exemplos de marcas precedentes em unção da


posição 177

Tabela 6.2.3.13 - Marcas precedentes em função da posição 180

Tabela 6.2.3.14 - Marcas precedentes, posição e possessivo 181

Tabela 6.2.3.15 - Marcas precedentes, terceira posição e classe


gramatical 185

Quadro 6.2.3.16 - Sobre estruturas preferenciais 189

Quadro 6.2.3.17 - Estruturas preferenciais e classe gramatical 190

Tabela 6.2.3.18 - Sobre os SNs inseridos em Sns mais altos 192


x

Tabela 6.2.3.19 - Marcas precedentes, segunda posição e classe


gramatical 194

Tabela 6.2.3.20 - Marcas precedentes: análise A 204

Tabela 6.2.3.21 - Marcas precedentes em função da posição:


análise B 205

Tabela 6.2.3.22 - Classe gramatical: análises A e B 209

Tabela 6.2.3.23 - Posição linear dos elementos no SN: análises


AeB 211

Tabela 6.2.3.24 - Classe gramatical e posição no SN: análise C 214

Tabela 6.2.3.25 - Relação entre os elementos do SN: análise D 219

Tabela 6.2.3.26 - Cruzamento de substantivos e adjetivos e


posição em todos os dados dos adultos 225

Tabela 6.2.3.27 - Cruzamento de classe gramatical e posição em


SNs de três ou mais constituintes nos dados
dos falantes adultos 226

Tabela 6.2.3.28 - Marcas precedentes e posição: análise B e D 229

Tabela 6.2.3.29 - Interferência entre marcas precedentes e


relação dos elementos no SN nos resultados
das crianças 232

Tabela 6.2.3.30 - Sobre a influência da terminação dos numerais


nos Sns de dois constituintes 236

Tabela 6.2.4.1 - Contexto fonético/fonológico seguinte em todos


os dados 248

Tabela 6.2.4.2 - Contexto fonético/fonológico seguinte em todos


os dados e nos itens regulares 249

Tabela 6.2.4.3 - Sobre a influência da consoante, da vogal e da


pausa em estudos diversos 250

Tabela 6.2.4.4 - Comparação da influência do contexto


fonético/fonológico seguinte nos itens regulares
e nos itens terminados em -S 251
xi

Tabela 6.2.4.5 - Comparação da influência do contexto


fonético/fonológico seguinte nos itens
regulares, nos terminados em -S e em -R dos
dados dos falantes adultos 253

Tabela 6.2.4.6 - Traços das consoantes com os itens regulares 254

Quadro 6.2.5.1 - Exemplos de função sintática do SN 260

Tabela 6.2.5.2 - Função sintática do SN 261

Tabela 6.2.5.3 - Função resumitiva do SN 262

Tabela 6.2.6.1 - Formalidade dos substantivos 269

Tabela 6.2.6.2 - Animacidade dos substantivos nos dados dos


falantes adultos 272

Tabela 6.2.6.3 - Animacidade dos substantivos nos dados de


todos os falantes 272

Tabela 6.2.6.4 - Grau dos substantivos 274

Tabela 6.2.6.5 - Distribuição dos adjetivos: grau e formalidade 275

Tabela 6.2.6.6 - Grau e formalidade dos adjetivos 276

Tabela 6.3.2.1 - A Pluralidade do contexto 289

Tabela 6.3.2.2 - Sobre o efeito do local da informação adicional


de plural 295

Tabela 6.3.2.3 - A Pluralidade do contexto 296

Tabela 6.3.2.4 - Sobre a influência do tipo indefinido na


quantidade de marcas plurais no substantivo
em SNs de dois elementos 300

Tabela 6.3.3.1 - Sobre a Configuração sintagmática do SN 303

Tabela 6.3.3.2 - Sobre a Configuração sintagmática do SN 305

Tabela 6.3.3.3 - Sobre a Configuração sintagmática do SN 309

Tabela 6.3.3.4 - Sobre a Função textual do SN 320

Tabela 6.3.3.5 - Sobre a Localização do SN 323

Tabela 6.3.3.6 - Configuração sintagmática do SN 338


xii

Tabela 6.3.3.7 - Configuração sintagmática do SN 340

Tabela 6.3.3.8 - Função textual do SN 342

Tabela 6.3.3.9 - Grau e formalidade do SN 343

Tabela 6.3.3.10 - Localização do SN 345

Tabela 6.3.3.11 - Relação entre Configuração sintagmática e


Localização do SN 346

Tabela 6.3.3.12 - Relação entre Configuração sintagmática e


Localição do SN 348

Tabela 6.3.3.13 - A Pluralidade do SN 350

Tabela 6.3.3.14 - Status informacional do SN 353

Tabela 6.3.3.15 - Animacidade do SN 355

Tabela 6.3.3.16 - Saliência fônica: dimensão processos 357

Tabela 6.3.3.17 - Pluralidade do contexto por escolarização 359

Tabela 6.3.3.18 - Tipos sintagmáticos de baixa freqüência em


SNs com a categoria substantivo na terceira
posição 369

Tabela 6.3.3.19 - Tipos sintagmáticos de alta freqüência em SNs


com a categoria substantivo na terceira posição 370

Tabela 6.3.3.20 - Tipos sintagmáticos de baixa freqüência em


SNs com a categoria não-substantivo na
terceira posição 371

Tabela 6.3.3.21 - Tipos sintagmáticos de alta freqüência em SNs


com a categoria não-substantivo na terceira
posição 372

Tabela 8.5.1 - Variáveis sociais dos adultos 445

Tabela 8.5.2 - Variáveis sociais das crianças 447

Tabela 8.5.3 - Variáveis sociais: tipo de ambiente e grau de


concordância 454
xiii

Tabela 8.6.1 - Saliência fônica dos substantivos, adjetivos e


categorias substantivadas por
subagrupamentos de falantes 465

Tabela 8.6.2 - Relação entre os elementos do SN por


subagrupamentos de falantes 474

Tabela 8.6.3 - Relação entre os elementos do SN por


subagrupamentos de falantes 475

Tabela 8.6.4 - Marcas precedentes em função da posição por


subagrupamentos de falantes 478

Tabela 8.6.5 - Marcas precedentes em função da posição por


agrupamentos de falantes 479

Tabela 9.4.1 - Variáveis sociais convecionais 491

Tabela 9.4.2 - Variáveis sociais não convencionais 492

Tabela 9.4.3 - Anos de escolarização e Sexo 494

Tabela 9.4.4 - Sobre interferências na variável anos de


escolarização: dados dos homens 495

Tabela 9.4.5 - Sobre interferências na variável anos de


escolarização: dados das mulheres 496

Tabela 9.4.6 - Relação entre variáveis não convencionais e


Sexo 498

Tabela 9.4.7 - Faixa etária e Sexo 501

Tabela 9.4.8 - Sobre a Faixa etária nos dados dos falantes do


sexo masculino 502

Quadro 9.4.9 - Distribuição dos falantes por ambiente, grau de


concordância e sexo 504

Tabela 9.4.10 - Sobre o comportamento das mulheres 505


xiv

*
LISTA DE SÍMBOLOS E ABREVIATURAS

f Sexo feminino
m Sexo masculino
p Primário
g Ginasial
c Colegial
a Anos
Apl. Aplicação da regra, ou seja, número total de
ocorrências com a marca analisada
Total Número total de ocorrências nas quais se esperaria a
marca analisada
Prob. ou P. Probabilidade de aplicação da regra
Freq. ou F. Freqüência de aplicação da regra
+ Aplicação categórica positiva, ou seja, presença
constante da marca analisada na presença de um
dado fator
- Aplicação categórica negativa, ou seja, ausência
constante da marca analisada na presença de um
dado fator
xxx Não ocorrência de um certo tipo de dado
E Entrevistador
F Falante
(N,NN) Nas tabelas, os parênteses ao redor dos números
indicam que as probabilidades são estatisticamente
não relevantes

*
Esta versão desta tese foi adaptada para ser impressa a laser em fevereiro de 1966.
Portanto, ocorreram alterações no formato das letras e das linhas das páginas. Sempre que
foi possível, fizemos corresponder o início e o fim das páginas desta versão com o início e o
fim das páginas da versão original. As diferenças dificilmente ultrapassam duas linhas, ora
na parte superior, ora na parte inferior das páginas. Aproveitamos também a oportunidade
para efetuar a correção dos erros detectados até a presente data. Alguns constam da errata
anexada à versão original; outros foram encontrados posteriormente. Objetivando maior
precisão de redação, alteramos a denominação de Princípio do Processamento Paralelo
para Princípio do Processamento com Paralelismo.
1 - INTRODUÇÃO

No presente trabalho, fazemos uma análise minuciosa da

concordância gramatical de número plural entre os elementos flexionáveis do

sintagma nominal em português sob uma perspectiva teórica que une

aspectos da Teoria da Variação Lingüística Laboviana ou Sociolingüística

Quantitativa e aspectos da Teoria Funcionalista fora do arcabouço teórico da

Gramática Gerativa.

Temos quatro objetivos com esta análise.

O primeiro deles é o de apresentar a descrição e explicação de um

conjunto de variáveis lingüísticas e não lingüísticas que regem a

sistematicidade da variação da concordância de número entre os elementos

do SN. Vamos evidenciar que existe um sistema gerenciando esta variação,

sendo, portanto, possível estabelecer-se com relativa precisão em que

circunstâncias lingüísticas haverá a ocorrência de uma estrutura

sintagmática com todas as marcas de plural ou com apenas algumas delas.

Conseqüentemente, é possível prever em que estruturas lingüísticas os

falantes são propensos a colocar ou não todas as marcas formais de plural.

O segundo objetivo é discutir a hipótese funcionalista de Kiparsky

(1972), inserida no arcabouço teórico da Gramática Gerativa, trazendo

evidências de que uma teoria lingüística adequada que pretende ter caráter

explanatório deve incorporar também motivações ou princípios gerais

externos, ou seja, princípios não estritamente gramaticais determinando o

uso e, conseqüentemente, a forma da língua.


16

O terceiro objetivo envolve uma questão bastante polêmica: a análise

da relação entre a variação e mudança, no sentido de se verificar se o

fenômeno focalizado reflete um estágio de variação sociolingüística estável

ou um processo de mudança lingüística em progresso.

O quarto objetivo envolve outro ponto também polêmico, o que se

relaciona à questão da variação inerente: se a variação grupal reflete a

variação individual, ou seja, se ela é inerente ou se é apenas fruto do

agrupamento de indivíduos com comportamentos lingüísticos diferenciados

entre si, mas internamente homogêneos.

Através desta análise, objetivamos, portanto, discutir aspectos

relacionados ao funcionamento de gramáticas particulares, no caso a do

Português, bem como aspectos que dizem respeito a características comuns

às línguas naturais.

Desta forma, pretendemos trazer contribuições a nível

descritivo/explicativo do funcionamento de uma língua particular com a

descrição e explicação das variáveis lingüísticas que regem a concordância

nominal variável e, também, a nível da teoria lingüística geral, através de

questões que dizem respeito (1) a princípios universais envolvendo

diferentes línguas; (2) à relação entre variação e mudança e (3) à existência

ou não de variação inerente.

A nossa exposição seguirá a seguinte ordem: no segundo capítulo,

apresentamos todos os aspectos relativos aos dados lingüísticos analisados,

quais sejam: a sua fonte, o perfil social dos falantes que os produziram, a sua

forma de obtenção e a sua caracterização precisa; no terceiro, descrevemos

sucintamente os pressupostos teóricos deste trabalho; no quarto,


17

explicitamos aspectos teóricos adicionais que envolvem algumas das

questões a serem discutidas através dos resultados desta pesquisa e, no

quinto, descrevemos o suporte quantitativo utilizado na análise dos dados.

No sexto capítulo, o mais longo de todos eles, apresentamos

exaustivamente a análise das variáveis lingüísticas, procurando ver as

implicações para algumas das questões teóricas que serão discutidas.

No sétimo capítulo, sugerimos a postulação de um princípio de

motivação externa de caráter universal, baseado no processamento das

unidades lingüísticas, para dar conta (1) de resultados obtidos através da

nossa análise, (2) de resultados obtidos através de outras análises de outros

fenômenos do Português e (3) de resultados obtidos através de análises

feitas para diversos fenômenos envolvendo também outras línguas como o

Espanhol, o Francês, o Inglês, o Quechua e o Crioulo Caboverdiano.

No oitavo capítulo, discutimos a relação entre variação e mudança,

com base nos resultados de variáveis sociais convencionais como Anos de

escolarização, Sexo e Faixa etária e abordamos a questão da variação

inerente com base nos resultados de variáveis lingüísticas por

subagrupamentos de falantes. No nono, trazemos resultados de novas

variáveis sociais não convencionais do tipo Mercado ocupacional, Mídia e

Sensibilidade lingüística. No décimo, apresentamos a conclusão e, nos dois

últimos, as notas e as referências bibliográficas.

Não desenvolvemos um capítulo específico para a revisão bibliográfica.

Optamos por fazer referência aos diversos trabalhos sobre o assunto nos

momentos oportunos. Também não reservamos um capítulo especial para a

interpretação lingüística dos resultados estatísticos. Preferimos apre-


18

sentar as conclusões ao final de cada item ou subitem, bem como ao final de

cada capítulo. Esta forma de apresentação objetiva fazer com que cada parte

possa ser percebida como um texto fechado e, conseqüentemente, ser

claramente entendida, sem recorrência necessária a outras partes do

presente trabalho.

Não temos a pretensão de apresentar uma análise acabada, o que

nem é possível. Antes de mais nada, interessa-nos o processo analítico, que

nos conduz necessariamente a um conhecimento mais profundo dos fatos.

Por isto, a nossa exposição sempre se reveste de um cunho polêmico e

apresenta um mínimo do caminho que seguimos para buscar as perguntas e

apresentar as respostas que se encontram neste trabalho. Sempre que

possível, sugerimos mais de uma alternativa de análise, buscando a mais

adequada com base em argumentação lingüística e estatística. Queremos

crer que, desta forma, tivemos oportunidade de contribuir para conhecer um

pouco mais do nosso precioso sistema de comunicação: a língua.

Estamos assumindo que a análise que vamos apresentar no corpo

deste trabalho se reveste de caráter explicativo. Sabemos estar sendo por de

mais ambiciosos, mas esta foi a tarefa a que nos impusemos, ao continuarmos

o estudo de um fenômeno lingüístico do Português do Brasil iniciado em 1976,

por Braga & Scherre, e amplamente rediscutido e reestudado em outras

amostras de fala por Braga em 1977, Scherre em 1978, Ponte em 1979,

Carvalho Nina em 1980 e Guy em 1981. Se não tivermos alcançado o nosso

objetivo (e julgamos que sim), temos certeza de termos conseguido uma

descrição acurada dos dados que tínhamos em mãos: da análise


19

que fizemos, somos capazes de prever, com baixa margem de erro, em que

contextos lingüísticos e sociais haverá maior ou menor probabilidade de

ocorrer a concordância de número entre os elementos do sintagma nominal

em Português.
2 - OS DADOS LINGÜÍSTICOS

2.1 - Introdução

Extraímos o material lingüístico aqui analisado de uma amostra

constituída de 64 horas de fala gravada de 64 falantes radicados no

município do Rio de Janeiro. Estas 64 horas estão na forma de entrevistas,

transcritas e armazenadas eletronicamente, constituindo-se um "banco de

dados", o qual foi organizado por uma equipe de pesquisadores sediada na

Faculdade de Letras da UFRJ, congregando também professores de outras

universidades como UFRRJ, UFF e UFJF - a equipe do Projeto Censo.1 As

entrevistas feitas com os 64 falantes ocorreram em dois momentos distintos:

em 1982-1984, gravaram-se 48 entrevistas com 48 falantes de 15 a 71 anos,

através de um projeto de pesquisa financiado pela FINEP e, em 1983-1985,

gravaram-se 16 entrevistas com 16 falantes de sete a 14 anos, através de

outro projeto de pesquisa financiado pelo INEP. Estas 64 entrevistas foram

todas transcritas segundo um sistema de transcrição específico e, após,

foram digitadas e armazenadas eletronicamente. Estão hoje em fase final de

correção para uso futuro através de acesso automático.

A descrição detalhada a respeito da formação do "banco de dados" e

a caracterização minuciosa da amostra encontram-se em sucessivos

relatórios apresentados por esta equipe aos órgãos financiadores e

encontram-se especialmente sistematizadas no primeiro volume de um

relatório final apresentado à FINEP em 1986, por ocasião do segundo biênio

de financiamento de pesquisa através deste órgão de fomento (cf. NARO et


21

alii, 1986, v.I, p.3-59; Adendos computacionais e Anexos). Vamos apresentar

aqui uma síntese da constituição da amostra nos aspectos relevantes para

este trabalho.

2.2 - Constituição da amostra

A equipe do Projeto Censo na sua primeira fase de coleta dos dados

decidiu estratificar a amostra dos 48 falantes adultos segundo três

características sociais tradicionalmente conhecidas: Anos de escolarização,

Sexo e Faixa etária.

Em termos dos Anos de escolarização, a equipe decidiu estabelecer

três recortes: um a quatro anos (antigo primário), cinco a nove anos (antigo

ginasial) e nove a onze anos (antigo colegial). Atualmente os dois primeiros

recortes são denominados de primeiro grau e o terceiro recorte é

denominado de segundo grau. A equipe decidiu fazer este tipo de recorte por

considerar que esta "antiga divisão (...) corresponde a diferenças bem

conhecidas nos currículos e metodologias de ensino utilizados nesses

níveis". (p.31) A equipe justifica a exclusão de universitários por já existir um

"projeto específico (NURC) para o estudo da linguagem deste grupo" (p.31) e

justifica também a dos analfabetos por já terem sido "estudados no Projeto

Competências Básicas do Português junto ao MOBRAL (1977)". (p.31)

O recorte relativo ao Sexo é por si evidente: sexo feminino e sexo

masculino.

No que concerne à Faixa etária, a equipe estabeleceu três recortes:

15 a 25 anos; 26 a 49 anos e 50 anos em diante. A primeira faixa cobre um


22

intervalo de 10 anos, a segunda de 24 anos e a terceira não tem

teoricamente intervalo definido, mas na prática ele não vai além dos 25

anos. Segundo a equipe, o critério para o estabelecimento dos recortes foi

semi-intuitivo e se justifica em termos da inserção dos falantes no mercado

de trabalho, na ausência de algum fato marcante como guerra ou processo

migratório, que são fatos históricos muito fortes na divisão dos grupos em

função de faixas etárias. A equipe apresenta então a caracterização das três

faixas etárias conforme transcrevemos abaixo.

15 a 25 anos - Adolescentes e adultos jovens que se


iniciam no mercado de trabalho. Enquanto nas classes
mais favorecidas essa faixa ainda se encontra na escola,
sendo mantida pelos pais, a expectativa era de que, na
classe menos favorecida, esses jovens já estariam
inseridos, ou pelo menos com a atenção voltada para o
trabalho.
26 a 49 anos - Adultos maduros. É a faixa, ao que
tudo indica, que exerce plenamente seu potencial de
trabalho.
50 anos - Nesta faixa estão inseridos os falantes, que,
se ainda não estão aposentados, já estão aquém do seu
ponto máximo de realização quanto às suas perspectivas
de trabalho. (NARO et alii, 1986, p.30-1)

Quanto à origem dos falantes, a equipe estabeleceu que eles

deveriam ser cariocas ou morar no Rio de Janeiro desde os cinco anos de

idade, sem terem saído da cidade por mais do que dois anos consecutivos.

Após traçado o perfil da amostra, a equipe dividiu a cidade do Rio de

Janeiro em 48 grandes porções com base em informações da prefeitura

sobre a divisão de bairros em termos geográficos e em termos de sentimento

de bairro e, a seguir, sorteou aleatoriamente um bairro e um tipo de

informante. A equipe afirma que não usou "métodos de escolha totalmente


23

aleatórios por não existir nenhuma maneira de listar todos os habitantes do

bairro. (...) Parte da população não possui endereço do tipo padrão e muito

menos telefone". (p.32)

A segunda fase de coleta de dados envolveu a complementação do

corpus em termos de uma quarta faixa etária: a dos falantes entre sete a 14

anos, denominados simplesmente crianças. A amostra das crianças foi

também estratificada em função de Anos de escolarização - um a quatro

anos (primário) e cinco a oito anos (ginasial) - e Sexo: feminino e masculino.

Segundo a equipe, foi impossível evitar, neste caso, um certo

enviesamento entre Faixa etária e Anos de escolarização. Todos os falantes

de sete a 10 anos estão nos quatro primeiros anos do primeiro grau e todos

os falantes de 11 a 14 anos estão nos quatro últimos.

As crianças pesquisadas nasceram e foram criadas no Rio de Janeiro

e todas elas estudam em escolas públicas. Estas escolas foram sorteadas

aleatoriamente de uma relação fornecida pela Secretaria de Educação do

Município do Rio de Janeiro. Uma das razões para a escolha das escolas

públicas foi manter um certo paralelismo com a amostra dos adultos,

considerando que falantes de nível universitário tendem a colocar seus filhos

em escolas particulares. Após o sorteio da escola, procurava-se um aluno

que atendesse às características já estabelecidas.

O procedimento para a coleta dos dados dos adultos e das crianças

foi de forma geral o mesmo, com as especificidades naturais relativas Às

diferenças existentes entre as faixas etárias.


24

Após o término do levantamento dos dados, os informantes ficaram

distribuídos da seguinte forma:

1) adultos:

a) Anos de escolarização: 19 de um a quatro (primário); 16 de

cinco a oito (ginasial) e 13 de nove a 11 anos (colegial);

b) Sexo: 24 homens e 24 mulheres;

c) Faixa etária: 16 de 15/25 anos; 15 de 26/49 anos e 17 de

50/71 anos;

2) crianças:

a) Anos de escolarização: oito de um a quatro (primário) e oito

de cinco a oito (ginasial);

b) Sexo: oito meninos e oito meninas;

c) Faixa etária : 16 de 7/14 anos.

No quadro 2.2.1, apresentamos os dados sociais relativos a cada

falante adulto feminino. No quadro 2.2.2, os relativos a cada adulto masculino

e, no quadro 2.2.3, os relativos a cada criança.


25

QUADRO 2.2.1
CARACTERÍSTICAS SOCIAIS DOS FALANTES ADULTOS FEMININOS
IDENTIFICAÇÃO SEXO ANOS DE IDADE
ESCOLARIZAÇÃO
Lei04 F 3 (primário) 25
Sue05 F 4 (primário) 24
Jup06 F 4 (primário) 18
Joa10 F 4 (primário) 27
Nil12 F 4 (primário) 45
Ire17 F 4 (primário) 52
Mal16 F 4 (primário) 56
Dal18 F 4 (primário) 71
Jos35 F 5*.(primário)2 59
Glo11 F 6 (ginasial) 48
Nad36 F 7 (ginasial) 57
Val24 F 8 (ginasial) 15
Fat23 F 8 (ginasial) 15
Ari30 F 8 (ginasial) 43
Dor29 F 8 (ginasial) 44
Hel34 F 8 (ginasial) 62
San39 F 9 (colegial) 16
Ana40 F 9 (colegial) 18
Eve43 F 9 (colegial) 42
Mar22 F 10 (colegial) 17
Lau28 F 11 (colegial) 43
Hel44 F 11 (colegial) 44
Mgl48 F 11 (colegial) 52
Mag47 F 11 (colegial) 53
26

QUADRO 2.2.2
CARACTERÍSTICAS SOCIAIS DOS FALANTES ADULTOS
MASCULINOS
IDENTIFICAÇÃO SEXO ANOS DE IDADE
ESCOLARIZAÇÃO
Cab02 M 4 (primário) 16
Sam01 M 4 (primário) 18
Rob15 M 4 (primário) 22
Seb09 M 4 (primário) 39
Edb07 M 4 (primário) 41
Jan03 M 4 (primário) 56
Lui08 M 4 (primário) 57
Edp13 M 4 (primário) 62
Man14 M 5* (primário) 59
Ago33 M 5* (primário) 60
Car19 M 6 (ginasial) 20
Pac20 M 7 (ginasial) 25
Cas46 M 7 (ginasial) 62
Ubi21 M 8 (ginasial) 20
Jae25 M 8 (ginasial) 30
Jov26 M 8 (ginasial) 32
Cla27 M 8 (ginasial) 32
Cid32 M 8 (ginasial) 57
Geo31 M 8 (ginasial) 58
Leo38 M 10 (colegial) 18
Pit37 M 10 (colegial) 25
Par41 M 11 (colegial) 26
Dav42 M 11 (colegial) 31
Mor45 M 11 (colegial) 51
27

QUADRO 2.2.3
CARACTERÍSTICAS SOCIAIS DAS CRIANÇAS
IDENTIFICAÇÃO SEXO ANOS DE IDADE
ESCOLARIZAÇÃO
Adl57 F 1 (primário) 10
Mar50 F 2 (primário) 8
Eri59 F 3 (primário) 9
Ros52 F 4 (primário) 10
Adm61 F 5 (ginasial) 14
Mon54 F 6 (ginasial) 12
Adr63 F 7 (ginasial) 12
Jaq56 F 8 (ginasial) 14
Nel49 M 1 (primário) 7
Jos58 M 2 (primário) 10
Mar51 M 3 (primário) 9
Vin60 M 4 (primário) 9
Fra53 M 5 (ginasial) 11
Gus62 M 6 (ginasial) 11
Ale55 M 7 (ginasial) 13
Jor64 M 8 (ginasial) 14

Apresentamos a seguir a descrição do processo de coleta e

armazenamento dos dados.

2.3 - Processo de coleta e armazenamento dos dados

Decidiu-se que a gravação da entrevista propriamente dita duraria

uma hora. Decidiu-se também que ela não seria feita no primeiro contato

com o informante para minimizar o conhecido Paradoxo do observador (cf.

LABOV, 1972a, p.207-9). Nesta oportunidade, o entrevistador preenchia uma

ficha social para cada falante. Além de estabelecer contato e identificar o

informante correto, esta ficha, projetada pela equipe, objetivava obter

informações diversas dos falantes, a serem oportunamente utilizadas. Uma


28

destas informações dizia respeito, por exemplo, ao tipo e freqüência de

contato do falante com os meios de comunicação de massa.

Após o contato com os informantes e o preenchimento da ficha

social, o entrevistador planejava a entrevista com um dos pesquisadores,

objetivando-se elicitar a maior gama possível de formas lingüísticas da

maneira mais espontânea possível.

Gravadas as entrevistas, elas eram submetidas a um controle de

qualidade técnica e lingüística. Se necessário, eram refeitas. Caso contrário,

eram transcritas segundo um sistema de transcrição específico e

submetidas posteriormente a uma revisão para o controle de qualidade da

transcrição. Como último passo, eram digitadas, armazenadas

eletronicamente, para, ao final, se submeterem a um processo de correção

da digitação e se tornarem prontas para serem utilizadas em pesquisas

futuras através de mecanismos eletrônicos de levantamento de dados. Este

procedimento não impedia que as entrevistas já pudessem ser utilizadas

para pesquisas antes de armazenadas na forma final. Em verdade, todas as

pesquisas realizadas até agora com base neste "banco de dados", inclusive

a nossa, tiveram seus dados retirados manualmente através das entrevistas

manuscritas ou através das entrevistas digitadas sem a correção final. O

processo de armazenamento eletrônico dos dados ainda encontra-se em

desenvolvimento.
29

2.4 - Caracterização dos dados

De posse das entrevistas, caracterizadas como textos semi-livres em

situação da fala semi-espontânea, localizamos todos os sintagmas nominais

relevantes; efetuamos um outro controle de qualidade, ouvindo novamente

todos os sintagmas nominais localizados e fizemos o seu levantamento

sob critérios de classificação apropriados. Antes de falarmos do total

obtido, gostaríamos de explicitar novamente que o fenômeno lingüístico que

estamos analisando é o da concordância gramatical de número plural

entre os elementos flexionáveis do sintagma nominal. Além disso,

consideramos necessário caracterizar com precisão o tipo de dado que

constitui o nosso objeto de estudo, para que as nossas conclusões fiquem

claras e inequívocas.

Inicialmente podemos afirmar que encontram-se no escopo de nossa

análise todo e qualquer SN que tenha pelo menos uma marca formal ou

semântica de plural. Todavia, esta caracterização não é suficientemente

precisa, pois ela engloba estruturas do tipo muita mulher casada que, no

momento, não constitui o nosso centro de interesse. Para casos deste tipo,

não existe nenhuma prescrição: eles tanto podem ser produzidos na forma

singular - muita mulher casada - ou na forma plural - muitas mulheres

casadas. Estas duas formas são igualmente aceitas pela tradição gramatical

brasileira, pelo menos implicitamente, diferentemente de outras formas

como duas mulher casada. Neste caso, a nossa tradição gramatical só

legitima a forma duas mulheres casadas.

Pretendemos analisar aqui os dados envolvidos no processo

gramatical de concordância nominal de número plural que esta mesma


30

tradição prevê como existente, explícita ou implicitamente, e que, diante de

sua ausência, rotula-os como desvios da norma gramatical ou simplesmente

como erros.

Sendo assim, excluímos casos do tipo muita mulher casada, mas

incluímos casos como: muitas mulheres casadas; muitas mulheres casada

ou muitas mulher casada. Incluímos igualmente casos do tipo uma porção

de coisas; uma porção de coisas interessantes, mas não excluímos uma

porção de coisa interessante ou uma porção de coisa. Estes dois últimos

casos são considerados pela tradição gramatical também como desvios da

norma, embora não se encontrem claramente referenciados em quaisquer

partes das gramáticas, relativas à concordância nominal. Entretanto, basta

que se leiam as partes relativas à concordância verbal envolvendo as

construções acima para que se possa inferir que a ausência de marca formal

do plural no substantivo do SN encaixado não está conforme os padrões

gramaticais vigentes (cf. ALI, 1971, p.295; MELO, 1978, p.229-80;

BECHARA, 1982, p.298; ROCHA LIMA, 1983, p.358; CUNHA & CINTRA,

1985, p.488).

É importante observar ainda que, embora tenhamos analisado dados

de SNs complexos como um punhado de; um montão de; uma série de; um

grupo de etc., não estendemos a nossa análise a estruturas do tipo uma lista

de presentes x uma lista de presente, pois consideramos que estes casos

encontram-se em áreas fronteiriças. Temos dúvidas sobre a obrigatoriedade

da marca formal de plural no substantivo do SN encaixado. Estes dados são

interessantes de serem analisados, mas em outra oportunidade. Excluíram-


31

se também casos de núcleos coordenados, uma vez que a própria tradição

gramatical brasileira admite a variação nestas circunstâncias.

Por outras razões, excluíram-se desta análise outros dois tipos de

dados. São eles: (1) os que fogem da posição canônica como em "tios, eu

tenho dois"; (2) os que ocorrem em situação de neutralização do tipo "as

meninas são", "as botas cheias de", "os jogadores do". A exclusão do

primeiro tipo ocorreu pela escassez de dados, inviabilizando uma análise

quantitativa do tipo laboviana, e a exclusão do segundo, pela impossibilidade

de se perceber com precisão nestas situações a presença ou ausência do

morfema de plural.

Sabe-se que em Português o /S/ em final de palavra, morfêmico ou

não, pode-se realizar em termos de segmentos como [s] (fricativa, alveolar,

surda); como [] (fricativa, palatal, surda); como [z] (fricativa, alveolar,

sonora) e como [] (fricativa, palatal, sonora) (cf. CÂMARA JR., 1975, p.83-

4). Admite-se também a sua realização como uma aspirada [h] (cf. GRYNER

& MACEDO, 1981, p.135-6), o que, todavia, é bastante raro em nossos

dados. Tal realização é mais comum em travamento silábico no interior da

palavra. A não freqüência desta realização em final de palavra fez com que

não eliminássemos os dados seguidos de /R/. Foram finalmente excluídos

casos indubitavelmente cristalizados do tipo Os Trapalhões, "moro em Duas

Barras", bem como todos os casos de núcleo nominal invariável como

costas, férias etc., os quais merecem ser estudados separadamente.

Excluindo-se os casos acima citados, podemos então afirmar que

todo e qualquer sintagma que apresentasse pelo menos uma marca formal
32

ou semântica de plural que implicasse necessariamente outra ou outras

marcas formais de plural nos elementos flexionáveis do SN foi nosso objeto

de estudo. Analisamos, portanto, SNs com todas as marcas formais de plural

(todos os dias; os nossos filhos), com algumas marcas (essas estradas nova;

essas coisas toda); com apenas uma (aqueles médico todinho; as perna bem

feita) ou até sem nenhuma marca formal explícita, quando ocorria um SN

contendo um numeral como primeiro elemento seguido de outros elementos

não marcados (vinte ano; dois risco verde) ou quando o SN encontrava-se

encaixado num SN mais alto semanticamente plural sem marca formal

explícita (um montão de coisa; um punhado de peixinho colorido).3

Após o levantamento de todos os dados relevantes e, excluídos os

casos acima citados, obtivemos um total de 7193 sintagmas nominais nas 64

horas de fala analisada. Destes 7193, 6027 foram produzidos pelos falantes

adultos e 1166 pelas crianças. Outros detalhes sobre caracterização e

levantamento de dados que se fizeram importantes, bem como a sua forma

de codificação, serão apresentados nos momentos oportunos.


3 - PRESSUPOSTOS TEÓRICOS

Conforme afirmamos, o trabalho que vamos desenvolver aqui insere-

se de forma geral dentro da perspectiva teórica denominada Teoria da

Variação Lingüística Laboviana ou Sociolingüística Quantitativa. O texto

clássico de Labov, "The study of language in its social context", discute entre

outros aspectos as colocações saussurianas e chomskianas a respeito de

língua como uma estrutura invariante e incorpora ao conceito de língua

enquanto sistema a noção de estrutura heterogênea (cf. 1972, p.825-7;

1975a, p.183;187;203-4).

Resumindo algumas idéias deste texto, Scherre observa que

Labov dissocia, portanto, estrutura de homogeneidade e


introduz a noção de variação inerente a um sistema
lingüístico, uma vez que ela existe não só na comunidade
de fala mas até na gramática de um único indivíduo.
Sendo assim, deve ser focalizada por uma lingüística da
língua ou por uma teoria da competência e não relegada
ao domínio da lingüística da fala ou teoria do
desempenho. (SCHERRE, 1978, p.8)

Ao incorporar a noção de variabilidade à estrutura lingüística e atribuí-

la à lingüística considerada propriamente dita - a lingüística da língua -,

Labov propõe alargar o conceito de regra da gramática para abarcar o

conceito de regra variável, como uma forma alternativa da regra opcional, a

qual não é capaz de incorporar a variação sistemática. Propõe então a

generalização da regra variável em moldes gerativos, para dar conta da

probabilidade de aplicação de uma dada regra em função da presença de

determinados contextos lingüísticos e sociais relevantes (cf. LABOV, 1975a,

p.216-8 e 1975b, p.93-101)


34

Neste trabalho, partimos da idéia laboviana de variação sistemática

envolvendo os fenômenos lingüísticos. Todavia, consideramos pertinentes as

críticas feitas a Labov por querer considerar que a sua proposta teórica

constitua uma extensão da proposta da Gramática Gerativa (cf. KAY & MC

DANIEL, 1977, p.1-7). Nos moldes labovianos, interessa a freqüência de

aplicação de uma regra, fato que é absolutamente irrelevante para a

Gramática Gerativa. Para esta corrente teórica, o que interessa é a

possibilidade da ocorrência de uma dada estrutura e não o número de vezes

que esta estrutura ocorre. E ainda mais: nem mesmo importa a ocorrência de

uma dada construção. A Gramática Gerativa, embora considere que toda

construção aceitável seja necessariamente gramatical, no sentido não

normativo do termo, assume que há orações que mesmo inaceitáveis podem,

ainda assim, ser gramaticais, se a sua inaceitabilidade decorrer de fatores

externos ao conjunto de regras internalizadas, como questões ligadas à

forma da mente processar as informações. Sendo assim, uma estrutura com

múltiplos encaixes, embora gramaticalmente possível, pode não ocorrer nos

dados reais, uma vez que a sua produção pode ser impossível por questões

de processamento (cf. CHOMSKY, 1965, p.83-97). Em verdade, neste caso,

interessa a intuição sobre a possibilidade de ocorrência: a possível

ocorrência real é irrelevante.

A partir do momento que uma postura teórica considera irrelevantes

aspectos que para uma outra postura teórica são fundamentais e vice-versa,

cabe perguntar se uma pode ser vista como extensão da outra ou se elas
35

apresentam cortes epistemológicos realmente distintos. Em verdade,

consideramos que a Gramática Gerativa e a Teoria da Variação poderiam ser

vistas como duas formas complementares de ver o fenômeno lingüístico (cf.

OLIVEIRA, 1987, p.19-21). A primeira o olha do ponto de vista de processos

mentais, como caracterizadores da própria inteligência, e a segunda o olha

da perspectiva da sua relação com o meio social, como possíveis indicadores

da estrutura social existente nas comunidades de fala. A primeira atribui à

língua uma função cognitiva e a segunda, uma função social e comunicativa

(cf., também, LOBATO, 1986, p.43-4). Em verdade, a língua tem estas duas

funções e não há razão alguma para que uma se sobreponha à outra. Elas

são simplesmente duas funções diferentes que refletem, no mínimo, duas

facetas da estrutura lingüística.

Com o propósito de tentar resumir as grandes tendências lingüísticas

do Ocidente, na atualidade, Nichols & Woodbury (1985) chegam a afirmar

que a linha mestra da lingüística ocidental atual apresenta duas grandes

divisões: uma abordagem formal e outra funcional. A abordagem formal é

caracterizada em termos de ser orientada para o modelo: seu objetivo não é

descrever fenômenos lingüísticos explícitos, mas sim desenvolver um modelo

explanatório integrado a respeito do conhecimento lingüístico que o falante

possui, ou seja, a respeito da língua. Esta perspectiva focaliza propriamente

constructos teóricos internos e o dado é relevante apenas para a construção

e teste do modelo (cf. p.1).

Segundo eles,

o que é menos freqüentemente reconhecido é que existe


um outro modo, fundamentalmente diferente (embora
logicamente complementar) da lingüística teórica. (...)
36

Seu objetivo científico é descrever, não constructos


teóricos e analíticos, mas os próprios fenômenos
lingüísticos. (...) Busca-se fazer generalizações sobre
fenômenos concretos na língua. (NICHOLS &
WOODBURY, 1985, p.2)4

Nesta perspectiva, a Teoria da Variação ou Sociolingüística

Quantitativa pode-se denominar funcionalista, pois interessa-lhe também e,

primordialmente, descrever e explicar os dados lingüísticos reais (cf. LABOV,

1975a, p.187-205). A própria Nichols, em um texto de 1984, afirma que

o funcionalismo lingüístico combina certos avanços


teóricos da gramática formal com as preocupações e os
avanços teóricos da sociolingüística e etnografia da
comunicação. Ele objetiva solucionar o hiato entre o
estudo da língua e o estudo da comunicação.
(NICHOLS, 1984, p.98)5

Ainda no texto de 1984, Nichols tenta estabelecer uma tipologia para

as abordagens funcionalistas, uma vez que considera que ainda "(...) não há

teoria funcionalista embora haja esboços e relatos do que uma teoria deste

tipo seria e do que ela trataria (...)". (p.102)6

Segundo ela,

afirmações funcionalistas podem ser divididas em três


tipos: conservadoras, moderadas e extremistas. Os tipos
meramente conservadores reconhecem a inadequação
do formalismo ou estruturalismo estrito, sem propor uma
nova análise da estrutura. (...)
O tipo moderado não simplesmente aponta a
inadequação da análise formalista ou estruturalista, mas
vai além para propor análises funcionalistas da estrutura
e então substituir ou mudar abordagens inerentemente
formais ou estruturais da estrutura. (...)
Funcionalista extremista nega, de uma forma ou de
outra, a realidade da estrutura pela estrutura. Pode-se
afirmar que regras são baseadas inteiramente na função
e conseqüentemente não há restrições puramente
sintáticas; que a estrutura é somente a função codificada,
ou coisa parecida. (NICHOLS, 1984, p.102-3)7
37

Du Bois (1984), em "Competing motivation", apresenta por sua vez a

forma de conceber a relação entre fenômenos internos e externos ao sistema

que se podem associar às duas grandes correntes dentro da história da


Lingüística moderna: a primeira ele denomina de Estruturalismo autônomo e

a segunda de Funcionalismo transparente.

Segundo Du Bois, o Estruturalismo autônomo considera que

(...) as únicas forças que organizam a língua são forças


internas ao sistema. (...) Nada vem de fora: nem
motivação icônica e nem qualquer outra motivação
externa. (DU BOIS, 1984, p.345)8

O Funcionalismo Transparente, por sua vez, assume que

(...) todos os fatos sintáticos aparentemente autônomos


são realmente os resultados transparentes dos objetivos
funcionais do falante etc, de modo que nenhum aparato
sintático arbitrário precisa ser postulado para a língua (...)
Aqui as únicas forças que governam a sintaxe (que
existe no sentido simplesmente de ordenação das
palavras nos enunciados) são as forças positivas da
lingüística externa: talvez mecanismos de processamento
biologicamente baseados, intenção do falante etc. (DU
BOIS, 1984, p.345-6)9

Du Bois propõe em seu texto uma visão teórica conciliadora que

reconhece a existência das forças internas e das forças externas que atuam

sobre a língua, constantemente em competição. Não propõe eliminar a

distinção entre língua/fala, competência/desempenho, lingüística da

língua/lingüística da fala ou lingüística externa/lingüística interna. Propõe que

a lingüística propriamente dita reconheça que a gramática é um sistema

adaptativo que tem no seu funcionamento a existência de forças externas em


38

competição entre si, forças internas também em competição entre si e forças

externas e internas também em competição, que mais cedo ou mais tarde

chegam a uma resolução. Segundo ele,

nenhuma teoria do discurso ou da gramática seria


adequada (...) sem uma teoria explícita da competição e
reconciliação sistemática de motivações externas e
internas. (DU BOIS, 1984, p.347)10

Em síntese, Du Bois coloca o seguinte:

Se a língua é considerada ser adaptativa, no sentido que


responde às pressões do 'ambiente externo', nós
devemos rejeitar a estrutura teórica do estruturalismo
autônomo, que se limita, na sua tentativa de explicar a
estruturação da língua, a reconhecer apenas forças de
motivações internas ao sistema. Por outro lado, se a
língua é considerada como um sistema, e como tal tem
no mínimo um grau de continuidade de existência, nós
devemos rejeitar a estrutura teórica do funcionalismo
transparente, que falha em dar conta do fato de que as
categorias gramaticizadas (...) são retidas para serem
novamente usadas (...) em uma forma mais ou menos
congelada (...). Mais importante, talvez, é que ela falha
em construir propriamente o aspecto interno mais
fundamental da gramática, o processo de gramaticização
em si mesmo.
Como uma alternativa a versões rigidamente puristas
do estruturalismo autônomo ou funcionalismo
transparente, eu sugiro que será mais frutífero buscar
uma estrutura sintetizadora para a lingüística, uma capaz
de tratar com a interação de forças externas e internas, e
as suas resoluções sistemáticas. (...) Finalmente, nós
devemos procurar entender a natureza da interação
complexa entre língua e fala, entre discurso e gramática.
(DU BOIS, 1984, p.362)11

É neste contexto teórico ainda nebuloso que o nosso trabalho se

coloca.

Ele se insere na perspectiva teórica da Teoria da Variação ou da

Sociolingüística Quantitativa porque incorpora a noção de variação


39

sistemática, determinada a partir de padrões recorrentes extraídos de dados

do desempenho lingüístico na sua forma semi-espontânea. Como tal procura

estabelecer as variáveis lingüísticas e sociais que determinam a

previsibilidade da variação, ou seja, procura descrever e explicar os próprios

fenômenos lingüísticos. Todavia, ele se afasta desta perspectiva teórica no

sentido de que não considera a regra variável como uma extensão da regra

opcional de cunho gerativo, pelo fato de hoje concordarmos com a colocação

de Kay & Mc Daniel (cf. 1977, p.3) no que diz respeito à importância dada à

freqüência de ocorrência de uma estrutura na perspectiva variacionista e a

sua total irrelevância numa perspectiva formal e gerativista. Se usamos a

palavra regra dentro do nosso texto, queremos dar a ela o sentido de

padrões que emergem a partir dos dados do desempenho (cf. DU BOIS,

1984, p.384-51). Considerando que padrões se manifestam, é razoável supor

que exista uma contraparte internalizada destes padrões lingüísticos. Se

estes padrões pertencem ao que se denomina de língua ou de fala, não é

nosso objeto de discussão. É importante, todavia, considerar que, se forem

atribuídos à fala, temos de modificar o seu conceito conforme estabelecido

por Saussure e passar a considerá-la também essencial, sistemática e

coletiva (cf. SAUSSURE, 1973, p.22-3).

O nosso trabalho assume então da Teoria da Variação a idéia de que

há variação inerente, diferente do que Bickerton (1977) coloca em "Inherent

variability and variable rules". A variação aqui não é, portanto, considerada

como advinda da junção de indivíduos com comportamentos lingüísticos


40

internamente homogêneos, mas diferenciados entre si. Assume-se assim

que a variação existe no comportamento lingüístico individual e que ela

reflete, a nível grupal, o comportamento lingüístico de indivíduos que

variam da mesma forma. Além disso, as diferenças entre os agrupamentos

de indivíduos são interpretadas como diferenças dialetais ou como

indicadores de mudança lingüística (cf. BICKERTON, 1977, p.474-5; 488-9;

LABOV, 1975a, p.223-59; LABOV, 1975b, p.65-129 e GUY, 1980, p.1-35).

O nosso trabalho se insere também dentro do mundo teórico e


conturbado do que se convencionou rotular Funcionalismo, no sentido

moderado do termo conforme colocado por Nichols (1984), ou no sentido

conciliador de Du Bois (1984), porque admite e propõe princípios ou

motivações externas, em competição entre si, para explicar os padrões

sistemáticos, previsíveis e inerentes, que emergem do nosso estudo

minucioso de um fenômeno lingüístico em Português: a concordância

gramatical de número plural entre os elementos flexionáveis do sintagma

nominal.
4 - CONSIDERAÇÕES ADICIONAIS SOBRE ASPECTOS
TEÓRICOS

4.1 - Sobre o Funcionalismo no arcabouço teórico da Gramática


Gerativa

Kiparsky (1972), em seu artigo "Explanations in phonology",

apresenta uma série de limitações da Gramática Gerativa, que não

reproduziremos em detalhes aqui por não ser este o nosso objetivo.

Interessa-nos especificamente resumir algumas de suas propostas dentro do

que estamos chamando de Funcionalismo no arcabouço teórico da

Gramática Gerativa.

Segundo ele, há uma série de regularidades na fonologia e na

morfologia que são baseadas em condições de natureza funcional e que para

explicá-las é necessário "(...) adicionar à teoria condições substantivas que

pertencem não à forma da gramática (isto é, ao sistema de regras que gera a

língua) mas à sua saída (output)." (p.195) 12

Um destes aspectos regulares diz respeito a regras opcionais com

freqüências variáveis (cf. p.197).

Kiparsky afirma então o seguinte:

Uma simples ilustração deste tipo de fenômeno com o


qual eu me ocuparei aqui é encontrado naquelas
variedades do Inglês americano que têm a regra que
cancela o -t em final de palavra, usualmente de forma
opcional. Onde este -t é a terminação de tempo passado,
alguns falantes cancelam-no somente quando as formas
do passado e do presente do verbo mostram uma vogal
diferente na raiz (Twaddell, 1935, p.79). (...)
A vogal da raiz não pode na presente teoria da
fonologia gerativa servir para determinar se o -t pode ou
não ser cancelado. (...) Não há nenhum ponto na
derivação em que a informação crucial, se uma mudança
vocálica ocorreu, é disponível. (KIPARSKY, 1972,
P.197)13
42

Segundo Kiparsky, há tentativas formais para explicar o

comportamento variável do -t, mas todas elas insuficientes. Além disso,

considera que estas tentativas não constituem explicações e nem mesmo

base para explicações verdadeiras(cf. p.198). Segundo ele,

a regra é bloqueada (ou, em alguns dialetos, aplicada


menos freqüentemente) quando sua aplicação torna as
formas do presente e do passado indistiguíveis
(pass:passed) mas se aplica livremente onde esta
distinção é retida por causa da diferença vocálica
(keep:kep). (KIPARSKY, 1972, P.198) 14

O exemplo acima constitui apenas um dentre uma série de outros

apresentados por Kiparsky (cf. 1972, p.196-206). Para explicá-los, ele

postula a existência de condições de natureza funcional, denominadas por

ele de Condições de Distintividade, formulada nos seguintes termos:

Nós temos (...) Condições de Distintividade, que, como


uma aproximação inicial, estabelecem que há uma
tendência para informação semanticamente relevante ser
retida na estrutura superficial. (KIPARSKY, 1972,
p.195)15

Ao lado das Condições de Distintividade, Kiparsky estabelece

também Condições de Nivelamento, que não nos interessam no momento.

Com relação aos dois tipos de condições, aos quais ele atribui caráter

funcional, e especificamente no que se refere às Condições de

Distintividade, afirma então que "retenção de informação funcional na

estrutura superficial pareceria ser motivada por necessidade de percepção

da fala." (p.195)16

Afirma ainda que apenas a existência destes fenômenos não é

condição suficiente para provar que "(...) fatores funcionais estão atuando"
43

(p.198),17 mas considera necessário provar que "(...) aspectos substantivos

de condicionamento morfológico são constantes de uma língua para outra"

(p.198)18, ou seja, considera necessário evidenciar o seu caráter universal.

As Condições de Distintividade conforme estabelecidas por Kiparsky

dão origem então à hipótese funcionalista dentro do arcabouço da Gramática

Gerativa, que neste trabalho passaremos a nomear de Funcionalismo

kiparskiano, por causa de outras hipóteses funcionalistas existentes que não

se encaixam numa perspectiva gerativa.

As colocações de Kiparsky (1972) passaram a ser incorporadas em

trabalhos de natureza quantitativa. Em "The notion of the plural in Puerto

Rican Spanish: competing constraints on (-S) deletion", Poplack discute

explicitamente a hipótese funcional baseada nas Condições de Distintividade

de Kiparsky (cf. 1980a, p.57), retoma-a em "Deletion and disambiguation in

Puerto Rican Spanish" (cf. 1980b, p.372-3) e volta a discutir o assunto em

"Mortal phonemes as plural morphemes" (cf. 1981, p.59; 61-2), apresentando

resultados parcialmente opostos à hipótese em questão. Nestes artigos,

Poplack apresenta a influência de restrições estruturais e funcionais em

competição, evidenciando a supremacia das restrições estruturais.

Lefebvre, em "Variation in plural marking: the case of Cuzco

Quechua", apresenta também evidências de restrições funcionais e não

funcionais em competição, mostrando algumas situações que são previstas

pela hipótese funcionalista kiparskiana e outras que não o são (cf.1981, p.81-

2).

Em "Linguistic variation in Brasilian Portuguese: aspects of

phonology, syntax and language history", Guy também discute a hipótese


44

funcionalista kiparskiana (cf. 1981a, p.156-61; 165; 189-93; 241; 246; 250-2;

334; 342-9 e 351-2). Semelhantemente à Poplack, Guy encontra resultados

contrários à hipótese de Kiparsky. Para mantê-la, chega a propoo uma

mudança na proposta original de Kiparsky no sentido de que "(...) restrições

'funcionais' são operantes somente quando forma e função caminham lado a

lado, quando estrutura e significado são perfeitamente paralelos." (p.345)19

Em "Functional compensation for (-S) deletion in Puerto Rican

Spanish", Hochberg retoma novamente a hipótese funcionalista de Kiparsky,

apresentando resultados que a corroboram (cf. 1986, p.609-11; 616-9).

Cumpre-nos observar desde já que, embora Poplack, Guy, Hochberg

e Lefebvre tenham tratado de fenômenos de cancelamentos, eles

analisaram segmentos de natureza distinta: Poplack estudou o -S e a nasal

finais, morfêmicos e não-morfêmicos no Espanhol de Porto Rico; Guy

estudou os mesmos fenômenos no Português popular do Brasil, enquanto

Hochberg estudou apenas o cancelamento do -S morfêmico que marca as

formas verbais de primeira pessoa. Lefebvre, por sua vez, estudou a

variação de plural na língua Quechua - uma língua Indígena Americana

meridional falada na área andina por, aproximadamente, seis milhões de

pessoas - que, embora não apresente concordância nominal, apresenta a

verbal (cf. p.73). O fenômeno estudado por Lefebvre é, pois, de natureza

inteiramente morfológica, mas não apresenta os mesmos resultados que

Hochberg. Suas conclusões são semelhantes às de Poplack com as quais,

inclusive, estabelece comparações (cf. p.82-3).

A síntese das idéias de Kiparsky (1972) sobre a hipótese funcionalista

no arcabouço da Gramática Gerativa e os estudos feitos perseguindo esta

hipótese com resultados controversos, de 1980 a 1986, mostram a


45

atualidade da discussão e a necessidade de a inserirmos no corpo deste

trabalho, que retoma novamente o estudo do -S final de natureza morfêmica

no Português do Brasil.

4.2 - Sobre o Funcionalismo fora do arcabouço teórico da


Gramática Gerativa

Como já vimos, o Funcionalismo fora do arcabouço da Gramática

Gerativa é um rótulo usado para cobrir uma gama bastante ampla de

correntes lingüísticas que, embora diferentes entre si, apresentam algumas

características fundamentais em comum. Pela literatura lingüística existente

(cf., especialmente, DU BOIS, 1984, p.343-7; NICHOLS, 1984, p.97-117 e

NICHOLS & WOODBURY, 1985, p.1-13), ressaltam-se três principais pontos

em comum:

1) O primeiro deles diz respeito à função primeira que se pode

atribuir à língua, pois, nestas correntes funcionalistas, a língua é considerada

antes de mais nada como um instrumento de comunicação inserido no seio

de uma comunidade. Como tal, não pode ser estudada no abstrato sem que

se leve em conta o contexto lingüístico e, inclusive, todo o processo

comunicativo (cf. NICHOLS, 1984, p.97-8).

2) O segundo ponto se relaciona ao objeto do estudo lingüístico.

Como também já vimos, interessa a estas correntes funcionalistas descrever

os fenômenos lingüísticos substantivos e não constructos teóricos e

analíticos, buscando, conseqüentemente, universais de natureza substantiva

(cf. NICHOLS & WOODBURY, 1985, p.2). Os dados provenientes de intuição

não têm, portanto, lugar nesta perspectiva funcionalista.


46

3) O terceiro ponto diz respeito ao que se admite constituir uma

explicação em lingüística: não se considera que a língua tenha a sua

estrutura e funcionamento explicados apenas por forças ou motivações

internas em competição, mas considera-se também a ação de forças ou

motivações externas igualmente em competição, entre si ou entre estas e as

forças internas. Conseqüentemente, a própria característica da arbitrariedade

da língua é discutida, que, no sentido absoluto do termo, fica reservada

apenas para as relações internas entre os significantes e os significados dos

signos lingüísticos (cf. DU BOIS, 1984, p.342-4, 346; HAIMAN, 1980, p.515-

40; 1983, p.781-819).

Destes três pontos, interessa-nos detalhar o terceiro, o qual

abordaremos no interior deste trabalho.

Os princípios ou motivações externas ligados especificamente às

teorias funcionalistas, e encontrados por nós na literatura lingüística, são os

seguintes:

1) o Princípio da Iconicidade ou Motivação Icônica (cf. HAIMAN, 1980

e 1983; DU BOIS, 1984);

2) o Princípio da Economia ou Motivação Econômica (cf. HAIMAN,

1980 e 1983; DU BOIS, 1984);

3) o Princípio do Fluxo de Informação Preferido (cf. DU BOIS, 1984);

4) o Princípio da Topicidade (cf. DU BOIS, 1984);

5) o Princípio da Natureza Comunicativa Periférica da Oração VS ou

o Princípio da Tensão Baixa (cf. NARO & VOTRE, 1986).


47

4.2.1 - O Princípio da Iconicidade

O Princípio da Iconicidade ou a Motivação Icônica nos termos de

Haiman (1983) relaciona-se diretamente ao Princípio do Isomorfismo ou da

Invariância entre forma e expressão (cf. p.814). Seu objetivo é, portanto,

apresentar evidências lingüísticas de que "(...) uma dimensão lingüística (ou

formal) corresponde diretamente a uma dimensão não lingüística (ou

conceptual) (...)." (p.781)20 Dentre as evidências apresentadas, são de

nosso interesse particular as que ele utiliza para demonstrar um dos

aspectos da Motivação Icônica sintetizado na seguinte colocação: "(...) a

distância lingüística entre as expressões corresponde à distância conceptual

entre as idéias que elas representam." (p.782)21

Segundo Haiman, a diferença conceptual existente entre matar e

causar a morte, por exemplo, é iconicamente motivada no sentido da

colocação acima. Matar é uma expressão formal mais sintética do que

causar a morte e indica, por sua vez, maior proximidade entre o agente e o

paciente da ação. Em "x matou y", há a pressuposição de que a ação tenha

sido direta, no mesmo espaço e no mesmo tempo, o que não ocorre em "x

causou a morte de y". A distância material entre x e y é menor em matar do

que em causar a morte, o que corresponde também a uma distância (e não

complexidade) conceptual maior (cf. HAIMAN, 1983, p.782-4)


48

4.2.2 - O Princípio da Economia

Ao lado da Motivação Icônica, Haiman aponta também a existência

da Motivação Econômica a qual estabelece

(...) uma correspondência entre a dimensão lingüística


(transparência/opacidade, formas plenas/formas
reduzidas) e a dimensão conceptual (familiar/não familiar
e previsível/não previsível) (...). (HAIMAN, 1983, p.802)22

Neste sentido, Haiman afirma que "(...) poderia se argumentar que a

correspondência acima é em si mesma icônica em certo nível." (HAIMAN,

1983, p.802)23 Todavia, ele refuta esta associação, afirmando o seguinte:

Mas a forma não é um ícone do conceito, ou mesmo da


familiaridade do conceito. Redução da forma é um índice
ECONOMICAMENTE motivado da familiaridade, não um
índice motivado iconicamente. (HAIMAN, 1983, p.802)24

Segundo Haiman, a hierarquia dos mecanismos formais para a

especificação dos sujeitos de uma narrativa, estabelecida por Givón em

1983, e sua covariação em volume e complexidade com a previsibilidade da

identidade de seu sujeito, "(...) dá suporte a nossa tese de que quanto mais

imprevisível for um pedaço de informação, mais codificação ele requer."

(HAIMAN, 1983, p.802)25

Em outras palavras, Haiman coloca que o Princípio da Economia ou a

Motivação Econômica se apóia "(...) na verdade do axioma geralmente aceito

de que o que é previsível recebe menos codificação do que o que não é." (cf.

1983, p.807)26

Em verdade, este princípio se aproxima muito das Condições de

Distintividade de Kiparsky. A diferença entre Haiman e Kiparsky reside no


49

fato de que o primeiro assume claramente a natureza deste princípio como

externa, ou seja, uma natureza não formal e não estritamente gramatical.

4.2.3 - O Princípio do Fluxo de Informação Preferido e o


Princípio da Topicidade

O Princípio da Iconicidade e o Princípio da Economia já são muito

abordados dentro da literatura lingüística (cf. HAIMAN, 1983, p.814). À

medida em que os trabalhos funcionalistas vão tomando corpo, novos

princípios são propostos. E é com o objetivo de explicar a diferença entre as

línguas ergativas e as línguas absolutivas que Du Bois (1984) propõe a

existência, também em competição, de dois princípios menos conhecidos: o

Princípio do Fluxo de informção Preferido e o Princípio da Topicidade.27

Neste texto, Du Bois afirma que em Sacapultec, uma língua da

Guatemala, pode-se verificar, através de dados do discurso conectado, uma

estrutura de argumento preferencial. Com base neste tipo de dado, verifica-

se que o pressuposto da diversidade na ordenação dos argumentos (cf.

p.347-9) não existe, pois, nesta situação,

a aparente variação 'livre' desaparece. De outra forma, as


orações convergem para um padrão básico: um verbo
seguido por um argumento direto, (ou, menos
freqüentemente, nenhum) na forma de um sintagma
nominal pleno. (...) Mas orações com dois argumentos
diretos na forma de SNs plenos são extremamente raras.
(DU BOIS, 1983, p.348)28

Para Du Bois, a tendência acima se dá igualmente com verbos

transitivos e intransitivos,

(...) embora eles difiram num aspecto crucial. O único


argumento direto com verbos intransitivos é mais
comumente o sujeito, mas com transitivos é o objeto.
50

Estes argumentos juntos constituem, naturalmente, a


classe dos absolutivos nas línguas ergativas como
Sacapultec. Conseqüentemente, nós observamos uma
unidade natural no discurso para a categoria de
absolutivo: é a categoria na qual os sintagmas nominais
plenos aparecem. (DU BOIS, 1984, p.348)29

As duas tendências discursivas apontadas acima por Du Bois

denominam-se, respectivamente, de restrição de um só SN e restrição de

S/O (sujeito/objeto). São estas duas preferências discursivas que formam o

que Du Bois denomina de estrutura de argumento preferencial. O mais

interessante da argumentação de Du Bois decorre do fato de que, segundo

ele, tal configuração não surge arbitrariamente, pois ela ocorre em função do

fluxo de informação preferido no discurso narrativo de Sacapultec (cf.

p.348-9). Du Bois afirma então que

se nós examinarmos todas as ocorrências de itens de


referências nominais nas narrativas de Sacapultec que
têm status discursivo pragmático 'novo' (como definido
por Chafe 1976), nós vamos ver que eles aparecem
freqüentemente em certas categorias gramaticais e muito
raramente em outras, em particular, novas menções
ocorrem bem livremente nos papéis de S /sujeito de
verbo intransitivo/ ou de O /objeto de verbo transitivo/ (...)
mas quase nunca em papel de A /sujeito de verbo
transitivo/ (...) Esta preferência de menções novas para
papéis S e O (...) é a base para a preferência, descrita
antes, de sintagmas nominais plenos para os papéis de S
e O. Naturalmente, uma menção nova de um referente
tipicamente requer a informação codificada de forma
explícita que um sintagma nominal pleno pode fornecer,
de modo que a maioria das menções novas serão
realizadas como sintagmas nominais plenos (embora a
implicação reversa não seja verdadeira). Inversamente, o
fato de que informação nova nunca seja virtualmente
introduzida no papel de A explica em grande parte a
relativa escassez de sintagmas nominais plenos nesta
posição. (DU BOIS, 1984, p.349-50)30
51

Com estas e outras argumentações dentro de seu texto, Du Bois

considera que

podemos levantar a hipótese de que a gramatização da


ergatividade morfológica em Sacapultec é em última
instância a cristalização de certos padrões discursivos.
(DU BOIS, 1984, p.353)31

A seguir Du Bois desenvolve "(...) os preliminares para uma teoria de

motivações em competição" (p.353-9)32, discutindo, por exemplo, por que

razão nem todas as línguas são ergativas se existe motivação para a sua

existência. Afirma então que uma outra pressão discursiva que privilegia

marcar a relação tópico/agente, em competição com a pressão discursiva

para marcar a informação nova, motiva a morfologia das línguas não

ergativas ou motiva morfologia acusativa dentro das próprias línguas

ergativas (cf. p.354).

Além da demonstração de motivações externas atuando em

competição, Du Bois mostra também a atuação de forças internas em

competição com as forças externas ou forças internas em competição entre

si (cf. p.356), concluindo sobre a necessidade da lingüística incorporar estas

questões amplamente discutidas, numa tentativa de "procurar entender a

natureza da interação complexa entre língua e fala, entre discurso e


gramática." (p.362)33
52

4.2.4 - O Princípio da Baixa Tensão

Naro & Votre (1986), ao estudarem a ordem VS (ordem verbo/sujeito)

no Português do Brasil, numa amostra de 24 horas de fala gravada dentre

as 64 que constituem o "banco de dados" do Projeto Censo, assumem

explicitamente que, para a explicação deste fenômeno, não sentem

"nenhuma necessidade de postular a existência independente de uma

gramática abstrata" (p.455), ou seja, assumem uma postura funcionalista

radical. Apresentam ampla argumentação de que o importante na ordem VS

é a baixa centralidade comunicativa do sujeito, por ele não se constituir o

centro, pólo ou ponto de referência do que está sendo transmitido pelo

falante. Evidenciam que este aspecto é mais importante do que o traço novo

(cf. p.459-61), ou seja, a ordem VS em Português não é principalmente

motivada pelo fluxo de informação preferido como colocado por Du Bois

(1984), para as línguas ergativas. Tal constatação se reveste de

fundamental importância uma vez que, segundo Du Bois, é o Princípio da

Topicidade que determina a existência de línguas morfologicamente não

ergativas, tipo o Português. É então coerente e significativo que, para um

fenômeno específico do Português, Naro & Votre tenham constatado a

importância do centro, pólo ou ponto de referência, o que, segundo eles,

tende a corresponder, no nível sintático, à "posição do sujeito" (p.457), que

constitui o tópico natural dentro de uma oração. Segundo Naro & Votre, em

narrativas,

a dimensão centro-periferia corresponde à distinção entre


figura (aquilo que é narrado) e fundo (circunstâncias
externas à seqüência narrativa propriamente dita, mas
que a complementam de algum modo). (NARO &
VOTRE, 1986, p.463)
53

A partir da análise de "400 ocorrências de VS, e número

aproximadamente igual de SV" (p.455), Naro & Votre postulam a existência

do princípio da Natureza Comunicativa periférica da oração VS ou Princípio

de Tensão Baixa (PTB), transcrito abaixo.

O uso de ordenação VS indica um nível baixo de


tensão comunicativa. O sujeito não é apresentado como
central, isto é, um pólo receptor de informação e a oração
não está situada na linha central da comunicação.
Em termos mais positivos o PTB poderia ser
parafraseado afirmando a natureza comunicativamente
periférica da oração VS. (NARO & VOTRE, 1986, p.464-
5)

Com a explicitação deste princípio, acabamos de sintetizar os

princípios de motivação externa existentes na literatura lingüística

funcionalista, uma vez que vamos apresentar extensa argumentação de que

o Princípio da Economia, nos termos de Haiman, ou as Condições de

Distintividade, nos termos de Kiparsky, não são suficientes para explicar

certos padrões de concordância que emergem da análise dos dados do

desempenho. Conseqüentemente, vamos propor a existência de um outro

princípio, em competição com o Princípio da Economia, para explicar tais

padrões.

Estamos consoantes com as idéias de Du Bois, no sentido de que

nenhuma teoria do discurso ou da gramática seria


adequada (...) sem uma teoria explícita da competição e
reconciliação sistemática de motivações externas e
internas. (DU BOIS, 1984, p.347)34
54

Não objetivamos desenvolver aqui a teoria vislumbrada por Du Bois,

mas, sim, acrescentar mais argumentação sobre a necessidade de sua

existência.

Há ainda um outro princípio a ser referenciado no corpo deste

trabalho: o Princípio da Saliência. Mas, como ele não foi desenvolvido dentro

de uma perspectiva teórica funcionalista no sentido atual do termo, vamos

apresentá-lo no momento apropriado, ou seja, no item 6.2.2.


5 - SUPORTE QUANTITATIVO

Um dos modelos matemáticos utilizados em pesquisas variacionistas

foi introduzido na Lingüística por Sankoff em 1975. Ele recebe a

denominação de modelo misto ou logístico e tem como função calcular as

probabilidades associadas aos fatores de cada variável35 estudada, com

base em freqüências observadas. Discussões sobre modelos probabilísticos

anteriores a este, seus problemas e inadequações, são apresentadas em


1974 por Cedergren & Sankoff.

O modelo logístico tem sido utilizado com muito sucesso por

pesquisadores brasileiros desde 1976 e encontra-se detalhadamente descrito

na literatura lingüística (cf., por exemplo, LABOV, 1975b, p.65-129;

CEDERGREN & SANKOFF, 1974; GUY, 1975, p.59-69; LEMLE & NARO,

1977, p.25-8; BRAGA, 1977, p.3-8; ROUSSEAU & SANKOFF, 1978, p.57-68;

FASOLD, 1978; SCHERRE, 1978, p.12-8; NARO, 1981a, p.67-73; GUY,

1981a, p.29-38; NARO, 1981b, p.69-73 e NARO et alii, 1986, p.39-42).

Pela forma de funcionamento deste modelo, afirma-se que

probabilidades maiores do que 0,50 favorecem a aplicação da regra,

probabilidades menores do que 0,50 desfavorecem-na e todas as

probabilidades em torno de 0,50 têm sobre ela uma influência neutra.

Este modelo, que trabalha na base de probabilidades, é mais

adequado do que os que trabalham com percentagens cruas, porque ele

quantifica a influência relativa de cada variável, atribuindo pesos

probabilísticos devidos aos diversos fatores das diversas variáveis

estudadas (cf., por exemplo, NARO, 197636 e SCHERRE, 1978, p.41-2).

Além disso, ele tem no seu bojo a hipótese da uniformidade do efeito dos
56

fatores, sendo, portanto, suficiente que se calculem apenas as

probabilidades dos fatores, os quais formam um conjunto relativamente

pequeno, se comparado ao número hipoteticamente possível de ambientes

ou contextos (cf. LABOV 1975b, p.108-9; CEDERGREN & SANKOFF, 1974,

p.338-40). Entretanto, a realidade lingüística se mostra muitas vezes

diferente da hipótese da não interferência entre os diversos fatores das

diversas variáveis, sugerindo-se a necessidade de reanálise de duas ou mais

variáveis lingüísticas em apenas uma (cf. SCHERRE, 1978, p.71; 105-9;

NARO, 1981a, p.68) ou sugerindo-se a própria rediscussão da adequação do

modelo para fenômenos lingüísticos que não refletem variação inerente ou

que refletem processos de mudança lingüística (cf. KAY, 1978, p.71-82).

Para a implementação deste modelo matemático, foi desenvolvido um

programa computacional denominado VARBRUL, de autoria de David

Sankoff, que já se encontra na sua terceira versão, denominada VARBRUL

2S, escrito em linguagem FORTRAN, cujo funcionamento descrevemos a

seguir.37

O VARBRUL 2S, além de calcular as probabilidades dos fatores de

cada variável, apresenta uma seleção estatística das diversas variáveis

analisadas. Esta seleção ocorre inicialmente em função de um valor

estatístico denominado nível de significância, que deve ser igual ou menor do

que 0,05, por questões de confiabilidade estatística dos resultados. O nível

de significância é gerado por um parâmetro estatístico denominado log

likelihood (ou o cálculo da verossimilhança máxima) que mede o grau de

confiabilidade de as freqüências observadas terem sido geradas pelo modelo

estatístico, ou seja, ele mede a diferença entre as freqüências esperadas e

as observadas e, portanto, a que nível de significância os valores estatísticos


57

projetados se adequam aos observados, à semelhança do teste de qui-

quadrado (cf. ROUSSEAU & SANKOFF, 1978, p.60-1).38 Se o nível de

significância atribuído ao cálculo probabilístico efetuado para os fatores de

uma variável for igual, o programa escolhe o conjunto que apresentar o

valor do log likelihood mais próximo de zero, considerando-se que, se não

houver diferença entre as freqüências esperadas e as freqüências

observadas, o log likelihood será exatamente zero. Se houver identidade

entre o nível de significância e os log likelihood de dois conjuntos de valores

probabilísticos calculados, o programa então seleciona a variável ou o

conjunto de variáveis com menor número de fatores. Um nível de

significância 0,0 é considerado o ideal, pois ele indica uma certeza estatística

de os valores gerados pelo modelo estarem adequados aos valores

observados.

Um outro aspecto novo do VARBRUL 2S consiste no fato de que ele

trabalha com níveis diversos de análises, efetuando-se comparações entre

os valores probabilísticos atribuídos aos fatores das variáveis.

No nível zero, o programa calcula a média global de aplicação da

regra corrigida que pretende ser "a probabilidade de aplicação da regra

quando o efeito de todos os fatores de todas as variáveis é neutro." (LEMLE

& NARO, 1977, p.26-7) Esta probabilidade recebe o nome de input da regra.

No nível 1, o programa (a) calcula as probabilidades dos fatores de

cada uma das variáveis isoladamente, apenas em comparação ao input, (b)

atribui a cada uma delas um log likelihood e um nível de significância e (c)

efetua a seleção de uma das variáveis, nos moldes descritos acima.


58

Selecionada a primeira variável, o programa executa o segundo nível

de análise, quando observa o comportamento da variável selecionada em

conjugação com cada uma das outras variáveis, duas a duas, atribuindo log

likelihood e níveis de significância a cada par de variáveis com os valores

probabilísticos de seus fatores e, então , seleciona a segunda variável mais

relevante do ponto de vista estatístico.

A seguir, o programa compara as duas variáveis selecionadas com as

demais, três a três, a fim de selecionar a terceira variável e assim

consecutivamente até o término da seleção de todas as variáveis

estatisticamente relevantes. Teoricamente, o número de níveis de uma dada

análise é, pois, função do número de variáveis. Na prática, ele se limita ao

número de variáveis selecionadas.

O processo acima descrito, do nível 0 até o nível N, recebe o nome

de stepup e é feito também inversamente: do nível N ao nível 1, com o nome

de stepdown, a fim de se verificar se as variáveis não selecionadas são

também eliminadas.

Os diversos níveis de análise são interessantes, porque eles nos

permitem verificar precisamente a interferência entre variáveis, ocasionada

por codificação superposta. Quando não há sobreposições ou

enviesamentos entre variáveis, não se constatam interferências e as

probabilidades do primeiro nível permanecem as mesmas, ou bastante

semelhantes, até o último nível de análise. Esta seria a situação lingüística e

matematicamente ideal, mas não constitui a realidade dos fatos. Se

lingüisticamente os fatos sempre ocorressem dessa forma, não haveria

necessidade de sofisticação matemática na análise dos dados: o cálculo de

percentagens seria suficiente.


59

No caso de haver sobreposição entre variáveis, o programa atribui

pesos probabilísticos relativos em função da importância estatística de cada

uma delas, com base, por exemplo, numa distribuição equilibrada dos

dados entre os diversos fatores de uma variável.

Esta nova versão do programa, além de apresentar um instrumental

estatístico mais elaborado, permite-nos assim ver com clareza toda a

questão de codificações superpostas, conduzindo-nos a um entendimento

mais apurado da distribuição dos dados lingüísticos e permitindo-nos

análises lingüísticas cada vez melhores. No decorrer deste trabalho, teremos

oportunidade de demonstrar a utilidade dos diversos níveis de análise agora

efetuados por VARBRUL 2S.

Para a preparação dos dados de entrada para o VARBRUL 2S, em

quaisquer de suas versões, Naro desenvolveu um programa denominado

SWAMINC, escrito em linguagem SNOBOL para o compilador SPITBOL. A

sua primeira versão foi escrita em 1974. Atualmente são usadas as quinta e

sexta versões. Uma das funções do SWAMINC consiste em verificar erros

ocorridos na codificação dos dados emitindo mensagens a eles associadas.

Este programa também insere, cancela e amalgama símbolos em função das

alterações desejadas pelo pesquisador no decorrer da análise. Além disso

emite algumas estatísticas elementares do tipo: número total dos registros de

entrada e saída; número total de aplicação da regra; número total de

ocorrências; cálculo percentual de apli-


60

cação da regra para cada fator de cada variável bem como para a sua

aplicação global. A documentação detalhada do funcionamento do

SWAMINC encontra-se no manual do usuário SWAVA - escrito por Naro &

Votre em 1980

A partir deste ponto, vamos passar ao capítulo 6, que constitui o

cerne de nosso trabalho. Nele apresentamos a análise lingüística efetuada, a

qual será usada como base para as discussões teóricas apontadas na

Introdução.
6 - ANÁLISE DAS VARIÁVEIS LINGÜÍSTICAS

6.1 - Introdução

Vamos desenvolver, neste capítulo, a análise das variáveis

lingüísticas que julgamos atuar sobre a concordância de número entre os

elementos do sintagma nominal, sob duas perspectivas: (1) a que considera

cada elemento do SN como um dado de análise e (2) a que considera o SN

inteiro como unidade de análise. Na primeira perspectiva, analisamos todos

os constituintes flexionáveis de todos os SNs plurais pertinentes que fazem

parte de nossa amostra e, na segunda, analisamos os SNs de três ou mais

constituintes extraídos dos dados dos falantes adultos.

As duas perspectivas de análise a serem apresentadas têm como

objetivo mostrar que (1) algumas variáveis atuam especificamente sobre

cada elemento do SN; (2) outras atuam principalmente sobre o SN como um

todo e (3) um terceiro tipo atua tanto sobre os elementos do SN quanto sobre

o SN inteiro. No item 6.2, desenvolvemos, portanto, a análise denominada

atomística; no item 6.3, a análise não atomística e, no item 6.4,

apresentamos a conclusão da análise das variáveis lingüísticas.


62

6.2 - Análise atomística

6.2.1 - Introdução

Nesta parte do trabalho, consideramos como dado de análise cada

um dos constituintes flexionáveis dos SNs plurais conforme caracterizados

nos item 2.3. Se o constituinte estivesse formalmente marcado,

consideramos presença de concordância; caso contrário, consideramos

ausência. O termo concordância neste caso não é bem apropriado para

todas as situações, considerando que muitas vezes apenas um elemento do

SN é formalmente marcado (as perna toda marcada), podendo inclusive

haver SNs sem nenhuma marca formal de plural (dois risco verde; um

montão de nego velho). Nestes casos, o mais exato seria falar em indicação

de pluralidade e não em concordância. Concordância gramatical implica

harmonia formal em pelo menos dois elementos de uma dada construção, o

que não ocorre nas construções acima. Mesmo assim, temos nos referido a

estes casos como presença de concordância. Nesta parte, analisamos,

portanto, diversas propriedades lingüísticas relativas a cada um dos

elementos nominais da amostra, justificando assim o seu subtítulo: análise

atomística, em contraposição à análise não atomística, a ser desenvolvida no

item 6.3.

Vamos discutir aqui um conjunto expressivo de variáveis: algumas já


vistas em estudos anteriores e outras inteiramente novas. Para variáveis já

estudadas, propomos alternativas diversas de análise, procurando escolher a

mais adequada e, se possível, a mais simples. Com relação


63

ainda aos estudos anteriores, apresentamos uma síntese dos resultados já

obtidos e, quando pertinentes, comparamo-los com os nossos.

As variáveis discutidas nesta parte são as seguintes:

1) Processos morfofonológicos de formação do plural;

2) Tonicidade dos itens lexicais singulares;

3) Número de sílabas dos itens lexicais singulares;

4) Posição linear do elemento no SN;

5) Classe gramatical do elemento nominal;

6) Marcas precedentes ao elemento nominal analisado;

7) Contexto fonético/fonológico seguinte ao elemento nominal sob

análise;

8) Função sintática do SN (codificada em cada um de seus

constituintes);

9) Animacidade dos substantivos39;

10) Grau dos substantivos e dos adjetivos e

11) Formalidade dos substantivos e dos adjetivos.

Após a codificação de todos os elementos pertinentes, em função das

variáveis relacionadas acima, obtivemos um total de 13229 dados extraídos

de, aproximadamente, 7193 SNs. Destes 13229 dados, 11086 são de 6027

SNs produzidos pelos falantes adultos e 2143 são de 1166 SNs produzidos

pelas crianças. Os adultos e as crianças apresentaram, respectivamente, os

seguintes percentuais globais de concordância: 72% (7978/11086) e 66%

(1407/2143). Estes percentuais incluem todos os segmentos nominais

analisados em todos os ambientes possíveis, inclusive os ambientes de

presença positiva ou negativa da concordância. Todavia, cumpre observar

que, em etapas intermediárias ou em análises alternativas, o número de


64

dados pode variar, devido à existência dos contextos que implicam presença

categórica, positiva ou negativa, da marca de plural. A análise final,

envolvendo todos os dados, contém, para as crianças e os adultos,

respectivamente, os seguintes totais: 7861/10969 (72%) e 1385/2121 (65%).

Nas páginas seguintes, em cada item, seguem-se: síntese de estudos

anteriores; descrição e exemplificação das variáveis consideradas; análises

alternativas e resultados estatísticos obtidos, com as suas respectivas

interpretações lingüísticas.

6.2.2 - Saliência fônica

6.2.2.1 - Introdução

A introdução do Princípio da Saliência para explicar aspectos do

funcionamento sincrônico de uma língua foi feita por Lemle & Naro em

estudos realizados sobre o Português do Brasil entre 1974 e 1976. Suas

idéias sobre a atuação do Princípio da Saliência encontram-se publicadas em

1976 e em 1977 (cf. NARO & LEMLE, 1976, 259-68; LEMLE & NARO, 1977,

p.47; NARO & LEMLE, 1977, p.259-68). Este princípio consiste em

estabelecer que as formas mais salientes, e por isto mais perceptíveis, são

mais prováveis de serem marcadas do que as menos salientes. Nestes

trabalhos, os autores focalizam particularmente a saliência fônica na

concordância verbal, especialmente a dimensão que envolve a quantidade

de diferenciação material fônica na relação singular/plural,


65

denominada processos neste nosso trabalho. Em 1976, Braga & Scherre

verificam este tipo de influência sobre a concordância de número entre os

elementos do sintagma nominal. Novos estudos nesta mesma linha são

feitos por Braga (1977), Scherre (1978), Ponte (1979) e Carvalho Nina

(1980). Em 1981a, Naro retoma o estudo da concordância verbal, propondo

que se estabeleçam duas dimensões no eixo da saliência fônica:

diferenciação material fônica ou processos e tonicidade. Ainda em 1981a,

Guy analisa o eixo da saliência fônica levando em consideração estas duas

dimensões propostas por Naro em 1981a. Em nosso trabalho, vamos

reanalisar a influência do eixo da saliência, observando a possibilidade da

existência de uma terceira dimensão: o número de sílabas.

O primeiro objetivo nesta reanálise é verificar se a atuação do

Princípio da Saliência está correlacionada a características sociais dos

falantes de nossa amostra, bem como a características sociais dos falantes

de outras amostras estudadas.

O segundo objetivo, o principal deles, consiste em discutir

detalhadamente a sobreposição entre as três dimensões do eixo da saliência

fônica, especialmente a existente entre diferenciação material fônica na

relação singular/plural e tonicidade dos itens lexicais, apresentando, na

conclusão desta parte do trabalho, uma alternativa de análise que

consideramos mais adequada.

O terceiro objetivo desta parte é a rediscussão da hipótese

funcionalista de Kiparsky (1972) que postula, através das Condições de

Distintividade, que "há uma tendência para a informação semanticamente

relevante ser retida na estrutura superficial." (p.195)


66

Os resultados obtidos serão também utilizados no capítulo 8 para

retomar a polêmica da relação entre variação e mudança envolvendo a

concordância de número no SN, uma vez que há visões diferentes e até

conflitantes sobre esta questão.

As quatro questões que envolvem a saliência fônica mostram

claramente o interesse que o estudo de sua influência desperta. Acreditamos

que as reflexões a serem feitas neste capítulo servirão para um

entendimento mais claro dos diversos aspectos envolvidos.

6.2.2.2 - Estudos anteriores

A influência da variável Saliência fônica sobre a concordância de

número entre os elementos do SN, no que diz respeito ao grau de

diferenciação de material fônico na relação singular/plural, encontra-se ainda

em discussão, pois os diversos trabalhos realizados sobre o Português nem

sempre apresentam as mesmas conclusões.

Braga & Scherre (1976), num trabalho pioneiro sobre o assunto,

estudaram o Português do Brasil com falantes residentes no Rio de Janeiro,

mas de classes sociais e procedência geográfica distintas. Ao introduzirem o

estudo da Saliência fônica na concordância entre os elementos do sintagma

nominal, estabeleceram uma escala de diferenciação material fônica em

cinco níveis (cf. p.465-77):

1) inserção de -S e abertura vocálica ou plural metafônico (ovo/óvus);


67

2) inserção de -S e mudança silábica (milhão/milhões;

imóvel/imóveis);

3) inserção de -ES em palavras em -R (flor/flores);

4) inserção de -S em palavras de plural regular (livro/livros);

5) inserção de -ES em palavras que terminam em -S (rapaz/rapazes).

Braga & Scherre (1976) concluem que as formas mais salientes

favorecem mais marcas de plural do que as formas menos salientes.

Verificam que a escala da saliência é mais evidente nos falantes de classe

média e média alta do que nos de classe baixa, embora ocorra nos três

grupos. Encontram os valores probabilísticos mais baixos no fator inserção

de -ES em palavras em -S e atribuem isto ao fato de as palavras deste fator

já terminarem em uma consoante semelhante à do plural (cf. p.474).

Braga (1977), trabalhando com o Português do Triângulo mineiro da

classe média e baixa, retoma esta variável com as mesmas categorias e

conclui também que a classe média mineira apresenta resultados

probabilísticos favorecedores da presença da concordância em função do

grau de saliência fônica, da mesma forma estabelecida em Braga & Scherre

(1976). A classe baixa mineira, por sua vez, apresenta apenas uma oposição

binária: inserção de -S em itens terminados em -S, desfavorecendo a

presença da concordância, versus os demais, favorecedores. Braga deixa

fora da hierarquia, para ambas as classes, os itens de plural duplo, devido

à escassez de dados (cf. p.62-3).


68

Com relação a esta variável, Braga afirma, portanto, que, para a

classe média, a concordância de número entre os elementos do SN

é condicionada pelo grau de saliência fônica existente na


oposição singular/plural (...). Mas se a situação da classe
média parece conformar-se a este padrão e explicar-se
satisfatoriamente, o comportamento lingüístico da classe
baixa não se explica da mesma maneira. O
comportamento lingüístico das classes média e baixa é
diferente, e, novamente, a classe baixa está mais
avançada em termos de evolução lingüística.
Condicionamentos morfológicos parecem, pois, não
afetar a aplicação da regra de concordância de número
no SN, na classe baixa. Se, diacronicamente, houve um
momento em que condicionamentos, tais como os aqui
rotulados de grau de saliência fônica, exerceram pressão
sobre a aplicação da regra de concordância de número,
na classe baixa, hoje não se verifica o mesmo. (BRAGA,
1977, p.72-5)

Scherre (1978), analisando o Português do Rio de Janeiro, com base

em falantes escolarizados e semi-escolarizados, continua a considerar esta

variável basicamente da mesma forma e conclui também que os falantes

escolarizados evidenciam um comportamento lingüístico regido pelo Princípio

da Saliência. Considera, por sua vez, que os semi-escolarizados apresentam

ainda uma hierarquia em função da saliência, apenas menos marcada. Em

vez de cinco níveis, apresentam três, mas na mesma ordem da hierarquia

dos falantes escolarizados (cf. P.79-82).

Comparando os seus resultados com os de Braga, Scherre considera

que, se esse condicionamento ainda afeta o grupo carioca semi-

escolarizado, embora de forma enfraquecida, é possível imaginar "que ele

deve também ter existido em grupos de falantes que hoje não mais o

apresentam." (p.127)
69

Continuando, afirma que, de tal comparação, pode-se concluir

que os informantes mineiros de classe baixa evidenciam


um estágio de mudança lingüística mais avançado do que
os nossos semi-escolarizados; o condicionamento
morfológico, já enfraquecido nos últimos, não apresenta
mais uma hierarquia diretamente proporcional ao grau de
saliência fônica na oposição singular plural; o que nos
permite concluir novamente que a mudança se inicia nos
ambientes de menor saliência fônica e se alastra
progressivamente até atingir os de maior saliência fônica.
(SCHERRE, 1978, p.127)

É importante observar que Scherre apresenta uma diferença na

codificação de seus dados. Considera plurais formas do tipo mulhere, mese,

óvo, aviõe etc., o que não ocorre no trabalho de Braga, no qual estas formas

foram consideradas singulares (cf. 1977, p.83, nota 20). Mesmo assim os

casos de inserção de -ES em itens terminados em -S se apresentam na base

da hierarquia, ou seja, com menor probabilidade de concordância do que os

próprios regulares, nos falantes escolarizados, e com probabilidade igual à

dos regulares nos semi-escolarizados (cf. SCHERRE, 1978, p.79-82).

Ponte (1979) estuda os falantes semi-analfabetos de Porto Alegre,

Rio Grande do Sul. Trabalhando da mesma forma que Scherre (1978),

conclui que a hierarquia da saliência encontrada para os falantes gaúchos

semi-analfabetos é bastante semelhante à dos falantes semi-escolarizados

cariocas; há apenas uma diferença: o fator que menos favorece a aplicação

da regra é constituído por nomes regulares (livro/livros) e não pelos

terminados em - S (mês/meses) (cf. p.164-6). Segundo Ponte, os falantes

semi-analfabetos gaúchos estão também em estágio de mudança lingüística


70

avançado, o que se evidencia através da diminuição dos níveis da escala de

saliência (cf. p.180).

Carvalho Nina (1980) trabalha com falantes analfabetos da micro-

região Bragantina, Estado do Pará. Considerando a escala da saliência

fônica em quatro níveis (agrupa todos os casos de inserção de -ES por

terem comportamento semelhante), conclui que os Processos de formação

de plural não apresentaram condicionantes fortes, na concordância de

número, na fala dos informantes analfabetos. A comparação exata destes

resultados com os das pesquisas anteriores não é possível, pois Carvalho

Nina apresenta apenas percentagens. Todavia, é interessante constatar que

nenhum caso do fator inserção de -S com mudança silábica (milhão/milhões;

casal/casais) apresenta-se marcado (cf. p.103). Este fator é um dos mais

altos na hierarquia até agora proposta, mesmo para os falantes semi-

escolarizados cariocas e gaúchos.

Carvalho Nina afirma que o segundo fator de concordância mais alto

é constituído pelos itens regulares; o primeiro é formado pelos plurais duplos

e o terceiro pelos itens terminados em -R ou em -S. A interpretação da

influência dos regulares não é correta, pois neste caso encontram-se todos

os elementos não nucleares antepostos ao núcleo, enquanto nos demais

processos só estão os substantivos e adjetivos. Considerando que ela

trabalha só com percentagens, o peso real dos regulares não é medido. Se

retirados os casos não nucleares antepostos, certamente a percentagem dos

regulares se aproximará de zero.


71

A fraca influência da saliência fônica no comportamento lingüístico

destes falantes e a ausência total de marcas em um dos fatores de forte

saliência são interpretadas por Carvalho Nina da seguinte forma:

Talvez este fato se explique por ter-se um maior número


de informantes analfabetos reais, isto é, que não tiveram
quase nenhuma freqüência à escola e, talvez, por
residirem em zona rural, não contactaram, muitas vezes,
com a classe média. (...) Talvez se possa dizer que os
analfabetos se encontram num estágio mais avançado de
mudança lingüística do que os informantes cariocas,
mineiros e gaúchos. (CARVALHO NINA, 1980, p.144-5).

Guy (1981a) estuda falantes semi-escolarizados do Rio de Janeiro.

Diferentemente de todos os estudiosos até aqui relacionados, analisa duas

dimensões do eixo da saliência fônica:

1) grau de diferenciação material fônica na relação singular/plural e

2) tonicidade da sílaba.

Com relação ao item 1, Guy (cf. p.181-99) estabelece uma escala de

saliência de sete níveis, não mais de cinco.

As duas diferenças apresentadas por Guy ocorrem porque

1) ele separa em duas categorias os itens que apresentam alteração

silábica na sua forma plural, ou seja, estabelece um fator para os que

terminam em -ão (avião/aviões) e outro para os que terminam em -l

(lençol/lençóis) e

2) destina um fator apenas para o item vez, por causa da expressão

às vezes, mantendo outro para os demais itens deste tipo.


72

Guy conclui então o seguinte:

1) Não existe diferença entre a probabilidade atribuída aos regulares

(0,28), aos itens em -ão (0,30) e aos em -l (0,33).

2) Os itens terminados em -R (0,62) têm comportamento bem

semelhante ao dos itens terminados em -S (0,51) e ao do item vez (0,54).

3) Os plurais metafônicos se apresentam muito marcados (0,86), mas

o número de dados é pequeno.

Com base nos resultados acima e após retirar os metafônicos, devido

à escassez de dados, chega ele a uma análise final binária de itens

terminados em vogal, do ponto de vista fonético (-ão, -l e regulares),

desfavorecendo a presença da concordância (0,36), e itens terminados em

consoantes (-R e -S), favorecendo-a (0,64).

Guy (1981a) observa que os resultados de sua análise são bem

diferentes dos apresentados por Braga (1977) e Scherre (1978) (que também

são diferentes entre si). Evidencia ele que os seus dados e os de Braga

mostram que não há diferença entre os itens regulares e os em -ão ou em -l,

enquanto os de Scherre contradizem isto, pois apresentam tais casos como

sendo o segundo fator que mais favorece o índice de concordância. Por outro

lado, os resultados de Scherre mostram também que não há diferença entre

os itens terminados em -R e os terminados em -S como os dele, mas

diferentemente mostram também que os regulares se comportam como

estes itens e não como os itens em -ão ou em -l. Considera ele ainda

que a diferença mais forte entre os resultados é encontrada no baixo valor


73

probabilístico atribuído aos itens em -S em Braga, o que não se encontra

em nenhum dos outros estudos (cf. p.187) 40

Guy conclui mesmo assim que os resultados por ele encontrados "(...)

são certamente consistentes com a hipótese da saliência, mas não

constituem prova conclusiva de seu efeito." (p.189)41

A influência do segundo eixo da saliência fônica - a tonicidade da

sílaba - é considerada por Guy um efeito aparente. Segundo ele, este efeito

é um reflexo da influência poderosa que a tonicidade exerce sobre o

cancelamento do -S final não morfêmico. Afirma então que

(...) o cancelamento do -S é raro nas sílabas tônicas mas


ocorre na maioria das sílabas não tônicas. Este mesmo
efeito, embora reduzido em magnitude, é observado nos
dados de marcas de plural (...). (GUY, 1981a, p.163)42

Uma vez resumidos os diversos estudos em questão, a nossa

apresentação segue a seguinte ordem: no item 6.2.2.3, relatamos os

primeiros resultados obtidos no nosso trabalho; no item 6.2.2.4, observamos

a relação entre saliência e características sociais dos falantes de nossa

pesquisa; no item 6.2.2.5, refletimos sobre a relação entre as variáveis

Processos e Tonicidade; no item 6.2.2.6, efetuamos comparações entre os

nossos resultados e os de alguns estudos acima resumidos; no item 6.2.2.7,

discutimos a influência da fronteira de morfema; no item 6.2.2.8, continuamos

a refletir sobre a relação entre Processos e Tonicidade e, no item 6.2.2.9,

concluímos, apresentando a nossa alternativa final de análise.


74

6.2.2.3 - Três dimensões do eixo da Saliência fônica

Vamos considerar, neste trabalho, o eixo da Saliência fônica sob três

dimensões:

1) processos morfofonológicos de formação do plural;

2) tonicidade da sílaba dos itens lexicais singulares;

3) número de sílabas dos itens lexicais singulares.

Como já colocamos inicialmente, um dos pontos em discussão, nesta

parte do trabalho, é se o Princípio da Saliência atua de forma diferente em

função de características sociais dos falantes, especialmente no que diz

respeito aos seus anos de escolarização.

Se o efeito do Princípio em foco for sempre positivo, podemos então

estabelecer o seguinte:

1) Com relação a Processos, espera-se que as formas que

apresentam maior diferenciação de material fônico na relação singular/plural

(ovo/óvos; leitão/leitões; casal/casais) tendam a ser mais marcadas do que

as que apresentam menor diferenciação (coisa/coisas; carioca/cariocas).

2) Com relação à Tonicidade, espera-se que os oxítonos singulares e

os monossílabos tônicos (pé; pais, país, leitão, principal), por terem acento

na sílaba que vai receber o morfema de plural, favoreçam mais a aplicação

da regra do que os paroxítonos (coisa, salário, dólar, descartável) e

proparoxítonos (fábrica, finíssimo), cuja sílaba final não é acentuada.

Consideramos oportuno observar que Naro (1981a) analisa a Tonicidade,


75

mas da forma plural (cf. p.95), e Guy (1981a) não é explícito a este respeito,

mas deduzimos que ele trata da tonicidade dos itens lexicais singulares (cf.

p.138), embora trabalhe com uma oposição binária: sílabas acentuadas e

sílabas não acentuadas.

3) Com relação ao número de sílabas, espera-se que os itens de

maior número de sílabas (salário, português, descartável), por conterem mais

material fônico e serem, portanto, mais perceptíveis, sejam os mais

marcados.

Para a variável Processos, estabelecemos em nosso trabalho uma

categorização comparável à de Guy (1981a), com uma diferença:

desconsideramos de nossa análise a expressão às vezes e codificamos

todas as ocorrências de itens terminados em -S em um só fator. Além disso,

codificamos casos do tipo "papeizinhos" junto aos plurais metafônicos, por

apresentarem também duas possibilidades de marcas (cf. SCHERRE, 1978,

p.61). Estes casos passaram a ser referenciados como plural duplo.

Observamos, finalmente, que os itens do tipo irmão/irmãos foram


classificados como regulares, uma vez que não apresentam alteração

silábica junto à inserção do morfema de plural, à semelhança da codificação

de Scherre (cf. 1978, p.65) e de Guy (cf. 1981a, p.181-2). A variável

Processos ficou então subdividida da seguinte forma:

1) plural duplo:
- nóvos papeizinhos (Joa10,fp,27a);
- esses pósto, né? (Mal16,fp,56a);
76

2) itens terminados em -l, cujo plural se faz com inserção de -S e

alterações silábicas (ou apenas com alterações silábicas):


- os casais (Dav42,mc,31a);
- os quartéis (Cla27,mg,32a);
- termos comerciai, era (Mor45,mc,51a);

3) itens terminados em -ão, cujo plural se faz com inserção de -S e

alterações silábicas (ou apenas com alterações silábicas):


- seleções carioca (Man14,mp,59a);
- as próprias contradições (Par41,mc,25a);
- todas as religiõe, intão (San39,fc,16a);

4) itens terminados em -R, cujo plural se faz através da inserção de -

ES ou de -E:
- cores assim lindas (Pit37,mc,25a);
- esse pescadore (Ire17,fp,52a);
- esses professor (Ana40,fc,18a);

5) itens terminados em -S, cujo plural se faz através da inserção de -

ES ou de -E:
- os fregueses (Ana40,fc,18a);
- sete mese (Mor45,mc,51a);
- certos país (Joa10,fp,27a);

6) itens terminados em vogal ou vogal + nasal, cujo plural se faz

através da inserção de -S sem nenhuma alteração morfofonêmica, o

chamado plural regular:


77

- uns metaizinhos (Hel34,fg,62a);


- as lei trabalhista (Cid32,mg,57a);
- tribos indígena (Geo31,mg,58a);
- os meus três irmãos (Jaq56,fg,14a).

Conforme explicitado acima, consideramos plurais os elementos

nominais analisados que tinham uma marca formal, padrão ou não padrão, à

semelhança de Scherre (cf. 1978, p.60-1). É então importante salientar que

72% (568/789) das formas marcadas nos itens não regulares (incluindo os de

plural duplo) são do tipo padrão. O percentual acima refere-se a formas

totalmente padrão, pois foram excluídas desses 568 casos todas as

ocorrências em situações de neutralização ("as mulheres sejam" ou "essas

posições são sempre revistas"), embora tais dados tenham sido também

analisados: eles são 11% (85/789) do total das formas marcadas. Os 17%

(136/789) restantes ficam por conta das formas não padrão(mese,

comerciai, religiõe, óvo etc.).

Para a variável Tonicidade do item lexical singular, estabelecemos

três subdivisões:

1) oxítonos e monossílabos tônicos (seleção, casal, quartel, cor,


pescador, professor, freguês, mês, país, lei, meu, irmão);

2) paroxítonos e monossílabos átonos (carioca, própria,43 linda,

esses, certos, trabalhista, tribo, o, um);

3) proparoxítonos (indígena).
78

Finalmente, para a variável Número de sílabas do item lexical

singular, consideramos também uma subdivisão tríplice:

1) monossílabos (o, um, cor, lei, mês, meu);

2) dissílabos (casal, própria, quartel, tribo, irmão) e

3) mais de duas sílabas (seleção, carioca, contradição, pescador,

professor, metalzinho, trabalhista, indígena).

Os resultados que vamos apresentar a seguir, ainda neste item e nos

itens 6.2.2.4 e 6.2.2.5, nos levam às seguintes conclusões:

1) Os Processos de formação do plural e a Tonicidade dos itens

lexicais singulares influenciam a concordância de número entre os elementos

do SN.

2) O Número de sílabas dos itens lexicais singulares não exerce

influência sobre a concordância de número entre os elementos do SN.

3) A categorização dos dados considerando os três eixos da saliência

apresenta sobreposição e, conseqüentemente, ocorre interferência entre

eles.

4) Os subagrupamentos de falantes em função de qualquer

característica não lingüística apresentam mais marcas no plural duplo e

menos marcas no plural regular, ficando as diferenças nas categorias

intermediárias.

A tabela 6.2.2.1, a seguir, apresenta os resultados da variável

Processos para os adultos. Antes, gostaríamos de observar que, nesta parte

do trabalho, só apresentamos resultados de falantes adultos porque nos


79

outros trabalhos, com os quais faremos comparações, não foram estudados

dados de crianças.

TABELA 6.2.2.1
PROCESSOS MORFOFONOLÓGICOS DE FORMAÇÃO DO
PLURAL DE TODOS OS DADOS DOS ADULTOS
PROCESSOS Apl./Total % Prob.
Duplo
maravilhoso )
maravilhósos) 63/68 = 93 0,86
-l
(internacional )
(internacionais) 83/97 = 86 0,56
-ão
(contradição )
(contradições) 173/200 = 86 0,42
-R
(pescador )
(pescadores) 237/268 = 88 0,48
-S
(português )
(portugueses) 219/265 = 83 0,38
Regular
(pequenininha )
(pequenininhas) 7086/10071 = 70 0,24

Através destes resultados, podemos verificar que os falantes adultos,

com referência a Processos, evidenciam mais marcas de concordância nos

itens lexicais que apresentam mais diferença material fônica entre as suas

respectivas formas singulares e plurais. Os plurais duplos favorecem-nas

com 0,86 e os regulares inibem-nas com 0,24. São exatamente estes casos

que possuem, respectivamente, maior e menor dife-


80

rença material fônica na relação singular/plural. Entre os itens terminados em

-l (0,56), em -R (0,48) e em -S (0,38), constata-se uma hierarquia em termos

de grau de saliência. Todavia, os itens terminados em -ão fogem da

hierarquia prevista. Esperava-se que o seu comportamento fosse igual ou

bastante semelhante ao dos itens terminados em -l, uma vez que fazem o

plural de forma bastante parecida: além da inserção de -S, verificam-se

alterações silábicas. Vamos voltar a esta questão nos itens subseqüentes.

Antes disto, queremos apresentar na tabela 6.2.2.2 os resultados obtidos

para a variável Tonicidade.

TABELA 6.2.2.2
TONICIDADE DA SÍLABA DOS ITENS LEXICAIS SINGULARES
DE TODOS OS DADOS DOS ADULTOS
TONICIDADE Apl./Total % Prob.
Oxítono e monossí-
labo tônico
(país/leitão) 1028/1198 = 86 0,66
(meu/pé)
Paroxítono e mo-
nossílabo átono
(coisa/dólar/os/as) 6752/9615 = 70 0,39
Proparoxítono
(fábrica ) 81/156 = 52 0,44
(indígena)
(médico )

Podemos verificar que a Tonicidade da sílaba do item singular

influencia a concordância: ela ocorre mais, se a sílaba do item lexical

singular for marcada, ou seja, se o item lexical for oxítono. Mas se o item
81

lexical singular for paroxítono ou proparoxítono, apresentando, portanto, a

sílaba final não marcada, a concordância ocorre menos.

A terceira dimensão da saliência fônica - o Número de sílabas dos

itens lexicais singulares - não foi considerada relevante para a

ausência/presença de concordância entre os elementos do SN, embora em

termos de percentagens haja uma oposição entre monossílabos (95%), por

um lado, e dissílabos (64%) e mais de duas sílabas (58%), por outro.

A tabela 6.2.2.3 apresenta resultados para esta variável.44

TABELA 6.2.2.3
NÚMERO DE SÍLABAS DOS ITENS LEXICAIS
SINGULARES DE TODOS OS DADOS DOS ADULTOS
NÚMERO
DE Apl./Total % Prob.
SÍLABAS
Monossílabo 2901/3056 = 95 (0,48)

Dissílabo 2943/4621 = 64 (0,51)

Mais de duas 1794/3070 = 58 (0,51)

As diferenças entre as probabilidades associadas ao número de

sílabas são irrelevantes, ou seja, os valores para os três fatores são

praticamente iguais a 0,50, o que mostra a neutralidade desta variável sobre

a concordância nominal. Além disso, ela não foi considerada como

estatisticamente relevante. As diferenças entre as percentagens e as

probabilidades ocorrem por haver forte interferência entre as variáveis

Tonicidade, Número de sílabas e Relação dos elementos no SN.45


82

A análise estatística reflete fielmente o que ocorre com a distribuição

real dos dados lingüísticos, pois

1) 90% dos casos de monossílabos ocorrem antepostos ao núcleo,

sendo 81% artigos e 09% possessivos, os quais são marcados por esta

razão e não por serem monossílabos;

2) os 10% restantes são todos tônicos, e são marcados por causa da

Tonicidade e não, também, pelo número de sílabas.

Os resultados até aqui apresentados foram obtidos através da

análise de todos os dados dos falantes adultos.

Considerando que a diferenciação material fônica só ocorre

basicamente nos substantivos, adjetivos e categorias substantivadas, uma

vez que os demais itens lexicais são regulares (a exceção de três

ocorrências de tal e uma de qualquer) e considerando também que todos os


artigos foram classificados no mesmo fator de paroxítonos, decidimos repetir

a análise acima considerando apenas as classes gramaticais pertinentes.

Esta decisão ocorreu por simples cautela, pois tínhamos uma outra variável
Relação entre os elementos do sintagma nominal, a ser discutida no item

6.2.3.7, que dá conta de um possível enviesamento nos resultados. Mas,

considerando que as categorias não relevantes perfazem aproximadamente

40% dos casos, decidimos testar o instrumental estatístico usado.

Os resultados obtidos nesta etapa são apresentados nas tabelas

6.2.2.4 e 6.2.2.5, para as variáveis Processos e Tonicidade, respectivamente.


83

TABELA 6.2.2.4
PROCESSOS MORFOFONOLÓGICOS DE FORMAÇÃO DO
PLURAL DOS SUBSTANTIVOS, ADJETIVOS E CATEGORIAS
SUBSTANTIVADAS DOS DADOS DOS ADULTOS
PROCESSOS Apl./Total % Prob.
Duplo
(maravilhoso )
(maravilhósos) 63/68 = 93 0,85
-l
(internacional )
(internacionais) 80/93 = 86 0,56
-ão
(contradição )
(contradições) 173/200 = 86 0,42
-R
(pescador )
(pescadores) 237/268 = 88 0,49
-S
(português )
(portugueses) 219/265 = 83 0,39
Regular
(pequenininha )
(pequenininhas) 2819/5583 = 50 0,24
84

TABELA 6.2.2.5
TONICIDADE DA SÍLABA DOS ITENS LEXICAIS SINGULARES
DOS SUBSTANTIVOS, ADJETIVOS E CATEGORIAS
SUBSTANTIVADAS DOS DADOS DOS ADULTOS
TONICIDADE Apl./Total % Prob.
Oxítono e monos-
sílabo tônico
(país/leitão) 829/992 = 84 0,66
(meu/pé)

Paroxítono e mo-
nossílabo átono
(coisa/dólar) 2681/5329 = 50 0,39
(maravilhoso)

Proparoxítono
(fábrica
(indígena) 81/156 = 52 0,44
(médico)

Pelos resultados acima, e pela sua comparação com os resultados

das tabelas 6.2.2.1 e 6.2.2.2, podemos ver que não existe nenhuma

diferença entre os resultados probabilísticos associados aos diversos fatores

das variáveis Processos e Tonicidade, quer se considerem todos os dados,

quer se considerem apenas os substantivos, adjetivos e categorias

substantivadas. A única diferença nas duas análises que merece menção é a

que diz respeito à ordem de seleção entre as duas variáveis focalizadas.

Considerando-se todos os dados, a variável Tonicidade é selecionada em

terceiro lugar, com significância 0,0, e a variável Processos, em sexto, com

significância 0,000. Considerando-se apenas as classes gramaticais

pertinentes, praticamente inverte-se a situação: a variável Processos é

selecionada em segundo lugar, com significância 0,0, e a variá-


85

vel Tonicidade em sétimo, com significância 0,000. A nossa intuição de

lingüista nos diz que a segunda análise condiz melhor com a realidade dos

fatos, porque a variável Processos é a que se aplica especificamente ao

fenômeno da concordância. Daqui para a frente, sempre que possível,

apresentaremos análises envolvendo apenas os substantivos, os adjetivos e

as categorias substantivadas, quando estivermos tratando das variáveis

Processos e Tonicidade. Queremos ainda dizer que o instrumental estatístico

utilizado mostra-se satisfatório, atribuindo os devidos pesos probabilísticos

aos fatores das diversas variáveis.

6.2.2.4 - Relação entre Saliência fônica e


características sociais dos falantes

Considerando (1) que os itens terminados em -ão fogem da

hierarquia prevista e (2) que queremos testar a hipótese de o grau de

influência da variável Processos estar vinculado a características sociais dos

falantes, fizemos uma separação da nossa amostra em função dos anos de

escolarização: um a quatro anos (antigo primário), cinco a oito anos (antigo

ginasial) e nove a 11 anos (antigo colegial). Para facilitar a redação, estamos

utilizando a terminologia primário, ginasial e colegial, alternando com a

indicação destes falantes em termos dos anos de escolarização

correspondentes. Elegemos inicialmente esta característica social por ser ela

a mais evidente em termos de se poder observar as possíveis diferenças

entre os resultados dos diversos trabalhos já realizados. Pelo resumo dos

trabalhos anteriores, pudemos ver o ponto marcante de dife-


86

rença ou semelhança entre as amostras é exatamente o nível de

escolarização dos falantes.

A tabela 6.2.2.6 contém os resultados para a variável Processos,

subdividida em termos do grau de escolarização.

TABELA 6.2.2.6
PROCESSOS MORFOFONOLÓGICOS DE FORMAÇÃO DO PLURAL DOS
SUBSTANTIVOS, ADJETIVOS E CATEGORIAS SUBSTANTIVADAS DOS
ADULTOS POR ESCOLARIZAÇÃO
PROCESSOS FALANTES
Todos Primário Ginasial Colegial

Duplo F. 63 = 93% 22 = 88% 24 = 92% 17 = 100%


(novo ) 68 25 26 17
(nóvos) P. 0,85 0,84 0,88 +

-l F. 80 = 86% 21 = 70% 18 = 95% 41 = 93%


(casal ) 93 30 19 44
(casais) P. 0,56 0,50 0,73 0,63

-ão F 173 = 86% 31 = 72% 61 = 84% 81 = 96%


(leitão ) 200 43 73 84
(leitões) P. 0,42 0,39 0,32 0,66

-R F. 237 = 88% 77 = 82% 74 = 89% 85 = 94%


(cor ) 268 94 83 90
(cores) P. 0,49 0,51 0,47 0,61

-S F. 219 = 83% 87 = 78% 68 = 83% 64 = 90%


(país ) 265 112 82 71
(países) P. 0,39 0,48 0,27 0,37

Regular F. 2819 = 50% 653 = 33% 992 = 53% 1158 = 68%


(caro) 5583 1990 1876 1701
(caros) P. 0,24 0,24 0,24 0,24
87

Os resultados acima mostram semelhanças e diferenças no

comportamento dos falantes de nossa amostra, em função dos anos de

escolarização.

Com relação às semelhanças, podemos ver que todo e qualquer

falante apresenta probabilidades altas associadas ao plural duplo,

probabilidades baixas associadas ao plural regular e probabilidades

intermediárias associadas aos demais fatores. De uma forma geral, podemos

falar em três grandes oposições envolvendo a variável em questão para

qualquer agrupamento de falantes, o que é claramente refletido nas

probabilidades grupais.

Com relação às diferenças, temos o seguinte:

1) Os falantes de primário não apresentam diferenças relevantes

entre os quatro fatores intermediários: 0,50 para os itens terminados em -l;

0,51 para os itens em -R; 0,48 para os itens terminados em -S e 0,39 para os

itens em -ão, a menor probabilidade dentre as destes quatro fatores.

2) Os falantes do ginasial já apresentam maior diferenciação entre as

quatro categorias intermediárias: 0,73 para os nomes terminados em -l; 0,32

para os itens em -ão; 0,47 para os itens em -R e 0,27 para os itens em -S.

Neste caso, a probabilidade atribuída aos nomes em -ão situa-se abaixo da

probabilidade dos itens em -R, mas acima das probabilidades dos itens em -

S; mas é radicalmente diversa da que foi atribuída aos itens em -l.

3) Os falantes do colegial apresentam também pouca diferença entre

os fatores intermediários: há uma aproximação muito forte entre os

terminados em -l (0,63), em -ão (0,66) e em -R (0,61). Somente os itens em -

S apresentam-se menos marcados (0,37). Neste caso, diferentemente dos


88

outros dois, há uma aproximação bastante forte entre os itens terminados em

-l e os terminados em -ão.

4) Com relação ao distanciamento ou aproximação dos fatores das

categorias intermediárias em relação aos itens regulares, pode-se verificar

que as probabilidades variam dependendo do grupo de falantes analisado:

nos falantes do primário, a probabilidade que mais se distancia dos

regulares é a que está associada aos itens em -R (diferença de 0,27) e a

que mais se aproxima é a dos itens em -ão (diferença de 0,15); nos falantes

do ginasial, a que mais se distancia é a que é atribuída aos itens em -l

(diferença de 0,48) e a que mais se aproxima é a dos itens em -S (diferença

de 0,03); nos falantes de colegial, a probabilidade mais distante dos

regulares está associada aos itens em -ão (diferença de 0,42) e a mais

próxima é a dos itens em -S (diferença de 0,13).

A novidade nos resultados obtidos nesta etapa diz respeito ao

distanciamento entre as probabilidades associadas aos itens em -ão e em -l

nos falantes do primário e do ginasial, pois a nossa expectativa era de que


estes itens apresentassem comportamento semelhante, considerando que a

forma de se pluralizarem é também semelhante.

Antes de quaisquer tentativas de interpretação de diferenças mais

sutis entre os diversos agrupamentos de falantes, gostaríamos de apresentar

os resultados da variável Tonicidade, a seguir, na tabela, 6.2.2.7.


89

TABELA 6.2.2.7
TONICIDADE DA SÍLABA DO ITEM LEXICAL SINGULAR DOS
SUBSTANTIVOS, ADJETIVOS E CATEGORIAS SUBSTANTIVADAS DOS
DADOS DOS ADULTOS POR ESCOLARIZAÇÃO
TONICIDADE FALANTES
Todos Primário Ginasial Colegial

Oxítono e F. 829 = 84% 254 = 74% 272 = 85% 299 = 93%


monossíla- 992 345 321 322
bo tônico
(país )
(leitão) P. 0,66 0,67 0,69 0,59
(meu, pé)

Paroxítono F. 2681 = 50% 622 = 33% 937 = 53% 1092 = 67%


e monossí- 5329 1901 1778 1620
labo átono
(raro)
(coisa/dólar) P. 0,39 0,44 0,38 0,35
(os/as)

Proparoxí- F. 81 = 52% 15 = 31% 28 = 47% 38 = 79%


tono 156 48 60 48
(fábrica )
(indígena) P. 0,44 0,39 0,43 0,56
(médico )

Podemos novamente verificar que os itens oxítonos são sempre os

mais marcados e que os paroxítonos são sempre os menos marcados. Esta

oposição é uniforme: encontra-se em qualquer agrupamento de falantes.

A diferença de comportamento entre os falantes nesta variável fica

por conta da influência dos proparoxítonos que, pela nossa hipótese,

deveriam apresentar probabilidade igual ou inferior à dos paroxítonos, pois a

sílaba que vai receber a marca de plural é ainda menos marcada, ou seja,

mais distante da tônica. Isto se constata para os falantes do primário e do


90

ginasial, mas não para os falantes do colegial, que apresentam um índice

probabilístico nos proparoxítonos (0,56) próximo ao dos oxítonos (0,59).

A interpretação que fazemos desta diferença de comportamento é

que, para os falantes do colegial, importa em verdade o fato de o item lexical

ser mais saliente: os proparoxítonos e os oxítonos, enquanto um todo, têm a

característica comum de serem mais salientes do que os paroxítonos, pois

eles são itens marcados na língua portuguesa, que é constituída

predominantemente de palavras paroxítonas. Testamos se a diferença entre

os oxítonos e proparoxítonos era estatisticamente relevante e constatamos

que sim, a nível de 0,005.

Outra hipótese plausível seria a de que os proparoxítonos são

categorias instáveis na língua portuguesa. Constata-se inclusive a passagem

de proparoxítonos a paroxítonos mesmo na fala de pessoas escolarizadas,

mas com freqüência menor do que na fala das não escolarizadas.

Cosquinha por cocegazinha ou abobrinha por aboborazinha são formas

naturais para qualquer falante do Português, mas abobra por abóbora, corgo

por córrego, musga por música, Petropis por Petrópolis e arve por árvore

ocorrem predominantemente em grupos de falantes menos escolarizados.

Este comportamento instável de alguns proparoxítonos não tem suporte

empírico em nossos dados. Todos os proparoxítonos da nossa amostra são

proparoxítonos reais. Há apenas um caso de arve na fala das crianças.

Em resumo, constatamos que Processos e Tonicidade influenciam

presença/ausência da concordância nominal embora apresentem algumas

diferenças na forma de atuar em função do grau de escolarização


91

dos falantes. Na tentativa de entendermos melhor as diferenças existentes,

vamos apresentar a seguir uma análise detalhada da relação entre estas

duas variáveis.

6.2.2.5 - Refletindo sobre a relação entre Processos


e Tonicidade

Os resultados que apresentamos no item 6.2.2.4 não são diretamente

comparáveis aos de todos os estudos feitos anteriormente, pois a maioria

deles, exceto Guy (1981a), não levou em consideração a variável

Tonicidade. Em verdade, o próprio estudo de Guy (1981a) não seria

diretamente comparável ao de Scherre (1978), pois ela, embora tenha

trabalhado com um subconjunto dos dados de Guy (1981a),46 só codificou a

variável Processos. A sobreposição entre estas duas variáveis é evidente

porque, como se vê na tabela 6.2.2.8, a grande maioria dos itens regulares e

dos itens de plural duplo são paroxítonos; os itens em -l e em -R são


predominantemente oxítonos; todos os itens em -ão e em -S são oxítonos e
todos os proparoxítonos são regulares. Sendo assim, os itens que não têm

oposição oxítonos versus paroxítonos (os em -ão e os em -S) apresentam

uma superposição muito forte na codificação de Processos e Tonicidade.


92

TABELA 6.2.2.8
CRUZAMENTO DE PROCESSOS E TONICIDADE NOS SUBSTANTIVOS,
ADJETIVOS E CATEGORIAS SUBSTANTIVADAS DOS ADULTOS:
PERCENTAGENS
PROCESSOS TONICIDADE
Oxítono e mo- Paroxítono Proparoxítono
noss. tônico
Duplo 5/5 = 100% 58/63 = 92% xxx
-l 67/77 = 87% 13/16 = 81% xxx
-ão 173/200 = 86% xxx xxx
-R 231/260 = 88% 6/8 = 75% xxx
-S 219/265 = 83% xxx xxx
Regular 134/185 = 72% 2604/5242= 50% 81/156 = 52%

Inevitavelmente haverá diferenças probabilísticas entre duas análises

que codifiquem apenas Processos ou apenas Tonicidade, ou ambas, porque

o instrumental estatístico que usamos pretende dar a cada uma das variáveis

o peso probabilístico devido.

Na tabela 6.2.2.9 (ver a página seguinte), temos os resultados

probabilísticos associados ao cruzamento das variáveis Processos e

Tonicidade.

Os resultados probabilísticos da tabela 6.2.2.9 mostram que atuam

tanto a variável Processos quanto a variável Tonicidade. Nas colunas,

temos novamente uma escala em função do grau de diferenciação material

fônica na relação singular/plural, quer para os oxítonos, quer para os

proparoxítonos. Nas linhas, temos a oposição entre os oxítonos e os não

oxítonos, restando, todavia, testar se as diferenças quatro entre as

categorias intermediárias são estatisticamente relevantes. Retomaremos

esta questão no item 6.2.2.8.


93

TABELA 6.2.2.9
CRUZAMENTO DE PROCESSOS E TONICIDADE NOS
SUBSTANTIVOS, ADJETIVOS E CATEGORIAS UBSTANTIVADAS
DOS DADOS DOS ADULTOS: PROBABILIDADES
PROCESSOS TONICIDADE

Oxítono e mo- Paroxítono Proparoxítono


noss. tônico

Duplo + 0,80 xxx

-l 0,74 0,44 xxx

-ão 0,61 xxx xxx

-R 0,68 0,38 xxx

-S 0,58 xxx xxx

Regular 0,40 0,18 0,22

A fim de testarmos o nível de influência da variável Tonicidade sobre

a variável Processos, efetuamos uma análise dos dados ignorando o efeito

da Tonicidade, o que tornará a comparação entre os resultados dos diversos

estudos mais segura. Os resultados desta etapa são apresentados na tabela

6.2.2.10, a qual contém apenas probabilidades, pois nem as percentagens e

nem o número de dados sofreram qualquer alteração. Repetimos as

probabilidades com o efeito da Tonicidade na primeira coluna de cada grupo

ou subgrupo de falantes para que a comparação possa ficar mais clara.


94

TABELA 6.2.2.10
SOBREPOSIÇÃO ENTRE PROCESSOS E TONICIDADE NOS
SUBSTANTIVOS, ADJETIVOS E CATEGORIAS SUBSTANTIVADAS
DOS DADOS DOS ADULTOS
PROCESSOS FALANTES
Primário Ginasial Colegial
c/ton. s/ton. c/ton. s/ton. c/ton. s/ton.
Duplo
(novo ) 0,84 0,75 0,88 0,76 + +
(nóvos)
-l
(móvel ) 0,50 0,56 0,73 0,80 0,63 0,61
(móveis)
-ão
(eleição ) 0,39 0,47 0,32 0,42 0,66 0,72
(eleições)
-R
(flor ) 0,51 0,59 0,47 0,56 0,61 0,65
(flores)
-S
(luz ) 0,48 0,55 0,27 0,36 0,37 0,45
(luzes)
Regular
(tribo ) 0,24 0,15 0,24 0,12 0,24 0,14
(tribos)

Pelos resultados, podemos ver que a hierarquia entre os diversos


fatores alterou em apenas dois aspectos: nos falantes de ginasial, o
comportamento dos itens de plural duplo (0,76) praticamente se identificou
ao dos itens terminados em -l (0,80) e, nos falantes do colegial, a
probabilidade associada aos itens em -ão (0,72), além da mudança de
posição, passou a se distanciar um pouco da associada aos itens em -l
(0,61). De forma geral, os itens terminados em -ão continuam a fugir da
hierarquia prevista, exceto nos falantes do colegial em que eles apresentam
mais chances de serem marcados (0,72) do que os próprios itens em -l
(0,61). Todavia ocorre uma diferença sistemática entre praticamente todos os
95

fatores de todos os falantes. O peso probabilístico do plural duplo e dos


regulares diminui, uma vez que não há o fator paroxítono a quem é atribuído
um peso probabilístico baixo; inversamente, sobe o peso de todos os demais
fatores que são constituídos na sua maioria de itens lexicais oxítonos, pois
não há mais também o fator oxítono a que se atribui um peso alto. A
conseqüência mais marcante desta nova distribuição de pesos
probabilísticos é o maior distanciamento entre as probabilidades associadas
aos regulares e aos demais itens, exceto para os de plural duplo de todos os
falantes, conforme se observa na tabela 6.2.2.11.

Estamos apresentando, na tabela 6.2.2.11, as diferenças entre as


probabilidades associadas aos itens regulares e as probabilidades

associadas aos demais itens em termos da presença ou ausência da variável

Tonicidade, na análise. Estas diferenças estão na tabela 6.2.2.11 sob os

rótulos respectivos c/ton (com tonicidade) e s/ton (sem tonicidade), para os

falantes dos três níveis de escolarização. Efetuamos então as diferenças

entre as probabilidades dos itens não regulares e as dos itens regulares,

obtendo, portanto, a diferença probabilística entre eles. Ilustrando o

processo, podemos ver, na tabela 6.2.2.10, que os falantes do primário têm,


respectivamente, as probabilidades 0,39 e 0,47 associadas aos itens em -ão

nas análises com ou sem tonicidade, e 0,24 e 0,15 para os itens regulares

nestas mesmas análises. As diferenças entre as probabilidades dos itens em

-ão e as dos itens regulares nas respectivas análises são, portanto, de 0,15 e

de 0,32.
96

TABELA 6.2.2.11
DIFERENÇAS PROBABILÍSTICAS ENTRE OS PROCESSOS NÃO
REGULARES E O PROCESSO REGULAR EM FUNÇÃO DA
PRESENÇA OU AUSÊNCIA DA VARIÁVEL TONICIDADE
PROCESSOS FALANTES
Primário Ginasial Colegial
c/ton. s/ton. c/ton. s/ton. c/ton. s/ton.
Duplo
(porto) +0,60 +0,56 +0,64 +0,64 + +
(pórtos)
-l
(móvel ) +0,26 +0,41 +0,49 +0,68 +0,39..+0,47
(móveis)
-ão
(dentão ) +0,15 +0,32 +0,08 +0,30 +0,42 +0,59
(dentões)
-R
(melhor ) +0,27 +0,44 +0,22 +0,44 +0,37 +0,51
(melhores)
-S
(raiz ) +0,24 +0,40 +0,03 +0,24 +0,13 +0,31
(raízes)

Observando-se então as diferenças probabilísticas entre os itens


regulares e não regulares, conclui-se que a variável Tonicidade tem uma

influência bastante forte no grau de distanciamento que se estabelece entre

estes fatores da variável Processos. É oportuno observar que, na análise em

que se considera a variável Processos com Tonicidade, os itens terminados

em -S, nos falantes de ginasial, quase não apresentam diferenças com

relação aos regulares: neste caso, ela é de apenas 0,03. Se retirado o efeito

da Tonicidade, a diferença se eleva para 0,24.

Diante de tais diferenças probabilísticas, fica definitivamente

demonstrado que análises que codificam apenas a variável Processos não


97

podem ser diretamente comparáveis às que codificam também a variável

Tonicidade. Levaremos isto em conta no item 6.2.2.6, no qual vamos

comparar os nossos resultados aos de outros estudos realizados sobre o

assunto em pauta.

Gostaríamos de retomar neste ponto a questão que envolve os itens

terminados em -l e em -ão no que diz respeito a serem considerados como

constituintes de um ou de dois fatores. Como já vimos, todos os estudiosos

deste assunto que antecederam Guy (1981a) os agruparam em um só fator,

levando-se em conta que eles fazem a oposição singular plural de forma

semelhante - com inserção de -S e alterações silábicas - e que deveriam,

portanto, ter o mesmo efeito sobre a aplicação da concordância entre os

elementos do SN. Guy (1981a), todavia, efetuou a separação destes dois

tipos de itens em dois fatores separados.

Os nossos resultados mostram que esta separação se mostra

pertinente, pelo menos para os falantes do primário e do ginasial: os itens em

-ão, com ou sem a influência da Tonicidade, favorecem menos a aplicação

da regra do que os itens em -l. Para os falantes do colegial, todavia, os itens

em -ão chegam a favorecer mais a aplicação da regra do que os em -l, se

retirado o peso da Tonicidade.

O que não nos parece adequada é a afirmação generalizante de Guy

de que os regulares têm o comportamento igual aos dos itens em -ão e em

-l por terminarem em vogal (cf. GUY, 1981a, p.183-4).

Mesmo considerando também a influência da variável Tonicidade, os

itens terminados em -ão, da nossa amostra, não apresentam compor-


98

tamento igual ao dos regulares; muito menos os itens terminados em -l. Isto

nos leva obrigatoriamente a observar com cuidado a sobreposição entre

variáveis lingüísticas, antes de qualquer generalização.

Guy (1981a), numa tentativa de interpretar as discrepâncias entre os

resultados do seu estudo, os de Braga (1977) e os de Scherre (1978) (ver

item 6.2.2.2. p.72-73), levanta duas hipóteses, sem, contudo, demonstrá-las.

Na primeira, ele considera que a variável Processos pode não ser

muito poderosa e neste caso

(...) os valores dos fatores poderiam facilmente oscilar


por flutuação aleatória nos dados e por sistemas de
codificação diferentes usados na análise de outras
variáveis. (GUY, 1981a, p.187)47

Na segunda, ele observa que a diferença de número de dados em

cada uma das categorias da variável Processos é muito grande. Mais de

90% dos dados são de plural regular, o que

(...) significa que há uma forte correlação entre o valor do


fator para plurais regulares e a probabilidade de input
(...). Em tal situação, mudanças pequenas nos dados,
mesmo em outros grupos de fatores, podem produzir
mudanças muito fortes na posição relativa destes dois
valores, e portanto nos outros valores neste grupo de
fatores. (GUY, 1981a, p.188)48

Com base nessas duas hipóteses, afirma ele que

em qualquer caso, os nossos resultados são preferíveis,


uma vez que nós temos mais dados (quase 30% mais do
que os de Scherre) - o remédio soberano para
estatísticas instáveis. (GUY, 1981a, p.188)49
99

Consideramos que a primeira hipótese aventada por Guy (1981a), no

que toca à oscilação dos resultados por sistemas de codificação diferentes

usados na análise de outras variáveis, é a mais plausível. Como já

observamos, diferentemente de todos os demais pesquisadores, Guy

codifica as variáveis Processos e Tonicidade, intimamente associadas. A

Tonicidade, codificada ao lado de Processos, retira dos fatores não

regulares constituídos de oxítonos grande parte do seu peso, assim como

atribui aos regulares maior peso, pois os paroxítonos favorecem pouco a

presença de concordância (ver tabelas 6.2.2.10 e 6.2.2.11). A proximidade

entre regulares, itens em -ão e em -l, na análise de Guy, deve ocorrer,

portanto, pelo que foi apontado acima. Guy todavia não mostra isto

explicitamente.

Se fosse possível termos os resultados de Scherre (1978) incluindo a

variável Tonicidade ou os de Guy (1981a) sem Tonicidade, poderíamos ver

melhor as reais diferenças entre estas duas análises. Os resultados destes

dois estudos na sua forma original podem ser vistos na tabela 6.2.2.12.
100

TABELA 6.2.2.12
PROCESSOS E ESCOLARIZAÇÃO: COMPARAÇÃO ENTRE OS
RESULTADOS DE SCHERRE (1978) E GUY (1981a)
PROCESSOS FALANTES SEMI-ESCOLARIZADOS CARIOCAS
SCHERRE(1978) GUY (1981a)
Apl./Total % Prob. Apl./Total % Prob.
Duplo
(novo ) 30/34 = 82 0,96 6/8 = 75 0,84
(nóvos)

-l e -ão
(incrível )
(incríveis) 39/101 = 39 0,49 68/141 = 48 0,28
(noção )
(noções)

-R
(anterior ) 37/80 = 46 0,25 96/142 = 68 0,59
(anteriores)

-S
(freguês ) 72/140 = 51 0,29 222/445 = 50 0,50
(fregueses)

Regular
(armazém ) 4291/7240 = 59 0,26 5887/9058 = 65 0,25
(armazéns)

Observando-se os resultados da tabela 6.2.2.12, podemos ver que

1) as percentagens atribuídas aos itens em -l e em -ão no trabalho de

Guy (48%) são, inclusive, maiores do que as de Scherre (39%);

2) as percentagens atribuídas ao fator -S são iguais: 51% e 50%.

As grandes diferenças entre as duas análises estão nas

probabilidades, quando se atribui o peso relativo a cada fator.


101

A diferença percentual marcante entre estes dois conjuntos de dados

(22%) encontra-se apenas nos itens em -R (46% e 68%). Neste caso, a

diferença probabilística pode não ser devida apenas a diferenças nos

sistemas de codificação.

Acabamos de ver que a introdução da variável Tonicidade ao lado da

variável Processos apresenta repercussões bastante evidentes na relação

que se pode fazer entre os itens regulares e os demais itens. Uma análise

que considera este aspecto tem de estar atenta para as suas interferências e

não se furtar de apresentá-las objetivamente.

Além disso, verificamos que o poder da variável Processos sobre os

substantivos, adjetivos e categorias substantivadas é muito forte. Para os

falantes do primário e do ginasial, a sua seleção ocorre antes da seleção da

variável Tonicidade com significância 0,0. Apenas para os falantes do

colegial, a situação se inverte.

Diferentemente de Guy (1981a), não consideramos que o efeito da

Tonicidade seja aparente, especialmente nos casos não regulares. Nestes

casos, a simples ausência de -S não significa ausência de marcas de plural.

A Tonicidade é, portanto, um traço integrante do eixo da saliência fônica,

com repercussões importantes sobre o índice de presença de marca formal

de plural nos itens analisados.


102

6.2.2.6 - Comparando os resultados de estudos


diversos

Feitas as reflexões acima, podemos agora comparar os resultados do

presente estudo com os dos demais trabalhos. Na tabela 6.2.2.13,

encontramos os nossos resultados para os falantes do primário e os de Guy

(1981a) para falantes semi-escolarizados, que estavam se alfabetizando no

MOBRAL. Nesta parte do estudo, consideramos a análise que envolve todos

os dados, uma vez que a dos demais estudiosos também baseia-se em


todos os dados da amostra.

Com base nos resultados desta tabela, a seguir, verificam-se as

seguintes similaridades: o plural duplo é o que mais favorece a aplicação da

regra, e o plural regular, o que menos a favorece. Observa-se também que

os itens em -ão, fora os regulares, apresentam as mais baixas

probabilidades de aplicação da regra. Conseqüentemente, os itens em -R e

em -S favorecem mais a aplicação da regra do que os próprios itens em -ão.

Esta é uma das grandes descobertas com o desmembramento feito entre os

itens que fazem a oposição singular/plural com inserção de -S e alterações


silábicas.
103

TABELA 6.2.2.13
PROCESSOS E ESCOLARIZAÇÃO: COMPARAÇÃO ENTRE OS NOSSOS
RESULTADOS E OS DE GUY (1981a)50
PROCESSOS FALANTES
Primário Semi-escolarizados
Guy (1981a)
Apl./Total % Prob. Apl./Total % Prob.
Duplo
(famoso ) 22/25 = 88 0,85 6/8 = 75 0,86
famósos)
-l
(horrível ) 21/31 = 68 0,49 25/57 = 44 0,33
(horríveis)
-ão
(profissão ) 31/43 = 72 0,39 44/84 = 52 0,30
(profissões)
-R
(revólver ) 77/94 = 82 0,50 96/142 = 68 0,62
(revólveres)
-S
(rapaz ) 87/112 = 78 0,47 76/147 = 52 0,51
(rapazes)
Regular
(amendoim ) 2175/3598 = 60 0,24 5887/9058 = 65 0,28
(amendoins)

Outra grande diferença observada, em relação a análises anteriores,

é a alta taxa probabilística associada aos itens em -S, pois, se retirado o

efeito da variável Tonicidade, esta probabilidade, inclusive, aumenta (de 0,47

passa a 0,55, como vimos na tabela 6.2.2.10). Esta categoria apresenta, a

nosso ver, comportamento bastante flutuante nos agrupamentos de falantes.


104

Nos nossos falantes do ginasial e do colegial, inclusive, ela já apresenta um

comportamento diferente: mais semelhante ao dos regulares na análise que

considera a variável Tonicidade (ver tabela 6.2.2.6). Ao compararmos

análises que não consideraram a variável Tonicidade, para os nossos

falantes do colegial, para os escolarizados cariocas e para a classe média

mineira, veremos também que o seu comportamento não é uniforme.

Todavia, a probabilidade associada aos itens em -l (0,49) nos nossos

falantes do primário é mais alta do que a dos falantes semi-analfabetos de

Guy (0,33). No nosso caso, ela fica próxima à dos itens terminados em -R

(0,50) e em -S (0,47), enquanto, nos falantes da amostra de Guy, ela se

mantém semelhante(0,33) à dos itens em -ão (0,30) e dos regulares (0,28).

Então os nossos falantes do primário apresentam uma oposição tríplice em

termos de: plural duplo, plural não regular, e plural regular; os semi-

escolarizados estudados por Guy apresentam também uma oposição

tríplice, mas fora da escala da saliência prevista: plural duplo, plural dos

itens em -R e em -S, e demais casos (itens em -l, em -ão e regulares).

A conclusão a que se chega com base na comparação entre estes

resultados é a de que a escala da saliência para os falantes do primário se

comporta dentro da linha por nós esperada de forma mais nítida do que para

os falantes que freqüentavam o MOBRAL, ou seja, o seu maior refinamento

parece estar ligado a um maior índice de escolarização.

Vamos agora comparar os nossos resultados com os de Braga (1977)

e com os de Scherre (1978). Utilizaremos neste ponto os resultados da


105

nossa etapa de análise sem o efeito da Tonicidade e com o agrupamento

dos itens terminados em -l e em -ão em um só fator, por questão apenas de

comparabilidade. Já adiantamos, todavia, que mesmo assim a comparação

não é perfeita, porque Braga (1977) codificou formas não padrão do tipo

veze, mese como singulares. Após a apresentação dos resultados

comparativos, vamos discutir esta segunda questão.

Os nossos resultados não serão comparados aos de Ponte (1979),

porque o instrumental estatístico por ela utilizado é diferente do nosso, o que

pode falsear a comparação. Nem faremos comparação com os resultados de

Carvalho Nina (1980), porque ela, além de apresentar apenas resultados

percentuais, apresenta também um número improvável de dados para os

fatores não regulares da variável Processos, se comparados aos que já

obtivemos até hoje para estes fatores. Exemplificando: enquanto obtivemos

apenas 25 dados no fator plural duplo para os nossos falantes do primário,

Carvalho Nina obteve 338 casos. Podemos com isso levantar a hipótese de

que não estamos trabalhando exatamente com o mesmo tipo de dado.

Como estamos trabalhando com a concordância nominal, não levamos em

conta dados do tipo "comprar ovos" que podem, por exemplo, ter sido

considerados por Carvalho Nina (cf. p.110).

A diferença numérica acima poderia ser atribuída ao número de

falantes pesquisados, o que não é verdade, pois esta diferença não é tão

grande: Carvalho Nina trabalhou com 20 falantes analfabetos e nós

trabalhamos com 16 falantes do primário. Esta dúvida se desfaz totalmente,

se considerarmos o total de falantes adultos por nós analisados - 48 - que

mesmo assim apresenta um total de apenas 68 dados, contra os 338 ca-


106

sos de Carvalho Nina para o mesmo fator, com um conjunto de apenas 20

informantes.

Todavia, é possível observar que os analfabetos paraenses

apresentam um comportamento surpreendente: os itens terminados em -ão e

em -l jamais são marcados. Pelo que pudemos ver dos exemplos

apresentados e das observações de Carvalho Nina (1980), o núcleo só

tende a ser marcado quando for constituído por um item de plural duplo, por

um item em -S ou em -R, mas sem o -S final, ou seja, apresenta-se nas

formas ólhu (cf. p.66 e 144), caçadore (cf. p.67) e veze (cf. p.68). Ao falar da

possibilidade de marcas no segundo elemento do SN, afirma ela que "a

ausência de flexão se verificava no núcleo do sintagma nominal, salvo

ocorrências irrelevantes." (p.70)

Os resultados comparativos dos nossos falantes do primário e do

ginasial, e os do primeiro grau de Braga (1977), encontram-se na tabela

6.2.2.14. É bom relembrar que os itens em -l e em -ão foram aqui agrupados

e, com isto, desaparece uma grande diferença entre o comportamento dos

falantes do primário e os do ginasial da nossa amostra. Os itens em -l são

muito marcados nos dados deste segundo grupo de falantes (ver tabela

6.2.2.6). Além disso, os resultados abaixo foram obtidos sem a interferência

da variável Tonicidade. A escala de saliência é nitidamente tríplice para os

três grupos de falantes. A diferença reside apenas na categoria que ocupa a

base da hierarquia.
107

TABELA 6.2.2.14
PROCESSOS E ESCOLARIZAÇÃO: COMPARAÇÃO ENTRE OS NOSSOS
RESULTADOS DO PRIMÁRIO E GINASIAL E OS DE BRAGA (1977)
PROCESSOS FALANTES
1º grau
Primário Ginasial (BRAGA, 1977)
Duplo F. 22 = 88% 24 = 92% 3 = 75%
(pãozinho ) 25 26 4
(pãezinhos) P. 0,76 0,82 0,95

-l e -ão F. 52 = 70% 79 = 86% 11 = 22%


(possível ) 74 92 51
(possíveis)
(garotão )
(garotões) P. 0,51 0,54 0,42

-R F. 77 = 82% 74 = 89% 20 = 25%


(morador ) 94 83 79
(moradores) P. 0,59 0,60 0,54

-S F. 87 = 78% 68 = 83% 5 = 3%
(melhor ) 112 82 145
(melhores) P. 0,56 0,42 0,08

Regular F. 2175 = 60% 2360 = 71% 1871 = 56%


(problema ) 3598 3330 3326
(problemas) P. 0,15 0,15 0,44

A diferença de comportamento mais forte entre os nossos resultados

e os de Braga, ainda não discutida, é, portanto, a que se refere à inversão

das probabilidades associadas aos itens terminados em -S e os de plural

regular. Esta mesma inversão pode ser observada nos falantes do segundo

grau de Braga (1977) e nos "universitários"51 de Scherre (1978), conforme

se pode observar pelos resultados da tabela 6.2.2.15.


108

TABELA 6.2.2.15
PROCESSOS E ESCOLARIZAÇÃO: COMPARAÇÃO ENTRE OS NOSSOS
RESULTADOS DO COLEGIAL E OS DE BRAGA (1977) E SCHERRE (1978)
PROCESSOS FALANTES
Universitários 2º grau
Colegial (SCHERRE, 1978) (BRAGA, 1977)

Duplo F. 17 =100% 21 =100% 4 = 57%


(tijolo ) 17 21 7
(tijólos) P. + + 0,50

-l e -ão F. 125 = 95% 116 = 95% 66 = 79%


(móvel ) 131 122 83
(móveis)
(machão )
(machões) P. 0,73 0,85 0,76

-R F. 85 = 94% 76 = 88% 51 = 61%


(bar ) 90 86 83
(bares) P. 0,69 0,57 0,62

-S F. 64 = 90% 80 = 52% 27 = 17%


(mês ) 71 154 158
(meses) P. 0,45 0,18 0,18

Regular F. 2531 = 81% 2705 = 80% 2192 = 70%


(irmão ) 3123 3365 3138
(irmãos) P. 0,17 0,39 0,46

Se não fosse a inversão apontada acima, a escala da saliência nos

falantes de maior nível de escolarização seria praticamente perfeita. A escala

da saliência é também um pouco perturbada no fator plural duplo dos

mineiros do segundo grau. Acreditamos que a discrepância com relação ao

plural duplo e a inversão das probabilidades associadas aos itens em -S e

aos regulares nos falantes mineiros têm a sua explicação no fato de Braga

ter considerado formas do tipo mese como singulares, o que não explica,

todavia, a inversão no caso dos "universitários" cariocas, em que tal fato não
109

ocorreu. Scherre é bastante clara a este respeito. Ela codificou todas estas

formas como plurais (cf. 1978, p.68).

Numa tentativa de entender melhor a posição dos itens terminados

em -S na escala da saliência, decidimos verificar a distribuição das formas

plurais não padrão nos diversos fatores da variável Processos, para então

reanalisarmos nossos dados na direção da análise de Braga, embora

saibamos que isto não esclareça a inversão dos resultados de Scherre.

Temos, no quadro 6.2.2.16, a distribuição completa dos itens não

regulares em função do tipo de marca encontrada. As marcas apresentadas

neste quadro são de três tipos: padrão (meses); não padrão (mese) e com

neutralização (meses são).

Através da distribuição dos dados no quadro 6.2.2.16, a seguir,

podemos ver que o número de formas não padrão do tipo mese é

significativamente alto: 40% contra 45% de formas padrão (meses). Este

número também é bastante alto nos plurais duplo: há 24% de formas não

padrão (óvo) e 71% de formas padrão (óvos). Estes percentuais justificam a

reanálise. A diferença entre os totais de aplicação de todos os não regulares,


789 no quadro 6.2.2.16 e 775 nas tabelas, ocorre porque, no quadro

6.2.2.16, incluem-se também os dados categóricos do tipo determinada

discussões.
110

QUADRO 6.2.2.16
DISTRIBUIÇÃO DAS MARCAS DE PLURAL NOS ITENS NÃO
REGULARES
PROCESSOS MARCA MARCA MARCA
NÃO COM
PADRÃO PADRÃO NEUTR. TOTAL
Duplo
(novo/nóvos) 47(71%) 16(24%) 3( 5%) 66

-l
(casal/casais) 71(85%) 7( 8%) 5( 6%) 83

-ão
(leitão/leitões) 154(87%) 10( 6%) 13( 7%) 177

-R
(cor/cores) 194(81%) 14( 6%) 30(13%) 238

-S
(país/países) 102(45%) 89(40%) 29(13%) 220

TOTAL 568(72%) 136(17%) 80(10%) 784

A reanálise feita, considerando formas plurais não padrão como

ausência de concordância, não significa mudança de posição frente aos

dados. Continuamos a acatar tais formas como plurais, mas não temos como

reanalisar os dados de Braga (1977), para tornar seus resultados

comparáveis aos nossos; porém, temos condições de fazer os nossos

comparáveis aos seus e depois podemos inverter o raciocínio.

O nosso objetivo aqui é apenas o de saber qual seria a "verdadeira"

posição da categoria constituída pelos itens em -S, assim como já

verificamos, através das idéias de Guy (1981a), a necessidade da colocação

dos itens em -l e em -ão em dois fatores separados, pelo menos para os

falantes do primário e do ginasial.


111

Na tabela 6.2.2.17, temos os resultados da reanálise feita focalizando

apenas os três fatores diretamente envolvidos: plural duplo, itens terminados

em -S e plural regular. Em primeiro plano, repetimos os resultados da análise

que vimos apresentando, em que a forma padrão e a não padrão são

consideradas presença de concordância, e, em segundo plano, colocamos

os resultados da reanálise dos dados conforme Braga (1977), na qual se

considera presença da concordância apenas a forma padrão e, como

ausência, a forma não padrão e a forma não marcada. É importante observar

ainda que as formas com neutralização (meses são) foram desconsideradas

nesta reanálise. Além disso, considerou-se a separação entre os itens

terminados em -l e em -ão e incluiu-se a variável Tonicidade, ou seja, esta

reanálise contém o mesmo número de variáveis e o mesmo número de

fatores da análise que foi apresentada nas páginas 68-69. É importante

observar novamente que os resultados desta etapa envolvem todos os dados

dos falantes adultos. Os números apresentados abaixo para a primeira

alternativa de análise diferem, portanto, ligeiramente dos que se encontram

na tabela 6.2.2.6, a qual envolve apenas os substantivos, adjetivos e

categorias substantivadas.
112

TABELA 6.2.2.17
SOBRE A ANÁLISE DA CONCORDÂNCIA
TIPOS DE FALANTES PROCESSOS
APLICAÇÃO
Duplo -S Regular

Padrão+não padrão Primário 22=88% 87=78% 2175=60%


versus 25 112 3598
não aplicação 0,85 0,49 0,24

Ginasial 24=92% 68=83% 2360=75%


26 82 3330
0,90 0,26 0,23

Colegial 17=100% 64=90% 2531=81%


17 71 3123
+. 0,33 0,25

Padrão versus Primário 13=52% 31=32% 2175=60%


não padrão + não 25 97 3598
aplicação 0,66 0,22 0,48

Ginasial 16=64% 36=49% 2360=71%


25 74 3330
0,64 0,15 0,49

Colegial 15=100% 35=56% 2531=81%


15 63 3123
+. 0,16 0,48

Os resultados da tabela 6.2.2.17 mostram-se perfeitamente dentro do

esperado: diminui-se a influência do plural duplo e inverte-se a posição dos

outros dois fatores na escala da saliência. Os itens terminados em -S

passam a ocupar, portanto, a base da hierarquia. Invertendo-se agora as

conclusões acima, poderíamos esperar (1) que o fator plural duplo em Braga

(1977) apresentasse probabilidade alta de aplicação da


113

regra e (2) que a base da hierarquia fosse ocupada pelos itens de plural

regular, se a sua codificação fosse igual à nossa.

Dois aspectos envolvendo os itens em -S ainda assim não se

explicam: (1) o fato de serem bem menos marcados nos dados dos falantes

do primeiro grau apresentados por Braga (1977), mesmo mantendo-se a

hierarquia (cf. Tabela 6.2.2.14, p.107); (2) o fato de apresentarem-se na

base da hierarquia nos dados dos falantes escolarizados apresentados por

Scherre (1978), invertendo realmente a sua posição com relação aos itens

regulares ( ver tabela 6.2.2.15, p.108).

A única hipótese que temos em mãos para conjecturar sobre estas

questões diz respeito a certas particularidades da formação de plural

envolvendo os itens terminados em -S.

É comum se afirmar que "os nomes paroxítonos (...) terminados em s

(ou em x)" (ROCHA LIMA, 1973, p.74) do tipo alferes, ourives e pires não

possuem plural morfológico (cf., também, BECHARA, 1972, p.79). Todavia,

segundo Pereira (1949), tais itens já tiveram as formas plurais alfereses,

ouriveses e pireses, respectivamente (cf. p.94).


Com relação aos itens lexicais oxítonos em -S, a afirmação geral é

que eles se pluralizam normalmente: gás/gases; português/portugueses;

luz/luzes; giz/gizes (cf. ROCHA LIMA, p.75 e BECHARA, p.77).

Bechara (1972) afirma ainda que "os nomes das letras vão

normalmente ao plural", exemplificando com os efes, os erres e os is (p.80),

mas afirma, por outro lado, que xis é invariável, ocorrendo, portanto, os xis,

bem como cais e cós (cf. BECHARA, 1972, p.72 e, também, ROCHA LIMA,

1973, p.79).

Segundo nossa intuição, itens lexicais como giz, nariz, gravidez,

avidez, morbidez, insensatez e lilás dificilmente seriam susceptíveis de


114

pluralização. Nos nossos dados, ocorre apenas gravidez, dentre a lista feita

acima, sem plural morfológico (as minhas gravidez).

Levantam-se então as seguintes questões:

1) Por que não se pluraliza xis se é normal pluralizar efe, por

exemplo?

2) Por que não se pluralizam formas como cais, cós se são palavras

que se referem a elementos concretos e contáveis, normalmente

pluralizáveis?

3) Por que achamos que não se pluralizam giz e nariz se ambos são

também elementos concretos e contáveis? Para o segundo caso, poder-se-

ia dizer que se tem apenas um nariz e por isto ficaria estranho pluralizar o

item nariz. Mas como atribuir esta interpretação à palavra giz?

4) Por que consideramos estranha a idéia de se pluralizarem

palavras como gravidez, avidez, insensatez etc? Poder-se-ia ser tentado a

afirmar que estas palavras são abstratas e, portanto, menos susceptíveis de

pluralização. Esta colocação carece de fundamento, pois pluralizam-se

facilmente palavras tão abstratas quanto as acima relacionadas: obrigações,

privações, problemas, asneiras, vantagens, mentiras, possibilidades,

descobertas, conceitos etc., embora não descartemos a hipótese de que este

traço associado aos itens derivados terminados em -S iniba mais ainda a sua

pluralização morfológica (ver item 6.2.6).

5) Por que parece estranha a pluralização do item lilás, que não

partilha de nenhuma das possíveis particularidades dos outros itens acima?

Nos nossos dados, os itens oxítonos em -S que ocorrem são

basicamente os seguintes: vez, mês, país, raiz, rapaz, freguês, português,


115

holandês, feliz e gravidez. Embora não tenhamos feito estatísticas,

certamente as ocorrências concentram-se em mês e vez, mesmo excluindo,

neste segundo caso, as construções às vezes.

Observa-se, portanto, que o item lexical terminado em -S é bastante

peculiar e merece, para o futuro, um estudo bastante apurado para se

verificar se muitos dos oxítonos realmente não se pluralizam ou se este fato


se limita a uma classe morfológica específica de itens lexicais ou se há um

traço semântico comum a todos os substantivos menos susceptíveis de

pluralização.
Antes de concluirmos este tópico, vamos discutir a questão

relacionada à queda do -S em fronteira de morfema com base nos dados que

estamos analisando e vamos fazer algumas reflexões adicionais sobre

análises alternativas envolvendo Processos e Tonicidade.

6.2.2.7 - Sobre a fronteira de morfema

Em 1980a, Poplack já apresentava resultados percentuais que


evidenciavam que o cancelamento do -S no Espanhol de Porto Rico era mais

freqüente em formas bimorfêmicas do que em formas monomorfêmicas,

fornecendo evidência contrária à hipótese funcionalista de Kiparsky (1972), a

qual estabelece que a informação semântica relevante tende a ser retida na

estrutura de superfície (cf. POPLACK, 1980a, p.57-8).


116

Em 1980b, Poplack reitera a colocação acima, através de um número

maior de dados referentes ao cancelamento do -S e através da análise da

queda da nasal final (cf. POPLACK, 1980b, p.373).

Em 1981, Poplack afirma que o cancelamento da nasal no Espanhol

ocorre mais em verbos regulares, recolocando que esta conclusão vai contra

a hipótese funcionalista de Kiparsky, uma vez que "(...) mais informação

corre o risco de ser perdida neste contexto."(p.65).52 Observa também que

um efeito idêntico foi encontrado em diversos estudos do


Português brasileiro (Lemle e Naro 1977, Guy e Braga
1976, Votre 1978) e que Naro descreve em termos de
saliência fônica. (POPLACK, 1981, p.65)53

Guy (1981a) sugere que a regra de cancelamento do -S no Português

popular do Brasil é inibida pela presença de fronteira de morfema, num

processo semelhante ao encontrado por outras regras de cancelamento de

segmentos do tipo -t, -d finais em Inglês. Sugere ainda que "(...) este efeito

inibidor ocorre somente onde a estrutura e a função de morfema coincidem",

(p.165)54 o que explica o fato de a queda da nasal em Português não ser

regida por restrições funcionais: neste caso, a função de morfema não é

exercida por um segmento, mas por um traço suprassegmental - a

nasalização da vogal (cf. p.164-5). Todavia, Guy não codificou a queda de -S

considerando as formas monomorfêmicas em oposição às bimorfêmicas. Ele

chega à conclusão acima, sobre o -S, através de um raciocínio inferencial,

alegando problemas no levantamento dos dados (cf. p.164).

Neste estudo, não analisamos a queda do -S final sem função

morfêmica. O nosso centro de interesse é a concordância de número entre


117

os elementos do SN. como já vimos, consideramos as formas pósto, religiõe,

comerciai, pescadore e mese como plurais, embora não haja a presença

do -S final. Considerando os dados desta forma, não podemos afirmar que

um índice menor de marcas em itens do tipo livro seja contrafuncional, pois a

forma singular religião tem o mesmo risco de perder a informação de plural

ao ocorrer dentro de um SN plural.

Para testarmos a hipótese funcionalista do tipo acima aludido com

base nos dados de que dispomos, retiramos do seu conjunto todas as

ocorrências de itens não regulares na sua forma singular (posto, religião,

comercial, pescador e mês) e consideramos não aplicação da concordância

a ausência do -S também nas formas plurais não padrão (pósto, religiõe,

comerciai, pescadore e mese). É importante observar também que todos os

elementos nominais analisados estão inseridos dentro de um SN com pelo

menos uma marca de plural, encontrando-se, portanto, em igualdade de

condições.

Pela hipótese funcionalista kiparskiana, espera-se que o -S final


ocorra mais em palavras do tipo livro do que nas demais. No primeiro caso,

ele é o morfema de plural, em fronteira de morfema; e, nos demais casos,

ele é apenas parte do morfema de plural, sem, portanto, estar em fronteira de

morfema. Segundo Kiparsky (1972), como já bem o sabemos, as Condições

de Distintividade estabelecem que há uma tendência para a informação

semanticamente relevante ser retida na estrutura superficial (cf., novamente,

p.195).

Os resultados desta etapa de análise estão na tabela 6.2.2.18, a

seguir. Nesta fase do trabalho, não fizemos análises só com os substan-


118

tivos, adjetivos e categorias substantivadas, pois, como já sabemos, as

probabilidades quase não seriam alteradas. Além disso, esta etapa envolve

todas as demais variáveis assinaladas: Relação entre classes nucleares e

não nucleares, Marcas em função da posição, Contexto fonológico seguinte,

Função resumitiva e todas as variáveis sociais.

Á exceção dos itens de plural duplo, que apresentam-se

categoricamente marcados nos dados dos falantes do colegial, os valores

probabilísticos associados a todos os fatores de todos os falantes

relacionados na tabela 6.2.2.18 são extremamente uniformes, indicando o

seguinte:

1) Os itens terminados em -l, em -ão e em -R favorecem a presença

do -S final.

2) Os itens regulares e os terminados em -S desfavorecem a

presença do -S final, sendo que estes últimos apresentam as mais baixas

probabilidades dentre todos.

3) Os itens de plural duplo favorecem mais a inserção de marcas de

plural do que os itens regulares e menos um pouco do que os itens

terminados em -l, em -ão e em -R.

Os resultados falam por si. A inserção do -S final não tem fortes

ligações com a fronteira de morfema. Os itens regulares, ao contrário do que

se esperava, são o segundo fator na escala de desfavorecimento. Por outro

lado, os itens de plural duplo, que apresentam nitidamente a possibilidade de

duas marcas distintas de plural em pontos também distintos, favorecem mais

a inserção de -S sistematicamente.
119

TABELA 6.2.2.18
PROCESSOS: SOBRE A FRONTEIRA DE MORFEMA
PROCESSOS FALANTES
Todos Primário Ginasial Colegial

Duplo F. 47 = 75% 13 = 59% 16 = 70% 15 = 100%


(novo ) 63 22 23 15
(nóvos) P. 0,54 0,52 0,45 +

-l F. 71 = 91% 16 = 84% 16 = 89% 39 = 95%


(casal ) 78 19 18 41
(casais) P. 0,70 0,67 0,55 0,83

-ão F. 154 = 94% 28 = 90% 56 = 98% 68 = 92%


(leitão ) 164 31 57 74
(leitões) P. 0,69 0,72 0,86 0,58

-R F. 194 = 93% 62 = 91% 65 = 97% 66 = 92%


(cor ) 208 68 67 72
(cores) P. 0,70 0,72 0,79 0,64

-S F. 102 = 53% 31 = 42% 36 = 59% 35 = 72%


(país ) 191 73 61 57
(países) P. 0,13 0,15 0,10 0,13

Regular F. 7182 = 71% 2175 = 60% 2397 = 71% 2531 = 81%


(o ) 10167 3598 3367 3123
(os) P. 0,31 0,28 0,28 0,35

A hipótese funcionalista do tipo kiparskiana apenas se insinua com

relação à colocação do plural duplo na hierarquia da saliência, nos falantes

do primário e ginasial, com relação aos itens terminados em -l e em -R

principalmente, mas cai por terra se comparada com os regulares.


120

Por detrás das oposições maiores, o que está em jogo é o Princípio

da Saliência fônica, por enquanto visto na sua primeira dimensão: os itens

que apresentam maior diferenciação de material fônico na relação

singular/plural são os que mais favorecem a inserção de -S, por serem os

mais perceptíveis. Os itens terminados em -S (mês/meses) encontram-se na

base da hierarquia, por estarem envolvidos num processo haplológico que

consiste em eliminar sílabas ou palavras iguais ou parecidas (cf. 1976, p.162;

CÂMARA JR., 1977, p.134; BRAGA & SCHERRE, 1976, p.474 e SCHERRE,

1978, p. 101-2; ver, também, item 6.2.4.2) e por apresentarem

comportamento bastante especial como discutimos nas páginas anteriores.

A influência da Tonicidade vem corroborar a atuação do Princípio da

Saliência, pois os itens oxítonos favorecem mais a inserção de -S do que os

paroxítonos para quaisquer falantes, conforme se pode ver pelos resultados

da tabela 6.2.2.19.
121

TABELA 6.2.2.19
TONICIDADE: SOBRE A FRONTEIRA DE MORFEMA
TONICIDADE FALANTES
Todos Primário Ginasial Colegial

Oxítono e F. 895 = 83% 261 = 76% 304 = 86% 292 = 77%


monossíla- 1072 346 360 336
bo tônico
(país )
(leitão) P. 0,66 0,68 0,69 0,56
(meu, pé)

Paroxítono F. 6771 = 70% 2049 = 60% 2252 = 71% 2409 = 81%


e monossí- 9641 3417 3179 2983
labo átono
(caro )
(dólar) P. 0,39 0,43 0,38 0,37
(os/as)

Proparoxí- F. 84 = 53% 15 = 31% 30 = 48% 38 = 79%


tono 159 48 62 48
(fábrica )
(indígena) P. 0,44 0,38 0,42 0,57
(médico )

Os proparoxítonos se comportam como itens não marcados para os


falantes do primário e do ginasial e como marcados para os do colegial,

conforme também já vimos no item 6.2.2.4.

Retomando as colocações de Kiparsky (1972), podemos ver que ele

classifica o número como uma categoria forte, ao lado do gênero e do tempo.

Ao fazer isto, ele se baseia em línguas que não têm concordância, como o

Inglês. Todavia, dentro de sua proposta, o número em Português deve ser

considerado uma categoria fraca. Como ele próprio coloca, "(...) categorias

fracas são aquelas que registram informação que é relativamente

redundante." (p.206)55 Generalizando, dentro de seu esquema, qualquer


122

categoria que envolva concordância deve se classificar como uma categoria

fraca, e não apenas a marca de pessoa (cf. p.206).

Consideramos, ainda mais, que esta classificação, que se supõe

universal, deve ser repensada pois, como vamos mostrar no item 6.2.3, a

existência de uma marca no primeiro elemento do SN não é condição

suficiente para que as demais caiam. Em SNs de mais de dois elementos, se

houver uma marca também no segundo elemento, haverá mais chances de

ocorrer uma outra marca a seguir e, se à primeira marca se seguir um zero,

as chances de aparecer um zero seguinte são quase categóricas.

Os nossos resultados apontam para o fato de que o cancelamento ou

a inserção de categorias lingüísticas não é necessariamente regido por

princípios funcionalistas do tipo estabelecido por Kiparsky. É importante

salientar que o comportamento do -S em Português não constitui um caso

particular. O cancelamento do -R também não é influenciado pela fronteira de

morfema (cf. VOTRE, 1978, p.44-7;, 64-7 e 105-7 e CALLOU, 1979, p.148).

Assim, a hipótese de Guy sobre o cancelamento do -S e sobre o

cancelamento da nasal em Português não se sustenta. Em verdade, a

interpretação para a ausência do efeito da fronteira de morfema sobre a

nasal em Português não se deve ao fato de falta de correspondência entre

estrutura e função. O seu cancelamento ocorre, em princípio, porque em

português, uma língua que tem concordância, permite-se o cancelamento de

consoantes finais, mesmo que elas estejam exercendo algum papel

morfológico (cf., novamente, GUY, 1981a, p.164, cf., também, VOTRE, 1978,

p.105-7; p. 128 e 195-7 e NARO, 1980, p.166).


123

6.2.2.8 - Reflexões adicionais sobre a relação entre


Processos e Tonicidade

Acabamos de ver que Processos e Tonicidade são as duas

dimensões do eixo da saliência fônica que exercem influência sobre a

concordância de número entre os elementos do sintagma nominal.

Com relação a Processos especificamente, vimos que todos os

nossos falantes apresentam uma oposição entre os itens de plural duplo e os

terminados em -l, favorecedores da concordância; e os itens regulares,

desfavorecedores.

Os itens em -ão já não apresentam posição tão firme na escala da

saliência. Nos dados dos falantes do colegial, o seu comportamento é igual

ao dos terminados em -l, com os quais apresentam similaridade em termos

de formação do plural. No caso dos grupos de falantes do primário e do

ginasial, além de apresentarem menor probabilidade de concordância do

que itens em -l, estão abaixo da probabilidade associada aos itens em -R.

Entretanto, seu comportamento nos nossos dados jamais se iguala ao dos

regulares que são, sistematicamente, os menos marcados.

É sabido por todos que os itens terminados em -ão, diferentemente

dos itens terminados em -l, são categorias também consideradas flutuantes

em relação à formação de plural. A nossa tradição gramatical afirma que a

formação de plural dos itens terminados em -ão pode se dar de três formas:

em -ãos (irmão/irmãos - formação regular); em -ães (capitão/capitães) e -ões

(balão/balões - o caso mais comum). Registra-se, inclusive, mais de uma

possibilidade para uma só palavra (anciãos,


124

anciões, anciães) (cf. ROCHA LIMA, 1983, p.76). Mesmo admitindo

que isto possa estar influenciando o comportamento diferenciado desta

categoria, gostaríamos de ressaltar que, nos nossos 200 dados deste tipo

para os falantes adultos, só encontramos um dado de plural em -ães

(alemães) e nenhum caso de plural em -ão no sentido de regularização

(verão/verãos, por exemplo). Em todos os dados que já analisamos, incluindo

os de 1978, detectamos apenas um caso de regularização (cordãos): ou

encontramos sempre a forma totalmente plural ou totalmente singular.

É interessante observar ainda que os poucos aumentativos em -ão

que ocorreram, precisamente 11 casos, tenderam a se apresentar na forma

singular, (amigão, cachorrão, brabão, dentão etc.) e não na sua forma plural

irregular (amigões, cachorrões, brabões, dentões) e muito menos na forma

regular(amigãos, cachorrãos, brabãos, dentãos).

Acreditamos que, em tais situações, os falantes devem evitar o plural

por causa da incerteza.56 As duas formas plurais cedem a vez à forma

singular, apesar da saliência. Esta é uma hipótese bastante sedutora e que

poderia se aplicar a todos os casos de ausência de marca nos nomes

irregulares em -ão. Podemos imaginar que esteja ocorrendo um processo de

regularização, e, uma vez que os itens são regularizados, eles são pouco

marcados, como todo e qualquer regular.

O interessante desta hipótese reside no fato de podermos verificar o

comportamento de casos do tipo irmão, mão, órgão e órfão que já fazem o

plural de forma regular. Se a hipótese agora levantada estiver correta, é de

se esperar que estes casos apresentem menos concordância do que os

próprios regulares que não terminam em -ão.


125

Esquadrinhando nossos dados, verificamos, todavia, que há apenas

38 casos deste tipo, dentre os quais 36 são oxítonos e dois paroxítonos.

Mesmo diante do número exíguo de dados, efetuamos uma etapa de análise

em função dos anos de escolarização dos falantes e obtivemos os resultados

relacionados na tabela 6.2.2.20, para os falantes do primário e do ginasial.

TABELA 6.2.2.20
SOBRE OS REGULARES EM -ÃO
PROCESSOS FALANTES
Primário Ginasial
Apl./Total % Prob. Apl./Total % Prob.
Duplo
(famoso ) 22/25 = 88 0,90 24/26 = 92 0,91
(famósos)

-l
(casal ) 21/30 = 70 0,56 18/19 = 95 0,76
(casais)

-R
(pescador ) 77/94 = 82 0,57 74/83 = 89 0,51
(pescadores)

-S
(rapaz ) 87/112 = 77 0,53 68/82 = 83 0,31
(rapazes)

-ão
(nação) 31/43 = 72 0,45 61/73 = 84 0,37
(nações)

Regular
(salário) 648/1973 = 33 0,35 979/1859 = 53 0,30
(salários)

Regular
em -ão
(irmão ) 5/17 = 17 0,11 13/17 = 76 0,20
(irmãos)
126

Pelos resultados da tabela acima, é possível vermos que os regulares

em -ão situam-se abaixo dos demais regulares na escala de concordância, o

que realmente aponta para a existência de um processo de regularização

dos nomes em -ão dos falantes com menos escolarização. Os dados dos

falantes do colegial são poucos - apenas quatro - mas mesmo assim

apresentam-se com todas as marcas: o que é no mínimo consistente com o

fato de os falantes do colegial apresentarem uma diferença bem mais

marcante entre os itens em -ão e os itens regulares, como já tivemos

oportunidade de ver. Por causa do número de dados, pesquisas futuras

podem trazer mais evidências para a hipótese que acabamos de estabelecer.

Os itens terminados em -S, de forma geral, tendem a se colocar na

hierarquia entre os itens em -R e os regulares, embora este fato deixe de

ocorrer nos universitários cariocas. Já discutimos exaustivamente o

comportamento desta categoria.

Em suma, dentre as seis categorias estabelecidas, quatro

apresentam comportamento regular e duas apresentam comportamento

flutuante.

Resta, entretanto, saber se as diferenças entre as categorias

intermediárias são estatisticamente relevantes.

Para testarmos a significância estatística das diferenças entre os

fatores intermediários da variável Processos, efetuamos uma etapa de

análise com apenas os quatro fatores em questão, os quais são: itens em -l;

em -ão; em -R e em -S. Este teste foi feito inicialmente com todos os dados

de todos os falantes e, a seguir, com os dados dos falantes subdivididos em

termos dos anos de escolarização. Os resultados são sistemáticos: não há

significância estatística entre os quatro fatores em questão, pois a variável


127

Processos, com somente estas quatro categorias, não é selecionada em

nenhuma das etapas de análise. As diferenças existentes entre estes quatro

fatores podem nos apresentar indícios lingüísticos interessantes, mas sem

validade estatística a nível de 0,05.

Por outro lado, a análise dos itens regulares isoladamente apresentou

seleção da variável Tonicidade para todos os falantes e para os

subagrupamentos de falantes em função do grau de escolarização, embora

não tenha sido colocada entre as três primeiras variáveis selecionadas.

Diante disto, decidimos testar se as diferenças entre os itens regulares e os

demais itens desta variável, incluindo-se os de plural duplo, seriam

estatisticamente significativas.

Vamos apresentar os resultados destes testes em tabelas separadas,

cada uma delas mostrando os resultados para as variáveis Processos e

Tonicidade. Focalizaremos primeiro os resultados relativos aos três fatores

não regulares que não são flutuantes e, após, os resultados dos flutuantes.

As três tabelas a seguir, 6.2.2.21, 6.2.2.22 e 6.2.2.23, contêm,

portanto, os resultados relativos aos regulares versus itens de plural duplo,

regulares versus itens terminados em -l e regulares versus itens terminados

em -R, nesta ordem. Em cada uma destas tabelas, apresentamos também os

resultados relativos à variável Tonicidade.


128

TABELA 6.2.2.21
RELAÇÃO ENTRE ITENS REGULARES E ITENS DUPLOS
PROCESSOS FALANTES
Todos Primário Ginasial Colegial

Regular F. 2819= 50% 653= 33% 992= 53% 1158= 68%


(filho ) 5583 1986 1876 1701
(filhos) P. 0,19 0,20 0,17

Duplo F. 63= 93% 22= 88% 24= 92% 17=100


%
(bondoso ) 68 25 26 17
(bondósos) P. 0,81 0,80 0,83 +

TONICIDADE

Oxítono e mo- F. 139= 73% 39= 57% 53= 78% 44= 86%
nossílabo tô- 190 68 68 51
nico P. 0,66 0,67 0,67 0,60

Paroxítono F. 2662= 50% 621= 33% 935= 53% 1076= 67%


5305 1893 1774 1602
P. 0,39 0,43 0,39 0,35

Proparoxítono F. 81= 52% 15= 31% 28= 47% 38= 79%


156 48 60 48
P. 0,44 0,39 0,44 0,55
129

TABELA 6.2.2.22
RELAÇÃO ENTRE ITENS REGULARES E ITENS EM -L
PROCESSOS FALANTES
Todos Primário Ginasial Colegial

Regular F. 2819= 50% 653= 33% 992= 53% 1158= 68%


(filho ) 5583 1980 1876 1701
(filhos) P. 0,33 0,35 0,25 0,31

-l F. 80= 86% 21= 70% 18= 95% 41= 93%


(principal ) 93 30 19 44
(principais) P. 0,67 0,65 0,75 0,68

TONICIDADE

Oxítono e mo- F. 201= 77% 58= 61% 67= 81% 75= 90%
nossílabo tô- 262 95 83 83
nico P. 0,66 0,67 0,67 0,62

Paroxítono F. 2617= 50% 601= 32% 915= 52% 1086= 67%


5258 1867 1752 1614
P. 0,39 0,44 0,38 0,34

Proparoxítono F. 81= 52% 15= 31% 28= 47% 38= 79%


156 48 60 48
P. 0,44 0,39 0,44 0,54
130

TABELA 6.2.2.23
RELAÇÃO ENTRE ITENS REGULARES E ITENS EM -R
PROCESSOS FALANTES
Todos Primário Ginasial Colegial

Regular F. 2819= 50% 653= 33% 992= 53% 1158= 68%


(filho ) 5583 1984 1876 1701
(filhos) P. 0,36 0,35 0,38 0,30

-R F. 237= 88% 77= 82% 74= 89% 85= 94%


(bar ) 268 94 83 90
(bares) P. 0,73 0,65 0,62 0,70

TONICIDADE

Oxítono e F. 365= 82% 111= 71% 125= 85% 123= 91%


monossílabo 445 161 147 135
tônico P. 0,66 0,67 0,69 0,57

Paroxítono F. 2610= 50% 600= 32% 913= 52% 1082= 67%


5250 1859 1752 1608
P. 0,39 0,44 0,37 0,36

Proparoxítono F. 81= 52% 15= 31% 28= 47% 38= 79%


156 48 60 48
P. 0,45 0,39 0,43 0,57

A oposição entre os regulares e os outros três tipos de processos em

questão é indubitável, pois ocorre para todos os falantes conforme nos


mostram os resultados. Igualmente, a influência da Tonicidade se faz

presente em cada um dos tipos de relação apresentada. É importante

salientar que ocorre a seleção tanto de Processos quanto de Tonicidade, na

relação regular versus não regular, para estes três casos, ou seja, isto

ocorre quando se tem nos não regulares a oposição oxítono/paroxítono,

mesmo com poucos dados nas categorias dos paroxítonos. Apenas os

falantes do colegial deixam de apresentar variação nos duplos, o que é

perfeitamente consistente dentro da linha que verifica que há uma leve

correlação entre Processos e anos de escolarização dos falantes.


131

É interessante ainda observar que (1) na relação regular/duplo, a

variável Processos é selecionada antes da variável Tonicidade; (2) na

relação regular/-l, quem é selecionada em primeiro plano é a variável

Tonicidade e (3), na relação regular/-R, a variável Tonicidade é selecionada

em primeiro plano para os falantes do primário e do ginasial, enquanto para

os falantes do colegial quem é selecionada antes é a variável Processos.

Verifica-se assim uma alternância constante entre o peso relativo mais forte

da variável Processos ou da variável Tonicidade. Neste ponto, creditamos

este fato a uma simples distribuição dos dados, que ora está mais favorável

para Processos, ora mais favorável para Tonicidade.

Os resultados da relação entre regular/-ão e regular/-S são

apresentados nas duas tabelas 6.2.2.24 e 6.2.2.25, que se seguem.


132

TABELA 6.2.2.24
RELAÇÃO ENTRE ITENS REGULARES E ITENS EM -ÃO
PROCESSOS FALANTES
Todos Primário Ginasial Colegial

Regular F. 2819= 50% 653= 33% 992= 53% 1158= 68%


(filho ) 5583 1980 1876 1701
(filhos) P. 0,39 (0,43) (0,43) 0,29

-ão F. 173= 86% 31= 72% 61= 84% 81= 96%


(patrão ) 200 43 73 84
(patrões) P. 0,61 (0,57) (0,57) 0,71

TONICIDADE

Oxítono e - F. 307= 80% 69= 63% 112= 81% 125= 92%


monossílabo 385 110 139 135
tônico P. 0,66 0,77 0,71 0,62

Paroxítono F. 2604= 50% 600= 32% 913= 52% 1076= 67%


5242 1865 1750 1602
P. 0,39 0,41 0,36 0,35

Proparoxítono F. 81= 52% 15= 31% 28= 47% 38= 79%


156 48 60 48
P. 0,45 0,37 0,41 0,53
133

TABELA 6.2.2.25
RELAÇÃO ENTRE ITENS REGULARES E ITENS EM -S
PROCESSOS FALANTES
Todos Primário Ginasial Colegial

Regular F. 2819= 50% 653= 33% 992= 53% 1158= 68%


(filho ) 5583 1980 1876 1701
(filhos) P. 0,41 0,37 (0,47) (0,42)

-S F. 219= 79% 87= 77% 61= 84% 64= 91%


(rapaz ) 264 112 73 70
(rapazes) P. 0,66 0,63 (0,53) (0,58)

TONICIDADE

Oxítono e F. 353= 79% 125= 70% 119= 80% 108= 89%


monossílabo 449 179 148 121
tônico P. 0,66 0,67 0,69 0,65

Paroxítono F. 2604= 50% 600= 32% 913= 52% 1076= 67%


5242 1865 1750 1602
P. 0,39 0,44 0,38 0,33

Proparoxítono F. 81= 52% 15= 31% 28= 47% 38= 79%


156 48 60 48
P. 0,45 0,40 0,42 0,52

Os dois fatores não regulares agora em evidência são aqueles que

não apresentam uma oposição interna entre oxítonos e paroxítonos, pois

todos eles são oxítonos. Tal enviesamento na distribuição dos dados vai se

refletir na seleção das variáveis em jogo, refletindo assim o que é mais

relevante nos dados de cada conjunto de falantes: se o Grau de

diferenciação material fônica na relação singular/plural ou se a Tonicidade

dos itens regulares. No que diz respeito à relação regular/-ão, para os

falantes do primário e do ginasial, apenas a Tonicidade é selecionada,

embora Processos chegue à última etapa da análise mostrando diferenças

na direção esperada. Somente para os falantes do colegial, as duas variáveis

são selecionadas como relevantes do ponto de vista estatístico.


134

Se retirarmos o peso da variável Tonicidade, certamente Processos é

selecionada com oposições marcantes: 0,31 x 0,69 para os falantes do

primário e 0,30 x 0,70 para os do ginasial. Então parece que, para os falantes

que apresentam indícios mais fortes do processo de regularização das

formas em -ão, prevalece como mais relevante, no eixo da saliência fônica, a

dimensão da Tonicidade, em detrimento de Processos. Ressalte-se,

entretanto, que mesmo tendo sido selecionadas as duas variáveis em jogo

para os falantes do colegial, a variável Tonicidade é selecionada antes da

variável Processos.

Com relação ao fator constituído pelos itens em -S, ocorre uma

situação parecida, mas quase inversa no que diz respeito aos

subagrupamentos de falantes. Ambas as variáveis são selecionadas para os

falantes do primário, sendo a Tonicidade também selecionada em primeiro

plano, o que derruba a hipótese levantada no parágrafo acima. Para os

demais falantes, a variável Processos não é selecionada, embora também

se mantenha um distanciamento probabilístico entre regular/-S na linha

prevista. Se retirarmos novamente o efeito da variável Tonicidade, vamos ter

também um oposição forte entre regular/-S para os falantes do ginasial(0,37

x 0,67) e para os do colegial (0,31 x 0,69). Já tivemos oportunidade de

observar que a categoria dos itens em -S é a mais flutuante de todas por

uma série de razões: (1) está envolvida num processo de haplologia

sintática; (2) há itens terminados em -S que não são susceptíveis de se

pluralizarem e (3) é a classe de itens que apresenta um maior número de

formas não padrão. Constata-se mais uma vez um jogo constante entre

Processos e Tonicidade.
135

6.2.2.9 - Conclusão

Após todas estas reflexões, temos certeza de que passamos a

entender um pouco mais do funcionamento da saliência fônica na

concordância de número entre os elementos do sintagma nominal. Na

tentativa de refletir este entendimento, através de uma análise alternativa

para a que considera Processos e Tonicidade como variáveis separadas,

vamos alinhar uma série de motivos que nos levaram a esta análise.

Considerando

1) que as diferenças existentes entre os itens não regulares

intermediários, quer no que diz respeito à variável Processos quer com

relação à variável Tonicidade, não são consideradas estatisticamente

significativas, quando estes itens são analisados isoladamente;

2) que a variável Tonicidade é sistematicamente selecionada, junto

ou não à variável Processos, sempre que os itens regulares estão em jogo

em qualquer contraposição com os outros fatores, isolados ou agrupados;


3) que a variável Tonicidade é selecionada quando os itens regulares

são analisados separadamente;

4) que decorre dos itens 2 e 3 que a oposição entre os fatores da

variável Tonicidade é estatisticamente relevante apenas para os itens

regulares, como reflexo da sua influência sobre a queda do -S final;

5) que também decorre dos considerandos acima que a tonicidade

dos itens não regulares e a sua diferenciação material fônica na relação

singular/plural definem a sua saliência;


136

6) que uma análise que codifica duas variáveis tão superpostas,

quanto Processos e Tonicidade o são, não é desejável do ponto de vista

lingüístico e nem do ponto de vista estatístico;

7) que o número de dados dos paroxítonos dos itens em -R e em -l e

dos oxítonos dos itens de plural duplo é excessivamente pequeno, propomos

o seguinte:

A) Fazer uma análise alternativa que considere uma só variável,

advinda da junção de Processos e Tonicidade, ignorando a relação oxítono e

paroxítono para os itens não regulares e mantendo-a, acrescida do fator

proparoxítono, para os itens regulares. Desta forma, a nova variável agora

denominada de Saliência fônica conteria os fatores:

1) duplo (oxítono ou paroxítono);

2) -l (oxítono ou paroxítono);

3) -R (oxítono ou paroxítono);

4) -ão (oxítono);

5) -S (oxítono);

6) regular oxítono;

7) regular paroxítono e

8) regular proparoxítono.

B) Comparar as duas análises alternativas, a fim de que se verifique

qual delas é estatisticamente melhor, uma vez que a segunda reflete melhor

a realidade dos fatos sob a perspectiva lingüística.


137

Fizemos a nova análise proposta. E como já fizéramos uma outra

análise simplesmente eliminando a variável Tonicidade, a fim de verificarmos

a influência da Tonicidade sobre Processos (ver tabelas 6.2.2.10 e 6.2.2.11),

decidimos então comparar a relevância estatística das três possibilidades de

análise para o eixo da saliência. São elas: Análise 1 - Processos e

Tonicidade como duas variáveis separadas, com seis fatores na variável

Processos e três na variável Tonicidade; Análise 2 - Processos com seis

fatores sem a variável Tonicidade; Análise 3 - Processos e Tonicidade como

uma só variável, contendo oito fatores.

Para fazer o teste de significância estatística, utilizamos os testes de

log likelihood na forma transcrita abaixo.

Para testar a significância estatística ao longo destas


linhas, nós necessitamos somente encontrar a diferença
dos "logs" dos "likelihoods" para as duas análises, uma
vez que duas vezes esta diferença se aproximaria da
distribuição de um qui-quadrado se nenhum efeito resulta
dos fatores adicionais do modelo mais complexo. O
número de graus de liberdade envolvidos na distribuição
é o número de fatores eliminados dos grupos - ou, se um
grupo inteiro é eliminado, o número de fatores do grupo
menos 1. (NARO, 1981a, p.73)57

Procedendo desta forma, verificamos que existe uma diferença

estatística significativa entre a análise 1 e a análise 2, a nível de 0,001, a

favor da análise 1. O log likelihood da análise 1 com dois grupos de fatores é

mais próximo de zero do que o da análise 2 que tem apenas o grupo de seis

fatores, uma vez que foi eliminado o de três. Este fato significa
138

que a Tonicidade não pode ser simplesmente abandonada. Todavia, as

diferenças entre a análise 1 e a análise 3 não são estatisticamente

significativas para todos os falantes, para os falantes do primário, do ginasial

e do colegial. Tal situação nos diz, portanto, que, entre a análise 1 e a

análise 3, devemos escolher a mais simples. A mais simples é exatamente a

análise 3 que, além de transformar duas variáveis em uma só, contém um

fator a menos do que a análise 1. Mostrando de outra forma, podemos ver

que a análise 3 é mais simples do que a análise 1 pelo número de contextos

que se podem formar nos dois casos: oito na análise 3 e 18 na análise 1

(para este último caso, seis x três fatores em duas variáveis distintas

perfazem 18 contextos possíveis).

Uma quarta análise alternativa seria a que apresentamos nas páginas

91-93, com o cruzamento de Processos e Tonicidade também para os itens

não regulares (ver Tabelas 6.2.2.8 e 6.2.2.9). A nosso ver, esta seria a

análise lingüística mais intuitiva. Todavia, a diferença entre ela e a análise 3

só é significativa a nível de 0,20. A não relevância estatística da análise 4

reflete que, no conjunto dos dados, a diferença estatística entre a oposição

oxítono versus paroxítonos, para os não regulares, não é significativa. O

número de dados para se estabelecer esta oposição é deveras pequeno, o

que também inviabiliza análises feitas em termos de subagrupamentos de

falantes. A análise 3 deve ser novamente preferida, por ser a mais simples

do que a análise 4: esta contém dez fatores e aquela contém oito.

Uma vez decidida a questão, vamos apresentar os resultados

conforme a análise 3, na tabela 6.2.2.26.


139

TABELA 6.2.2.26
ANÁLISE FINAL DE PROCESSOS E TONICIDADE DOS SUBSTANTIVOS,
ADJETIVOS E CATEGORIAS SUBSTANTIVADAS DOS ADULTOS POR
ESCOLARIZAÇÃO
SALIÊNCIA FALANTES
FÔNICA
Todos Primário Ginasial Colegial

Duplo F. 63= 93% 22= 88% 24= 92% 17=100%


(novo ) 68 25 26 17
(nóvos) P. 0,80 0,81 0,82 +

-l F. 80= 86% 21= 70% 18= 95% 41= 93%


(casal ) 93 30 19 44
(casais) P. 0,69 0,64 0,85 0,68

-R F. 237= 88% 77= 82% 74= 89% 85= 94%


(cor ) 268 94 83 90
(cores) P. 0,65 0,67 0,64 0,71

-ão F. 173= 86% 31= 72% 61= 84% 81= 96%


(dentão ) 200 43 73 84
(dentões) P. 0,59 0,56 0,51 0,77

-S F. 219= 83% 87= 78% 68= 83% 64= 91%


(país ) 265 113 82 70
(países) P. 0,56 0,64 0,44 0,51

Regular oxíto- F. 134= 72% 38= 57% 51= 25% 44= 86%
no e monossí- 185 67 66 51
labo tônico P. 0,38 0,38 0,38 0,36

Regular propa- F. 81= 52% 15= 31% 28= 47% 38= 79%
roxítono 156 48 60 48
P. 0,21 0,16 0,19 0,32

Regular paro- F. 2604= 50% 600= 32% 913= 52% 1076= 67%
xítono 5242 1875 1750 1602
P. 0,17 0,19 0,16 0,17

Os resultados acima nos permitem ver com mais clareza a oposição

entre os diversos graus de saliência. Há uma oposição nítida entre as


140

probabilidades associadas dos três primeiros fatores do topo e aos três

últimos da base da escala, para todos os falantes de qualquer nível de

escolarização.

Os três primeiros fatores favorecem nitidamente a concordância

nominal e os três últimos desfavorecem-na. Verifica-se aí a forte influência da

diferenciação material fônica na relação singular/plural. O que importa para a

oposição entre as três primeiras e as três últimas categorias é a

diferenciação material fônica na oposição singular/plural. Nos falantes do

primário e colegial, constata-se inclusive uma suboposição entre o plural

duplo e os itens em -l e em -R. As três últimas categorias, todas de plural

regular, mostram novamente a oposição entre os oxítonos e os paroxítonos

para todos os agrupamentos de falantes. Os proparoxítonos, exceto para os

falantes do colegial, continuam a se comportar como os oxítonos.

Praticamente tudo que dissemos acima já foi dito nas páginas

anteriores. O formato de apresentação é, contudo, mais explícito. É na parte

que diz respeito aos fatores flutuantes - os constituídos pelos itens

terminados em ão e em -S - que isto se dá com precisão, chegando a trazer

novidades nesta nova forma de se analisarem os dados. Existindo alguma

aproximação entre o comportamento dos itens em -ão e dos regulares, ela

não vai se dar com qualquer regular, mas com os regulares oxítonos.

Mesmo assim, há uma distância considerável entre estes e aqueles. Entre os

nomes em -ão e os regulares paroxítonos, há um distanciamento muito

acentuado. Mesmo que esteja se processando a regularização dos itens em

-ão, ela ainda está longe de se completar. Com relação


141

aos itens em -S, verifica-se, também, que seu ponto de maior contato é com

a subclasse dos regulares constituída pelos regulares oxítonos, e não com

qualquer item regular.

Mostramos então que não podemos reduzir a escala da saliência

para a concordância nominal a uma oposição binária em termos de itens que

terminam em consoante e itens que terminam em vogal, como o faz Guy

(1981a), para qualquer falante do Português. Apontamos evidências de que a

escala da saliência, não tão regular como supúnhamos, atua no

funcionamento sincrônico de uma gramática. Algumas diferenças são

constatadas em função dos anos de escolarização dos falantes. As mais

evidentes são: (1) a ordem dos itens em -ão e em -S na escala da saliência e

(2) a oposição entre os proparoxítonos e os demais regulares. Nos outros

cinco fatores, a influência é bastante semelhante para os três

subagrupamentos de falantes. Nos dados aqui estudados, não se constata,

portanto, a Saliência fônica funcionando de forma muito diferente em função

dos anos de escolarização do falante, conforme constatara Braga (1977) e

mesmo Scherre (1978). Esta variável é realmente polêmica, permanecendo

ainda em aberto o número de suas subcategorias e a sistematicidade da

influência de algumas delas. O que não permanece em aberto é a existência

de sua forte influência numa oposição não binária.

A discussão a respeito de a concordância de número entre os

elementos do SN estar em processo de mudança lingüística e de o Princípio

da saliência ter alguma função neste processo será levada a termo no

capítulo 8, onde apresentamos outros resultados em função de novos


142

subagrupamentos de falantes. No próximo item, vamos discutir a relação

também polêmica entre três variáveis amplamente estudadas: Posição linear,

Classe gramatical e Marcas precedentes.

6.2.3 - Três variáveis relacionadas: Posição linear, Classe


gramatical e Marcas precedentes

6.2.3.1 - Introdução

A Posição linear que o elemento ocupa no SN, a sua Classe


gramatical e a natureza das Marcas a ele precedentes têm sido consideradas

como variáveis muito importantes para dar conta do fenômeno do

cancelamento ou da inserção do -S final, especialmente quando este

segmento é uma marca de plural. Todavia, estas três variáveis nunca foram

consideradas separadas, numa mesma análise. Apenas Poplack (1980a)

observa o efeito destas três variáveis através da (1) Classe gramatical e do

(2) cruzamento entre Marcas precedentes e Posição. A grande maioria dos


demais estudiosos privilegiaram a análise que considera apenas o efeito da

Posição e Marcas precedentes como duas variáveis distintas, sem observar

o efeito da Classe gramatical. Um dos estudiosos, Guy (1981b), chega a

estabelecer um paralelo entre o efeito da Classe gramatical no Espanhol de

Porto Rico e o efeito da Posição no Português do Brasil, sem, contudo, fazer

menção ao cruzamento das restrições Marcas precedentes e Posição

efetuado por Poplack (1980a), na análise do Espanhol de Porto Rico.


143

Vamos apresentar, neste trabalho, uma abordagem analítica que

considera, inicialmente, estas três variáveis separadamente, verificando

todas as inter-relações entre elas através da observação minuciosa dos

dados que temos em mãos, objetivando, assim, fornecer uma descrição mais

adequada e uma explicação mais satisfatória do fenômeno lingüístico sob

estudo.

6.2.3.2 - Sobre a Posição linear

A variável Posição tem sido normalmente caracterizada em função do

local que o elemento analisado ocupa no SN no sentido estritamente linear,

conforme se observa no quadro 6.2.3.1.58 Este quadro apresenta as

subdivisões que têm sido consideradas pelos pesquisadores do assunto,

bem como exemplos extraídos de nossos corpus, com a indicação, entre

parêntesis, das terminologias alternativas utilizadas.

Todos os trabalhos realizados até o presente momento apresentam,

com relação a esta variável, uma conclusão uniforme: a primeira posição do

SN é a mais marcada, num índice probabilístico nunca inferior a 0,70; e as

demais posições evidenciam um índice baixo de marcas, estabelecendo-se

assim uma oposição forte com relação ao que ocorre com o primeiro

elemento do SN. No que diz respeito ao comportamento dos elementos da

segunda posição em diante, alguns estudiosos encontram uma perfeita linha

decrescente, enquanto outros não. Estes chegam, às vezes, a verificar um

aumento de inserção de marcas nas últimas posições.


144

QUADRO 6.2.3.1
EXEMPLOS DE POSIÇÃO LINEAR DO ELEMENTO NO SN
POSIÇÕES EXEMPLOS
Primeira posição as perna toda marcada (Man14,mp,59a)
(posição zero ou suas tias (Glo11,fg,48a)
distância zero) coisas lindas (Dor29,fg,44a)
do meus pais (Joa10,fp,27a)
representante diretos (Jov26,mg,32a)
grande viagis (Glo48,fc,52a)
Segunda posição todas as casas (Hel44,fc,44a)
(posição 1 ou do meus pais (Joa10,fp,27a)
distância 1) os mesmos direitos (Val24,fg,15a)
as boas ações (Ire17,fp,52a)
coisas lindas (Dor29,fg,44a)
doze latinha (Jup06,fp,18a)
as porta aberta (Sam01,mp,18a)
Terceira posição as duas palavras (Hel34,fg,62a)
(posição 2 ou os mesmos direitos (Val24,fg,15a)
distância 2) todas as casas (Hel44,fc,44a)
essas estradas nova (Mar47,fc,53a)
coisas até ligadas (Pit37,mc,25a)
uns amigos meus (Hel34,fg,62a)
três colega meu (Joa25,mg,39a)
essas bestera toda (Fat23,fg,15a)
Quarta posição os meus quatro filhos (Dal18,fp,71a)
(posição 3 ou do meus dez anos (Nil12,fp,45a)
distância 3) do meus próprios filho (Glo48,fc,52a)
as minhas duas filha (Ire17,fp,52a)
os piores nomes feios (Ire17,fp,52a)
esses políticos aí chaguistas (Pac20,mg,25a)
as conta quase toda (Mag47,fc,53a)
os documento dela todinho (Jro64,mg,14a)
Quinta e sexta os meus ainda velhos amigos (Gus62,mg,11a)
posição as três coisa mais importante (Hel44,fc,44a)
(posição 4 e 5 ou aquelas pessoas assim bem (Jos35,fp,59a)
distância 4 e 5) esquisitinha
as mulheres ainda muito mais (Hel44,fc,44a)
antiga

Para maior clareza na discussão desta variável, vamos apresentar um

breve resumo dos trabalhos sobre o assunto, por ordem cronológica.


145

Braga & Scherre (1976), num trabalho pioneiro sobre o assunto,

analisam a influência da Posição (denominada Distância) e concluem que a

oposição geral detectada é entre a primeira e as demais posições no SN,

favorecendo e desfavorecendo, respectivamente, a aplicação da regra (cf.

p.472). Scherre (1978), falando sobre estes mesmos resultados, observa o

seguinte:

As duas classes - média e baixa - apresentam ainda


uma ligeira elevação quando se passa da distância
2 para a 3. A diferença entre as probabilidades para
estas distâncias é de respectivamente 0,10 e 0,05.
A diferença da classe baixa é totalmente irrelevante.
A da classe alta poderia refletir alguma tendência -
elevação da probabilidade a partir da distância três -
mas o número de dados é muito baixo para
apresentarmos essa conclusão. (SCHERRE, 1978,
p.44)

Braga retomou o estudo da variável Posição, ainda denominada

Distância, e concluiu que, para os falantes da classe baixa e média, a

probabilidade de aplicação da regra é mais elevada na primeira posição,

abaixando-se progressivamente nas segunda/terceira posições, e nas

quarta/quinta posições (cf. BRAGA, 1977, p.58-59).

Scherre também reanalisou esta variável, concluindo que, para os

falantes escolarizados e semi-escolarizados, a primeira posição do SN

é a que mais favorece a inserção de marca de plural


(...) Em ambos os grupos estudados, há também
uma queda considerável entre os números
probabilísticos da posição zero(primeiro elemento) e
posição um(segundo elemento) (SCHERRE, 1978,
p.84)

Scherre (1978) observa todavia que, enquanto o grupo escolarizado

apresenta "a oposição básica entre a posição zero - favorecendo a


146

aplicação da regra - e a posição não zero - desfavorecendo-a" (p.85), o grupo

semi-escolarizado evidencia "uma linha decrescente em termos de

favorecimento, partindo da posição 0(zero) até a posição 4(quatro)". (p.85)

Scherre observa ainda que, com relação à posição 4(quinto elemento), a

probabilidade de aplicação da regra sobe no grupo escolarizado e desce no

grupo semi-escolarizado, evidenciando-se duas direções opostas. Considera,

entretanto, que o número escasso de dados impossibilita também qualquer

conclusão definitiva a respeito do comportamento desta última posição (cf.

p.84).

Ponte (1979), da mesma forma que Scherre (1978), conclui que a

primeira posição é o fator que mais favorece a aplicação da regra. Constata,

também, uma queda forte na segunda posição e, a partir desta, uma linha

decrescente em termos de favorecimento de aplicação da regra. Na quinta

posição, há apenas um dado, impossibilitando qualquer conclusão segura a

seu respeito (cf. PONTE, 1979, p.160-1).

Carvalho Nina (1980), por sua vez, conclui que a aplicação da regra

ao primeiro elemento do SN é quase categórica no sentido positivo,

ocorrendo novamente uma queda brusca em relação às demais posições, as

quais apresentam uma escala decrescente (cf. p.104-5).59

Guy (1981a), semelhantemente aos pesquisadores anteriores, conclui

que a primeira posição do SN é a que mais favorece a marca de plural,

havendo uma passagem brusca para a segunda posição e uma escala

decrescente a partir do segundo elemento do SN (cf. p.179).

Todos os pesquisadores envolvidos concluem que a variável Posição

é a mais importante de todas, no sentido de exercer uma influência


147

polarizada e uniforme sobre a regra de concordância de número entre os

elementos do SN em Português. Além disso, todos eles explicam este

condicionamento em função do fenômeno da redundância: "repetição

explícita de sinais que não trazem nova informação à já existente."

(BIDERMAN, 1968, p.11)

Considera-se, então, de forma geral, que o mecanismo da

concordância não constitui uma necessidade lógica das línguas, pois uma

marca formal ou semântica de plural em algum ponto no SN é suficiente

para se transmitir a informação desejada (cf. ALI, 1971, p.279). Como se

afirma que em Português marca-se preferencialmente a primeira posição, as

demais marcas tornam-se desnecessárias (cf., por exemplo, SCHERRE,

1978, p.104-5).60 A visão que subjaz à explicação do comportamento desta

variável é, portanto, funcionalista, no sentido de Kiparsky (1972) (cf. p.195;

cf., também, MARTINET, 1973, p.181-5 e HAIMAN, 1983, p.801-8). Já é do

nosso conhecimento que as Condições de Distintividade de Kiparsky

estabelecem que há uma tendência para a informação semanticamente

relevante ser retida na estrutura superficial (cf. 1972, p.195), podendo,


conseqüentemente, cancelarem-se informações redundantes.

Pretendemos então reanalisar a variável Posição linear do elemento

no SN com o objetivo de reavaliar conclusões tão fortemente estabelecidas,

verificando se a hipótese funcionalista do tipo kiparskiana dá realmente conta

do fenômeno em estudo.
148

6.2.3.3 - Sobre a Classe gramatical

A influência da Classe gramatical sobre a variação de marcas de

plural no SN foi estudada por Cedergren (1973), Poplack (1980a) e Lefebvre

(1981).

Cedergren (1973), analisando o Espanhol do Panamá, conclui que,

nos casos do -S morfema de plural, os determinantes inibem a forma 0(zero)

e os substantivos e adjetivos favorecem-na (cf. p.46).

Poplack, analisando o Espanhol de Porto Rico, conclui também que

os determinantes desfavorecem o cancelamento do -S plural, enquanto os

adjetivos e substantivos favorecem-no. Poplack afirma ainda que, além de

Cedergren (1973), Ma & Herasimchuck (1968) e Terrell (1976) encontraram

resultados análogos em outros estudos de outros dialetos hispânicos (cf.

p.60).

Há, todavia, pequenas diferenças entre as conclusões de Cedergren

e Poplack. A primeira autora observa que os adjetivos têm mais chances de

reterem a marca do que os substantivos (cf. CEDERGREN, 1973, p.46). E a

segunda verifica, contrariamente, que os adjetivos têm menos chances de

serem marcados do que os substantivos, embora a diferença entre estas

duas classes seja bem pequena (cf. POPLACK, 1980a, p.61).

Lefebvre (1981), em "Variation in plural marking: the case of Cuzco

Quechua", analisa também a influência da Classe gramatical sobre a

presença de marcas plurais nos nomes em termos de: nomes, pronomes e

interrogativos+nomes, concluindo que esta variável não tem signi-


149

ficância sobre a aplicação desta regra (cf. p.80). Este caso é, todavia,

diferente de todos os demais arrolados acima, pois não envolve o fenômeno

de concordância nominal, inexistente nesta língua, mas sim a presença ou

ausência de marcas plurais nos nomes e pronomes.

Em nossa pesquisa, não consideramos apenas a subdivisão tríplice,

até então apresentada. Fizemos uma categorização mais detalhada,

resumida e exemplificada no quadro 6.2.3.2, na página seguinte.


150

QUADRO 6.2.3.2
EXEMPLOS DE CLASSE GRAMATICAL DOS ELEMENTOS NO SN
CLASSES EXEMPLOS
Substantivo problemas assim maiores (Lau28,fc,43a)
essas carne congelada (Jan03,mp,56a)
das otas famílias (Pac20,mc,25a)
Categoria trabalha uma, as outras fica (Jos35,fp,59a)
substantivada os próprio do lugar (Edp13,mp,62a)
a gente procura ouvir as coisas (Ire17,fp,52a)
boas e as ruins a gente
Pronome delas todas (Dor29,fg,44a)
pessoal de todos eles (Jan03,mp,56a)
3a. pessoa todos ele (Jan03,mp,56a)
Adjetivo novas escolas (Gus62,mg,11a)
coisas assim fabulosas (Mor45,mc,51a)
umas casinha bunitinha (Jup06,fp,18a)
Quantificador todos os anos (Sam01,mp,18a)
eles todos (Dal18,fp,71a)
aquelas cruzinha toda (Geo31,mg,58a)
Possessivo suas tias (Glo11,fg,48a)
no meus filhos (Edb07,mp,41a)
uns colega meu (Geo3l,mg,58a)
Adjetivo 2 determinadas discussões (Pac20,mg,25a)
os próprios vagabundo (Dav42,mc,31a)
eles mesmo (Rob15,mp,22a)
Indefinido alguns meses (Sam01,mp,18a)
os outros colégios (Sue05,fp,24a)
diversas perguntas (Rob15,mp,22a)
Artigo e essas carne congelada (Jan03,mp,56a)
demonstrativo todos os anos (Sam01,mp,18a)
umas pessoas ricas (Joa10,fp,27a)

Os rótulos categoriais do quadro 6.2.3.2 seguem basicamente a

terminologia tradicional. Diferem apenas com relação a dois tipos de

adjetivos e com relação à categoria substantivada.


151

Os itens do tipo determinado, mesmo e próprio são de classificação

controvertida. Ora são considerados como adjetivos (cf. LEMLE, 1984,

p.150), ora como demonstrativos (cf. BECHARA, 1982, p.266), ora como

identificadores (cf. LOBATO, 1986, p.120). Estes casos foram colocados

numa só categoria rotulada de adjetivo 2. Os demais adjetivos (avaliativos ou

não, deverbais, indicativos de cor, nacionalidade etc.) ficaram sob o rótulo de

adjetivo.

A categoria substantivada envolve todas as classes gramaticais

(adjetivos, possessivos e indefinidos) que ocorrem em SNs que não têm um

substantivo ou um pronome pessoal como núcleo (ver exemplos no quadro

6.2.3.2).

Esta classificação mais detalhada tem como objetivo final verificar a

relação entre Classe gramatical e Posição a ser discutida no item 6.2.5.4,

buscando, assim, explicação para a influência da variável Classe gramatical.

Como vamos ver no item seguinte, normalmente tenta-se "explicar" a sua

influência em função da variável Posição.

6.2.3.4 - Relação entre Classe gramatical e Posição

Guy (1981b), em "Parallel Variability in American Dialects of Spanish

and Portuguese", estabelece uma relação direta entre a variável Classe

gramatical, conforme estudada para o Espanhol de Porto Rico por Poplack, e

a variável Posição do elemento no SN, conforme estudada por ele para o

Português popular do Brasil.


152

A tabela apresentada por Guy (cf. 1981b, p.90) encontra-se

reproduzida a seguir.61

EFEITO PARALELO DA POSIÇÃO NO SN SOBRE A MARCA DE PLURAL


CLASSE GRAMATICAL DO ELEMENTO DO SINTAGMA NOMINAL
Determinante Nome Adjetivo
Espanhol de
Porto Rico
(POPLACK, 1980b) 0,74 0,43 0,31
POSIÇÃO DO ELEMENTO NO SINTAGMA NOMINAL
Primeira Segunda Terceira
Português do
Brasil
(GUY, 1981a) 0,93 0,43 0,34

Com base nos resultados probabilísticos acima, Guy afirma que

é claro que os efeitos são virtualmente idênticos, exceto


para a primeira posição. A pequena discrepância é sem
dúvida devida à ocorrência do determinante lo (de los)
nos dados de Poplack. (GUY, 1981b, p.90)62

Guy considera ainda que, se os casos de lo fossem retirados dos


dados de Poplack, a discrepância entre determinante e primeira posição

seria reduzida ou até eliminada (cf. 1981b, p.90).

Discordamos da correlação estabelecida acima por uma série de

razões. A primeira delas diz respeito à distribuição do substantivo e do

adjetivo na segunda e na terceira posição, que pode ser vista no quadro

6.2.3.3, na página 154.63 Com base nos dados dos falantes adultos,

podemos ver que o percentual de ocorrências de substantivos na terceira

posição - 8,7% (514 em 5871 casos) - não é tão baixo para ser despre-
153

zado, embora a maioria dos substantivos ocorram na segunda posição:

88,5% (5196 em 5871 ocorrências). Em verdade, o número de substantivos

na terceira posição - 514 - é maior do que o número de adjetivos nesta

mesma posição: 307, ou seja, 53% dos casos de terceira posição são

substantivos (514/968) e 31%, adjetivos (307/968).

Além do mais, há um grande número de adjetivos na segunda

posição: 163 em 518 casos, perfazendo 31,5% dos casos de adjetivos,

percentual também significativamente alto para ser ignorado. Não há dúvidas

de que o número de adjetivos da segunda posição (163) é quase irrelevante

em relação ao número de substantivos nesta mesma posição (5196), mas

não o é em relação ao número de adjetivos de todas as posições (518).

Portanto, se igualarmos segunda posição e substantivo, deixaremos

de captar qualquer regularidade que envolva outras classes gramaticais que

ocorram nesta posição, pois a maioria dos casos que ocorre aí é exatamente

de substantivos (5196/5781=88,5%). Se igualarmos também terceira posição

e adjetivo, deixaremos de ver como se comporta o substantivo nesta posição,

além de podermos estar estabelecendo conclusões falsas a respeito do

comportamento do adjetivo.
154

TABELA 6.2.3.3
DISTRIBUIÇÃO DOS DADOS DOS FALANTES ADULTOS EM FUNÇÃO DA
CLASSE GRAMATICAL E DA POSIÇÃO DOS ELEMENTOS NO SN
CLASSE POSIÇÃO
Primeira Segunda Terceira Total

Substantivo 153= 95% 2777= 53% 317= 62% 3247= 56%


161 5196 514 5871
Categoria xxx 60= 65% 16= 70% 76= 66%
substantivada 93 23 116

Pronome 12=100% 27= 82% xxx 39= 87%


pessoal de 12 33 45
3a. pessoa

Adjetivo 47= 98% 125= 77% 125= 41% 297= 57%


48 163 307 518

Quantificador 133=100% 3= 43% 22= 20% 158= 64%


133 7 108 248

Possessivo 184=100% 130= 96% 2= 17% 316= 95%


184 135 12 331

Adjetivo 2 9= 90% 21= 78% 3=100% 33= 80%


10 28 3 41

Indefinido 424= 99% 45= 94% 0= 0% 469= 98%


429 48 1 478

Artigo e 3268= 97% 75=100% xxx 3343= 97%


demonstrativo 3363 75 3438

Total 4230= 97% 3263= 56% 485= 50% 7978= 72%


4340 5778 968 11086

É possível, inclusive, levantar a hipótese de que a discrepância entre

a probabilidade da primeira posição, para o Português do Brasil, e a dos

determinantes, para o Espanhol de Porto Rico, ocorra pela interfe-


155

rência natural entre as duas variáveis consideradas por Poplack: Classe e

Marcas precedentes em função da posição (cf. 1977, p.13-6 e 1980a, p.61-

2). Os resultados utilizados por Guy são, todavia, obtidos de uma análise que

trabalha apenas com a variável Posição, sem observar, portanto, a influência

da Classe gramatical (cf. 1981b, p.86).64

Outro aspecto importante que nos leva a questionar a correlação

estabelecida por Guy (1981b) é que ela se aplicaria mais apropriadamente a

SNs de três ou mais elementos e, especialmente, a SNs de estrutura

[determinante + substantivo + adjetivo]. O seu texto não é suficientemente

explícito para sabermos com quais SNs ele trabalhou. Vamos observar,

portanto, o comportamento do determinante, do substantivo e do adjetivo,

sob dois aspectos: (1) em SNs de três ou mais elementos; (2) em todos os

SNs da amostra. Neste segundo caso, consideramos também os dados das

crianças, a fim de mostrarmos a generalidade do fenômeno.65

Os valores percentuais obtidos para os SNs de três ou mais

constituintes encontram-se na tabela 6.2.3.4. Observando as percentagens

desta tabela, constatamos que o efeito das variáveis Classe gramatical e

Posição é bastante paralelo. Entretanto, se compararmos o número de

ocorrências dos adjetivos com o número de ocorrências dos elementos da

terceira posição, é possível verificarmos novamente que, embora haja

similaridade percentual, não há realmente identidade entre o número de

adjetivos (347) e o número de elementos da terceira posição (822).


156

TABELA 6.2.3.4
SOBRE O EFEITO PARALELO DA POSIÇÃO EM TODOS OS SNS DE
TRÊS OU MAIS ELEMENTOS DOS FALANTES ADULTOS
CLASSE Determinante Substantivo Adjetivo
796/881 = 90% 534/917 = 58% 162/347 = 50%
POSIÇÃO Primeira Segunda Terceira
711/792 = 90% 339/531 = 64% 442/822 = 54%

Fazendo-se o cruzamento entre Classe gramatical e Posição,

podemos obter os resultados percentuais relacionados na tabela 6.2.3.5, na


página seguinte.

Os resultados desta tabela, a seguir, mostram, claramente, que não

se pode estabelecer um paralelo entre determinante e primeira posição;

substantivo e segunda posição; adjetivo e terceira posição. Mesmo nos SNs

de três ou mais constituintes, o paralelo assim feito encobre fatos

importantes:

1) determinantes na segunda posição são até mais marcados do que

na primeira;

2) os substantivos têm mais chances de serem marcados na terceira

posição do que na segunda;

3) os adjetivos, inversamente aos substantivos, se apresentam mais

marcados na segunda do que na terceira posição.


157

TABELA 6.2.3.5
CRUZAMENTO DE POSIÇÃO E CLASSE GRAMATICAL EM DE TODOS
OS SNS DE TRÊS OU MAIS ELEMENTOS DOS FALANTES ADULTOS
Primeira Segunda Terceira
posição posição posição
Determinante 668/759 = 89% 118/121 = 96% 0/1 = 0%
Substantivo 33/33 = 100% 184/370 = 50% 317/514 = 62%
Adjetivo xxx 37/40 = 92% 125/307 = 41%

Com relação ao fato de os determinantes apresentarem menos

marcas na primeira posição, é importante observar que neste caso os

determinantes não marcados se encontram inseridos numa estrutura

sintagmática bastante peculiar, ou seja, ocorrem nas seqüências do tipo

[artigo ou demonstrativo + possessivo + substantivo] (casa do meus pais),

das quais falaremos posteriormente.

Considerando, agora, todos os dados que envolvem alguns

"determinantes" (artigos, demonstrativos, indefinidos) e os substantivos e os

adjetivos acompanhados por estes determinantes, é possível, não apenas

reafirmarmos o comportamento diferenciado das classes em relação à

posição como, também, evidenciarmos que o paralelo entre Classe e

Posição não se pode mais estabelecer, nem em termos percentuais,

conforme visto através dos resultados da tabela 6.2.3.4.

As tabelas 6.2.3.6 e 6.2.3.7, dos adultos e das crianças,

respectivamente, confirmam o que dissemos nas páginas anteriores: os

substantivos são menos marcados do que os adjetivos na segunda posição e

mais marcados do que estes na terceira.


158

TABELA 6.2.3.6
CRUZAMENTO DE POSIÇÃO E CLASSE GRAMATICAL EM TODOS OS
DADOS DOS FALANTES ADULTOS
Primeira Segunda Terceira
posição posição posição
Determinante 3692/3792= 97% 120/123 = 96% 0/1 = 0%
Substantivo 153/161 = 95% 2277/5196= 53% 17/514 = 62%
Adjetivo 47/48 = 98% 125/163 = 77% 15/307 = 41%

TABELA 6.2.3.7
CRUZAMENTO DE POSIÇÃO E CLASSE GRAMATICAL EM TODOS OS
DADOS DAS CRIANÇAS
Primeira Segunda Terceira
posição posição posição
Determinante 752/768 = 98% 20/23 = 87% xxx
Substantivo 16/18 = 89% 424/1057 = 40% 46/86 = 53%
Adjetivo 4/4 =100% 18/18 =100% 16/40 = 42%

Através destas tabelas, percebe-se também que qualquer classe

gramatical que esteja na primeira posição tende a ser mais marcada.

Totalizando-se os dados de Classe gramatical e Posição, verifica-se, ainda,

que o paralelo entre Classe e Posição conforme estabelecido por Guy

(1981b) não mais se estabelece.

Colocando-se os totais em uma outra tabela, a 6.2.3.8, para maior

clareza, observa-se, em termos percentuais, que os adjetivos são mais

marcados do que os substantivos e que a segunda posição e a terceira

posição são igualmente marcadas. Para a Posição, tais resultados não

chegam a ser surpreendentes. Como vimos nos resumos feitos, o que parece

ocorrer, em linhas gerais, é uma oposição entre primeira e demais


159

posições. Mas, com relação à Classe, estes resultados se assemelham mais

aos encontrados por Cedergren (1973) do que aos de Poplack (1980 e

1981).

TABELA 6.2.3.8
PARALELO ENTRE POSIÇÃO E CLASSE GRAMATICAL EM TODOS OS
DADOS
CLASSE GRAMATICAL
Determinante Substantivo Adjetivo
Adultos 3812/3916 = 97% 3247/5871 = 55% 297/518 = 64%
Crianças 772/791 = 98% 486/1161 = 42% 38/62 = 61%
POSIÇÃO DO ELEMENTO NO SN
Primeira Segunda Terceira
posição posição posição
Adultos 3892/4001 = 97% 3022/5482 = 55% 442/822 = 54%
Crianças 772/790 = 98% 462/1098 = 42% 62/126 = 49%

Já sabemos que Cedergren, em 1973, afirma que os adjetivos têm

mais chances de reterem a marca (63%) do que os substantivos (44%) (cf.

p.46) e que, em 1980, Poplack apresenta resultados indicando que os

substantivos é que têm probabilidade mais alta (0,43) de reterem a marca do

que os adjetivos (0,31) (cf. 1980a, p.63). Mas, em 1981, Poplack apresenta

resultados ligeiramente diferentes, evidenciando-se que o comportamento do

substantivo (0,40) praticamente se iguala ao do adjetivo (0,38) em termos

probabilísticos (cf. p.61).

Observamos finalmente que o único caso de determinante na terceira

posição posposto ocorre com o indefinido qualquer em "esses ne-


160

gócio qualquer", o que sugere que ele deveria ser reclassificado como

adjetivo 2, que pode também ocorrer esporadicamente posposto ao núcleo

do SN.

Os fatos até aqui apresentados já são suficientes para nos levarem a

duvidar do efeito paralelo entre Classe e Posição e nos conduzirem a

introduzir a variável Classe gramatical ao lado da variável Posição, se

quisermos ter uma compreensão mais clara do fenômeno em estudo.

Todavia, outra questão sobre a distribuição das classes pelas

posições ainda merece ser levantada: a que diz respeito à classe

determinante. Não sabemos quais elementos Cedergren (1973) e Poplack

(1980 e 1981) colocam sob este rótulo. Até aqui, consideramos apenas o

artigo, o demonstrativo e o indefinido, embora, em Português, o possessivo e

o quantificador todo sejam também classificados desta forma. Mas tanto o

possessivo quanto o quantificador podem ocorrer nas três posições do SN,

diferentemente dos outros determinantes e, além disso, a freqüência de suas

marcas é função de suas posições de ocorrência, conforme se constata na

tabela 6.2.3.9, a seguir.

TABELA 6.2.3.9
RELAÇÃO ENTRE POSSESSIVO, QUANTIFICADOR E POSIÇÃO
Primeira Segunda Terceira
posição posição posição
Possessivo
Adultos 184/184 = 100% 130/135 = 96% 2/12 = 17%
Crianças 42/43 = 100% 24/25 = 96% 2/4 = 50%
Quantificador
Adultos 133/133 = 100% 3/7 = 43% 22/108 = 20%
Crianças 23/23 = 100% xxx 1/5 = 20%
161

O possessivo se comporta como qualquer determinante quando

ocorre na primeira e segunda posição. Na terceira, com pouca freqüência,

apresenta um baixo índice de marcas. No caso dos adultos, 41% das

ocorrências são de segunda posição e, nas crianças, 35%. Estes percentuais

são bastante elevados para serem ignorados, em termos de uma análise que

iguala a segunda posição à classe substantivo.

O quantificador, por sua vez, ocorre com freqüência alta na terceira

posição: 43%(108/248), contra 54%(133/248) na primeira posição,

considerando-se apenas os dados dos adultos, de maior freqüência. Na

primeira posição, ele é categoricamente marcado e, na terceira, apresenta

um índice de marcas de apenas 20%. Podemos ver, portanto, que o

percentual de ocorrência do quantificador na terceira posição é também alto

e não pode ser deixado de lado. A freqüência do quantificador é baixa na

segunda posição e, neste caso, ele se apresenta com 43% das marcas.

Estes casos são de uma estrutura bastante típica: [pronome

pessoal+quantificador] (eles todos).

Verificamos assim que (1) só a variável Posição não dá conta de


captar o alto índice de marcas do possessivo, e de outros determinantes,

tanto na primeira quanto na segunda posição e que (2) só a variável Classe

não dá conta do baixo índice de marcas do possessivo e do quantificador na

terceira posição. É necessário, no mínimo, que se trabalhe com as duas

variáveis, separadas ou cruzadas, ou com alguma outra que dê conta da

relação entre as duas.

O comportamento do possessivo e do quantificador na terceira

posição assemelha-se mais ao dos adjetivos do que ao dos determinantes. A

característica distribucional que têm em comum é exatamente a de es-


162

tarem na terceira posição ou, em outras palavras, estarem pospostos ao

núcleo do SN.

A grande diferença entre o possessivo e o quantificador da segunda

posição, por sua vez, se dá em função também da sua relação com o núcleo

do SN. Dos 135 casos de possessivo desta posição, 130 são antepostos.

Dos sete casos de quantificador desta mesma posição, todos são pospostos.

Oportunamente voltaremos a falar da relação que o elemento nominal não

nuclear estabelece com o seu núcleo dentro do SN.

Com relação ao quantificador, é importante, ainda, abrirmos um

parêntesis e observarmos que, dentre os 133 casos dos dados dos falantes

adultos que ocupam a primeira posição, 69 estão em SNs de dois elementos.

Dentre estes, 16 casos são do tipo que poderiam ser interpretados como SNs

de três constituintes sem a marca no quantificador da primeira posição.

Então, casos como "em todos lado tem assalto", codificados como um SN de

dois constituintes, poderiam ser analisados como "em tod' os lado tem

assalto". Optamos por analisar tais SNs como de dois constituintes e com

marca no quantificador, porque todos os demais casos têm marca no


quantificador da primeira posição. Outra solução que hoje nos ocorre seria

tê-los considerado como neutralizados e, conseqüentemente, tê-los

eliminado da nossa análise. Isto entretanto não foi feito no momento

adequado.

Focalizando agora a relação entre classe e primeira posição, com

base nos dados dos adultos (ver tabela 6.2.3.3, p.156), observa-se que,

dentre os 4340 dados da primeira posição, 87% dos casos(3792/4340) são

artigos, demonstrativos e indefinidos. Embora a maioria dos casos que aí

ocorram sejam de determinante por excelência, qualquer classe que ocupe

esta posição tende a ter marcas num nível percentual próximo


163

a 90%, conforme se constata novamente na tabela 6.2.3.10, a seguir, para os

adultos e para as crianças. O paralelo entre Classe e Posição deixa,

portanto, mais um fato não explicitado.

A afirmação mais correta, então, é que a primeira posição do SN é

percentualmente a mais marcada, independente da classe gramatical,

embora o substantivo seja um pouco menos marcado do que as demais

classes. Já observamos também que a maioria dos casos não marcados

nesta posição encontram-se numa estrutura sintagmática bastante regular.

São eles os artigos e demonstrativos (deste segundo tipo há apenas dois

dados) seguidos de um possessivo e um substantivo, como se vê nos

exemplos abaixo:

- interferir no meus problemas (Val24,fg,15a);

- não bate no teus filho (Mgl47,fc,53a);

- vou com a minhas colegas (Val24,fg,15a) e

- eu e o meus colega, entendeu (Man14,mp,59a).


164

TABELA 6.2.3.10
PRIMEIRA POSIÇÃO DO SN E CLASSE GRAMATICAL
CLASSE FALANTES
Adultos Crianças
Substantivo 153/161 = 95% 16/18 = 89%
Pronome pessoal 12/12 = 100% xxx
Adjetivo 47/48 = 98% 4/4 = 100%
Quantificador 133/133 = 100% 23/23 = 100%
Possessivo 184/184 = 100% 42/43 = 98%
Adjetivo 2 9/10 = 90% xxx
Indefinido 424/429 = 97% 80/80 = 100%
Art. e dem. 3268/3363 = 97% 672/688 = 98%

Dentre os dados das crianças (19) e dos adultos (110), temos 129

ocorrências não marcadas na primeira posição. Das 129, 112 são de artigos

e demonstrativos. Dos 112 casos, 94 estão inseridos na estrutura

sintagmática em questão. Eles perfazem 73% do total de casos e 84% do

total de artigos e demonstrativos não marcados na primeira posição.

Em "O estudo da regularidade dos possessivos no Português do Rio

de Janeiro", Silva afirma que o falante tende a não analisar a contração do

tipo no e po como dois morfemas: preposição e artigo (cf. 1982, p.389). Os

nossos dados sugerem que o falante pode estar analisando esta contração

como uma preposição, ou seja, como uma categoria que não se flexiona e,

portanto, não apresenta marcas de plural. Esta possibilidade de reanálise

parece tão forte que chega a se estender aos artigos diante de possessivos

precedidos de preposição que não apresentam contração e mesmo àqueles

não precedidos de preposição.


165

Segundo Guy, tais fatos ocorrem devido à influência da nasal que

forma um contexto que favorece o cancelamento do -S fonético (cf. 1981a,

p.176). Mas, de acordo com esta hipótese, como se explicaria a ausência de

marcas diante do possessivo teu. Além disso, nos outros 36 casos restantes,

sem marca na primeira posição, apenas três são seguidos de nasal. É

realmente notável o número de casos não marcados versus o número de

casos marcados em estruturas com o artigo seguido de possessivo: é da

ordem de 57% (87/153), enquanto o de todos os demais casos é da ordem

de, no máximo, 5%. Vamos voltar ainda a esta discussão.

No que concerne à relação entre classe e segunda posição, verifica-

se que, dos seus 5778 casos, 90%(5196/5778) dos dados dos adultos (ver

tabela 6.2.3.3, p.156) são de substantivos; o que faz com que o seu peso

possa encobrir o de qualquer outra categoria nesta posição, se igualarmos

segunda posição a substantivo, sem estabelecermos, portanto, codificação

para posição e classe de forma distinta.

Observando, todavia, os dados da segunda posição, distribuídos

pelas classes na tabela 6.2.3.11, na página seguinte, para os dois grupos de

falantes, podemos constatar que o percentual de marcas de todas as outras

categorias que não o substantivo, à exceção do quantificador, é bastante

elevado, inclusive o dos adjetivos.

Poder-se-ia levantar a hipótese de que pelo menos o alto índice de

marcas dos possessivos da segunda posição ocorresse devido à ausência

de marcas na primeira posição (nO meus problemas). Isto não é verdade.

Retirados os 87 casos sem marca na primeira posição, do total


166

de 160 dos adultos (135) e das crianças (25), fica-se com 73, dos quais 67

são também marcados, perfazendo-se um total de 92% de marcas.

TABELA 6.2.3.11
SEGUNDA POSIÇÃO DO SN E CLASSE GRAMATICAL
CLASSE FALANTES
Adultos Crianças
Substantivo 2777/5196 = 53% 424/1057 = 40%
Cat. substantivada 60/93 = 86% 13/20 = 65%
Pronome pessoal 27/33 = 82% 3/5 = 60%
Adjetivo 125/163 = 77% 18/18 = 100%
Quantificador 3/7 = 43% xxx
Possessivo 130/135 = 96% 24/25 = 96%
Adjetivo 2 21/28 = 78% 1/1 = 100%
Indefinido 45/48 = 94% 6/9 = 67%
Art. e dem. 75/75 = 100% 14/14 = 100%

Resumindo, o estabelecimento do efeito paralelo entre Classe e

Posição proposto por Guy (1981b) impede que se veja o seguinte:

1) A terceira posição não é ocupada apenas por adjetivos; os

substantivos também ocorrem nesta posição e, inclusive, com freqüência

maior do que a dos adjetivos.

2) Os substantivos e adjetivos se comportam de forma oposta na

segunda e terceira posição.

3) Os possessivos e o quantificador se comportam como

determinantes na primeira posição e como adjetivos na terceira.


167

4) Qualquer classe gramatical que esteja na primeira posição tende a

ser muito marcada, independente de ser determinante.

5) Os artigos e os demonstrativos não marcados que ocupam a

primeira posição encontram-se inseridos numa estrutura sintagmática regular

(artigo definido + possessivo + substantivo).

6) Todas as classes que ocorrem na segunda posição, exceto o

quantificador, já comentado, têm comportamento bastante diferente do

substantivo nesta mesma posição.

Portanto, uma análise desta natureza não é adequada, uma vez que

deixa de dar conta de uma série de aspectos regulares que envolvem o

fenômeno sob estudo. Conseqüentemente, é necessário inserir as variáveis

Classe e Posição na análise dos dados, bem como pensar de que forma elas

se interagem em termos da relação entre os elementos nucleares e não

nucleares dos SNs.

É importante se ter em mente que todas as observações feitas até o

presente momento se basearam em percentagens e não em probabilidades.

Elas foram utilizadas para mostrarmos a necessidade da introdução das duas

variáveis sob foco, mas a análise final será baseada nas probabilidades, que

poderão confirmar ou não as distribuições já observadas. Antes de

passarmos à apresentação dos resultados probabilísticos, vamos falar sobre

a variável mais polêmica das três em discussão: Marcas precedentes.


168

6.2.3.5 - Sobre marcas precedentes

A variável Marcas precedentes foi considerada por todos os

estudiosos que analisaram a regra de concordância nominal, mas de formas


as mais diversas. Poplack, por exemplo, mede o efeito das Marcas

precedentes em função da Posição que o elemento ocupa no SN. Segundo

ela, esta variável apresenta um efeito muito forte sobre o cancelamento do -S

plural, atuando da seguinte forma:

(...) Uma marca imediatamente precedente leva a mais


marcas (quando S, 0S ou SS precede o dado em
questão, o cancelamento é desfavorecido) (...) e zeros
levam a zeros, um efeito que é claramente estrutural (...),
e contra funcional, no sentido de que, em vez dele
favorecer um padrão de marcas com uma marca flexional
de pluralidade, ele favorece todas as
marcas(funcionalmente redundante) ou nenhuma (perda
de função). (POPLACK, 1981, p.61. Cf., também, 1980a,
p.62-7; 1980b; p.61-2)66

Poplack coloca ainda que um efeito oposto

(...) foi encontrado por Guy e Braga para o Português


brasileiro, uma língua que marca a pluralidade no SN e
no SV da mesma forma que o Espanhol. (POPLACK,
1980a, p.64)67

O nosso objetivo, nesta parte do trabalho, é retomar a variável

Marcas precedentes de forma análoga à de Poplack e mostrar que o


Português e o Espanhol apresentam mais semelhanças do que diferenças.

Para isto, vamos evidenciar que os estudos sobre o Português que

consideraram esta variável não a trabalharam adequadamente ou deixaram

de explorar regularidades importantes. Faz-se necessário, portanto, que

apresentemos um resumo de como os diversos pesquisadores obser-


169

varam a influência desta variável em Português, antes de descrevermos o

nosso tratamento.

A forma de codificar esta variável não tem sido uniforme nos diversos

trabalhos sobre o Português e, por isto, comparações exatas não são

possíveis. Carvalho Nina (1980), por exemplo, além de fazer uma codificação

bastante diferente das demais, apresenta apenas resultados percentuais, o

que torna duplamente inviável qualquer espécie de comparação (cf. p.72-5).

Braga (1977) codifica esta restrição em termos binários: presença ou

ausência de marca formal de flexão antes do segmento analisado,

imediatamente ou não. Desta forma, todos os numerais são colocados no

fator ausência formal de marcas (cf. p.30-1). Ela conclui que este

condicionamento não é muito poderoso, mas evidencia uma leve tendência

para haver mais marcas quando há ausência de flexão antes e vice-versa (cf.

p.39). Segundo Braga,

tal comportamento evidencia uma tendência à eliminação


da redundância exigida pelas regras de concordância
nominal. (BRAGA, 1977, p.70)

Scherre (1978) codifica seus dados fazendo um cruzamento parcial

entre Marcas precedentes e Posição, sem, contudo, abandonar a variável

Posição, e conclui que a oposição maior que se pode detectar é a seguinte:

Ausência de flexão ou a sua neutralização na posição


0(zero) favorece a aplicação da regra, /enquanto/
presença de marca formal ou semântica de plural em
pelo menos um dos segmentos precedentes desfavorece
a aplicação da regra. (SCHERRE, 1978, p.110)
170

A oposição geral encontrada por Scherre é análoga à de Braga, mas,

diferentemente desta, agrupa os casos de numeral junto à presença de

marcas e não à ausência. Os resultados de Scherre mostram-se bastante

polarizados - 0,68 versus 0,32 para os falantes escolarizados e 0,82 versus

0,18 para os semi-escolarizados -, enquanto os de Braga, não - 0,56 versus

0,44 para a classe média e 0,54 versus 0,46 para a classe baixa (cf.

SCHERRE, 1978, p.109 e BRAGA, 1977, p.38).

Antes de estabelecer a conclusão geral, Scherre apresenta uma

codificação mais detalhada do que a de Braga (cf. SCHERRE, 1978,

p.74;105-9). Todavia, Scherre não explora adequadamente uma diferença

sistemática encontrada entre o efeito da presença ou ausência de marcas

antes do terceiro, quarto e quinto elementos, em SNs com marca no seu

primeiro ou segundo elemento. A presença de marcas neste caso favorece

mais marcas, enquanto a ausência favorece mais zeros, resultados estes

que apontam para a conclusão apresentada por Poplack. Scherre (1978)

chega a observar que a ausência de marcas precedendo o terceiro, quarto e

quinto elementos é o fator que mais inibe a aplicação da regra, ou seja,

favorece a forma zero no segmento seguinte. Ela chega também a observar

que é importante analisar esta variável "em termos de oposições gerais e

oposições mais específicas." (p.91).

Scherre considera ainda que as "conclusões globais explicam-se (...)

em função do fenômeno da redundância" (p.111), mas afirma que as

diferenças internas entre os diversos fatores que já apresentam uma marca

precedente receberam interpretações ad hoc, uma vez que, segundo ela,

não se conseguiu um princípio geral que desse conta do fe-


171

nômeno. Scherre observa então o seguinte:

(...) Isto indica que o grupo em si está mal definido, pois


parece não haver influência de redundância local sobre a
aplicação da regra. Seria interessante partir para a
reestruturação desse grupo em função de número de
marcas plurais precedentes. (SCHERRE, 1978, p.112-3)

Estes aspectos apontados por Scherre (1978) serão explorados neste

trabalho, utilizando-se as idéias de Poplack com o objetivo já explicitado de

mostrar que, diferentemente das conclusões gerais de Braga & Scherre

(1976), Braga (1977) e, também, Ponte (1979), Carvalho Nina (1980) e Guy

(1981a), o Espanhol e o Português têm mais semelhanças do que

diferenças.

Ponte (1979) estudou a variável em discussão de forma bastante

semelhante à de Scherre (1978), introduzindo apenas uma mudança,

sugerida por Scherre, qual seja, a de separar os numerais dos segmentos

precedentes não flexionáveis, colocando-os, portanto, separados de casos

do tipo "coisas ASSIM fabulosas" e "as ) mais ) novas" (cf. SCHERRE, 1978,

p.112 e PONTE, 1979, p.80). A conclusão geral a que chega Ponte é a

mesma de Scherre, como se pode ver pela passagem abaixo:

Segmento precedente flexionável sem marca formal ou


semântica de plural na posição 0(zero) (A) favorece a
regra, e segmento precedente com marca plural e/ou
semântica de plural (S,Z e Q) inibem-na. Há dois fatores
que estão fora desta classificação: H, que inibe a regra,
pois o segmento precedente apesar de não flexionado
está em posição não zero; R, que é constituído por
segmento precedente não flexionável e cuja baixa
probabilidade (0,08) mostra que também inibe a regra.
(PONTE, 1979, p.162)
As conclusões acima, com referência ao fator H(duas SOBRINHA

nossa), apontam também para a conclusão de Poplack: zeros levam a zeros.

Guy (1981a) retoma a variável Marcas precedentes, tentando

estabelecer um paralelo com o tratamento dado por Poplack. Não consegue,


172

todavia, chegar a conclusões novas. Ele afirma que a análise que cruza

Marcas precedentes e Posição não é elegante e é grosseira (cf. p.176) e que

aquela que considera Marcas precedentes e Posição como duas variáveis

separadas é estatisticamente melhor (cf. p.178).

Nesta nova forma de analisar, Guy também não explora a diferença

entre segmentos precedentes marcados, favorecendo mais marcas, e

segmentos precedentes não marcados na posição não zero, favorecendo,

relativamente, menos marcas. Em verdade, Guy nem chega a falar nesta

diferença e não levanta, à semelhança de Scherre (1978), a hipótese da não

influência da redundância local, no sentido de eliminação de marcas, a partir

das primeiras posições (cf. GUY, 1981a, p.179 e SCHERRE, 1978, p.112-3).

A nosso ver, Guy apresenta dois problemas na codificação de seus

dados que o impediram de ver regularidades mais fortes em direção à

análise proposta por Poplack.

Primeiro, ele codifica seqüências do tipo 00- e n0- juntas (cf. p.169-

70); temos tudo para crer que, se seqüências 00- ocorrerem (nos nossos

dados não ocorrem), elas propiciarão mais marcas no terceiro elemento,

senão corre-se o risco de se perder a informação de plural. No entanto,

seqüências do tipo n0- (TRÊS RISCO verde) provocam zeros seguintes sem

nenhuma possibilidade de perda de informação, já contida no primeiro

elemento do SN, através do numeral. Vamos retomar, oportunamente, as

supostas seqüências 000.

Segundo, ele codifica todas as seqüências de quatro elementos


173

juntas, quer as que tenham "esses" precedentes (sss- (AS PARTIDAS

TODAS iguais) ou 0ss- (dO MEUS DEZ anos)), quer as que terminem em

zero ou zeros precedentes (ss0- (OS PIORES NOME feio) ou s00- (AS

PERNA TODA marcada) ou s0m- (AS CASA MAIS antiga)) (cf. Guy, 1981a,

p.169-70). Esta junção não faz sentido dentro da proposta de Poplack de que

marcas levam a marcas e zeros levam a zeros.

Resta ainda ressaltar que todos os pesquisadores que codificaram o

numeral na variável Marcas precedentes separadamente concluíram que ele

tende a favorecer mais a presença de -S do que uma marca formal

precedente (cf. SCHERRE, 1978, p.111-2; PONTE, 1979, p.163; GUY, 1981,

P.179-80).68

As explicações para a influência positiva do numeral são, todavia,

opostas.

Scherre (1978), numa linha nitidamente funcionalista kiparskiana,

considera que o numeral favorece mais marcas nos dados dos falantes semi-

escolarizados, porque ele tem apenas marca semântica de pluralidade e

pode estar sendo menos percebido como plural do que aquele segmento

precedente que tem a marca formal e, indubitavelmente, a idéia de plural

nesta marca. Ela alega que a marca semântica de plural nos numerais pode

não estar sendo percebida pelos falantes semi-escolarizados, pois eles, às

vezes, colocam um -S, talvez pluralizador, nestes elementos, fenômeno

pouco constatado na fala dos falantes escolarizados, na qual numeral tem a

mesma influência que um segmento precedente com marca formal de plural

(cf. p.11-2).69

Guy (1981a), por sua vez, numa linha claramente não funcionalis-
174

ta kiparskiana, sugere que a influência mais forte do numeral seja resultado

de auto-monitoração e auto-correção (cf. 1981a, p.180). Afirma ele que

o contexto plural mais óbvio na fala de uma pessoa seria


seguramente em um SN contendo um número que
especificasse alguma quantidade plural. Então na
situação de entrevista, esperar-se-ia que o falante do
dialeto popular que está tentando acomodar a sua fala ao
dialeto padrão do entrevistador "se corrigisse" mais neste
ambiente plural mais óbvio. (GUY, 1981a, p.180)70

Além disso, todos os pesquisadores aludidos concluíram que o

elemento inserido em um sintagma preposicional dentro de um SN mais alto

com marca semântica de plural (simbolizado SPrep-), do tipo UMA PORÇÃO

DE coisa, tende a ser pouco marcado. Scherre (cf. 1978, p.108), Ponte (cf.

1979, p.163) e Guy (cf. 1981a, p.179) apresentam resultados probabilísticos

que indicam que este fator é o segundo mais forte no sentido de inibir a

presença de marcas no segmento analisado. Ele perde apenas para o fator

ausência de marcas a partir da segunda posição. Todavia, usando as

palavras de Guy ao falar de numerais, podemos constatar que a carga

semântica de pluralidade, nestes casos, é tão óbvia quanto a dos numerais.

A única diferença reside no fato de não indicarem um número preciso. Mas,

relativamente à influência dos numerais, tais construções favorecem mais a

forma zero.

Scherre, seguida por Ponte (cf. 1979, p.111) e por Guy (cf. 1981a,

p.180), apresenta a seguinte interpretação para este fato:

a baixa influência do fator Q (uma porção de coisa) na


aplicação da regra deve ser atribuída ao fato de o fa-
175

lante considerar as formas desse tipo como um todo,


sendo a marca formal desnecessária. Poderíamos
inclusive levantar a hipótese de serem elas análogas às
formas de duplicidade na concordância:
-uma porção de coisas estava boa;
-uma porção de coisas estavam boas. (SCHERRE,
1978, p.112)

A interpretação de Scherre, para este fator, não é claramente

funcionalista no sentido kiparskiano do termo.

Guy, encontrando este mesmo efeito, coloca de forma explícita que

isto certamente está conforme a tendência de se eliminar redundância (cf.

1981a, p.180). Sua interpretação, para este fator, é então claramente de

base funcionalista kiparskiana.

Verificamos, portanto, que as análises da variável Marcas

precedentes apresentam resultados não interpretados, explicações ad hoc e,

inclusive, explicações diferentes para resultados idênticos. A sua abordagem,

à luz das idéias de Poplack (1980a, 1980b e 1981), cujos indícios se

encontram também no trabalho de Scherre (1978), Ponte (1979) e Guy

(1981a), trará, indiscutivelmente, uma compreensão mais clara dos fatos e,

conseqüentemente, uma explicação uniforme para o seu comportamento.

Através de uma codificação feita com base em Poplack, vamos

mostrar, de início sob bases percentuais, que o condicionamento da variável

Marcas precedentes é absolutamente regular. Apresentamos, a seguir, o

quadro 6.2.3.12, que contém exemplos detalhados desta variável, bem como

a simbologia que será usada no decorrer de sua apresentação.

O quadro 6.2.3.12 apresenta então a variável Marcas precedentes

subdividida em nove grandes categorias, com diversas subcategorias.

Relembramos que, especialmente nesta variável, estamos apresentando


176

nos exemplos, de forma sistemática, o dado sob análise sublinhado e o

contexto precedente, que constitui o fator condicionante, em MAIÚSCULAS.

São também especificadas no quadro 6.2.3.12 a posição em que se

encontram as marcas condicionantes e a posição em que se encontra o

elemento analisado.

O primeiro fator, denominado ausência, refere-se, como o próprio

nome diz, à ausência de qualquer constituinte do SN precedendo o dado da

primeira posição (os fregueses; do meus tio).

O fator 0(zero), o segundo na ordem de apresentação, constitui-se

dos casos de primeira posição não marcados(dO meus tios; FILHOTINHO

novos; TANTA gargalhadas).

Os fatores 3 e 4 dizem respeito às estruturas inseridas num sintagma

preposicional dentro de um SN semanticamente plural.

O fator 3, simbolizado SPrep(x)s-, engloba os casos (a) de núcleo

nominal mais alto com marca formal de plural (MILHÕES de coisa) ou (b) de

núcleo nominal com ou sem marca formal de plural acompanhado de marca

no primeiro elemento do SN sob análise (UM GRUPO DE CRIANÇAS

abandonadas; UMA SÉRIE DE OUTRAS coisas).


O fator 4, simbolizado SPrep0(0)-, abarca as ocorrências (a) de

núcleo nominal mais alto sem marca formal de plural (UMA PORÇÃO DE

carro; UM GRUPO DE crianças abandonadas); (b) de núcleo nominal sem

marca formal de plural seguido de ausência de marca no primeiro elemento

do SN sob análise (UMA PURÇÃO DE COISA interessante).


177

QUADRO 6.2.3.12
EXEMPLOS DE MARCAS PRECEDENTES EM FUNÇÃO DA POSIÇÃO
TIPO POSIÇÃO POSIÇÃO EXEMPLOS
DE DAS DE
MARCAS MARCAS ANÁLISE
1)Ausência 1 os fregueses
2)Zero 1 2 dO meus pais

3)Sprep(x)s- 1 2 MILHÕES DE coisas


1,2 3 UM GRUPO DE CRIANÇAS
abandonadas

4)Sprep 0(0)- 1 2 UMA PORÇÃO DE carro


1,2 3 UMA PORÇÃO DE COISA
interessante

5)Numeral 1 2 TRÊS capítulos


6)s- 1 2 UNS troço
AS maiores privações

7)s(s)s-
ss- 1,2 3 AS MAIORES privações
sss- 1,2,3 4 AS PARTIDAS TODAS iguais

8)y(x)x-
0s- 2 3 dO MEUS tios
sm- 1 3 PESSOAS MUITO humildes
ns- 2 3 NOVE NÚCLEOS formados
sn- 1 3 AS DEZ horas
ssn- 1,2 4 OS MEUS QUATRO filhos
0sn- 2 4 dO MEUS DEZ anos
ssm- 1,2 4 AQUELAS LOJAS BEM baratinhas
nsm- 2 4 DEZ SINHORAS LÁ sentada
ssmm- 1,2 5 AQUELAS PESSOAS ASSIM BEM
esquisitinha
sssmm- 1,2,3 6 AS CRIANÇAS TODAS DA RUA
abandonadas

9)x(y)0-
s0- 1 3 UMAS BORRACHA grande
n0- 1 3 DOIS RISCO verde
s00- 1 4 AS PERNA TODA marcada
ss0- 1,2 4 OS PIORES NOME feio
sn0- 1 4 AS MINHA DUAS filha
s0m- 1 4 AS CASA MAIS antiga
s0m- 1 4 AS COISA MUITO uniformes
s0mm- 1 5 dOS BAIRRO AINDA MAIS calmo
178

O fator 5 é constituído de numerais, e apenas numerais, da primeira

posição (TRÊS capítulos; NOVE núcleos formados; DEZ sinhoras lá sentada;

DOIS risco verde).

O fator 6 agrupa todos os casos de marcas formais de plural em

elementos da primeira posição (OS fregueses; UNS troço; OS meus quatro

filhos; AS perna toda marcada; NOTAS melhores).

O fator 7, representado por ss(s)-, envolve a presença de duas ou

mais marcas formais de plural precedendo o segmento analisado (AS

MAIORES privações; AS PARTIDAS TODAS iguais).

O fator 8, simbolizado y(x)x-, engloba todos os casos de presença de

pelo menos uma marca formal de plural precedendo o elemento nominal

analisado, não mediada por zero em elemento que admite marca. Nestes

casos, portanto, os elementos nominais analisados são precedidos de:

A) 0s- .zero e marca formal (dO MEUS tios);

B) ns- .numeral e marca formal (NOVE NÚCLEOS formados)

C) sn- .marca formal e numeral (AS DEZ horas);

D) sm- .marca formal e modificador (PESSOAS MUITO humildes).

Os demais casos deste fator seguem o mesmo princípio: entre a

última marca formal e o segmento analisado não pode existir um zero,

embora admita-se aí a existência de numerais ou modificadores. Sendo

assim, entende-se que o "y" da simbologia y(x)x- pode ser lido como zero,

numeral ou marca formal, mas o "x" jamais pode ser lido como zero.

O raciocínio acima se aplica também ao fator 9, simbolizado


179

x(y)0-: o "x" jamais pode ser zero. Seus valores são apenas dois: marca

formal de plural ou numeral. O "y", por sua vez, pode assumir valores

diversos, inclusive marca formal ou zero. É importante observar que a

característica necessária deste fator é que, entre a última marca e o

elemento analisado, tem de haver necessariamente um zero, mesmo

mediado por um numeral ou por um modificador. Neste fator, podemos,

então, ter elementos nominais precedidos de:

A) s0- .marca formal e zero (UMAS BORRACHA grande);

B) n0- .numeral e zero (DOIS RISCO verde);

C) s00- .marca formal, zero e zero (AS PERNA TODA marcada;

D) sn0- .marca formal, numeral e zero (UNS QUATRO SALÁRIO

mínimo);

E) s0n- .marca formal, zero e numeral (AS MINHA DUAS filha);

F) s0m- .marca formal, zero e modificador (AS CASA MAIS antiga);

G) s0mm- .marca formal, zero, modificador e modificador (dOS

BAIRRO AINDA MAIS calmo).

Os casos de dois zeros precedentes foram todos agrupados aos de

apenas um zero por serem de menor número de ocorrências. Há, por

exemplo, apenas dois casos do tipo s00-(AS PERNA TODA marcada e AS

OTA CRIANÇA pequena).

A tabela 6.2.3.13 apresenta percentuais de presença de concordância

para esta variável considerando os nove agrupamentos de Marcas


180

precedentes em função da posição. Mantivemos a numeração de 1 a 9 do

quadro 6.2.3.12 para que o leitor possa se orientar melhor em termos dos

exemplos, uma vez que não vamos repeti-los nas tabelas.

TABELA 6.2.3.13
MARCAS PRECEDENTES EM FUNÇÃO DA POSIÇÃO
MARCAS POSIÇÃO FALANTES
DE
ANÁLISE Adultos Crianças
1)Ausência 1 4225/4335 = 97% 836/855 = 98%
2)0(zero) 2 105/105 = 100% 19/19 = 100%

3)SPrep(x)s- 1e2 11/16 = 69% 1/1 = 100%


4)SPrep0(0)- 1e2 68/177 = 38% 14/80 = 17%

5)Numeral 2 886/1529 = 58% 146/258 = 37%


6)s- 2 2205/3974 = 55% 326/796 = 41%

7)ss(s)- 3e4 258/368 = 70% 36/50 = 71%


8)y(x)x- 3,4,5 207/382 = 54% 28/59 = 47%
9)x(y)0- 3,4,5 13/200 = 6% 1/25 = 4%

Observando, portanto, a tabela 6.2.3.13, podemos verificar que a

ausência de qualquer marca fora do SN provoca um alto percentual de

marcas no elemento nominal da primeira posição, assim como o zero na

primeira posição provoca a sua presença categórica, no sentido positivo, no

elemento da segunda posição. Tais resultados sugerem que a hipótese

funcionalista de Kiparsky (1972) está se confirmando, pois evidencia-se uma

tendência de inserir o -S, quando ele é fundamental para indicar


181

a idéia de pluralidade. Todavia, já sabemos, através da discussão da relação

entre Classe e Posição, que a ausência sistemática de marcas na primeira

posição ocorre, predominantemente, em estruturas do tipo do meus pais, e

sabemos ainda mais que a quantidade de marcas no possessivo da segunda

posição praticamente independe da presença ou ausência de marcas no

artigo ou demonstrativo precedente. Isto vai contra a hipótese funcionalista

kiparskiana, pois, levando-a em consideração, esperar-se-ia que a presença

de uma marca no primeiro elemento provocasse sempre um índice

significativamente maior de queda na segunda posição. Todavia, a segunda

posição precedida de s- é marcada em 92% das vezes.

Podemos comprovar o que dissemos acima através dos números

contidos na tabela 6.2.3.14.

TABELA 6.2.3.14
MARCAS PRECEDENTES, POSIÇÃO E POSSESSIVO
MARCAS POSIÇÃO FALANTES
Adultos Crianças
Ausência 1 184/184 = 100% 42/43 = 98%
0 (zero) 2 75/75 = 100% 12/12 = 100%
s- 2 55/60 = 92% 12/13 = 92%

O percentual de ausência de marcas na segunda posição precedida

de s- na primeira posição é muito pequeno para se apontar uma tendência

funcionalista forte.

Além disso, o funcionamento de todos os demais fatores indica, tanto

nos dados dos adultos quanto nos das crianças, um comportamen-


182

to extremamente regular não funcionalista, em direção às conclusões de

Poplack: presença de marcas leva a marcas e presença de zeros leva a

zeros. Mesmo nos casos das construções em sintagmas preposicionais

dentro de um SN mais alto, o índice de marcas é função da existência de

"esses" ou de zeros. Assim SPrep(x)s- (MILHÕES DE coisas e UM GRUPO

DE CRIANÇAS abandonadas) favorece mais a inserção de marcas no

segmento sob análise do que o SPrep0(0)- (UMA PORÇÃO DE carro e UMA

PORÇÃO DE COISA interessante).

Além disso, observa-se que a presença de duas ou três marcas

formais precedentes (AS MAIORES privações e AS PARTIDAS TODAS

iguais) constitui o fator que, percentualmente, mais favorece a presença de

concordância no segmento seguinte. Dentro da mesma linha, verifica-se que

a presença de pelo menos uma marca precedente não mediada por zero

continua a favorecer marcas no segmento seguinte, embora com um

percentual menor. Inversamente, a presença de um zero precedente, desde

que já se tenha uma marca no primeiro ou no segundo elemento, provoca

quase que categoricamente o aparecimento de um outro zero no segundo


segmento.

O comportamento dos três últimos fatores é altamente regular até

mesmo em um pequeno número de dados, pois, antes de agruparmos os

seus diversos casos, observamos separadamente cada um deles.

Em termos percentuais pelo menos, podemos afirmar que o

Português tem um comportamento bastante semelhante ao do Espanhol, o

que traz mais evidências sobre uma variável de comportamento forte que

não é estritamente regida pela hipótese funcionalista nos moldes de Kiparsky

(1972).
183

6.2.3.6 - Relação entre Marcas precedentes,


Posição e Classe gramatical

Apresentamos, no item 6.2.3.3, resultados percentuais que mostram

que o substantivo, por um lado, e o adjetivo, o possessivo e o quantificador,

por outro, evidenciam comportamento diferenciado em função da segunda e

terceira posição no SN: o substantivo é menos marcado na segunda do que

na terceira posição (ou quase igualmente marcado nestas duas posições),

enquanto o adjetivo e o possessivo são mais marcados na segunda do que

na terceira e o quantificador é pouco marcado tanto na segunda quanto na

terceira posição.

Apresentamos, no item 6.2.3.4, evidências de que o tipo e o número

de marcas precedentes influencia a presença ou ausência de marcas

seguintes e chegamos a mostrar que o possessivo da segunda posição

praticamente não sofre influência de s- ou de zero na primeira posição (ver

tabela 6.2.3.14, p.181).

Evidenciamos, também, que os fatores ausência fora do SN ou zero

na primeira posição têm efeito regular, praticamente categórico sobre

qualquer classe (ver tabelas 6.2.3.13 e 6.2.3.14). Resta ainda saber

1) se todas as classes que ocupam a terceira, quarta e quinta posição

do SN são igualmente afetadas por marcas formais ou zeros precedentes;

2) se todas as classes em SPreps, inseridos num SN mais alto, são

igualmente afetadas;

3) se todas as classes que ocupam a segunda posição do SN se


184

comportam da mesma forma que o possessivo, ou seja, se são

indiferentemente afetadas pela presença ou ausência de marca formal de

plural no elemento da primeira posição e

4) se todas as classes que ocupam a segunda posição do SN são

igualmente afetadas pelo numeral da primeira posição.

Para a discussão do primeiro ponto, vejamos a tabela 6.2.3.15, na

página seguinte. Esta tabela contém os resultados percentuais que

envolvem o substantivo, o adjetivo, o possessivo e o quantificador, que são

as classes da terceira, quarta e quinta posição que nos interessam

particularmente, neste ponto. Através dos resultados da tabela 6.2.3.15,

percebe-se que o efeito das marcas precedentes é absolutamente regular

para qualquer classe gramatical que ocupa as referidas posições, ou seja,

- marca formal precedente favorece o aparecimento de marca formal

no segmento seguinte;
- forma zero precedente favorece o aparecimento de zero no
segmento seguinte.

Observa-se ainda que, coerentemente com os dados globais, a

presença de ss(s)- é mais forte do que a de y(x)x- no sentido de

favorecimento de marcas seguintes.


185

TABELA 6.2.3.15
MARCAS PRECEDENTES, TERCEIRA POSIÇÃO E CLASSE GRAMATICAL
MARCAS POSIÇÃO CLASSE FALANTES
Adultos % Crianças % Total %

ss(s)- 3e4 Subst. 158/211=75 23/31= 74 181/242=75


(OS OUTROS colégios)

ss(s)- 3e4 Adj. 73/109=67 10/15= 67 83/124=67


(UMAS PESSOAS ricas)

ss- 3 Poss. 2/4 =50 2/2 =100 4/6 =67


(UNS AMIGOS meus)

ss- 3 Quant. 22/41 =54 1/2 = 50 23/43 =53


(AQUELAS BRIGAS todas)

0s(x)- 3e4 Subst. 152/285=53 22/50= 44 174/335=52


(DO MEUS pais)

sx(x)- 3e4 Adj. 39/72 =54 5/8 = 62 44/80 =55


(COISAS ATÉ ligadas)

xs- 3 Poss. 0/1 = 0 xxx 0/1 = 0


(DOIS IRMÃOS meus)

ssm- 4 Quant. 0/1 = 0 xxx 0/1 = 0


(AS CONTAS QUASE toda)

x0(0)- 3e4 Subst. 3/14 =21 0/4 = 0 3/18 =17


(AS OTA menina)

x0(0)- 3,4,5 Adj. 10/113= 9 1/15= 7 11/128= 9


(AS LEI trabalhista)

x0- 3e4 Poss. 0/6 = 0 0/2 = 0 0/8 = 0


(UNS COLEGA meu)

s0- 3 Quant. 0/66 = 0 0/3 = 0 0/69 = 0


(NAQUELES NEGÓCIO todo)

As outras classes que ocorrem nesta posição são (a) categorias

substantivadas (24 casos) e (b) indefinidos e adjetivo 2 (cinco casos). E-


186

las apresentam comportamento semelhante ao dos elementos especificados

na tabela 6.2.3.15, conforme se pode ver abaixo:

A) ss(s)- ................................. 3/3 = 100%;

B) y(x)x- .................................17/24 = 71%;

C) x(y)0-................................. 0/2 = 0%.

Uma série de observações interessantes a respeito dos tipos de

seqüências possíveis merecem ser feitas.

Guy (1981a) levanta a hipótese de que a concordância de número

entre os elementos do SN opera da seguinte forma: ela se limita a copiar a

informação plural da esquerda para a direita através do nódulo SN.

Conseqüentemente, "(...) ela não seria capaz de saltar sobre as palavras,

produzindo seqüências marcada-não marcada-marcada" /grifos nossos/

(p.169),71 ou seja, segundo ele, seqüências do tipo s0s são improváveis e,

se ocorrerem, isto deve ser creditado à influência de fatores que atuam sobre

a queda do -S final não morfêmico e não a fatores que atuam sobre o -S

morfêmico.

Em termos percentuais, os nossos dados comprovam esta hipótese,

pois apenas três casos de substantivos (essas nossa dificuldades) e 11 de

adjetivos (as coisa naturais) apresentam tais seqüências, ou seja, 1% do total

de seqüências de três ou mais constituintes(14/1053).

Verificando os 14 casos de s0s, podemos constatar que oito deles


ocorrem diante de consoantes sonoras (das quais cinco são nasais), um

diante de vogal e cinco diante de consoantes surdas. Dentre estes últimos

cinco casos, quatro ocorrem diante de consoantes labiais e um dian-


187

te de velar. Em verdade, 12 dos 14 casos (86%) ocorrem em ambientes que

favorecem levemente a queda do -S final não morfêmico (cf. SCHERRE,

1979, p.7 e GUY 1981a, p.144).

Conforme já vimos, Scherre (1979), analisando a influência do

contexto fonético/fonológico seguinte sobre a inserção de marca formal de

plural em elementos do SN, com base nos mesmos dados de Scherre

(1978), conclui que "os traços [+surdo] e [+consonantal] favorecem a

aplicação da regra e os traços [-surdo] e [+consonantal] desfavorecem-na".

(p.7)

Verificamos também que Guy (1981a), ao falar sobre a queda do -S

não morfêmico, conclui que (1) consoantes sonoras favorecem cancelamento

mais do que surdas e consoantes labiais, em relação às velares, favorecem

também o cancelamento (cf. p.143-4). Ele considera ainda que este efeito,

embora com magnitude reduzida, permanece na análise do -S morfêmico (cf.

p.166). Cumpre relembrar que os resultados obtidos para a análise desta

variável nos dados em questão são perfeitamente paralelos aos de Guy

(1981a), conforme se pode ver no item 6.2.3 deste trabalho.

Concluindo, as seqüências s0s são realmente fruto da influência do

contexto fonético/fonológico seguinte sobre a queda do -S final não

morfêmico e não um efeito específico sobre a concordância de número entre

os elementos do SN.

Resta ainda a questão das seqüências do tipo 0s (grande viagis) e

0sx (do meus pais; no meus problemas) que também não deveriam ocorrer,

considerando a forma da regra operar, prevista por Guy (1981a). Seqüências

0s, as de SNs de dois elementos, são muito poucas. Há ape-


188

nas 33 casos num total de 4290 estruturas: 0,8%. As seqüências 0sx já são

em maior número. Dentre os 1053 casos de SNs de três ou mais elementos,

97 são deste tipo: 9%. É o percentual mais alto de todas as ocorrências não

previstas pela forma da regra operar. Já falamos sobre estes casos no item

anterior, p.151-167.

Mostramos que 94 destes 97 casos são de uma estrutura bastante

particular: [artigo + possessivo ou demonstrativo + substantivo] (do meus

pais). Refutamos a hipótese da influência da nasalidade, por ocorrerem

estruturas do tipo no teus filhos72 e por haver apenas outros três casos,

dentre 36, diante de nasais. Malgrado a sistematicidade desta estrutura,

fizemos um levantamento dos segmentos seguintes nos 130 casos em

questão, à luz de que os traços [sonoro], [labial] e [dental] desfavorecem

levemente a inserção do morfema de plural, como um reflexo no

favorecimento da queda do -S não morfêmico, e concluímos que os casos de

0s, 0ss ou 0s0 também podem ser explicados pela influência do contexto

seguinte. A distribuição dos 130 casos em função desta variável é a seguinte:

1) 107 casos ocorrem diante de sonoras (82%);


2) 8 casos ocorrem diante de surdas labiais e dentais (6%) e

3) 15 casos ocorrem diante de surdas velares e diante de vogais

(12%).

Dos 130 casos, 115 (88%) não marcados estão diante de ambiente

propício ao cancelamento do -S não morfêmico. Acreditamos, portanto, que a

concordância de número entre os elementos do SN em português opera

realmente da forma proposta por Guy (1891a): aplica-se ao nódulo


189

do SN da esquerda para a direita sem saltar nenhuma palavra, a não ser as

que não podem ser marcadas.

Gostaríamos, todavia, de acrescentar que, além da não freqüência de

seqüências do tipo s0s ou 0s(x), há também uma preferência pelas

seqüências sss ou x00, ficando as seqüências do tipo yxx sem preferência

nítida, como se pode ver pelo quadro 6.2.3.16, com base nos dados dos

adultos e das crianças conjuntamente.

QUADRO 6.2.3.16
SOBRE ESTRUTURAS PREFERENCIAIS
ESTRUTURAS Subst. Adj. Poss. Quant. Total

sss(s)- 181 (75%) 83 (67%) 4 (67%) 23 (53%) 291 (70%)


xs0(0)- 61 (25%) 41 (33%) 2 (43%) 20 (47%) 124 (30%)
Total- 242 124 6 43 415

x0x(s)- 3 (21%) 11 ( 9%) 0 ( 0%) 0 ( 0%) 14 ( 6%)


x00(0)- 15 (79%) 117 (81%) 8 (100%) 69 (100%) 210 (94%)
Total 18 128 8 69 223

yxx(s)- 174 (52%) 44 (55%) 0 ( 0%) 0 ( 0%) 218 (52%)


yx0(0)- 161 (48%) 36 (45%) 1 (100%) 1 (100%) 199 (48%)
Total 335 80 1 1 417

A distribuição acima evidencia com clareza que o falante prefere a

estrutura com todas as marcas formais de plural -sss- (os outros colégios;

as partidas todas iguais; uns amigos meus; aquelas brigas todas) ou com

zeros, uma vez marcada a primeira posição, -x00- (as lei trabalhista; uns

colega meu; aqueles negócio todinho; umas borracha grande; dois risco

verde; quatro quarto reservado; aqueles cabelim branquim; duas cebola


descascada; aquelas casa bem antiga; as conta quase toda).
190

A estrutura que apresenta a mistura de marcas precedentes, quer

quanto à quantidade, quer quanto ao tipo (do meus pais, dois irmãos meus;

os três dias) ou a que tem a marca mediada por um modificador (coisas até

ligadas; umas pessoa muito ricas) não apresenta preferência nítida de

presença ou ausência de marca na última posição: ocorre tanto -S quanto -

0 no terceiro elemento.

Além disso, é importante observar a distribuição das estruturas

ss-, x0- e yx- em termos das classes gramaticais que aí podem ocorrer. O

quadro 6.2.3.17 reapresenta esta distribuição.

QUADRO 6.2.3.17
ESTRUTURAS PREFERENCIAIS E CLASSE GRAMATICAL
ESTRUTURAS Subst. Adj. Poss. Quant. Total

sss(s)- 181 83 4 23 291


xs0(0)- 61 41 2 20 124
Total 242(41%) 124(37%) 6(31%) 43(36%) 415(39%)

x0x(s)- 3 11 0 0 14
x00(0)- 15 117 8 69 210
Total 18 (3%) 128(37%) 8(56%) 69(61%) 223(21%)

yxx(s)- 174 44 0 0 218


yx0(0)- 161 36 1 1 199
Total 335(56%) 80(25%) 1(12%) 1 (3%) 417(40%)

Com base nas distribuições do quadro 6.2.3.17, podemos então

verificar o seguinte:

1) Os substantivos privilegiam as estruturas ss- (os outros colégios)

ou yx- (do meus pais; os três dias). Em 595 estruturas, 242 (41%) são
191

do primeiro tipo e 334 (56%) do segundo, perfazendo um total de 577 casos,

ou seja, 97%. Apenas 18 casos ocorrem em x0- (as ota menina), com o

percentual de 3%.

2) Os adjetivos se distribuem uniformemente. Dos 330 casos, 124

(37%) ocorrem em ss- (umas pessoas ricas); 82 (25%) em yx- (coisas até

ligadas; dois cavalos lindo); 124 (38%) em x0- (as lei trabalhista; dois risco

verde).

3) Os quantificadores privilegiam as estruturas x0- (essas coisa toda).

Dentre 113 casos, 69 (61%) são deste tipo e praticamente não ocorrem em

yx- (as contas quase toda); apenas 4 casos (3%) são do tipo yx-. O restante

- 41 (36%) - fica igualmente na estrutura ss- (aquelas brigas todas).

4) Os possessivos também privilegiam a estrutura x0- (uns colega

meu; três colega meu): 53% dos casos (8/15). Também ocorrem pouco em

estruturas yx- (dois irmãos meus) - 7% (1/15). O restante fica por conta da

estrutura ss- (uns amigos meus) - 40% (6/15).

As observações feitas até aqui tiveram como objetivo mostrar a

relação entre marcas precedentes e classes gramaticais que ocorrem na

terceira, quarta e quinta posição.

Vamos verificar agora o segundo ponto em questão: se todas as

classes inseridas em SNs mais altos são igualmente afetadas pelas marcas

precedentes. Para isto, vamos observar a distribuição detalhada destes

casos na tabela 6.2.3.18, a seguir.


192

TABELA 6.2.3.18
SOBRE OS SNS INSERIDOS EM SNS MAIS ALTOS
MARCAS POSIÇÃO CLASSE FALANTES
DE
ANÁLISE Adultos Crianças
SPrepS- 2 Subst. 4/7 = 57% 1/1 = 100%

SPrep0- 2 Subst. 64/164 = 39% 14/78 = 18%

SPrep0- 2 Ind. 4/4 = 100% xxx

SPrep+S- 3 Subst. 4/4 = 100% xxx

SPrep+S- 3 Adj. 3/5 = 60% xxx

SPrep+0- 3 Adj. 0/8 = 0% 0/2 = 0%

SPrep+0- 3 Poss. xxx xxx

Os percentuais acima indicam que (1) o SprepS- (MILHARES DE

coisas; MILHÕES DE pessoas) favorece a presença de -S no substantivo

seguinte enquanto o Sprep0- (UMA PURÇÃO DE carro; UM MONTÃO DE

ingresso) a desfavorece; (2) o Sprep+S- (UMA SÉRIE DE OTRAS coisas;

PURÇÃO DE OTROS cantores; UM GRUPO DE CRIANÇAS abandonadas;

UM MONTE DE IDÉIAS diferentes), também favorece a presença de -S em

substantivos e adjetivos e o Sprep+0- (UM MONTÃO DE NEGO velho; UMA

PURÇÃO DE PEIXINHO colorido; UM MONTE DE USINA nuclear) também

desfavorece a presença de marcas em adjetivos.

Observe-se que a influência de SPrep+0- é a mais forte de todas,

porque os elementos que estão nesta situação são precedidos de 00-, ou

seja, zero do núcleo nominal mais alto e do mais baixo. Esta é a única

situação dos dados por nós analisados em que ocorre a forma 000: ausência

de qualquer marca formal de plural, mas com carga semântica de


193

pluralidade, carga esta que é transmitida através do núcleo nominal mais alto

das estruturas em questão. Ocorre apenas um caso de possessivo: encontra-

se na terceira posição (PUÇÃO DE BLOQUINHO nosso) e se comporta

como adjetivo: não marcado.

Os únicos casos que fogem, portanto, do esperado são os indefinidos

de segunda posição precedidos de SPrep0- (UMA PURÇÃO DE otos

cantores): eles apresentam 100% de marcas. Isto está exatamente dentro da

terceira questão que queremos discutir: se todas as classes que ocupam a

segunda posição do SN se comportam da mesma forma que o possessivo,

ou seja, se são indiferentemente afetadas pela presença ou ausência de

marca no elemento precedente. Vejamos a tabela 6.2.3.19 que apresenta

resultados de marcas precedentes, segunda posição e classe gramatical.


194

TABELA 6.2.3.19

MARCAS PRECEDENTES, SEGUNDA POSIÇÃO E CLASSE GRAMATICAL


CLASSE FALANTES MARCAS
GRAMATICAL Zero s- Numeral

Substantivo Ad. 21/21 = 100% 1806/3482 = 52% 884/1524 = 58%


Cr. 4/4 = 100% 261/719 = 36% 146/257 = 57%

Categoria Ad. 1/1 = 100% 57/87 = 66% 2/5 = 40%


subst. Cr. 0/1 = 0% 13/19 = 68% xxx

Pronome Ad. xxx 27/33 = 82% xxx


pessoal Cr. xxx 3/5 = 60% xxx

Adjetivo Ad. 7/7 = 100% 119/157 = 76% xxx


Cr. 2/2 = 100% 16/16 =100% xxx

Quantificador Ad. xxx 3/7 = 43% xxx


Cr. xxx xxx xxx

Possessivo Ad. 75/75 = 100% 55/60 = 92% xxx


Cr. 12/12 = 100% 12/13 = 92% xxx

Adjetivo 2 Ad. xxx 21/27 = 78% xxx


Cr. xxx 1/1 =100% xxx

Indefinido Ad. xxx 41/44 = 94% xxx


Cr. 1/1 = 100% 5/8 = 62% xxx

Artigo e de- Ad. xxx 75/75 =100% xxx


monstrativo. Cr. xxx 15/15 =100% xxx

Observando os percentuais desta tabela, podemos perceber que as


classes da segunda posição não são igualmente afetadas em função das
marcas precedentes.
Os substantivos, se precedidos de zero, apresentam marcas
categóricas positivas mas, se precedidos de s- ou de numeral, reduzem
consideravelmente o número de marcas.
Os adjetivos, no caso dos adultos, apresentam menor número de
marcas quando precedidos de s- do que de zero. No caso das crianças,
apresentam-se categoricamente marcados, em termos positivos. Os
adjetivos 2, para os adultos, comportam-se como adjetivos e, para as
195

crianças, não há número de dados suficientes para se fazer qualquer


comentário.

A categoria substantivada apresenta comportamento percentual

intermediário entre os substantivos e os adjetivos e os pronomes pessoais

têm um comportamento diferenciado dos substantivos.

Os indefinidos (exceto no caso das crianças), os artigos e

demonstrativos apresentam comportamento idêntico ao dos possessivos: são

também muito marcados na segunda posição, mesmo quando precedidos

de marca na primeira.

Estávamos vendo até aqui que a variável Marcas precedentes exercia

um efeito extremamente uniforme sobre todas as classes gramaticais, à

exceção do possessivo na segunda posição e dos indefinidos em SPrep0-.

Através dos resultados percentuais descritos acima, podemos agora verificar

que a presença de marca na primeira posição exerce efeito diferenciado em

função da classe gramatical. Isto mostra, mais uma vez, a necessidade da

variável Classe na análise dos dados.

É exatamente com relação ao comportamento dos elementos da

segunda posição que o Português e o Espanhol diferem. Segundo Poplack,

um zero na primeira posição também conduz a outro zero na segunda

posição (cf. 1977, p.16 e 1981, p.61). Isto não ocorre em Português, pelo

menos no tipo de dado que levantamos. O zero na primeira posição conduz a

mais marcas do que a própria presença de marcas e, às vezes, a classe é

indiferente à existência ou não de marcas na primeira posição.

Poplack observa, também, que "o contexto mais favorável ao can-


196

celamento da marca é precisamente quando as duas marcas precedentes já

foram canceladas" (1980a, p.64),73 o que conduz a formas do tipo 000.

Neste aspecto, o nosso trabalho também difere do de Poplack. Segundo ela,

em Espanhol há formas do tipo:

- la [0] cosa [0] bonita [0]

com informação semântica de plural deduzida do contexto, embora o falante

do Espanhol não as reconheça como plural de forma isolada (cf. 1980a, p.1-

4).74

Este tipo de SN não existe em Português. Há sim casos do tipo

menina bonita não chora com sentido genérico. Mas, para nós, não se trata

aí de cancelamento ou ausência de inserção de marca formal de plural.

Pode-se ter em Português a idéia de plural sem nenhuma marca formal de

plural, quer seja através de um substantivo coletivo do tipo pessoal, povo,

turma, gente, quer através do uso genérico de menina bonita não chora, quer

através de outras palavras que denotam pluralidade muito livro caro, havia
roupa espalhada na vitrine, bastante coisa, como bem o coloca Pereira (cf.

1984, p.11; p.36-8 e p.56-65, cf., também, NARO, 1981, p.64).

Os únicos casos de 000 observados por nós e analisados em termos

da ausência de marca formal de plural nos elementos flexionáveis são do tipo

já referenciado: uma purção de peixinho colorido. Embora haja três zeros, do

ponto de vista da forma, uma purção de é semanticamente plural e induz à

idéia de pluralidade no substantivo do SN mais baixo. Todavia, não há

dúvidas de que os dois zeros formais precedentes a colorido conduzem-no a

ser sempre não marcado.


197

A outra possibilidade de estruturas não formalmente marcadas mas

semanticamente plurais, e também não analisadas por nós, diz respeito ao

uso de construções cristalizadas que envolvem partes do corpo do tipo

Paula e Rafael, vem lavá a mão, o pé e escová o dente. Estas estruturas são

comuns em Português mesmo com referência "às duas mãos", "aos dois

pés" e, certamente, "aos dentes". Trata-se necessariamente de "mais de

um", numa relação de posse inalienável, em estruturas cristalizadas.

Toda a argumentação apresentada até o presente momento nos leva

à conclusão de que a variável Marcas, desvinculada das variáveis Posição e

Classe, não dá uma visão adequada dos fatos lingüísticos em Português. É,

portanto, necessária a consideração dessas três variáveis, mesmo que a

análise fique menos elegante.

Com relação à quarta questão, se todas as classes gramaticais que

ocupam a segunda posição do SN são igualmente afetadas pelo numeral da

primeira posição, ela simplesmente não faz sentido. A grande maioria destes

casos é de substantivo: 1524 dos 1528 nos dados dos adultos e os 257

dados das crianças. Os cinco casos restantes são de categoria

substantivada (ver tabela 6.2.3.19). Vamos passar a apresentar a seguir os

resultados probabilísticos que envolvem uma análise que codifica (1)

Posição, (2) Marcas precedentes em função da posição e (3) Classe

gramatical, com o objetivo de buscarmos a melhor forma de descrever os

fatos lingüísticos que temos em mãos e verificarmos que explicações podem

ser dadas para o efeito das variáveis sob consideração, bem como para a

relação entre a configuração sintagmática do SN e o número de marcas de

plural.
198

6.2.3.7 - Análises alternativas

Vamos apresentar resultados probabilísticos de análises alternativas,

considerando as três variáveis discutidas: Posição, Classe gramatical e


Marcas precedentes.

Na análise A, apresentamos os dados codificados à semelhança de

Guy para as variáveis Posição e Marcas, na sua forma final (cf. 1980a,

p.168-80).75

Para a variável Posição, consideramos, portanto, quatro fatores:

1) primeira posição;
2) segunda posição;

3) terceira posição e

4) quarta e quinta posição.

A variável Marcas precedentes foi subdividida, conforme Guy (1981a),

em cinco fatores:
1) ausência fora do SN e zero na primeira posição;

2) marcas formais imediatamente precedentes(s-; ss-; 0s-; sss-) ;

3) segmento precedente não flexionável, incluindo todos os numerais,

em qualquer posição (n-; sm-; ns-; sn-; n0-; ssm-; nsm-; s0m-; n0m-; ssmm- e

s0mm-) ;

4) s- precedente mas não imediatamente (s0-; s00-; ss0-) ;

5) sintagma preposicional inserido dentro de um SN mais alto com

marca semântica de plural (SPrep).

A variável Marcas apresentada aqui contém uma diferença com


199

relação à de Guy. Ele colocou em um só fator (1) a ausência fora do SN, (2)

o zero na primeira posição e (3) 00 ou n0 precedentes. Mas, considerando

que as probabilidades respectivas são 0,98, 0,96 e 0,32 (cf. 1981a, p.170-7),

colocamos, na análise A, n0- junto aos numerais ou outros segmentos não

flexionáveis, embora isto ainda não seja o mais adequado como vamos

mostrar na análise B. Conforme já afirmamos, ocorrências de 000 não foram

constatadas em nossos dados.

Outra diferença ainda pode ser apontada. Todos os casos de quarta e

quinta posição foram colocados por Guy juntos ao fator com maior número

de casos: s- ou ss- imediatamente precedente. Segundo Guy, esta colocação

arbitrária se deu porque as marcas das primeiras posições destes casos não

eram diretamente recuperáveis pelo sistema de codificação original.

Considera ele que, "uma vez que há tão poucos dados envolvidos aqui, isto

não introduziria qualquer distorção significativa." (1981a, p.177)76 Na análise

ora apresentada, fizemos a codificação correta. Os casos terminados em s-

ou em 0-, sem numeral, ficaram em seus devidos lugares e todos os casos

de elementos não flexionáveis foram codificados juntos.

Esta forma de analisar estabelece pouca superposição entre Marcas

precedentes e Posição e foi considerada por Guy, como já dissemos, melhor

que aquela que observa o detalhamento de Marcas precedentes em função

da Posição (cf. 1981a, p.178).

Introduzimos, por razões já expostas, uma variável nova nesta

análise: a Classe gramatical, conforme descrita no item 6.2.3.3 e resumida

no quadro 6.2.3.2, p.150.

Voltamos a observar que o fator n0- (DOIS risco verde), que Guy
200

colocou junto a ausência fora do SN na primeira posição (cf. 1981a, p.177) e

que nós colocamos nesta análise junto a "numeral", deverá ser colocado

junto a s0-, principalmente se quisermos seguir as idéias de Poplack de que,

exceto a ausência fora do SN, marcas levam a marcas e zeros levam a

zeros. Acrescentamos ainda que, se desejarmos fazer uma comparação

adequada com Poplack, temos de reorganizar uma série de outros dados

colocados junto a "numeral" em termos de terem um s- ou um zero

precedendo o elemento analisado.

Então seqüências do tipo 0s-; sm-; ssm- e ssmm- devem todas ficar

juntas, formando um fator, pois apresentam marcas imediatamente

precedentes ou apenas mediadas por um numeral ou modificador, enquanto

seqüências do tipo n0-; s0n-; s0m-; n0m-; s0mm- devem todas também

ficar juntas, formando outro fator, pois apresentam um zero precedente,

também mediado por elementos não marcados formalmente. Estas

seqüências, que sugerimos que sejam separadas em dois fatores diferentes,

estão todas agrupadas junto ao numeral precedendo o elemento da segunda

posição (três CAPÍTULOS), pois todas elas têm ou um numeral ou um

modificador: segmentos precedentes não flexionados, que foram agrupados

por Guy (cf. 1981a, p.169) e por outros estudiosos já citados. Sob a

perspectiva de Poplack, dados de natureza completamente distinta estão

num só fator na análise A, pois o que importa neste caso é a presença ou

ausência de marcas formais. Esta reorganização é feita na análise B,

descrita a seguir.

Na análise B, mantivemos as variáveis Posição e Classe da mes-


201

ma forma que na análise A e recodificamos a variável Marcas precedentes

em função da posição nos moldes de Poplack. Ela ficou constituída de nove

fatores, a seguir relacionados:

1) ausência fora do SN;

2) zero na primeira posição;

3) SPrep(x)s- na primeira e/ou segunda posição;

4) SPrep0(0)- na primeira e/ou segunda posição;

5) numeral na primeira posição;

6) s- na primeira posição;

7) ss(s)- dois ou três "esses" imediatamente precedentes;

8) y(x)x- pelo menos um s- precedente, não mediado por zero(0s-;

sm-; ns-; sn-; ssn-; 0sn-; ssm-; nsm-; ssmm-) ;

9) x(y)0- pelo menos um zero imediatamente precedente não

mediado por s-, com uma marca formal ou um numeral na primeira posição

(s0-; n0-; s00-; ss0-; sn0-; s0n-; s0m-; s0mm-).

O quadro 6.2.3.12, apresentado na p.177, contém exemplos diversos


de cada um destes nove fatores.

É claro que a análise B codifica dois fatores de forma bastante

superposta, pois Marcas precedentes é praticamente uma subdivisão de

Posição.

O nosso objetivo central neste momento é verificar o que ocorre, do

ponto de vista estatístico, com as três variáveis juntas tanto na análise A

quanto na análise B, ou seja, queremos saber quais variáveis são

selecionadas pela metodologia que usamos e em que ordem esta seleção

ocorre e com que significância.


202

Em ambas as análises, para os adultos, constatamos que, de um total

de 10 variáveis, (1) Marcas precedentes é a primeira variável selecionada,

com significância 0.0; (2) Classe gramatical é a quinta variável selecionada

com significância também 0,0; (3) Posição é a décima variável selecionada,

ou seja, a última, com significância 0,003 na análise A e 0,008 na análise B,

sem convergência no último passo da análise, até a iteração número 100, em

ambas as análises.

Com relação aos resultados das crianças, verificamos que, em ambas

as análises contendo nove variáveis, Marcas precedentes é também

selecionada em primeiro lugar com significância 0,0, mas a ordem de seleção

de Classe não é relevante em relação às demais variáveis: a significância é

0,000. A variável Posição, por sua vez, é selecionada apenas na análise A,

mesmo sem convergência. Embora esta variável não seja selecionada na

análise B, seus valores probabilísticos ainda permanecem diferenciados e

com convergência.
Encontram-se na tabela 6.2.3.20, na p.204, os resultados de Marcas
precedentes da análise A para os dados dos adultos e das crianças

separadamente. Transcrevemos os resultados de Guy (cf. 1981a, p.179) com

uma só diferença: Guy coloca em sua tabela - a de número 6-17 - apenas os

valores do total, o percentual e as probabilidades. Calculamos a aplicação da

regra a partir dos valores dados.

Os resultados dos três grupos de falantes são bastante semelhantes,

principalmente no que diz respeito à hierarquia entre os fatores. De uma

forma geral, eles confirmam as conclusões anteriores: ausência de


203

marca fora do SN e zero na primeira posição favorecem a concordância

(0,94; 0,90; 0,86) e presença de pelo menos uma marca antes do elemento

analisado a desfavorece relativamente (0,59/0,49/0,57; 0,57/0,39/0,47;

0,04/0%/0,21; 0,45/0,16/0,35), conforme se pode ver pelas respectivas

probabilidades atribuídas aos outros quatro fatores. Em termos das

diferenças entre estes quatro fatores que apresentam pelo menos uma

marca antes do elemento analisado, quer semântica quer formal, emergem

as mesmas questões já levantadas por nós e abaixo relacionadas.

1) Como dar uma explicação uniforme para a influência diferente do

"numeral" e do SPrep? Ambos têm marcas semânticas de plural, mas,

enquanto os numerais favorecem relativamente a presença de concordância

(0,59; 0,49; 0,57), o SPrep a desfavorece (0,45; 0,16; 0,35).


204

TABELA 6.2.3.20
MARCAS PRECEDENTES: ANÁLISE A
MARCAS FALANTES Apl./Total % Prob.

Ausência fora do SN e Adultos 4330/4440 = 98 0,94


zero na 1a. posição Crianças 855/874 = 98 0,90
Guy(1981a) 4842/5097 = 95 0,86

Numeral ou outro seg- Adultos 1055/1891 = 56 0,59


mento não flexionável Crianças 169/314 = 54 0,49
em qualquer posição Guy(1981a) 488/1437 = 34 0,57

Marcas formais Adultos 2507/4420 = 57 0,57


imediatamente Crianças 368/862 = 43 0,39
precedentes(s,ss, Guy(1981a) 699/2914 = 24 0,47
sss, 0s etc.)

Marcas formais Adultos 7/142 = 5 0,04


não imediatamente Crianças 0/12 = 0 -
precedentes (n0, Guy(1981a) 8/131 = 6 0,21
s0, ss0,s00 etc.)

SPrep Adultos 79/193 = 41 0,45


Crianças 15/81 = 19 0,16
Guy(1981a) 140/209 = 67 0,35

2) Como explicar o fato de que "esses" imediatamente precedentes

favoreçam mais a concordância (0,57; 0,39 e 0,47) do que um s- não

imediatamente precedente (0,04; 0%; 0,21)? Em outras palavras, como

explicar que marcas estão levando a marcas e zeros a zeros, se o fator "s-

não imediatamente precedente" em verdade é sempre seguido de um ou


205

mais zeros? A rigor, este fator seria mais adequadamente descrito como

"zero imediatamente precedente com uma marca na primeira posição".

Através da análise B, descrita nas paginas 202 e 203, pretendemos

mostrar que todas as questões levantadas são adequadamente respondidas.

Apresentamos na tabela 6.2.3.21 resultados probabilísticos para os nove

fatores que constituem agora a variável Marcas precedentes.

TABELA 6.2.3.21
MARCAS PRECEDENTES EM FUNÇÃO DA POSIÇÃO: ANÁLISE B
POSIÇÃO
FALANTES
MARCAS DE
ANÁLISE Adultos Crianças
Apl./Total % Prob. Apl./Total % Prob.

Ausência 1 4225/4335 = 97 0,92 836/855 = 98 0,93


Zero na 1a.
posição 2 105/105 = 100 + 19/19 = 100 +

Numeral na
1a. pos. 2 886/1529 = 58 0,56 146/258 = 57 0,72
s- na 1a.
posição 2 2205/3974 = 55 0,49 326/796 = 41 0,57

Sprep(x)s- 2e3 11/16 = 69 0,71 1/1 = 100 +


Sprep0(0)- 2e3 68/177 = 38 0,34 14/80 = 17 0,28

ss(s)- 3e4 258/368 = 70 0,61 36/50 = 72 0,76


y(x)x- 3,4,5 207/382 = 54 0,47 28/59 = 47 0,58
x(y)0- 3,4,5 13/200 = 6 0,04 1/25 = 4 0,01

Os resultados desta tabela apresentam, em termos probabilísticos,


206

regularidades que já mostráramos em termos percentuais e que são

parcialmente encobertas pela análise do tipo A, suscitando explicações ad

hoc.

À exceção dos fatores ausência fora do SN e zero na primeira

posição que favorecem, respectivamente, marcas na primeira e segunda

posição, todos os demais nos levam a uma conclusão absolutamente

consistente: marcas levam a marcas e zeros levam a zeros. O SPrep que

contém um s- (MILHARES DE coisas) ou seguido de um s- (UMA SÉRIE DE

OUTRAS coisas; UMA PORÇÃO DE CRIANÇAS abandonadas) favorece a

inserção de s- no segmento analisado, enquanto o SPrep que contém um

zero (UMA PORÇÃO DE coisa) ou que é seguido de zero (UMA PORÇÃO

DE PEIXINHO colorido) favorece a forma zero seguinte. Antes de efetuarmos

este agrupamento, fizemos análises prévias dos dados dos adultos

separando o SprepS- do Sprep+S- e Sprep0- do Sprep+0-, obtendo os

seguintes resultados:

A) SprepS- ............................................. 0,70;

B) Sprep+S- ........................................... 0,77;


C) Sprep0- ............................................. 0,40;

D) Sprep+0- ........................................... 0%.

Como o número de dados de SprepS- (4/7) e Sprep+S- (7/9) era

muito pequeno e o comportamento era idêntico, consideramos oportuno e

adequado agrupá-los. O número de dados de Sprep+0 (0/9), e também o seu

comportamento, levou-nos, conseqüentemente, a agrupá-los com Sprep0-

(68/168). Os dados das crianças impossibilitaram uma análise probabilística

prévia, pois há apenas um caso de SprepS- (1/1) e dois de Sprep+0 (0/2)

(ver tabela 6.2.3.18, p.192).


207

Então, não é simplesmente o SPrep que desfavorece a aplicação da

regra, como tem sido dito por todos os pesquisadores que consideraram este

fator, mas sim o SPrep0(0)-. As baixas probabilidades atribuídas ao SPrep

decorrem do fato de a maioria dos casos serem de SPrep0(0)- (92) e não de

SPrep(x)s- (8), o que não nos impediu, a nível grupal, de detectar a mesma

regularidade encontrada nos demais fatores. Não precisamos agora de

explicações ad hoc para dar conta do comportamento do numeral e do

SPrep, ambos com carga semântica de pluralidade. A carga semântica junto

ao SPrep(x)s- favorece mais a aplicação da regra do que os numerais: duas

marcas levam a mais marcas. O numeral, por sua vez, favorece mais a

inserção de marcas no segmento analisado do que o SPrep0(0)-: o numeral

tem a marca semântica de plural que também conduz a marcas e o

SPrep0(0), embora tenha a marca semântica de pluralidade, tem também o

zero formal que conduz a zero. O SPrep0(0)-, por sua vez, se comparado

com x(y)0- que não contém marca semântica intrínseca de pluralidade,

conduz a menor índice de zeros, sendo x(y)0- o fator que conduz a maior

índices de zeros. As probabilidades destes fatores são, na ordem de

favorecimento de aplicação da regra, para os adultos e crianças

respectivamente, as seguintes:

A) SPrep(x)s- ......................................... 0,71 e 100%;

B) numeral na 1a. Posição..................... 0.56 e 0,72;

C) SPrep0(0)- ........................................ 0,34 e 0,28;

D) x(y)0-................................................. 0,04 e 0,01.


208

Considerando agora apenas os "esses" precedentes versus zero(s)

precedente(s), podemos verificar que a presença de ss(s)- (dois ou mais

"esses" precedentes) favorece mais a inserção de -S no segmento analisado

do que a presença de s- (marca na primeira posição imediatamente

precedente) ou do que a presença de y(x)x- (pelo menos um s- precedente

não mediado por zero), embora todos estes três fatores favoreçam a

concordância. A presença de x(y)0- (pelo menos um zero precedente não

mediado por s-, com marca na primeira posição), por sua vez, desfavorece

drasticamente a concordância, como já vimos. Os resultados probabilísticos

são destacados, a seguir, para os adultos e crianças, respectivamente:

A) ss(s)- ................................................. 0,61 e 0,76;

B) s- ....................................................... 0,49 e 0,57;

C) y(x)x- ................................................. 0,47 e 0,58;

D) x(y)0-................................................. 0,04 e 0,01.

Novamente, não são necessárias explicações ad hoc. Os resultados

evidenciam que marcas levam a marcas e zeros levam a zeros. Evidenciam

também que mais marcas de uma só natureza - ss(s) - conduzem a mais

marcas do que uma só marca ou marcas de natureza distinta, evidenciando-

se a força da proximidade no processamento das unidades lingüísticas.

A segunda variável em foco, a Classe gramatical, apresenta as

probabilidades de concordância na tabela 6.2.3.22, para a análise A(Prob.A)

e B(Prob.B).
209

TABELA 6.2.3.22
CLASSE GRAMATICAL: ANÁLISES A e B
CLASSE
GRAMATICAL FALANTES Apl./Total % Prob.A Prob.B

Substantivo Adultos 3347/5871 = 55 0,25 0,25


Crianças 486/1158 = 42 0,22 0,18

Categoria Adultos 75/115 = 65 0,33 0,33


subst. Crianças 15/22 = 68 0,41 0,36

Pronome Adultos 39/45 = 87 0,73 0,73


pessoal Crianças 3/5 = 60 0,48 0,45

Adjetivo Adultos 290/511 = 57 0,23 0,23


Crianças 38/56 = 69 0,36 0,43

Quantificador Adultos 158/248 = 64 0,38 0,38


Crianças 24/26 = 92 0,52 0,61

Possessivo Adultos 241/256 = 94 0,60 0,60


Crianças 68/71 = 96 0,69 0,70

Adjetivo 2 Adultos 33/41 = 82 0,55 0,55


Crianças 1/2 = 50 0,36 0,35

Indefinido Adultos 486/477 = 98 0,81 0,81


Crianças 86/89 = 96 0,72 0,71

Artigo e de- Adultos 3343/3438 = 97 0,62 0,62


monstrativo Crianças 686/702 = 98 0,73 0,74

Esta variável apresenta probabilidades semelhantes nas duas

análises. Considerando a dispersão natural dos números, com base nas

probabilidades da análise B, revelam-se, para os falantes adultos, três

agrupamentos de classes:

1) indefinidos (0,81) e pronomes pessoais (0,73);

2) artigos/demonstrativos (0,62), possessivos (0,60) e adjetivos 2

(0,55);
210

3) quantificador (0,38), adjetivos (0,23), substantivos (0,25) e

categorias substantivadas (0,33).

Utilizando-se o mesmo critério para as crianças, constata-se que,

diferentemente dos adultos, formam-se quatro agrupamentos:

1) artigos/demonstrativos (0,74), indefinidos (0,71) e possessivos

(0,70);

2) quantificador (0,61);

3) pronomes pessoais (0,45), adjetivos (0,43), categorias

substantivadas (0,36) e adjetivos 2 (0,35) e

4) substantivos (0,18).

Pelos agrupamentos feitos acima, percebe-se claramente que não há

uma linha natural, em termos de classe gramatical, determinando-os.

Diversas questões merecem então ser levantadas:

1) Por que os quantificadores e os pronomes pessoais, por exemplo,

têm comportamento diferenciado para ambos os grupos de falantes?

2) Por que os adjetivos se comportam como substantivos nos dados

dos falantes adultos, mas não nos das crianças?

3) Por que os substantivos formam uma categoria isolada nos dados

das crianças?

Antes de tentarmos explicar os agrupamentos categoriais feitos,


211

gostaríamos de apresentar os resultados probabilísticos da variável Posi-ção,

mesmo sem convergência e/ou não selecionados. É oportuno observar que

os valores probabilísticos das variáveis Marcas e Classe gramatical,

apresentados até aqui, trazem em si mesmos o peso probabilístico que

deveria ser atribuído à variável Posição, pois eles foram retirados da etapa

de análise em que se desconsiderou a influência desta variável, por não

haver convergência nos resultados dos adultos e por não ter sido ela

selecionada nos dados das crianças.

Observando as probabilidades da tabela 6.2.3.23, é possível

constatar que a Posição, mesmo ao lado de Marcas precedentes (em função

ou não da posição), ainda tem algum efeito.

TABELA 6.2.3.23
POSIÇÃO LINEAR DOS ELEMENTOS NO SN: ANÁLISES A e B
POSIÇÃO FALANTES Apl./Total.A % Prob.A Prob.B
Primeira Adultos 4230/4340 = 97 (0,58) (0,89)
Crianças 837/856 = 98 (0,44) (0,74)

Segunda Adultos 3263/5778 = 56 (0,56) (0,53)


Crianças 503/1149 = 44 (0,64) (0,44)

Terceira Adultos 454/884 = 51 (0,57) (0,24)


Crianças 60/107 = 56 (0,66) (0,35)

Quarta e Adultos 31/84 = 37 (0,30) (0,26)


quinta Crianças 7/19 = 37 (0,27) (0,45)

A primeira posição favorece mais a aplicação da regra do que as

demais posições, principalmente se observarmos a análise B, que apresenta

resultados lingüísticos melhores dentro das nossas expectativas. A


212

falta de convergência entre os resultados com as três variáveis juntas, e

mesmo a não seleção da variável Posição na análise B, para as crianças,

ocorre pela superposição existente na codificação dos dados. Na análise B,

isto é mais flagrante, pois o fator ausência, da variável Marcas; os artigos e

demonstrativos, da variável Classe; e a primeira posição, da variável

Posição quase se identificam. De qualquer forma, os resultados até então

apresentados já mostram, em quaisquer das análises, que a variável Posição

não é, isolada, a mais forte das três em discussão.

Considerando

1) que as superposições conduzem a resultados probabilísticos

indesejáveis;

2) que os resultados probabilísticos associados à Classe gramatical

não são totalmente satisfatórios do ponto de vista lingüístico, por não se

estabelecerem agrupamentos (a) homogêneos para os dois grupos de

falantes e (b) lingüisticamente naturais do ponto de vista da classe

gramatical;

3) que em termos percentuais já sabemos que o substantivo, o

adjetivo, o possessivo e o quantificador não se comportam da mesma forma

em todas as posições do SN (ver item 6.2.3.4), decidimos transformar Classe

e Posição em uma só variável, ao lado de Marcas precedentes em função da

posição. Esta etapa foi por nós denominada de

análise C.

Daqui para frente, vamos abandonar a análise A - a que considera a

variável Marcas desvinculada da posição -, uma vez que ela encobre


213

regularidades lingüísticas importantes, demonstradas através das

percentagens e das probabilidades associadas aos diversos fatores da

variável Marcas na análise B.

Os resultados obtidos com o cruzamento de Classe e Posição são

apresentados na tabela 6.2.2.24. Todavia, eles servem apenas de

justificativa adicional para a análise D, a análise final, pois continuam sem

convergência para os adultos e, além disso, não selecionados para as

crianças.

Observando-se os resultados sob o ângulo da posição, podemos

verificar, agora em termos probabilísticos, que, para todas as classes

gramaticais, é a primeira posição que mais favorece o índice de marcas

formais de concordância. Mesmo assim, constatam-se diferenças entre as

classes, com intervalos não muito acentuados, à exceção do substantivo:

esta classe é sistematicamente a menos marcada nessa posição. Tal fato

também se evidencia nas percentagens. Todavia, já sabemos que os casos

de ausência de marca nesta posição ocorrem predominantemente em

contexto fonético/fonológico favorável ao cancelamento do -S final.

Creditamos, portanto, a este efeito, parte das baixas probabilidades que aí

se verificam. Na ocasião desta etapa da nossa análise, o contexto

fonético/fonológico seguinte encontrava-se em termos de consoante, vogal e

pausa e não em termos de traços das consoantes, onde se destaca este tipo

de influência. A nosso ver, apenas os artigos e demonstrativos sugerem

alguma sistematicidade não fonético/fonológica de ausência de marcas nesta

posição, pois, como já é do nosso conhecimento também, ocorrem

predominantemente em estruturas do tipo [artigo ou demonstrativo +

possessivo + substantivo] (no meus filhos).


214

TABELA 6.2.3.24
CLASSE GRAMATICAL E POSIÇÃO NO SN: ANÁLISE C
CLASSE E POSIÇÃO FALANTES
Adultos Crianças
Apl./Total % Prob Apl./Total % Prob.

Substantivo 1a pos. 153/161 = 95 (0,62) 16/18 = 89 (0,29)


Substantivo 2a pos. 2756/5175 = 53 (0,33) 419/1052 = 40 (0,28)
Substantivo 3a pos. 317/514 = 62 (0,20) 46/86 = 53 (0,28)

Cat.subst. 2a pos. 59/92 = 65 (0,43) 13/20 = 65 (0,45)


Cat.subst. 3a pos. 16/23 = 70 (0,28) 2/2 = 100 +

Pr.pessoal 1a pos. 12/12 = 100 + xxx


Pr.pessoal 2a pos. 27/33 = 82 (0,80) 3/5 = 60 (0,59)

Adjetivo 1a pos. 47/48 = 98 (0,84) 4/4 = 100 +


Adjetivo 2a pos. 118/156 = 78 (0,48) 18/18 = 100 +
Adjetivo 3a pos. 125/307 = 31 (0,12) 16/40 = 40 (0,31)

Quant. 1a pos. 133/133 = 100 + 23/23 = 100 +


Quant. 2a pos. 3/7 = 43 (0,34) xxx
Quant. 3a pos. 22/108 = 20 (0,10) 1/5 = 20 (0,14)

Possessivo 1a pos. 184/184 = 100 + 42/43 = 98 (0,74)


Possessivo 2a pos. 55/60 = 92 (0,75) 12/13 = 92 (0,87)
Possessivo 3a pos. 2/12 = 17 (0,03) 2/4 = 50 (0,53)

Adjetivo 2 1a pos. 9/10 = 90 (0,46) xxx


Adjetivo 2 2a pos. 21/28 = 78 (0,69) 1/1 = 100 +
Adjetivo 2 3a pos. 3/3 = 100 + 0/1 = 0 -

Indefinido 1a pos. 424/429 = 99 (0,92) 80/80 = 100 +


Indefinido 2a pos. 44/47 = 94 (0,92) 5/8 = 63 (0,64)
Indefinido 3a pos. 0/1 = 0 - xxx

Art.e dem. 1a pos. 3268/3363 = 97 (0,83) 672/688 = 98 (0,83)


Art.e dem. 2a pos. 75/75 = 100 + 14/14 = 100 +

Na segunda posição, a concordância mostra diferenças mais

acentuadas em função da classe gramatical. Artigos e demonstrativos,

indefinidos, adjetivos 2 e possessivos favorecem muito a inserção de


215

marcas e de forma uniforme. Os adjetivos já mostram queda de marcas nos

dados dos adultos, embora a percentagem ainda seja bem alta, e continuam

totalmente marcados nos dados das crianças. A categoria substantivada

apresenta índice baixo de concordância e a categoria menos marcada é o

substantivo. Os pronomes pessoais continuam a evidenciar comportamento

probabilístico semelhante ao dos "determinantes".

Na terceira posição, todas as categorias se apresentam com baixo

índice de marcas, sendo que os substantivos e as categorias substantivadas

são as mais marcadas.

Observando os resultados probabilísticos sob o ângulo da Classe

gramatical, contrapondo a segunda com a terceira posição, podemos

constatar que há sempre uma queda sistemática nas probabilidades dos

possessivos, quantificadores, adjetivos, substantivos e categorias

substantivadas, só que esta queda é mais acentuada nos possessivos,

quantificadores e adjetivos e muito baixa nos substantivos e categorias

substantivadas, o que aponta, no mínimo, para o fato de não se poder

estabelecer identidade ou paralelo entre classe gramatical e posição,

conforme Guy (1981b) o faz.

Com base em toda a argumentação apresentada até o presente

momento, pode-se assim constatar que existe um jogo complexo entre

Marcas precedentes, Classe gramatical e Posição que, a nosso ver,

evidencia-se de forma mais simples se a relação entre Classe gramatical e

Posição for focalizada sob outro ângulo.

Observando a distribuição dos nossos dados, vamos verificar que os

elementos não nucleares que ocorrem na primeira posição são certa-


216

mente todos antepostos ao núcleo do SN. Os da segunda posição também

são predominantemente antepostos. Todos estes casos se apresentam com

índices altos de marcas.

Os elementos não nucleares da segunda posição que têm

ocorrências pospostas são os seguintes: possessivos, quantificador, adjetivo

2 e adjetivo.

Dos 135 casos de possessivos da segunda posição dos falantes

adultos, 130 são antepostos. Dos 130 antepostos, 127 são marcados (98%)

e, dos cinco pospostos, três são marcados (60%). Dos 25 casos dados das

crianças, há apenas dois pospostos e um deles sem marca: (50%). Dos 23

antepostos, todos são marcados (100%).77

Os casos de adjetivo 2 desta posição são também antepostos e

pospostos. Dentre as 28 ocorrências dos adultos, 25 são antepostas e,

destas, 21 são marcados (84%). Os três casos pospostos são todos não

marcados. Este tipo de dado, no caso das crianças, ocorre apenas duas

vezes. Os dois casos que ocorrem (em verdade dois casos de numeral

ordinal) são antepostos ao núcleo: um deles é marcado e o outro não.

Dentre os adjetivos, há 163 casos dos adultos. Destes, 39 são

antepostos e 124, pospostos; fato que indica o porquê da queda da

concordância do adjetivo nesta posição, no caso dos adultos. Dos 39

antepostos, 36 são marcados (92%) e, dos 124 pospostos, 89 o são (72%).

Todos os adjetivos desta posição nos dados das crianças são marcados. A

maioria deles é, todavia, posposta: 13 em 18 (72%). Apenas cinco são

antepostos: 28%. Somente os adjetivos da segunda posição, nos dados das

crianças, fogem ao raciocínio geral que estamos estabelecendo: o


217

elo que une as classes gramaticais não nucleares, até aqui codificadas como

primeira e segunda posição, é basicamente a sua colocação anteposta ao

núcleo, enquanto o elo que une as classes gramaticais não nucleares da

terceira, quarta e quinta posição é a sua posposição ao referido núcleo.

Como o número de dados dos adjetivos da segunda posição nos dados das

crianças é bem menor - há 18 casos para elas e 163 para os adultos - ,

vamos assumir que a nossa linha de raciocínio é correta para todos os

falantes.

Retomando a distribuição dos elementos não nucleares, verificamos

que todos os casos de quantificador da segunda posição são pospostos e

com baixa concordância e, além disso, que todos os casos não nucleares de

terceira, quarta e quinta posições são todos pospostos ao núcleo, exceto dois

casos de adjetivo 2 (o meus PRÓPRIOS filhos; as duas PRIMERA viage), e

são eles que apresentam os mais baixos níveis de marcas.

Somos levados a concluir, portanto, que a relação entre a Classe

gramatical e Posição, no que toca aos elementos não nucleares, deve ser

vista à luz de como eles se distribuem ao redor do núcleo: não importa


exatamente nem a classe nem a posição nuclear, mas sim a posição do

elemento não nuclear em relação ao centro do SN.

Feito este raciocínio, apresentamos então a análise D que mantém a

variável Marcas precedentes conforme codificada na análise B e transforma

Classe e Posição em uma só variável, denominada Relação entre os

elementos no SN.

Os elementos nucleares continuaram a ser codificados em função da

posição por já termos indícios de sua atuação um pouco diferenciada em tais

circunstâncias.
218

A variável Relação ficou, portanto, constituída de nove fatores, a

seguir especificados:

1) substantivo na 1a. Posição;

2) substantivo na 2a. Posição;

3) substantivo na 3a. Posição;

4) categoria substantivada na 2a. Posição;

5) categoria substantivada na 3a. Posição;

6) pronome pessoal na 1a. Posição;

7) pronome pessoal na 2a. Posição;

8) classe não nuclear anteposta e

9) classe não nuclear posposta.

Passamos a apresentar os resultados da análise D. Em primeiro

lugar, nas tabelas 6.2.3.25 a 6.2.3.27, encontram-se os resultados da

variável Relação entre os Elementos do SN e, em segundo, nas tabelas

6.2.3.28 a 6.2.3.32, encontra-se a variável Marcas precedentes com seus

resultados finais.

Nesta análise, a análise alternativa D, a variável Marcas continua

sendo selecionada em primeiro plano com significância 0,0 para os dois

grupos de falantes, dentre nove e oito variáveis respectivamente.78 A

variável Relação é selecionada em quarto lugar nos adultos com significância

ainda 0,0 e em terceiro para as crianças com significância 0,000. A análise

dos adultos apresentou convergência até a iteração 31 com significância final

de 0,000 e a análise das crianças apresentou convergência até a iteração 57,

com significância final de 0,001. Os resultados da variável Relação

encontram-se na tabela 6.2.3.25, a seguir.


219

TABELA 6.2.3.25
RELAÇÃO ENTRE OS ELEMENTOS DO SN: ANÁLISE D
FATORES FALANTES
Adultos Crianças
Apl./Total % Prob. Apl./Total % Prob.
Subst.na
1a. pos. 153/161 = 95 0,66 16/18 = 89 0,34

Subst.na
2a.pos. 2756/5176 = 53 0,23 419/1052 = 40 0,21

Subst.na
3a.pos. 317/514 = 62 0,38 48/86 = 53 0,56

Categoria
subst. na 59/92 = 64 0,33 13/20 = 65 0,36
2a.pos.

Categoria
subst. na 16/23 = 70 0,49 2/2 = 100 +
3a.pos.

Pronome
pessoal 12/12 = 100 + xxx
na 1a. pos.

Pronome
pessoal 27/33 = 82 0,72 3/5 = 60 0,49
na 2a.pos.

Classe não
nuclear 4291/4406 = 97 0,87 857/877 = 98 0,87
anteposta

Classe não
nuclear 242/565 = 43 0,25 31/63 = 49 0,61
posposta

Os resultados da tabela 6.2.3.25 confirmam as nossas expectativas:


220

1) As classes não nucleares antepostas são mais marcadas do que

as pospostas; então, não é o adjetivo que é pouco marcado, mas o adjetivo

posposto. Também não é o quantificador que é muito marcado nos dados

das crianças e pouco marcado nos dos adultos, mas o quantificador

anteposto ou o quantificador posposto, respectivamente (ver o número de

dados na tabela 6.2.3.24). Generalizando, qualquer classe gramatical

anteposta ou qualquer classe gramatical posposta ao núcleo do SN

apresenta, respectivamente, mais ou menos chances de conter marcas

formais de plural. A simples afirmação de que a primeira posição do SN é a

mais marcada também não é, portanto, adequada. O elemento nominal não

nuclear pode estar até na terceira posição, mas, se estiver anteposto ao

núcleo, apresenta também mais chances de ser marcado do que o posposto.

Além disso, o substantivo da primeira posição é menos marcado do que as

classes antepostas que ocupam primeira e segunda posição dentro do SN,

mesmo nos dados dos adultos.

2) Os substantivos não são igualmente marcados em todas as

posições: na primeira e na terceira são sempre mais marcados do que na

segunda, o que refuta conclusões de que o substantivo é uma das classes

gramaticais menos marcadas (cf. CEDERGREN, 1973, p.46; POPLACK,

1980a, p.1-62; POPLACK, 1980b, p.373 e POPLACK, 1981, p.61), embora

Poplack já afirmasse também que o substantivo tendia a ser mais marcado

na primeira posição (cf. 1980a, p.65). Com relação ao comportamento do

substantivo na terceira posição, os nossos resultados não têm precedentes

na literatura lingüística.

3) As categorias substantivadas se comportam, em termos de

hierarquia, da mesma forma que os próprios substantivos; são mais

marcadas na terceira do que na segunda posição.


221

4) Os pronomes pessoais, embora apresentem probabilidades

significativamente mais altas do que os substantivos, evidenciam, como eles,

maior número de marcas na primeira do que na segunda posição.

Temos agora agrupamentos de classes naturais do ponto de vista

lingüístico. Os elementos não nucleares se agrupam em função da sua

relação com o núcleo do SN e os núcleos se agrupam em termos da posição

que ocupam dentro do SN.

A hipótese que levantamos neste momento para explicar a influência

desta variável é a da coesão sintagmática. Verificamos em nossos dados que

os únicos constituintes que aceitam elementos entre eles, modificadores ou

não, são os substantivos e seus elementos pospostos, pois deparamo-nos

com SNs do tipo:

- as brincadera mais usadas (Glo11,fp,48a);

- os irmãos mais novos (Ari30,fg,43a);

- aquelas lojinhas bem baratinhas (Joa10,fp,27a);

- as coisa muito certa (Ari30,fg,43a);

- as conta quase toda (Mag47,fc,53a);

- as costura mais séria (Seb09,mp,53a);

- essas ropinha bem fácil (Seb09,mp,53a);

- as camisa lá de Curitiba muito bonitas (Nil12,fp,45a);

- aqueles morro lá pra cima iscundido (Lui08,mp,57a);

- os documento dela todinho (Jro64,mg,14a).

Todavia, entre os próprios elementos antepostos e entre estes e os

seus núcleos raramente se encontra qualquer segmento. Dentre, apro-


222

ximadamente, 7193 SNs por nós analisados, encontramos apenas um caso

do tipo:

- os meus mais velhos amigos (Fat56,fg,14a).

A quase totalidade dos SNs do tipo

- os meus filhos (Dal18,fp,71a);

- todas as pessoas (Ubi21,mg,20a);

- as pequenas passagens (Eve43,fc,42a);

- os maiores problemas (Cab02,mp,16a);

- algumas outras coisas (Par41,mc,26a);

- as mesmas coisas (Par41,mc,26a)

não apresenta, portanto, segmentos intervenientes entre quaisquer de seus

constituintes.

Os constituintes dos SNs que aceitam ser separados por quaisquer

elementos têm uma relação sintagmática menos coesa; e o menor número

de marcas nesta situação deve ser visto como índice da não ligação formal

estreita entre estes constituintes. Inversamente, os constituintes que não

aceitam ser separados marcam formalmente esta inseparabilidade através

de mais inserção do morfema de plural. Esta hipótese dá conta inclusive do

fato de os sintagmas que têm o substantivo como seu último constituinte não

privilegiarem estruturas do tipo s00 (AS OTA menina; NOS PRIMERO

capítulo). Há apenas 15 casos deste tipo num total de 595 (2%) (ver quadro

6.2.3.17, p.190, tipo x00). Estas construções são do tipo mais coeso.

Lançando mão da noção da Motivação Icônica de Haiman de que "a

distância entre expressões corresponde à distância conceptual entre as

idéias que elas representam" (1983, p.782),79 diríamos que temos aí o


223

funcionamento do Princípio da Iconicidade. Há uma relação direta entre o

grau de coesão sintagmática entre os elementos do SN e o número de

marcas existentes: quanto mais coesão, mais marcas; quanto menos coesão,

menos marcas. Isto explica também por que o substantivo ou a categoria

substantivada tendem a ter mais marcas na terceira posição do que na

segunda: os da terceira posição estão inseridos dentro de uma estrutura

mais coesa. O substantivo e a categoria substantivada que ocorrem na

segunda posição pertencem, por sua vez, a dois tipos de estrutura

sintagmática: (1) uma constituída de dois elementos em que a questão da

coesão, a nosso ver, não se coloca e (2) outra constituída de [numeral +

substantivo + adjetivo], ou seja, do tipo considerado como menos coesivo:

- dois susto bem grande (Lei04,fp,25a);

- dois istatuto totalmente diferente (Cla27,mg,32a);

- dez senhoras lá sentada (Geo31,mg,58a);

- dez dias mais maravilhóso (Dor29,fg,44a).

A forte atuação do pronome pessoal na segunda posição não é

explicada pelo princípio da coesão sintagmática: eles ocorrem basicamente

em estruturas de dois elementos (ELES todos; todos ELES). Uma hipótese

que se levanta é que ele seja uma categoria mais marcada por pertencer a

um paradigma bem definido. O fato de se marcarem mais os substantivos e

os pronomes pessoais da primeira posição também não se explica por este

mesmo princípio: atua aí a tendência de línguas como o Português e o

Espanhol marcarem qualquer elemento nuclear na primeira posição.


224

Queremos retomar novamente a questão do paralelo feito por Guy

(1981b) entre determinante e primeira posição, entre substantivo e segunda

posição e entre adjetivo e terceira posição. Os resultados apresentados até

aqui mostram que não se pode estabelecer identidade entre determinante e

primeira posição, pois os determinantes ocorrem tanto na primeira quanto na

segunda posição e com probabilidades altas de concordância, por serem

antepostos. Além disso, o substantivo se apresenta nas três posições, com

probabilidade de ter mais marcas na primeira e terceira posições. O adjetivo,

como uma categoria posposta na terceira posição, é menos marcado do que

o próprio núcleo nesta mesma posição. Para dissipar quaisquer dúvidas,

fizemos uma análise probabilística só dos substantivos e adjetivos. Os

resultados serão vistos a seguir.

Nas tabelas 6.2.3.26 e 6.2.3.27, temos os resultados considerando,

respectivamente, (1) todos os dados e (2) apenas os SNs de três ou mais

elementos, cuja estrutura propicia o aparecimento de [determinante +

substantivo + adjetivo] e [determinante + adjetivo + substantivo].80


225

TABELA 6.2.3.26
CRUZAMENTO DE SUBSTANTIVOS E ADJETIVOS E
POSIÇÃO EM TODOS OS DADOS DOS ADULTOS
CLASSE GRAMATICAL Apl./Total % Prob.
Substantivo na
primeira posição 153/161 = 95 0,68

Substantivo na
segunda posição 2756/5157 = 53 0,27

Substantivo na
terceira posição 317/514 = 62 0,43

Adjetivo anteposto 80/84 = 95 0,80

Adjetivo posposto 210/427 = 49 0,29


226

TABELA 6.2.3.27
CRUZAMENTO DE CLASSE GRAMATICAL E POSIÇÃO EM
SNS DE TRÊS OU MAIS CONSTITUINTES NOS DADOS
DOS FALANTES ADULTOS
CLASSE GRAMATICAL Apl./Total % Prob.
E POSIÇÃO
Substantivo na
primeira posição 1/1 = 100 +

Substantivo na
segunda posição 179/356 = 50 0,22
Substantivo na
terceira posição 313/510 = 62 0,28

Adjetivo na
1a. posição xxx
(anteposto)

Adjetivo na
2a. posição 35/38 = 92 0,64
(anteposto)

Adjetivo na
3a. posição 100/260 = 38 0,16
(posposto)

Determinante (art.,
dem. e ind.) na 666/747 = 89 0,70
primeira posição
(anteposto)

Determinante (art.,
dem. e ind.) na 113/116 = 97 0,92
2a. e na 3a.posição
(anteposto)

Determinante
(indefinido) na 0/1 = 0 -
3a. posição
posposto)

Os resultados continuam os mesmos: os substantivos da segunda

posição são menos marcados do que os adjetivos nesta mesma posição;

inversamente os adjetivos da terceira posição é que são menos marcados do

que os substantivos aí presentes. A diferença entre os substantivos


227

da segunda e terceira posições na análise que considera todos os dados é

maior porque, naquele caso, os substantivos da terceira posição apresentam

contraste com os substantivos da segunda posição em SNs de dois

constituintes, os quais são menos marcados. Há um único caso de

substantivo na primeira posição (PONTOS existenciais muito atual) e um

indefinido na terceira (uns negócio QUALQUER). Merece destaque a dife-

rença de probabilidade entre determinantes da primeira(0,70) e da

segunda(0,92) posição: é bem maior nestes casos. Este resultado decorre

simplesmente do fato de a maioria das ausências de marcas em

determinantes da primeira posição ocorrerem em SNs de três ou mais

constituintes, na já tão discutida estrutura [artigo ou demonstrativo +

possessivo + substantivo] (no meus filhos).

Concluindo, fica definitivamente evidenciado que não se pode

estabelecer um paralelo entre Classe e Posição sem se perderem fatos

lingüísticos importantes.

No que diz respeito ainda à relação entre Classe gramatical e

Posição, gostaríamos de fazer uma observação final sobre a distribuição do


possessivo, do quantificador e do adjetivo.

O possessivo, quando anteposto, ocorre predominantemente em

estruturas com artigo definido (os meus filhos) e, quando posposto, em

estruturas que não possuem artigo definido (algumas colega minha; três

colega meu).

O quantificador, quando posposto, é realizado, às vezes, como tudo

(uns cabelo tudo arrepiado), elemento não flexionável e, portanto, não

considerado neste trabalho.

O adjetivo anteposto, por sua vez, é basicamente do tipo


228

"avaliativo" (grande, novo, maior, pior, melhor, bom, mau, belo). O adjetivo

posposto é de tipo diverso. Além do "avaliativo", há o "qualificativo" (humilde,

estranho, público, festivo, pelado), o "deverbal" (caído, aberto, largado,

marcado), o "substantivo adjetivado" (médico, menina, amigo), o indicativo de

nacionalidade ou de naturalidade (argentino, português, holandês, mineiro) e

o designativo de cores (preto, verde, azul)

Levanta-se apenas uma pergunta: será que tais categorias

antepostas ou pospostas são "a mesma categoria"? Chegamos a pensar que

o adjetivo "avaliativo" pudesse apresentar maior índice de concordância

mesmo quando posposto, o que levaria à conclusão de que o índice de

marcas de plural no adjetivo fosse função de traços semânticos e não de sua

distribuição ao redor do núcleo. Concluímos, em termos percentuais, que o

adjetivo "avaliativo" posposto apresenta o mesmo grau de concordância de

que os demais adjetivos pospostos, o que não nos incentivou a codificar em

detalhes as suas subclasses semânticas. Todavia, questões desta natureza

ficam como propostas para pesquisas futuras.

Uma vez explicados os principais fatos relacionados à variável

Relação, vamos apresentar as discussões finais sobre a variável Marcas

precedentes. A reapresentação de seus resultados se justifica pelo fato de

estarmos analisando variáveis muito relacionadas. É fundamental então

verificarmos se os mesmos pesos probabilísticos foram atribuídos à variável

Marcas, nesta nova forma de se analisarem os fatos.

Conforme podemos ver a partir dos resultados da tabela 6.2.3.28, as

grandes oposições não se modificaram.


229

TABELA 6.2.3.28
MARCAS PRECEDENTES E POSIÇÃO: ANÁLISES B E D
MARCAS E POSIÇÃO FALANTES
POSIÇÃO DE
ANÁLISE Adultos Crianças
% Prob.B Prob.D % Prob.B Prob.D

Ausência 1 97 0,92 0,79 98 0,93 0,92

Zero na
1a. posição 2 100 + + 100 + +

Numeral na
1a. posição 2 58 0,56 0,63 57 0,72 0,82
s- na 1a.
posição 2 55 0,49 0,55 41 0,57 0,69

SPrep(x)s- 2,3 69 0,71 0,74 100 + +


SPrep0(0)- 2,3 38 0,34 0,41 17 0,28 0,39

ss(s)- 3,4 70 0,61 0,60 72 0,76 0,62


y(x)x- 3,4,5 54 0,47 0,41 47 0,58 0,34
x(y)0- 3,4,5 6 0,04 0,06 4 0,01 0,02

A ordem entre SPrep(x)s-, numeral na primeira posição, SPrep0(0)- e

x(y)0- não se alterou. Temos para os adultos e crianças, nas análises 2 e 3,

respectivamente, as seguintes probabilidades:

A) SPrep(x)s- ......................................... 0,71/0,74 e 100%/100%;

B) numeral na 1a.posição ...................... 0,56/0,63 e 0,72/0,82;

C) SPrep0(0)- ........................................ 0,34/0,41 e 0,28/0,39;

D) x(y)0-................................................. 0,04/0,06 e 0,01/0,02.

Além disso, a presença de ss(s)- continua a favorecer mais a

aplicação da regra (0,61/0,60 e 0,76/0,62) no elemento seguinte do que a


230

presença de pelo menos um s- não mediado por zero (0,47/0,41 e 0,58/0,34).

A diferença, inclusive, se acentua.

A diferença entre a influência do numeral e a do s- na primeira

posição sobre o elemento que ocorre na segunda permanece quase

inalterada, embora os valores absolutos tenham mudado. Na análise B, esta

diferença é de 0,07 para os adultos e de 0,15 para as crianças; na análise D,

ela é de 0,08 para aqueles e de 0,13 para estes.

Confirma-se também o fato de a ausência fora do SN e de o zero na

primeira posição do SN serem os fatores que mais favorecem a inserção de

marcas no elemento nominal da primeira e da segunda posição,

respectivamente.

Da análise B para a D, ocorreu o seguinte:

1) Modificou-se a magnitude da influência da ausência fora do SN nos

adultos (0,92 na análise B e 0,79 na análise D). Nos resultados das crianças

isto não ocorre. Em compensação, neste caso, os substantivos da primeira

posição receberam menor peso probabilístico (0,35) do que nos adultos

(0,66) (ver tabela 6.2.3.25, p.219). A ordenação, todavia, não mudou em

nenhuma das situações.

2) Surgiram diferenças entre a influência do s- da primeira posição

sobre a segunda e do y(x)x- sobre as demais, em favor do primeiro fator.

Temos então para os adultos e crianças, nas análises B e D, o seguinte:

A) s- na primeira posição ....................... 0,49/0,55 e 0,57/0,69;

B) y(x)x- ................................................. 0,47/0,41 e 0,58/0,34.


231

Enquanto na análise B a diferença entre estes dois fatores é de 0,02

para os adultos e de 0,01 para as crianças, na análise D, ela é de,

respectivamente, 0,14 e 0,35. Mesmo assim, novamente a ordenação não foi


alterada.

3) Modificou-se a ordenação entre os fatores s- e ss(s)- nas crianças.

Na análise B, havia uma diferença de 0,19 em favor de ss(s)-. Esta situação

se inverte com alteração na diferença: 0,07 em favor de s-.

De uma forma geral, podem-se interpretar as mudanças ocorridas


pelo fato de se ter medido o restante da influência da variável Posição, agora

presente na variável Relação (ver tabela 6.2.3.23, p.211).

As modificações nos resultados das crianças foram mais drásticas,

especialmente as que envolvem a inversão de ordenação na influência dos

fatores s- e ss(s)-. O que ocorre é o seguinte: a metodologia que estamos

usando, ao comparar as diversas variáveis, procura atribuir os valores

devidos a cada uma delas, do ponto de vista estritamente estatístico. Ao se

comparar o efeito das variáveis em foco, Marcas precedentes e Relação, o

programa usado atribuiu valor relativamente alto às classes não nucleares

pospostas (0,60) e ao substantivo na terceira posição (0,55). Isto provocou

um abaixamento nas probabilidades de ss(s)- e de y(x)x- com conseqüente

aumento para s- e numeral na primeira posição.

Comparando-se os passos feitos pelo programa, podemos ver as

probabilidades dos fatores em jogo nestas variáveis, da forma em que se

segue, na tabela 6.2.3.29.


232

TABELA 6.2.3.29
INTERFERÊNCIA ENTRE MARCAS PRECEDENTES E RELAÇÃO DOS
ELEMENTOS DO SN NOS RESULTADOS DAS CRIANÇAS
MARCAS PROBABILIDADES
E
POSIÇÃO Isoladas Só com a variável Com todas as
Relação variáveis

Numeral na
1a. posiçâo. 0,58 0,84 0,82

s- na 1a.
posição 0,42 0,70 0,69

ss(s)- 0,73 0,58 0,62

y(x)s- 0,47 0,32 0,34

RELAÇÃO DOS
ELEM. NO SN

Classe não
nuclear 0,27 0,65 0,61
posposta

Subst. na
3a. posição 0,31 0,60 0,56

Podemos observar claramente, na tabela 6.2.3.29, que as

probabilidades isoladas dos fatores em questão se modificam bastante, até o

último passo da análise, sendo que esta mudança acentuada não ocorre nos

dados dos falantes adultos.

Considerando que os resultados das crianças é que estão um pouco

discrepantes de todos os que encontramos até agora e considerando

também que elas apresentam menos dados do que os adultos, pesquisas

futuras terão oportunidade de verificar se as pequenas diferenças aqui

apontadas ocorrem apenas devido ao número de dados ou se o

comportamento das crianças apresenta real diferença com relação à im-


233

portância probabilística absoluta atribuída, principalmente, ao substantivo de

terceira posição e à classe não nuclear posposta.

Cumpre inclusive observar que os valores probabilísticos iniciais

atribuídos a todos os fatores das variáveis Marcas e Relação são

extremamente semelhantes nos dados das crianças e dos adultos. Na

comparação entre os fatores, surgem algumas alterações mais fortes

exatamente nos resultados das crianças, o que não é inesperado quando se

trabalha com variáveis relacionadas e com um número relativamente

pequeno de dados. Nestes casos, o maior número de dados é certamente

fundamental para que as probabilidades possam ser adequadamente

associadas aos diversos fatores em jogo. Mesmo se constatando algumas

diferenças, as probabilidades finais associadas aos fatores das variáveis

Marcas e Relação, para os adultos e para as crianças, em termos de

hierarquia, são muito paralelas.

Resta agora interpretar o comportamento da variável Marcas

precedentes.

A explicação da influência desta variável não tem nenhum suporte

funcionalista, no sentido de Kiparsky (1972). Uma vez marcada a primeira

posição do SN ou, em alguns casos, a segunda, o número de marcas

seguintes é função da forma de processar a informação. Usando as palavras

de Schiffrin,

(...) parece haver uma tendência geral para formas


gramaticais particulares ocorrerem juntas. (...) podendo
tal fenômeno resultar de uma restrição mais mecânica na
continuação de uma forma a não ser que haja razão para
a mudança (...). (SCHIFFRIN, 1981, p.55-6).81

A tendência geral explicitada acima rege não só este fenômeno, mas

uma série de outros em Português, bem como não rege apenas o


234

funcionamento do Português e do Espanhol, mas também o do Francês, o do

Inglês, o do Quechua e o do Crioulo Caboverdiano. Isto sugere que qualquer

abordagem adequada da linguagem, seja sob o rótulo de lingüística da língua

ou de lingüística da fala, de teoria da competência ou de teoria do

desempenho, tem de conter princípios que dêem conta da tendência geral

de formas gramaticais particulares ocorrerem juntas (cf. SCHIFFRIN, 1981,

p.16).

O comportamento desta variável, em especial, mostra que a

explicação dos fatos lingüísticos está fora da gramática: a influência

recíproca, resultante da proximidade entre fenômenos, faz parte da forma da

mente humana operar em circunstâncias as mais diversas. No capítulo 7

deste trabalho, vamos retomar esta discussão e vamos propor a existência

do Princípio do Processamento Paralelo para explicar o funcionamento deste

tipo de variável que exerce uma forte influência sobre fenômenos diversos de

diversas línguas.

Focalizando apenas os numerais da primeira posição, é possível

entender agora, com clareza, que a sua influência sobre marcas na segunda

posição nada tem realmente de funcionalista no sentido kiparskiano. Com

base numa hipótese desta natureza, seria de se esperar que os elementos

seguintes aos numerais fossem menos marcados, uma vez que se afirma

serem os contextos, em que há um numeral, mais óbvios do ponto de vista

da pluralidade (cf. GUY, 1981, p.180). Além disso, Poplack coloca que

embora os fatores funcionais tenham um efeito


relativamente menor do que outros a ordenação dos
fatores dentro dos grupos funcionais é clara. A
informação adicional de plural favorece o cancelamento
da marca, ao passo que quando a única possibilidade de
marcar o plural é flexional, dentro do próprio SN, uma
marca tende a ser retida. Esta é uma tendência, mas ela
é um tanto fraca. (POPLACK, 1980a, p.62-3)82
235

Os nossos resultados relativos à influência dos numerais da primeira

posição são diferentes dos resultados do Espanhol no sentido acima

relatado.

Os numerais da primeira posição favorecem mais a inserção de

marcas na segunda posição do que o s- nesta mesma posição. Esta

tendência também foi verificada por Scherre (cf. 1978, p.111-2), Ponte (cf.

1979, p.163) e Guy (cf. 1981a, p.179-80). É bom relembrar aqui que Scherre

e Guy dão explicações diferentes e ad hoc para o funcionamento do numeral,

pois partem de um pressuposto geral inadequado para o fenômeno

lingüístico em questão: um pressuposto funcionalista no sentido kiparskiano

do termo. Repetindo, o que está em jogo aqui é a tendência geral de formas

semelhantes se agruparem (cf. SCHIFFRIN, 1981, p.51-7). Consideramos,

portanto, que a atuação do numeral se explica também dentro desta mesma

linha: marcas conduzem a marcas, inclusive quando esta marca é semântica.

Resta ainda uma outra indagação sobre o comportamento dos

numerais: haveria alguma diferença entre a atuação daqueles que terminam

em -S (três ANOS) e os numerais que não terminam em -S (quinze ANOS)?

Estariam os falantes interpretando o -S final dos numerais como plural e

inserindo mais marcas em elementos nominais precedidos por numerais

terminados em -S? Fizemos um levantamento de todos os numerais em SNs

de dois elementos dos dados dos adultos e das crianças, e, eliminados os

casos de neutralização (seis sócios, por exemplo), obtivemos os resultados

percentuais apresentados na tabela 6.2.3.30.


236

TABELA 6.2.3.30
SOBRE A INFLUÊNCIA DA TERMINAÇÃO DOS NUMERAIS NOS SNS
DE DOIS CONSTITUINTES
FATORES FALANTES
Adultos Crianças
Apl./Total % Apl./Total %
Numeral precedente
terminado em -S
(três anos) 382/661 = 58 78/142 = 55
(dois em dois meses)
(trinta e seis horas)

Numeral precedente
não terminado em -S
(quinze anos) 460/783 = 59 61/109 = 56
(nove anos)
(dez mil cruzeros)

Podemos observar que não existe diferença de marcas no segmento

da segunda posição se o numeral precedente termina ou não em -S. Como a

diferença percentual é quase nula, dificilmente haveria qualquer diferença

probabilística para estes dois fatores, o que não justifica a sua codificação.

Concluímos, portanto, que os "esses" que conduzem a "esses" são

apenas os que têm a informação semântica de pluralidade. Embora Schiffrin

fale em restrição mecânica, ela não é tão mecânica assim, pois, se o fosse,
atingiria também os "esses" precedentes sem informação de plural.

O comportamento do SPrep explica-se também sob as mesmas

bases, uma vez que o SPrep(x)s- conduz a mais marcas do que o SPrep0(0)-

e este por sua vez conduz a mais marcas do que a existência de um zero

num segmento que não tem marca semântica alguma de pluralidade.


237

Os únicos fatores desta variável que apontam para o funcionamento

da hipótese funcionalista kiparskiana são os que dizem respeito à ausência

fora do SN e ao zero na primeira posição, os quais determinam altos índices

de marcas nos elementos analisados. Este tipo de hipótese funcionalista não

explica, todavia, porque as marcas tendem a ocorrer nos elementos

nucleares antepostos e não nos pospostos. Também não explica porque os

substantivos da terceira posição são mais marcados do que os da segunda.

Além disso, já observamos detidamente que a maioria dos casos da segunda

posição precedida de zero envolve uma estrutura bem característica [artigo

ou demonstrativo + possessivo + substantivo]. A questão nada tem de

funcional em termos de Kiparsky (1972), pois os possessivos da segunda

posição são muito marcados quer sejam precedidos do zero (100%) quer

sejam precedidos de s- (92%): o fato é que todos os elementos não

nucleares antepostos tendem a ser muito marcados.

A nosso ver, a hipótese funcionalista, no sentido de Kiparsky (1972),

só explica em verdade a possibilidade da concordância de número entre os

elementos do SN Português ser variável, ou seja, por ser um mecanismo

considerado redundante, é possível haver ausência de marcas sem prejuízo

da informação.

Segundo Poplack, Terrell mostrou, para o Espanhol de Cuba, "(...)

que os falantes (...) constantemente evitavam suprimir todos os traços

morfológicos do plural (...)." (POPLACK, 1981a, p.63)83 Ela considera,

todavia, que isto não se aplica ao Espanhol de Porto Rico, pois há

(...) quase 1000 exemplos de seqüências de SN


contendo dois ou três elementos, sem nenhuma marca
morfológica. Além disso, a taxa de cancelamento (...)
238

é até mais alta quando o elemento analisado é precedido


por dois zeros (94%) do que quando é precedido por um
(82%). (POPLACK, 1980a, p.63) 84

O que ocorre com o Português do Brasil é análogo, neste aspecto, ao

Espanhol de Cuba, pois não há nenhum caso de SN sem marca formal ou

semântica de plural, a não ser os casos do tipo genérico, conforme já

discutimos no item 6.2.3.6, p.183-197.

Vimos, portanto, que a variável Marcas precedentes da forma agora

estudada pode ser explicada consistentemente pela "tendência geral de

formas semelhantes aparecerem juntas".

Finalmente, cumpre-nos observar que, ao analisarmos apenas os

SNs de três ou mais elementos, a propósito da variável Relação, a influência

do grupo Marcas precedentes permanece praticamente uniforme. O único

aspecto que merece destaque é a ausência de diferença entre um s-

precedente (0,58) e um numeral precedente (0,56) na primeira posição. Isto

ocorre porque as estruturas aí envolvidas são do tipo três cavalos lindo, dois

colega meu, em que há uma preferência nítida pelas seqüências n00. Em 40

seqüências n--, há:

A) uma do tipo n0s(2,5%);

B) seis do tipo nss(15%);

C) dez do tipo ns0(25%)e


D) 23 do tipo n00(57,5%).

Percebe-se desta forma que a estrutura sintagmática como um todo

está claramente envolvida. Conforme já colocamos na introdução deste

capítulo, estamos analisando todos os SNs sob uma perspectiva


239

atomística, considerando cada constituinte flexionável como um dado de

análise. Vamos ainda analisar todos os SNs de três ou mais constituintes dos

falantes adultos sob uma perspectiva não atomística, considerando o SN

inteiro como a unidade de análise. Nesta segunda perspectiva,

consideramos, entre outras, a variável Estrutura sintagmática do SN, cujos

resultados e conclusões vamos apresentar no item 6.3 .

Uma última palavra sobre a variável Posição precisa ser dita.

Colocamos, no início desta discussão, que esta variável apresentava, de

uma forma geral, resultados bastante semelhantes. Vimos também que

algumas pesquisas detectaram uma linha decrescente em termos de

desfavorecimento da concordância, a partir da primeira posição, enquanto

outras detectaram a elevação da concordância na quarta posição. É possível

levantar a hipótese de que, nas análises que detectaram a tendência à

elevação da probabilidade na quarta posição, os SNs em jogo terminassem

em substantivo ou tivessem o seu último elemento precedido de elementos

anteriores marcados.
240

6.2.3.8 - Conclusão

Acabamos de comprovar que a variável Posição isolada das Marcas

precedentes e da Classe gramatical não dá conta do fenômeno lingüístico

em estudo na sua totalidade. A melhor análise para este fenômeno, quer do

ponto de vista lingüístico, quer do ponto de vista estatístico, é, portanto, a

que considera estas três variáveis transformadas em duas:

1) Marcas precedentes em função da posição e

2) Relação entre elementos nucleares e não nucleares e posição dos

elementos nucleares dentro do SN.

Esta análise é mais adequada do ponto de vista estatístico porque

apresenta convergência com todas as variáveis juntas e apresenta também

log likelihood mais próximo de zero do que as outras análises. Ela é mais

adequada do ponto de vista lingüístico, porque dá conta de descrever

adequadamente a influência das variáveis Classe gramatical, Posição e

Marcas precedentes transformadas em duas, através do cruzamento entre

elas. Desta forma, evidenciam-se aspectos fortemente regulares que

envolvem, inclusive, casos de poucas ocorrências, como a questão dos

adjetivos antepostos em SNs de três constituintes, ou a presença de

marcas ou de zeros no quarto e no quinto elemento do SN.

Finalmente, além de uma descrição adequada, a nossa análise

fornece explicações contundentes para o funcionamento da variável Marcas

e da variável Relação, trazendo evidências de que o Português e o Espanhol,

duas línguas que marcam a pluralidade da mesma forma,


241

apresentam mais similaridades do que diferenças, no que diz respeito a um

condicionamento forte não funcionalista no sentido de Kiparsky (1972).

Nos subitens seguintes, ainda na perspectiva atomística, vamos

apresentar os resultados das variáveis restantes, que são:

- o Contexto fonético/fonológico seguinte;

- a Função sintática do SN;

- os Traços mórficos, semânticos e estilísticos do substantivo e/ou do

adjetivo.

6.2.4 - Contexto fonético/fonológico seguinte

6.2.4.1 - Introdução

Na análise do contexto fonético/fonológico seguinte, a primeira

expectativa que surge é a de que a busca do padrão silábico CV influencie a

ausência de concordância nominal que, em 95% dos casos, consiste apenas

na inserção de -S: um elemento de natureza consonântica. Sendo assim,

espera-se que uma vogal seguinte favoreça a inserção de marcas formais de


plural no SN, porque o fenômeno da elisão propiciará a ligação entre a

consoante final do item anterior com a vogal inicial da primeira sílaba do item

seguinte, dando uma sílaba do padrão CV, de tendência universal. De uma

forma oposta, espera-se que uma consoante seguinte a iniba, deixando de

provocar um travamentro silábico do tipo CVC, uma vez que não há

possibilidade de ocorrer o fenômeno da ligação (cf. CÂMARA JR., 1975,

p.50-1 e GUY, 1980, p.7-8;27-9).


242

Todavia, diversos trabalhos sobre o cancelamento ou inserção do -S

morfêmico, e até do não morfêmico, têm mostrado que a diferença

probabilística entre o efeito da consoante e o da vogal seguintes não é muito

forte e, às vezes, inexistente (cf. CEDERGREN, 1973, p.43; POPLACK,

1980a, p.61; 1980b, p.376 e 1981, p.61; BRAGA & SCHERRE, 1976, p.471;

BRAGA, 1977, p.31; SCHERRE, 1979, p.7-8; GUY, 1981a, p.166). A maior

diferença probabilística entre estes dois fatores - 0,13 - foi encontrada por

Poplack, em 1980, na direção esperada, ou seja, as vogais sendo menos

favorecedoras do cancelamento do -S morfêmico (cf. 1980b, p.376).

Entretanto, em 1981, Poplack reanalisa seus dados e apresenta outros

resultados, deixando perceber que a diferença entre o efeito da consoante

(0,47) e da vogal seguinte (0,40) diminui para 0,07 (cf. 1981, p.61).

Scherre (1979) considerou oportuno observar este efeito em tipos

nominais morfologicamente distintos, pelas seguintes razões:

1) Apenas os itens regulares fazem o plural através de inserção de -

S, onde se poderia verificar melhor a diferença em questão.

2) Os itens terminados em -S (mês) ou -R (mulher) foram

considerados por ela como indicando o plural através de inserção de -es

(meses/mulheres) ou de -e (mese/mulhere), o que faz com que apenas a

ausência do -S não seja analisada como falta de concordância. Este mesmo

raciocínio, afirma ela, se aplica também aos itens de plural duplo, aos

terminados em -l e em -ão.

3) A partir da observação dos dados, verificou-se que, contrariamente

à linha esperada, uma consoante seguinte parecia favorecer mais


243

a inserção de marca de plural nos nomes terminados em -S ou -R,

especialmente nos em -S (cf. p.1-2; 8-11).

Uma vez que a diferença existente entre consoante/vogal não exerce

influência significativa, Braga (1977), seguida por Scherre (1979) e Guy

(1981a), decidiu analisar os elementos seguintes em termos de traços,

principalmente as consoantes, na tentativa de capturar alguma regularidade

neste tipo de influência.

Braga faz um trabalho bastante detalhado em termos de traços do

segmento seguinte. Os resultados mais interessantes obtidos em termos

crescentes de favorecimento da inserção do morfema de plural são os

seguintes: palatais(0,11); labiais(0,36); nasais(0,41); dentais(0,42) e

velares(0,65) (cf. 1977, p.71-2).85 Ela explica seus resultados em termos de

assimilação. Os elementos consonânticos mais semelhantes aos segmentos

marcadores de plural, os palatais, são os que mais favorecem a presença de

concordância.

Scherre também efetua uma análise bastante detalhada. Todavia, ela

sempre agrupa as velares e as labiais, o que impossibilita uma comparação

direta com os resultados de Braga em termos de ponto de articulação. Além

disso, Scherre não verificou a influência das palatais, devido ao já conhecido

fenômeno da neutralização em Português (cf. CÂMARA JR., 1975, p.83-4 e

SCHERRE, 1987, p.73). Scherre não verificou também o efeito das nasais,

observado por Braga junto ao Ponto de articulação.

Com relação á influência da sonoridade dos segmentos consonantais,

não observada por Braga, Scherre chega a uma conclusão bas-


244

tante interessante: o segmento surdo(0,54/0,58) favorece a inserção de

marca formal de plural e o sonoro(0,42/0,42) a desfavorece (cf. 1979, p.7).86

Segundo Scherre, a influência positiva do traço +surdo não é

estranha, pois

é interessante nos lembrarmos de que a existência de


elementos surdos é mais geral nas línguas humanas do
que a de elementos sonoros. A atuação deste traço nos
mostra exatamente que os elementos surdos estão sendo
mais preservados do que os sonoros, pois em Português
a fricativa não labial é sempre surda diante de elementos
surdos. (SCHERRE, 1979, p.10)

A conclusão mais surpreendente de Scherre é a seguinte: "a

presença de uma consoante seguinte(0,74/0,69) favorece sensivelmente a

inserção de marca formal de plural, enquanto a de uma vogal(0,26/0,30) a

desfavorece" (1979, p.9) nos itens terminados em -S (mês/meses) e -R

(mar/mares) e tem efeito absolutamente neutro sobre os itens regulares

(consoantes: 0,48/0,51 e vogais 0,52/0,49).

Com relação à influência da consoante e da vogal nos itens em -S e -

R, inversamente ao esperado em função da busca do padrão silábico CV,


Scherre afirma que há uma explicação bastante simples:

Ocorre nestes casos, o fenômeno da haplologia -


processo morfofonêmico que consiste na supressão de
uma de duas sílabas iguais contíguas. Este fenômeno se
aplica essencialmente nos casos mês/meses. Inserindo-
se a marca de plural em casos seguidos de vogal vamos
ter duas sílabas muito semelhantes, fato que não ocorre
quando eles forem seguidos de uma consoante. Nada
mais natural, portanto, que a vogal desfavoreça a
aplicação da regra e que a consoante a favoreça.
(SCHERRE, 1979, p.10-1)
245

Guy (1981a) também observou o efeito da sonoridade e do ponto de

articulação das consoantes em termos de (1) +sonoro e -sonoro e (2) labial,

alveolar e velar. As suas conclusões com relação ao ponto de articulação são

análogas às de Braga (1977): as labiais(0,49) e as alveolares (e/ou

dentais)(0,48) favorecem menos a inserção do morfema de plural do que as

velares(0,54). Semelhante a Scherre (1979), ele conclui também que o traço

sonoro(0,44) desfavorece a inserção de marcas plurais e o surdo a

favorece(0,56).

Com relação à influência do ponto de articulação, Guy afirma que

estes resultados sugerem um padrão de dissimilação (cf. 1981a, p.145). A

articulação não velar do segmento que marca o plural e a articulação

também não velar dos segmentos seguintes formam uma seqüência de sons

mais semelhantes, o que parece estar sendo evitado.

Com relação à influência da sonoridade, Guy afirma que acha-se

bastante estabelecido no estudo da percepção da fala que as fricativas não

labiais surdas (denominadas por ele de sibilantes) são mais distintas e mais

perceptíveis que as sonoras correspondentes, o que favorece a permanência

das surdas e não das sonoras (cf. 1981a, p.146). Guy também não estudou

o efeito das fricativas não labiais (palatais e alveolares), bem como o efeito

das nasais separadamente.

A influência da pausa tem sido também observada nos estudos em

questão. Considera-se, todavia, que ela não apresenta, intrinsecamente, a

linha esperada em termos de favorecimento ou desfavorecimento da

presença de marcas de plural, no sentido da oposição consoante/vogal, ou

seja, no sentido da busca do padrão silábico universal CV. Segundo Guy,


246

(...) não se pode prever a priori um efeito geral da pausa


sobre regras de cancelamento. De outra forma, seu efeito
parece ser arbitrariamente definido para diferentes
dialetos: às vezes ela é tratada como não silábica, às
vezes como não consonantal, e às vezes como
simplesmente não marcada. (GUY, 1981a, p.145, cf.,
também, Guy, 1980, p.27-8.)87

Cedergreen observa que a pausa não tem nenhum efeito sobre o

cancelamento do -S final não morfêmico (cf. 1973, p.43) no Espanhol do

Panamá. Diferentemente Poplack considera que a pausa, em oposição à

consoante e à vogal, favorece o cancelamento do -S morfêmico no Espanhol

de Porto Rico (cf. 1980a, p.61; 1980b, p.376 e 1981, p.61). Com relação ao

Português do Brasil, Braga (cf. 1977, p.40) e Guy (cf. 1981a, p.166)

constatam que a pausa, em oposição à consoante e à vogal, favorece

ligeiramente a inserção do morfema de plural.

Os três estudos acima mostram três resultados diferentes para a

influência da pausa, o que de certa forma aponta para a arbitrariedade de

seu comportamento, conforme colocado por Guy.

Segundo Poplack, os seus resultados relativos ao comportamento da

pausa são similares aos encontrados por Terrell (1975) no estudo de

Espanhol formal de Porto Rico. Considera, todavia, que, neste mesmo

estudo, "(...) o cancelamento ocorre mais na posição pré-vocálica do que na

posição pré-consonantal." (POPLACK, 1980a, p.62) 88

Uma vez que temos resultados divergentes em alguns aspectos,

decidimos reanalisar os nossos dados, considerando também a influência

desta variável.
247

6.2.4.2 - Análise do Contexto fonético/fonológico


seguinte

Analisamos o Contexto fonético/fonológico seguinte nos nossos

dados, procurando confirmar ou não as conclusões mais interessantes dos

estudos feitos anteriormente.

Para tanto, fizemos inicialmente uma análise de todos os dados

considerando as oposições maiores em termos de (1)consoante; (2)vogal;

(3)pausa interna e (4)pausa final. A separação de pausa m interna e final

teve como objetivo verificar possíveis diferenças neste tipo de

condicionamento de comportamento considerado arbitrário.

Posteriormente, com base nas colocações de Scherre (1979),

separamos os itens lexicais em três grupos regulares, terminados em -S

(mês/meses) e em -R (mar/mares) - e verificamos novamente o efeito da

consoante, vogal e pausa seguintes.

Analisamos finalmente o conjunto dos itens regulares em termos de

traços das consoantes agrupados em três variáveis: Ponto de articulação,

Sonoridade e Caixas de ressonância. Já sabemos que este último efeito foi

estudado por Braga (1977), mas junto ao Ponto de articulação. Isto

impossibilita uma comparação direta entre os resultados dos dois estudos.

Os nossos resultados relativos a todos os dados em termos de

consoantes, vogais e pausa são apresentados na tabela 6.2.4.1, a seguir.


248

TABELA 6.2.4.1
CONTEXTO FONÉTICO/FONOLÓGICO SEGUINTE EM TODOS OS
DADOS
FATORES FALANTES
Adultos Crianças
Apl./Total % Prob. Apl./Total % Prob.
Consoante 5140/6863 = 75 0,43 911/1277 = 71 0,43

Vogal 1590/2248 = 71 0,48 251/429 = 58 0,39

Pausa
interna 1025/1678 = 61 0,56 166/307 = 54 0,56

Pausa
final 106/180 = 59 0,53 57/108 = 53 0,62

Os resultados acima corroboram a conclusão comumente

apresentada: a diferença de atuação da consoante e da vogal é praticamente

inexistente - 0,05 nos adultos a favor da vogal e 0,04 nas crianças a favor da

consoante. Encontra-se uma leve oposição entre pausa e não pausa,

favorecendo e desfavorecendo, respectivamente, a inserção de morfema de

plural nos SNs, nos dados dos falantes adultos. Nos dados das crianças, a

oposição é mais forte. Mesmo trabalhando só com os itens regulares, que

constituem 95($) dos dados, esta mesma situação permanece, conforme se

verifica nos resultados da tabela 6.2.4.2, que apresenta as pausas interna e

final já amalgamadas.
249

TABELA 6.2.4.2
CONTEXTO FONÉTICO/FONOLÓGICO SEGUINTE EM TODOS OS DADOS E
NOS ITENS REGULARES
FATORES FALANTES
Adultos Crianças
Todos os Só regulares Todos os Só regulares
dados dados

Conso- F. 5140 = 75% 4743 = 74% 911 = 71% 859 = 71%


ante 6883 6406 1277 1208
P. 0,44 0,44 0,46 0,45

Vogal F. 1590 = 71% 1428 = 70% 251 = 58% 238 = 60%


2248 2041 429 394
P. 0,49 0,50 0,41 0,44

Pausa F. 1131 = 61% 915 = 56% 233 = 54% 169 = 50%


1858 1624 415 338
P. 0,57 0,56 0,62 0,61

Os resultados encontrados acima, para a influência da pausa, são

consistentes com aqueles evidenciados por Braga (cf. 1977, p.40) e Guy (cf.

1981a, p.166) e opostos aos apresentados por Poplack (cf. 1981, p.61),

conforme se observa pelos resultados da tabela 6.2.4.3, a seguir.89


250

TABELA 6.2.4.3
SOBRE A INFLUÊNCIA DA CONSOANTE, DA VOGAL E DA PAUSA
EM ESTUDOS DIVERSOS
FATORES FALANTES
Adultos Crianças Guy Poplack
(1981a) (1981)
Consoante 0,44 0,46 0,46 0,53

Vogal 0,49 0,41 0,49 0,60

Pausa 0,57 0,62 0,55 0,37

Os resultados da análises do Português mostram que existe uma leve

oposição entre pausa e não pausa. Mostram, ainda, que a pausa favorece

mais a presença do morfema de plural do que uma vogal ou uma consoante.

Poplack encontra também uma oposição entre pausa e não pausa,

mas na direção oposta: a pausa está favorecendo o cancelamento (ou

desfavorecendo a inserção), enquanto a consoante e a vogal estão

favorecendo-o. Neste aspecto, Português e Espanhol de Porto Rico diferem.

A influência da pausa sobre a inserção das marcas de plural é

consistente em Português e apresenta uma polarização especialmente

positiva nos itens terminados em -S: favorece nitidamente a inserção do

morfema de plural, conforme se pode observar nos resultados da tabela

6.2.4.4. Os resultados relativos à oposição consoante/vogal são inteiramente

diversos nestes casos e perfeitamente paralelos aos encontrados por

Scherre (1979). Diferentemente das expectativas de busca do padrão

silábico, os nomes em -S recebem mais inserção do morfema de plural

quando seguidos de consoante do que de vogal.


251

TABELA 6.2.4.4
COMPARAÇÃO DA INFLUÊNCIA DO CONTEXTO FONÉTICO/FONOLÓGICO
SEGUINTE NOS ITENS REGULARES E NOS ITENS TERMINADOS EM -S
FATORES ITENS REGULARES ITENS TERMINADOS EM -S
Adultos Crianças Adultos Crianças

Conso- F. 4743 = 74% 859 = 71% 96 = 91% 13 = 81%


ante 6406 1208 106 16
P. 0,44 0,45 0,58 0,88

Vogal F. 1428 = 70% 238 = 60% 35 = 55% 1 = 08%


2041 394 64 12
P. 0,50 0,44 0,14 0,003

Pausa F. 915 = 56% 169 = 50% 78 = 96% 19 = 95%


1624 338 81 20
P. 0,56 0,61 0,81 0,98

Conforme já colocáramos em (1979), tais resultados são explicados

pelo fenômeno da fonética sintática: a haplologia sintática, que consiste em

eliminar grupos de segmentos semelhantes dentro da palavra ou em

fronteiras de palavras (cf. CÂMARA JR., 1977, p.134).

Do ponto de vista diacrônico, temos:

- bondadoso passando a bondoso;

- saudadoso passando a saudoso.

Do ponto de vista sincrônico, temos, por exemplo,

- "rua Con de Bonfim" por "rua Conde de Bonfim";

- "pos de gasolina" por "posto de gasolina";

- "po dexá que eu faço" por "pode deixar que eu faço";


252

- "tu de novo" por "tudo de novo".

Nos nossos casos em estudo, a presença de uma vogal seguinte e a

inserção de -ES ou de -E criam exatamente as mesmas circunstâncias sobre

as quais o fenômeno da haplologia opera, como podemos ver pelos

exemplos a seguir:

- quantaz vez eu (quantas vezes eu) (Pac20,mg,25a);


- pocos mês aí (pocos mezes aí) (Cab02,mp,16a);
- três mês ele (três mese ele) (Dav42,mc,31a).

Por sua vez, a presença de uma consoante seguinte ou a presença

da pausa e a inserção de -ES ou de -E não criam tais situações, favorecendo

a inserção de marcas formais de plural no SN.

Pode-se verificar, portanto, que não há o princípio da busca do

padrão silábico CV regendo a inserção do morfema de plural mas sim um

princípio estrito de fonética sintática.

Esta variável não foi selecionada para os itens terminados em -R, que

não apresentam o fenômeno da haplologia sintática, diferentemente do que

supunha Scherre (1979). Os resultados não selecionados apontam em

direção à oposição pausa x não pausa, apenas mais polarizados do que no

caso dos regulares, conforme se pode ver nos resultados da tabela 6.2.4.5, a

seguir.
253

TABELA 6.2.4.5
COMPARAÇÃO DA INFLUÊNCIA DO CONTEXTO
FONÉTICO/FONOLÓGICO SEGUINTE NOS ITENS REGULARES,
NOS TERMINADOS EM -S E EM -R
DADOS DOS FALANTES ADULTOS
FATORES ITENS LEXICAIS
Regulares Terminados Terminados
em -S em -R
Consoante F. 4743 = 74% 96 = 91% 121 = 84%
6406 106 144
P. 0,44 0,58 (0,36)
Vogal F. 1428 = 70% 35 = 55% 49 = 89%
2041 64 55
P. 0,50 0,14 (0,42)
Pausa F. 915 = 56% 78 = 96% 45 = 96%
1624 81 47
P. 0,56 0,81 (0,71)

Na análise dos traços das consoantes seguintes aos itens regulares,

consideramos três variáveis: Papel das cordas vocais, Ponto de articulação e

Caixas de ressonância. Os resultados, já sintetizados, são apresentados na

tabela 6.2.4.6. Para chegarmos a este ponto, passamos por duas etapas:

análise detalhada em termos de segmentos e análise detalhada em termos

de traços. Julgamos que a apresentação destes passos é desnecessária,

uma vez que se trata de variáveis de influência com pouca relevância sobre o

fenômeno em estudo. Na terceira coluna da tabela 6.2.4.6, colocamos os

resultados probabilísticos de Guy. Para estas variáveis, ele não apresenta as

freqüências (cf. 1981a, p.166). Além disso, os resultados de Guy referem-se

a todos os dados, o que, todavia, não impossibilita a comparação uma vez

que os regulares constituem a maioria absoluta dos dados.

Vejamos os resultados.
254

TABELA 6.2.4.6
TRAÇOS DAS CONSOANTES COM OS ITENS REGULARES
PAPEL DAS FALANTES
CORDAS VOCAIS
Adultos Crianças Guy
(1981a)
Sonoro F. 1903 = 65% 414 = 66%
2913 632
P. 0,46 (0,49) 0,44

Surdo F. 2843 = 81% 441 = 77%


3494 572
P. 0,54 (0,51) 0,56

PONTO DE
ARTICULAÇÃO

Labial F. 2142 = 81% 322 = 77%


2646 420
P. 0,44 (0,44) 0,49

Dental/ F. 1264 = 58% 263 = 58%


alveolar 2175 450
P. 0,49 (0,54) 0,48

Velar F. 1340 = 84% 270 = 81%


1586 334
P. 0,56 (0,51) 0,54

CAIXAS DE
RESSONÂNCIA

Nasal F. 811 = 61% 187 = 64%


1326 291
P. 0,46 0,43

Oral F. 3935 = 77% 668 = 73%


5081 913
P. 0,54 0,57

Os resultados obtidos para os falantes adultos são semelhantes aos

já relatados por Braga (1977) e Guy (1981a) em termos de Ponto de

articulação: as velares favorecem ligeiramente a presença do morfema de


255

plural. Eles são também semelhantes aos encontrados por Scherre (1979) e

Guy (1981a) em termos de Papel das cordas vocais: as surdas também

propiciam a inserção da marcas de plural um pouco mais do que as sonoras.

Com relação a estas duas variáveis, as crianças apresentam resultados não

selecionados. A única novidade que aqui se apresenta diz respeito à variável

Caixas de ressonância, indicando-se que, para ambos os agrupamentos de

falantes, as nasais desfavorecem a existência de marcas formais de plural no

SN, o que já era esperado pela incidência bastante perceptível da aspiração

e queda do -S diante da nasal bilabial principalmente. Passemos à

conclusão.

6.2.4.3 - Conclusão

Resumindo, em termos de contexto fonético/fonológico seguinte,

constata-se

1) a ausência do efeito da oposição consoante/vogal, não se

evidenciando a busca do padrão silábico universal CV;


2) a presença de efeito positivo da consoante e negativo da vogal nos

itens terminados em -S (mês/meses) devido ao fenômeno da haplologia

sintática;

3) a influência ligeiramente positiva da pausa nos itens regulares e

especialmente forte nos itens terminados em -S;

4) a influência bastante fraca dos traços dos segmentos em termos de

Papel das cordas vocais, Ponto de articulação e Caixas de ressonância.


256

Além disso, é interessante observar que estudos sobre o

cancelamento do -S não morfêmico em Português mostram que o efeito da

sonoridade é bastante polarizado. Gryner e Macedo (1981), num trabalho

sobre o Português falado em Cordeiro, interior do Estado do Rio de Janeiro,

mostram que os elementos surdos são os menos favorecedores do

cancelamento do -S (0,22). Os mais favorecedores são os sonorantes (0,71)

e os de efeito intermediário, os sonoros (0,59) (cf. P.136-7). Os resultados

de Guy (1981a) sobre o cancelamento do -S não morfêmico com respeito à

sonoridade são ligeiramente superiores aos encontrados para o -S

morfêmico (para o não morfêmico, 0,58 x 0,42, para surdos e sonoros,

respectivamente; e, para o morfêmico, 0,56 x 0,44).

Em termos da oposição consoante, pausa e vogal, ambos os estudos

evidenciam que a consoante favorece o cancelamento do -S não morfêmico,

enquanto a vogal o desfavorece, evidenciando-se assim um movimento em

direção à busca do padrão silábico CV, na questão do cancelamento do -S

não morfêmico. Em ambos os estudos, constata-se a influência neutra da

pausa sobre o cancelamento em questão.

Temos, portanto, indícios fortes para afirmar que o cancelamento do -

S não morfêmico e a inserção do -S morfêmico não se encontram, hoje,

completamente ligados a um processo único. Refutamos assim a hipótese

que levantamos em 1978 (cf. P.141). No presente estágio do Português,

trata-se de regras com condicionamentos distintos, conforme também o

coloca Guy (cf. 1981a, P.197).

A influência do Contexto fonético/fonológico sobre a

presença/ausência de marcas formais de plural no SN em Português não se

mostra muito forte, principalmente, se relacionada à influência (1) das


257

Marcas precedentes e posição e (2) da Relação entre elementos nucleares e

não nucleares e posição dos elementos nucleares no SN. Diferentemente do

que Poplack propõe para o Espanhol de Porto Rico, o -S morfêmico em

Português não é principalmente uma entidade fonológica (cf. 1980b, P.383),

mas sim um índice de, por exemplo, grau de coesão entre os elementos no

SN.

Podemos então levantar aqui a seguinte hipótese: se a variação no

número de marcas formais de plural no SN estiver refletindo um processo de

mudança lingüística, certamente não será um tipo de mudança preconizada

pelos neogramáticos, a qual se supõe altamente regular e não condicionada

por fatores outros que não os fonéticos (cf. LABOV, 1981, P.272-4).

6.2.5 - Função sintática do SN

A motivação para o estudo da influência da Função sintática sobre o

número de marcas plurais no SN decorreu do fato de termos detectado um

tipo especial de SN que se apresenta consistentemente menos marcado do

que os demais. Na maioria das vezes, este tipo de SN funciona como resumo

de idéias anteriores, mas pode também se apresentar como uma unidade

parentética. Como se pode observar pelos exemplos abaixo, este tipo de SN

não faz parte de uma estrutura sintática na qual se possa identificar a sua

função em termos tradicionais:

- Já saímos de melindrosa, de Pedrita, de (...) Que mais? Essas bestera


toda. (Fat23,fg,15a);
258

- (Sua tia nasceu onde?...) Bom Jardim, Friburgo, esses canto aí.;
(Sue05,fp,24a);

- Talvez por (...) Em termos de cidade grande hoje, as coisas sejam mais
agressivas, a pessoa (...) tem uma atitude mais agressiva ou de medo, né?
De assalto, de violência, essas coisas todas. (Hel44,fc,44a);

- Passavam filmes (...) sobre a vida de Jesus Cristo... esses negócio assim!
História a gente estuda... No princípio, era como os homens viviam, sabe?
Essas coisas assim! (...) a Pré-história, o período neolítico, (...) essas coisas
assim. (Sue05,fp,24a).

Decidimos então codificar uma variável denominada Função sintática

do SN, com o objetivo de analisar o comportamento do SN apresentado

acima e de verificar se as funções sintáticas tradicionais exercem alguma

influência sobre o número de marcas formais de plural no SN. Se a

hierarquia estabelecida para as diversas funções sintáticas tiver algum efeito

sobre o fenômeno em estudo, espera-se que os SNs que exerçam funções

essenciais e integrantes tenham mais marcas de plural do que os demais,

ficando em último lugar aqueles SNs que não exercem nenhuma função

sintática e que parecem ter menos relevância na comunicação, considerando

que a informação já foi transmitida em outros elementos do discurso ou que

ela é de natureza mais fática do que propriamente referencial, no sentido de

Jakobson 1969 (cf. P.118-162).

Com estas idéias em mente, fizemos uma categorização inicial desta

variável da seguinte forma:

1) SNs de função sujeito;

2) SNs de função complemento nominal ou verbal, incluindo-se os

chamados complementos circunstanciais e os relativos (cf. ROCHA LIMA,

1983, P.307-11 e FERNANDES, 1979);


259

3) SNs de função adjunto adnominal ou verbal;

4) SNs de função predicativa ou de função dúbia (estes últimos casos

podem ser interpretados como sujeito, como predicativo ou como objeto

direto);90

5) SNs de função dupla (casos de oração relativa que exercem uma

função na principal e outra na encaixada, através do que relativo

principalmente);

6) SNs de função abortada (casos em que ocorrem interrupções no

discurso, não sendo possível a identificação precisa da função sintática);

7) SNs de função resumitiva ou de função fática, conforme já

descritos.

Posteriormente subdividimos os casos de função sujeito em SNs de

função sujeito com verbos de ação e com verbos de não ação, com o

objetivo de verificar se a carga de agentividade também exerceria alguma

influência sobre o número de marcas de plural.

No quadro 6.2.5.1, apresentamos alguns exemplos desta variável.


260

QUADRO 6.2.5.1
EXEMPLOS DE FUNÇÃO SINTÁTICA DO SN
FUNÇÃO EXEMPLOS
Sujeito de os cara começa a correr (Jup06,fp,18a)
verbo de ação as garotas brincam (Glo11,fg,48a)

Sujeito de ver os homens viviam... (Sue05,fp,24a)


bo de não ação os pais dela eram (Glo11,fg,48a)

Complemento tem contato com as pessoas (Hel44,fc,44a)


participar das reuniões (Sue05,fp,24a)

Adjunto quarto dos fundos (Mar47,fc,44a)


acorda quatro horas (Ana40,fc,18a)

Predicativa eu não acho que sejam


ou pessoas alienadas não... (Hel44,fc,44a)
dúbia são 48 horas assim (Glo11,fg,48a)

Dupla as pessoas ficaram sem


as máscaras que elas têm (Hel44,fc,44a)

Abortada não tô interessada se tem


esquerda...as idéias...por
isto eu acho que (Hel44,fc,44a)

Resumitiva já saímos de melindrosa


De Pedrita, de...que
mais? Essas bestera toda (Fat23,fg,15a)

Os resultados obtidos, com base em um subconjunto da amostra para

as crianças, e com base em praticamente todos os dados para os falantes

adultos, evidenciaram que as funções sintáticas tradicionais não apresentam

oposição evidente entre si, como se constata na tabela 6.2.5.2, a seguir.91


261

TABELA 6.2.5.2
FUNÇÃO SINTÁTICA DO SN
FATORES FALANTES
Adultos Crianças
Apl./Total % Prob. Apl./Total % Prob.
Sujeito de
verbo de ação 465/602 = 77 0,56 61/98 = 62 0,51
Sujeito de ver-
bo de não ação 922/1187 = 78 0,57 62/96 = 65 0,50
Complemento no-
minal e verbal 2926/4153 = 70 0,48 254/395 = 64 0,53
Adjunto nominal
e verbal 1688/2319 = 73 0,53 129/184 = 70 0,60
Função dupla 662/844 = 78 0,63 36/56 = 65 0,41
Função predica-
tiva ou dúbia 700/1011 = 69 0,52 72/114 = 63 0,57
Função
abortada 394/572 = 67 0,50 49/71 = 69 0,50
Função
resumitiva 215/392 = 55 0,25 30/59 = 51 0,38

Tanto os SNs de funções consideradas essenciais quanto integrantes

e acessórias apresentaram índices de concordância bastante semelhantes.


Os SNs de função sujeito e função adjunto apresentam índices

probabilísticos extremamente próximos nos falantes adultos. Nas crianças, a

quase identidade de comportamento pode ser vista nos SNs de função

sujeito e função complemento. Além disso, os dois tipos de sujeito não

apresentam qualquer diferença de comportamento entre si, quer nos dados

dos adultos quer nos dados das crianças. Até mesmo os SNs de função

predicativa, dúbia e abortada apresentaram índices de concordância

extremamente semelhantes aos índices dos SNs de função sujeito.

Diante de tais resultados, nem ousamos interpretar os índices

probabilísticos relativamente altos atribuídos aos SNs de função adjunto nas


262

crianças (0,60) e aos SNs de função dupla nos adultos (0,63), bem como os

índices probabilísticos relativamente baixos atribuídos ao SNs de função

dupla nas crianças (0,41). Diríamos que tais resultados são possíveis

reflexos de outros aspectos não estudados por nós aqui, do tipo: a posição

tópica ou não tópica do SN. A única oposição consistente encontrada ocorre

apenas na relação entre os SNs de função resumitiva ou fática e os demais,

cujos resultados encontram-se amalgamados na tabela 6.2.5.3. A

denominação de Função sintática do SN para esta variável deixou de ter

qualquer significado. Passou-se então a denominá-la Função resumitiva do

SN. Os resultados da tabela abaixo, tanto para os adultos quanto para as

crianças, envolvem todos os dados da nossa análise, obtidos através da

última análise alternativa, sendo, portanto, diferentes em termos da aplicação

e do total de ocorrências em relação ao que se encontra na tabela 6.2.5.2.

TABELA 6.2.5.3
FUNÇÃO RESUMITIVA DO SN
FUNÇÕES FALANTES
Adultos Crianças
Apl./Total % Prob. Apl./Total % Prob.
+resumitiva 214/389 = 55 0,38 58/119 = 49 0,41

-resumitiva 7647/10580 = 72 0,62 1327/2002 = 66 0,59

Os resultados da tabela 6.2.5.3 mostram evidentemente que os SNs

de função resumitiva favorecem o número de marcas de plural e que


263

os demais favorecem-no. A explicação para estes resultados poderia ser de

base funcionalista, no sentido de Kiparsky: as marcas plurais dos SNs

denominados resumitivos parecem ter menos carga funcional por portarem

informação redundante ou por não terem função propriamente referencial.

Sendo assim, eles acrescentam pouco, ou quase nada de novo, à

mensagem transmitida, podendo, portanto, vir menos marcados sem risco de

se perder informação.

Contrapondo este tipo de influência àquela vista na variável Marcas

precedentes (itens 6.2.3.5 a 6.2.3.8, p.168 a 241), poderíamos dizer, nos

termos de Poplack para o Espanhol de Porto Rico, que há restrições em

conflito regendo a presença ou ausência das marcas de pluralidade no SN.

Em 1980, Poplack afirma, para o Espanhol, que

(...) fatores funcionais têm um efeito pequeno mas regular


no cancelamento, em direção à confirmação da hipótese
funcionalista. (...)
Entretanto, os fatores funcionais como um todo
afetam menos o cancelamento do que qualquer outro
grupo de fatores estudado, exceto o acento seguinte.
(POPLACK, 1980a, p.62)92

Em 1981, Poplack reanalisa estes mesmos dados de forma

ligeiramente diferente e conclui novamente que

(...) o fator funcional (...) tem um efeito regular sobre o


cancelamento da marca. (...) Entretanto esta não é uma
tendência forte. (...) Eles não afetam a retenção da marca
mais do que os fatores fonológicos e gramaticais.
(POPLACK, 1981, p.61)93

Os nossos resultados mostram, mais uma vez, semelhanças no

comportamento desta regra para o Espanhol de Porto Rico e para o

Português do Brasil. A variável Função resumitiva do SN, embora apresente


264

resultados bastante polarizados para os dois grupos de falantes, é

selecionada em penúltimo lugar.

Poplack, em 1981, afirma que o fraco efeito funcional encontrado por

ela no cancelamento do (S) não é exatamente do tipo postulado por

Kiparsky, pois, segundo ela, isto foi estabelecido para situações em que o

segmento

(...) realmente carrega toda a informação de plural que


deve ser conservada. Então considerações funcionais
não têm resultado no condicionamento estritamente
gramatical (...) determinando a retenção do (S).
Aqui nós temos um caso onde efeitos estruturais e
efeitos informacionais desempenham papéis em
competição, e onde restrições de natureza puramente
fonológica são igualmente importantes. (POPLACK, 1981,
p.61-2)94

A nosso ver, a melhor forma de explicar estes resultados seria

através de hipóteses funcionalistas não formais do tipo não kiparskiano, ou

seja, através de noções do tipo tópico X não tópico (cf. CHAFE, 1976, p.50)

ou de centralidade X perifericidade (cf. NARO & VOTRE, 1986, p.454-66).

Os SNs resumitivos ocorrem normalmente à direita da oração, não

sendo, portanto, tópicos do discurso. Usando as palavras de Naro & Votre,

poderíamos dizer que estes SNs são de baixa polaridade, pois jamais são

ponto de referência no discurso. Por esta razão, tendem a vir menos

marcados. É importante observar que nesta parte da nossa análise não

codificamos todos os SNs em termos de ser tópico ou não tópico do discurso

ou em termos de centralidade X perifericidade. Não sabemos se estas

noções se aplicam a quaisquer SNs não polares. Estamos sim observando

que os SNs rotulados como resumitivos são todos não polares. Não

podemos, todavia, afirmar que todos os não resumitivos são polares,


265

o que seria facilmente falsificável. A reanálise desta variável será feita no

item 6.3, ao considerarmos o SN inteiro como uma unidade de análise,

quando rediscutiremos a influência de uma série de variáveis numa

perspectiva não atomística.

Concluindo, vimos que a hierarquia estabelecida para as funções

sintáticas tradicionais não exerce influência relevante e coerente sobre o

número de marcas plurais no SN e vimos também que a oposição relevante

existente é de natureza funcional, no sentido não kiparskiano do termo.

Vimos ainda que a influência desta variável é uma das menos relevantes, no

sentido de ser uma das últimas selecionadas, e que isto é coerente com os

resultados relatados por Poplack (1980 e 1981) para o Espanhol de Porto

Rico.

6.2.6 - Traços mórficos, semânticos e estilísticos do


substantivo e/ou do adjetivo

6.2.6.1 - Introdução

Com base no fato de que "conservam-se geralmente no singular os

nomes de massas, que, em razão de não se poderem contar por unidades,

não comportam a noção de plural" (cf. ROCHA LIMA, 1983, p.74),

levantamos a hipótese de que os nomes [+concretos], [+específicos] e

[+contáveis] apresentassem maiores índices de concordância do que

[+abstratos], [+genéricos] e [-contáveis]. Codificamos os nossos dados

seguindo estas idéias, mas, seja por imprecisão de critérios ou por

inexistência real deste tipo de condicionamento no número de marcas

formais nos SNs plurais, não alcançamos os resultados desejados.


266

O que certamente mais nos chamou a atenção durante a análise dos

dados foi o fato de as palavras pessoa e coisa, ambas de emprego

essencialmente genérico e também de maior ocorrência, serem as mais e

menos marcadas, respectivamente. Em números aproximados, verificamos

que

1) havia 580 ocorrências do substantivo coisa com 209 marcadas:

36%;

2) havia 356 ocorrências do substantivo pessoa com 292 marcadas:

82%.

Então, a hipótese que de imediato se levanta é que a questão não

está ligada ao caráter genérico, mas sim ao caráter humano do item, não

apenas pela obviedade dos dados, mas também por já se saber, através da

literatura lingüística, que o traço [+humano] é discursivamente mais saliente,

e que tem se revelado um fator importante em fenômenos lingüísticos

estudados em Português (cf., por exemplo, MOLLICA, 1977, p.37; 54; 68 e

OMENA, 1978, p.33; 44; 91; 97-8).

Todavia, a observação dos dados nos mostrou também que os

substantivos cara e outro,95 portadores de traço [+humano], se

apresentavam tão pouco marcados quanto o substantivo coisa:

3) havia 280 ocorrências de substantivos cara e outro com 90

marcadas: 32%.

Com base nestas novas observações, surge também a hipótese da

influência da Formalidade léxica sobre o uso de uma ou outra variante


267

lingüística, o que já é também constatado na literatura lingüística por Fischer

(1974), ao estudar a variação in/ing para o inglês (cf. p.92).

A hipótese da influência da Formalidade léxica se torna

particularmente interessante de ser perseguida, ao verificarmos também que

4) havia 164 ocorrências de itens informais com traço [-humano] do

tipo bestera, troço, goró com apenas 21 marcadas: 13%.

Observamos, finalmente, que os itens lexicais diminutivos e

aumentativos, estes últimos de baixa freqüência, tendiam também a inibir,

consideravelmente, o número de marcas plurais no SN, ou seja,

5) havia 212 ocorrências de diminutivos/aumentativos, com apenas

71 marcadas: 34%.

É do conhecimento de todos que o diminutivo tem, ao lado da carga

semântica "tamanho pequeno", também a carga de "afetividade" e de

"pejorativo", por exemplo, traços que se coadunam perfeitamente com o

traço da "informalidade".

Com base nas observações relatadas acima, decidimos codificar os

substantivos (incluindo também os pronomes pessoais) e os adjetivos

especificamente, em termos das seguintes variáveis: Animacidade,

Formalidade léxica e Grau dos itens léxicos.

A apresentação de exemplos e dos resultados será feita a seguir,


268

seguindo a pertinência estatística atribuída a cada uma das variáveis

analisadas.96

6.2.6.2 - Formalidade dos substantivos

Foram classificados como informais os substantivos do tipo cara,

outro (de emprego substantivado), besteira, bobagem, grilo, lance, papo,

merda, goró, tipicamente usados como gírias. Incluíram-se também nesta

categoria todos os usos da palavra coisa sem função sintática, mas apenas

como função fática ou resumitiva - casos não detectados, quer em redações

de alunos, quer em escrita de jornais e revista (cf. OLIVEIRA, PEREIRA &

BASTOS, 1986), além de estruturas como um montão de, uma pá de, um

bando de, um monte de. Os demais casos foram considerados como não

marcados em relação à informalidade. Alguns exemplos de [+informais] são

apresentados a seguir:

- os paraíba brabo lá... (Jae25,mg,30a);


- tomou uns goró, queimou uns fumo e surrou... (Jov26,mg,32a);
- tá fritando uns troço... (Jov26,mg,32a);
- uns cara machão... (Pac20,mg,32a);
- acontece cum os otro... (Cla27,mg,30a);
- fazendo essas miséria todinha... (Ire17,fp,52a).

A divisão binária ocorreu pela inexistência de critérios precisos e não

tendenciosos para se estabelecer uma escala mais detalhada da

informalidade léxica. Estamos assumindo que a informalidade léxica

determina a ausência de marcas de plural no SN. Todavia, não é impossível

de se imaginar que a ausência de marcas possa ser um indicativo de não

formalidade discursiva.
269

Considerando, portanto, que poderíamos ser influenciados pela

ausência de marcas formais de plural na classificação da informalidade

léxica, preferimos ficar com uma classificação mais simplificada e mais

precisa, que não oferece margem a dúvidas. A nossa classificação aqui diz

respeito a itens léxicos e não a partes das entrevistas. Não utilizamos os

critérios de Labov para isolar a fala casual nas situações de entrevista,

porque consideramos que as nossas entrevistas versam sobre assuntos

corriqueiros e usuais, não nos fornecendo grandes possibilidades de

delimitar com precisão mudanças de estilo (cf. LABOV, 1972a, p.79-94 e cf.,

também, HOCHBERG, 1986, p.612). Além disso, a informalidade léxica

mostrava-se indiscutivelmente relevante.

Os resultados dos substantivos são apresentados na tabela 6.2.6.1.

TABELA 6.2.6.1
FORMALIDADE DOS SUBSTANTIVOS
FORMALIDADE FALANTES
Adultos Crianças
Apl./Total % Prob. Apl./Total % Prob.
+informal 130/459 = 28 0,39 34/192 = 18 0,33

-informal 3152/5451 = 58 0,61 447/951 = 47 0,67

Encontramos, na tabela 6.2.6.1, resultados probabilísticos dentro da

linha esperada: os substantivos mais informais inibem o número de marcas

plurais no SN, tanto no caso dos adultos quanto no das crianças,


270

enquanto os substantivos menos informais favorecem-no. Isto é

perfeitamente natural, pois já se sabe que, em situação de fala menos tensa,

por exemplo, o número de marcas formais de plural no SN tende a diminuir

(cf. BRAGA & SCHERRE, 1976, p.473; BRAGA, 1977, p.65-6; SCHERRE,

1978, p.91-3 e GUY, 1981, p.193). Os itens de menor formalidade léxica são

exatamente índices de menor formalidade da situação de fala.

A análise feita permite prever que, se um falante que normalmente

aplica muito a regra deixar de aplicá-la, certamente ele o fará numa estrutura

que contenha um item léxico marcado pela informalidade (cara).

Inversamente, um falante que aplica pouco a regra, ao aplicá-la, o fará em

estruturas que contenham um item léxico não marcado quanto à

informalidade (pessoa).97

6.2.6.3 - Animacidade dos substantivos

A classificação dos substantivos como [+humano] ou [+animado], em

princípio, não apresenta problemas, mas, mesmo assim, há casos limítrofes

e discutíveis. Os substantivos lojas, colégio, fábrica, por exemplo, podem


adquirir o traço [+humano] quando empregados no sentido de agrupamento

de pessoas (no sentido metonímico). Eles foram, por isso, neste emprego,

classificados como [+humano] e [+coletivo]. Estabelecemos inicialmente

quatro categorias obtidas através da combinação dos traços [+humano],

[+animado] e [+coletivo]. Este último caso foi usado apenas para os itens

com o traço [+humano]. Obtivemos, portanto, o seguinte:


271

1) [-humano] e [-animado]

- tirou as árvores fora... (Lui08,mp,57a);


- ia dar três capítulos... (Fat23,fg,15a);

2) [-humano] e [+animado]

- até a comida dos cachorros eu... (Mgl48,fc,52a);


- em cima das codorna... (Ago33,mp,60a);

3) [+humano] e [-coletivo]

- com meus pais eu já viajei... (Val24,fg,15a);


- as professoras novinhas gostavam... (Mgl48,fc,52a);

4) [+humano] e [+coletivo]

- as quadrilhas disputavam para... (San01,mp,18a);


- as lojas ficaram desesperada... (Lau28,fc,43a);
- contra as melhores equipe lá... (Man14,mp,59a).

A tabela 6.2.6.2 apresenta os resultados dos falantes adultos, com a

variável em questão subdividida em quatro categorias, e a tabela 6.2.6.3

mostra os resultados destas quatro categorias transformadas em duas, em

função das semelhanças de comportamento, para os adultos e para as

crianças.
272

TABELA 6.2.6.2
ANIMACIDADE DOS SUBSTANTIVOS NOS DADOS
DOS FALANTES ADULTOS
ANIMACIDADE Apl./Total % Prob.
-humano
-animado 1966/3748 = 52 0,44
-humano
+animado 22/61 = 36 0,33
+humano
-coletivo 1192/1947 = 61 0,59
+humano
+coletivo 102/154 = 66 0,65

TABELA 6.2.6.3
ANIMACIDADE DOS SUBSTANTIVOS NOS DADOS DE TODOS OS
FALANTES
ANIMACIDADE FALANTES
Adultos Crianças
Apl./Total % Prob. Apl./Total % Prob.
-humano 1988/3809 = 52 0,45 316/746 = 42 0,46

+humano 1294/2101 = 62 0,55 165/397 = 42 0,54

A oposição maior que temos com relação à Animacidade é [+humano]

x [-humano]. Novamente os resultados correspondem à nossa expectativa

lingüística: se o traço humano é considerado mais saliente, é de se esperar,

dentro da linha geral do nosso trabalho, que os substantivos marcados

positivamente com relação a este traço tenham mais marcas de plural

(0,55/0,54) do que os com traço [-humano] (0,44/0,46), como mostram as

probabilidades obtidas. Os resultados desta variável são consistentes para


273

os adultos e para as crianças, mas, sem sombra de dúvidas, eles não

apresentam diferenças probabilísticas fortes. Inclusive, no caso das crianças,

no nível de análise em que ele foi selecionado, o último, não houve

convergência até a iteração 21.

6.2.6.4 - Grau dos substantivos

Os substantivos foram categorizados também em função de grau:

normal x diminutivo/aumentativo. Exemplos de diminutivo/ aumentativo

podem ser vistos em:

- tem umas garotinha lá... (Val24,fg,15a);


- são meus amigão... (Seb09,mg,39a);
- tem umas briguinha... (Ari30,fc,43a);
- sai uns quatrocentos bolinhos de... (Ana40,fc,18a);
- e outras escolinha pequena, eles... (Eve43,fc,42a);
- dois dentão enorme que... (Mal16,fp,56a).

Os aumentativos não foram categorizados separadamente por duas

razões:

1) o número de casos é pequeno, apenas nove;

2) eles apresentam, em termos percentuais, comportamento

semelhante ao do diminutivo: em nove casos há apenas dois marcados.

Os resultados da nossa análise em função da variável Grau para os

substantivos encontram-se na tabela 6.2.6.4.


274

TABELA 6.2.6.4
GRAU DOS SUBSTANTIVOS
GRAU FALANTES
Adultos Crianças
Apl./Total % Prob. Apl./Total % Prob.
Diminutivo/
Aumentativo 63/157 = 40 0,40 8/55 = 15 0,37
Normal 3219/5753 = 56 0,60 473/1088 = 43 0,63

Os resultados acima - diminutivos/aumentativos desfavorecendo o

número de marcas plurais nos SNs (0,40/0,37) - explicam-se também em

função das situações de mais informalidade; afetividade etc. E,

conseqüentemente, de menos pressão social que envolve o uso dos

diminutivos/aumentativos. Nestas circunstâncias, a ausência de marcas

plurais nos SNs é comumente constada.


275

6.2.6.5 - Grau e formalidade dos adjetivos

Os adjetivos foram também categorizados em função da variável

Grau e Formalidade, mas a sua análise não foi feita da mesma forma que a

dos substantivos, porque os adjetivos apresentam uma distribuição um pouco

diferente, conforme se vê na tabela 6.2.6.5.

TABELA 6.2.6.5
DISTRIBUIÇÃO DOS ADJETIVOS: GRAU E FORMALIDADE
GRAU FALANTES
E
FORMALIDADE Adultos Crianças
Apl./Total % Apl./Total %
Dim./aum.
informal 4/20 = 20 0/4 = 0
Normal
informal 3/15 = 20 xxx
Normal
não informal. 290/481 = 60 38/58 = 65

Conforme se observa na tabela acima, os adjetivos informais limitam-

se a 15 casos, apresentam comportamento percentual igual ao dos adjetivos

de grau diminutivo/aumentativo e não ocorrem nos dados das crianças.

Consideramos então oportuno agrupar os adjetivos de grau

diminutivo/aumentativo e traço [+informal]. A tabela 6.2.5.6 apresenta os

resultados para a análise assim feita.


276

TABELA 6.2.6.6
GRAU E FORMALIDADE DOS ADJETIVOS
GRAU FALANTES
E
FORMALIDADE Adultos Crianças
Apl./Total % Prob. Apl./Total % Prob.
Dim./aum.
informal 7/35 = 20 0,37 0/4 = 0 xxx

Normal
não informal. 290/481 = 60 0,63 38/58 = 65 xxx

Os resultados dos adjetivos para Grau/Formalidade nos adultos,

ressalvadas as diferenças de análise, são comparáveis aos dos substantivos,

pois seguem a mesma direção já observada. A comparação, no que se refere

às crianças, não é diretamente possível, pois não há probabilidades. As

percentagens seguem, todavia, a mesma direção. Os traços [+informal] e

diminutivo/aumentativo desfavorecem a incidência de marcas formais de

plural no SN.

6.2.6.6 - Conclusão

Pelos resultados obtidos, concluímos que o número de marcas

formais de plural no SN é também condicionado por traços estilísticos

(formalidade), semânticos (animacidade) e mórficos (grau normal/diminutivo

ou aumentativo) dos substantivos e adjetivos.

É possível então prever que qualquer item lexical [+informal],

[+diminutivo] e [-humano] terá muita chance de não ser marcado com relação

à pluralidade. São, pois, comuns e muito naturais seqüências do tipo:


277

- travissero, fronha, essas coisinha pra buneca.


(Sam39,fc,16a);
- eles ali tem as barraquinha. (Cid32,mg,57a);
- limpa aqueles negocinho que tem (...) aquela pele melosa
(Ana40,fc,18a);
- fizeram umas casinha bonitinha e tudo. (Jup06,fp,18a);
- com aqueles cabelim branquim.(Sue05,fp,18a).

A motivação inicial que nos levou à análise de traços dos

substantivos não se confirmou, mas consideramos que o traço [+abstrato],

por exemplo, deve ser retomado, com critérios bem precisos. Ressaltamos,

todavia, que, ao se trabalhar com esta dimensão, será necessário que se

analisem SNs sem nenhuma marca formal de plural, a fim de que se possa

verificar também se há substantivos que, mesmo não se referindo a massas,

são menos susceptíveis de ocorrerem em estruturas plurais. No item 6.3.4,

teremos inclusive oportunidade de observar que algumas estruturas plurais,

diferentes de pluralia tanta, não têm correspondentes singulares, insinuando-

se que o chamado morfema de plural nem sempre indica apenas mais de um

e, às vezes, nem este significado lhe pode ser atribuído.

6.2.7 - Conclusão

A análise atomística aqui feita evidencia que um conjunto significativo

de variáveis contribuem para a não aleatoriedade da presença/ausência das

marcas formais de concordância gramatical (ou simplesmente de marcas

formais de plural) nos elementos flexionáveis do SN.


278

Constatamos que exercem influência sobre a concordância as

seguintes variáveis:

1) Saliência fônica, com as suas dimensões Processos e Tonicidade;

2) Relação entre os elementos não nucleares em função do núcleo e

posição dos elementos nucleares no SN;

3) Marcas precedentes em função da posição;

4) Contexto fonético/fonológico seguinte;

5) Função resumitiva do SN;

6) Formalidade dos substantivos e adjetivos;

7) Grau dos substantivos e adjetivos e

8) Animacidade dos substantivos.

A variável Saliência fônica explica-se pelo Princípio da Saliência; as

Marcas precedentes, em função da tendência de formas particulares

ocorrerem juntas, ou seja, em função do Princípio do Processamento

Paralelo e a variável Relação explica-se, principalmente, pelo Princípio da

Iconicidade.
A atuação do Contexto fonético/fonológico seguinte explica-se por

processos de dissimilação, por aspectos perceptuais evidentes e pelo

fenômeno da haplologia sintática.

A influência da Função resumitiva tem a sua interpretação em

princípios funcionalistas não kiparskianos, denominados Princípio da

Topicidade ou Princípio da Baixa Tensão.

O desempenho das variáveis Formalidade e Grau dos itens léxicos é

explicado pelo fato de que, em situações informais, a ausência de

concordância ocorre com naturalidade e, às vezes, com muita intensidade.


279

A variável Animacidade, de influência modesta, explica-se por ser o

traço +humano discursivamente mais saliente.

De uma forma geral, podemos concluir que a concordância ou as

marcas de plural ocorrem mais:

1) quando há mais saliência fônica na oposição singular/plural;

2) quando os itens nucleares ocupam as primeiras e as terceiras

posições do SN;

3) quando os itens não nucleares estão antepostos ao núcleo do SN;

4) quando os itens não são precedidos por qualquer elemento ou

quando são precedidos por elementos marcados;

5) quando o contexto seguinte é consonantal, com os traços [+surdo],

[+velar] ou [-nasal] ou quando é uma pausa.

6) quando o SN não é de função resumitiva e

7) quando os itens lexicais são não informais e são de grau normal e

humanos.

Inversamente, a concordância ou as marcas de plural ocorrem

menos:

1) quando há menos saliência fônica na oposição singular/plural;

2) quando os itens nucleares ocupam a segunda posição do SN;

3) quando os itens não nucleares encontram-se pospostos ao núcleo

do SN;

4) quando os itens da terceira posição são precedidos por elementos

não marcados, formalmente;


280

5) quando o contexto fonológico seguinte é uma vogal ou uma

consoante com os traços [+sonoro], [+labial], [+dental] ou [+nasal];

6) quando o SN é de função resumitiva;

7) quando os itens lexicais são informais, diminutivos/aumentativos e

não humanos.

Com base no exposto acima, é possível, portanto, prever em que

circunstâncias lingüísticas as marcas de plural tendem ou não a ocorrer nos

diversos constituintes dos sintagmas nominais no Português falado no Brasil.

Vamos proceder agora à apresentação da análise não atomística que

nos conduzirá à confirmação de uma série de aspectos localizados, vistos

agora de uma perspectiva global.


REANÁLISE DA CONCORDÂNCIA NOMINAL EM PORTUGUÊS

POR

MARIA MARTA PEREIRA SCHERRE

VOLUME II

DEPARTAMENTO DE LINGÜÍSTICA E FILOLOGIA

FACULDADE DE LETRAS

UNIVERSIDADE FEDERAL DO RIO DE JANEIRO

RIO DE JANEIRO, 1º SEMESTRE DE 1988


6.3 - Análise não atomística

6.3.1 - Introdução

Com o objetivo de entender melhor a relação entre Classe gramatical

e Posição, seja para corroborar a nossa explicação dada com base no

Princípio da Iconicidade, seja para trazer à luz novas explicações de

natureza não estritamente formal, decidimos analisar minuciosamente a

Configuração sintagmática de 948 SNs constituídos de mais de dois

elementos, que, por si, passou a ser considerada uma variável.

Como já foi dito, utilizamos nesta parte de nosso trabalho apenas os

dados dos falantes adultos. Além disso, assumimos o SN inteiro como

unidade de análise e consideramos, como aplicação da regra, a presença de

plural formal em todos os elementos flexionáveis que constituem o SN e,

como não aplicação, a falta de pelo menos uma marca formal de plural,

exceto nos casos do tipo do meus pais, os quais foram considerados como

aplicação da regra, uma vez que a explicação para a ausência de marca no

artigo não se dá pelas mesmas razões por que se dá a ausência no


substantivo, por exemplo. Além disso, decidimos abandonar todos os casos

que apresentam a seqüência: "marcada, não marcada, marcada" do tipo as


coisa naturais, pois a explicação para a ausência da marca em tais casos se

dá a níveis estritamente fonológicos (ver item 6.2.4). Além do que, estas

últimas seqüências não são comuns. Trata-se de apenas sete casos, num

total de 955 (0,007%). Deixamos de lado também SNs do tipo candidatos

assim certo; coisas muito limitadas; um montão de bestera escrita, pela

simples razão de estarmos interessados


282

na relação de ordem entre os elementos de um SN de três ou mais

constituintes que se encontram num mesmo nível hierárquico em termos de

estrutura frasal, o que não ocorre nos casos supracitados. Por outro lado,

consideramos como dados de análise, nesta parte, seqüências do tipo os

serviços todos ou todos os serviços. Embora haja neutralização entre o artigo

e o substantivo subseqüente, sabemos que os artigos têm 97% de chances

de serem marcados, o que nos autoriza a admitir aí a existência de marcas e

a não eliminar de nossa análise dados deste tipo.

Além da Configuração sintagmática, analisamos também a

Pluralidade do contexto, a Função textual do SN, a Localização do SN em

relação ao verbo ou à oração, o Status informacional do SN, o

Grau/Formalidade do SN, a Pluralidade do SN, a Animacidade do SN e a

Saliência fônica na dimensão processos. Antes de passarmos à discussão da

variável Configuração sintagmática, bem como à verificação de suas inter-

relações com outras variáveis, vamos apresentar os resultados relativos à

Pluralidade do contexto que foi selecionada como a variável mais importante

do ponto de vista estatístico, o que reflete a nossa posição de analista do

fenômeno lingüístico em foco. A sua seleção se deu em primeiro plano com

significância 0,0, em uma análise que teve nove variáveis selecionadas,

dentre as quais duas de natureza não lingüística: Grau de escolarização e

Sexo.
283

6.3.2 - A pluralidade do contexto

Apresentamos no item 6.2.3.7 os resultados relativos à influência da

variável Marcas precedentes ao elemento nominal analisado, dentro do SN.


Em linhas gerais, concluímos que, a partir da existência de uma marca,

marcas levam a marcas e zeros levam a zeros(ver tabela 6.2.3.28),

evidenciando-se, nos termos de Schiffrin (cf. 1981, p.55-6), uma tendência

geral para formas gramaticais particulares ocorrerem juntas, o que, a nosso

ver, deve-se explicar em termos de uma das formas da mente humana

operar.
Partindo-se então do princípio de que o desempenho lingüístico tende

a apresentar uma harmonia formal entre os seus elementos constituintes,

não apenas a nível da relação interna entre os elementos da estrutura

sintagmática, mas também a nível da relação entre os diversos sintagmas,

decidimos investigar se um contexto de maior pluralidade nominal provocava

a existência de SNs totalmente marcados e, inversamente, se um contexto


de menor pluralidade provocava a existência de SNs parcialmente marcados.

Movidos por estas idéias, fizemos uma categorização de nossos

dados bastante detalhada, a fim de controlarmos duas questões:

1) a da primeira ou não primeira ocorrência dos SNs de referência

idêntica ou do mesmo campo léxico-semântico que apareciam em série (cf.

BRAGA, 1986, p.428);

2) a da localização da informação plural, se precedente ou não ao SN

analisado.

Controlamos o primeiro aspecto para verificarmos o grau de influência

da primeira sobre a segunda ocorrência e vice-versa. Controlamos


284

o segundo aspecto, para uso futuro em comparações a serem feitas com

resultados de outros pesquisadores, sobre a influência da informação

precedente e/ou seguinte ao SN analisado. Como o pronome, na maioria da

vezes, encontra-se após o SN analisado, os casos de ocorrência pronominal

precedente, num total de sete, são apresentados juntos ao de ocorrência

seguinte ao SN. Todavia, eles foram também controlados para uso posterior.

Denominada Pluralidade do contexto, esta variável ficou subdividida

em oito fatores. Conforme fizéramos no item 6.2.3.5 (ver quadro 6.2.3.12,

p.177), o SN analisado encontra-se sublinhado e os elementos que

caracterizam o contexto encontram-se em MAIÚSCULAS.

1) Primeira ocorrência do SN, cercada de pronome pessoal plural

antes e/ou depois:

- A Luanda levou um tiro (...) é a única coisa que eu me lembro (...) num dá
pra num ficá...prestando atenção muito na novela, por causa do meus filho,
que o...a hora que ELES tão acabando de jantá... Aí fico gritando com
ELES... (Lei04,fp,25a);

- A maior parte dos meus amigos falam gíria, sabe? Falam mais para gíria.
ELES falam (...) Alguma coisa do tipo palavrão também. (Sam01,mp,18a);

- E: E o relacionamento da senhora com os vizinhos?


- F: Ah, é, ótimo também. Não tenho nada que dizé. Me dô com TODOS.
ELES lá, eu cá, né? (...)Eu gosto muito do meus vizinho. (Jos35,fp,59a).

2) Primeira ocorrência do SN, seguida de SN contendo todas as

marcas de plural e seguida de presença não obrigatória de pronome plural:


285

- E: Mas ela é filha desse marido.


- F: Do meu primeiro marido (...) Aí me disquitei. Aí fiquei com ela na
casa... Voltei pra casa do meus pais. Fiquei com ela, na casa dO MEUS
PAIS trabalhando. (Joa10,fp,27a);

- Quando nóis...somos jovens, nóis num damos tanto valor à... Ais nossas
raízes. Mais conforme nós vamos envelhecendo... Num me considero velha,
embora cum cinquenta e dois anos. Eu sô uma coroa, eu acho que a gente
dá muito...Eu...eu pelo menos dô muito valor AIS MINHAS RAÍZES. Intão
não vale a pena brigá, cum pai, cum irmão, cum tio...
(Mgl48,fc,52a);

- (...) Essa casa pra reformá, ela precisa de...de...um... De grana. Vamos
botá aí, aí... uns treis mil cruzeiros... TREIS MILHÕES, né? Pra ela ficá legal.
Aí, sim, eu lá atrás teria o que eu gosto, que é uma mesinha de sinuca; (...)
uma piscina legal (...) Pra comprá eu precisaria de, no mínimo, UNS DOZE
MIL CRUZEROS que...que é quanto essa casa miseravelmente tá valendo
atualmente. (Jov26,mg,37a);

- Meu pai tinha uma...uma preocupação social... Quando a gente foi pra lá,
ais casas todas da fazenda eram de sapê, TODAS AS CASAS foram
arrebentadas, ESSAS de sapê foram construídas novas. (Hel44,fc,44a).

3) Primeira ocorrência do SN, seguida de SN não totalmente marcado

e sem a presença de pronome pessoal seguinte:

- Eu acredito que, realmente, o PT seja um partido de expressão nacional,


porque ele não traiz nada de novo (...) de tão diferente, né? Que não seja as
próprias contradições da pessoa, né? (...) Ele vai colocar em baila...a vida
que a gente leva, né, (...) (...) Que os otros partido trazem...uma proposta
pronta (...) de como vai ser a participação de cada indivíduo, né? De como
vai se dá...o movimento político, né? Da...da...das classes soci...das classes
sociais ô...ô das transformações do...do sistema, já tá muito estabelecido
NOS OTRO PARTIDO. E o PT num coloca isso.
(Par41,mc,26a);

- Bom, eu num sei cumé que é o problema nos otos condomínio, mais eu
digo..., eu não diria NO OTOS CONDOMÍNIO - que nóis somo mais uma
sociedade fechada, não diria fechada, mais uma sociedade mais unida, né?
Pela questão de sê...vivê...naquele... Ah! Nós tamos vivendo no
condomínio...
(Mor45,mc,51a);

- E: E quais são, assim, os a maiores problemas aqui do bairro de Santa


Tereza? (...)
- F: (...) Minha filha já foi com revólver apontada ais nove horas da noite num
sábado. Menos de NOVE HORA, tava no meio da novela.
(Mgl48,fc,52a).
286

4) Segunda ocorrência do SN, precedida e/ou seguida de SN

totalmente marcado e de, opcionalmente, pronome plural:

- Quando nóis...somos jovens, nóis num damos tanto valor à... AIS
NOSSAS RAÍZES. Mais conforme nós vamos envelhecendo... Num me
considero velha, embora cum cinquenta e dois anos. Eu sô uma coroa, eu
acho que a gente dá muito...Eu...eu pelo menos dô muito valor ais minhas
raízes. Intão não vale a pena brigá, cum pai, cum irmão, cum tio...
(Mgl48,fc,52a);

- Meu pai tinha uma...uma preocupação social... Quando a gente foi pra lá,
AIS CASAS TODAS da fazenda eram de sapê, todas as casas foram
arrebentadas, ESSAS de sapê foram construídas novas. (Hel44,fc,44a);

- (...) Essa casa pra reformá, ela precisa de...de...um... De grana. Vamos
botá aí, aí... UNS TREIS MIL CRUZEIROS... TREIS MILHÕES, né? Pra ela
ficá legal. Aí, sim, eu lá atrás teria o que eu gosto, que é uma mesinha de
sinuca; (...) uma piscina legal (...) Pra comprá eu precisaria de, no mínimo,
uns doze mil cruzeros que...que é quanto essa casa miseravelmente tá
valendo atualmente. (Jov26,mg,37a);

- Eu nunca apanhei do meu pai (...) E eu nem me habituei a isso, MEUS


FILHOS também, nunca bati no meus filhos. Eu acho horrível! Batê numa
criança eu acho uma covardia. (Mag47,fc,53a);

- Faço tricô desde DOUZE ANOS (...) Mas eu faço tricô desde os douze
anos! (Mgl48,fc,52a).

5) Segunda ocorrência do SN seguida e/ou precedida de SN não

totalmente marcado:

- Ela vende, aí, um tal de (...) um livreto da Hermes, que ela nem impata
dinheiro dela (...) Ela pega, vende pra vizinhança (...), vai na Hermes e
compra tudo...cum dinheiro das pessoas e leva 25% de comissão (...) Que
dizê, DEIZ MIL CRUZEIRO que ela vendeu (...), que gaste (...) cem pra í,
cem pra voltá (...) gaste QUINHENTOS CRUZEIRO, sobra pra ela dois mil
cruzeiro limpinho dela, pra ela, sem ela fazê força. Que ela vende DEIZ MIL
CRUZEIRO. Ela quando vai lá, ela já tá com trinta, QUARENTA MIL
CRUZEIRO de venda. (Jov26,mg,32a);

- Eu acredito que, realmente, o PT seja um partido de expressão nacional,


porque ele não traiz nada de novo (...) de tão diferente, né? Que não seja as
próprias contradições da pessoa, né? (...) Ele vai colocar em baila...a vida
que a gente leva, né? (...) (...) Que OS OTROS PARTIDO trazem...uma
proposta pronta (...) de como vai ser a participação de cada
287

indivíduo, né? De como vai se dá...o movimento político, né? Da...da...das


classes soci...das classes sociais ô...ô das transformações do...do sistema, já
tá muito estabelecido nos otro partido. E o PT num coloca isso.
(Par41,mc,26a);

- Bom, eu num sei cumé que é o problema nOS OTOS CONDOMÍNIO, mais
eu digo..., eu não diria no otos condomínio - que nóis somo mais uma
sociedade fechada, não diria fechada, mais uma sociedade mais unida, né?
Pela questão de sê...vivê...naquele... Ah! Nós tamos vivendo no
condomínio... (Mor45,mc,51a).

6) Ocorrência de SN isolado, seguida e/ou precedida de SNs

singulares generalizantes e/ou pronomes pessoais no singular:

- E: Vem cá! E se você ganhasse na Loteria, hein? O que você faria, assim
cum tanto...tanto dinheiro?
- F: (...) Ia pegá um bom dinheiro, e dá, assim, prum grupo de criança (...)
(...) Paguei a passagi e inda fiquei cum... O que? Cinquenta cruzeros. (...)
Tão, peguei, entrô aqueles minininho, né? Mais do que pobrezinho,
piquinininho (...) "Moça compra uma bala aí. Deis cruzero". ELE tava com
uns cinco tabletim na...na... (...) Comprei a bala dO GAROTO. "vai embora".
Aí O GAROTO pegô, desceu... (San39,fc,16a):

- (...) Os órgãos governamentais dizem que tá dentro do mínimo, né? E o


que é que cê vai dizê?... Até O PRÓPRIO PASSAGERO tem interesse em
posá, sabe disso? (...) ELE tá no centro da cidade (...) Se todos os passagero
tivesse conhecimento disso (...) (...) Então você pergunta: (...) Se fizesse
essa pergunta PO PASSAGERO, mas ELE preferiria posá, no Santos
Dumont, por facilidade que ELE tem, tá praticamente em casa
(Mor45,mc,51a);

- F: Nunca dei um tapa! Eu só olho...


- E: Nunca bateu?
- F: Nunca bati no meus filhos. Ela bate, não sei o quê? Eu nunca dei um
tapa. Só dei um tranco uma vez (...) Dei-LHE um, sabe? Um...tranco assim,
ELE... Aí, eu só olho pra ELE, já é motivo pra ELE ir pro canto chorá.
- E: E a menina?
- F: A menina? A menina é uma coisa maravilhosa. Atrevidinha, folgadinha...
com aquele tamaninho que você vê aí... (Jov26,mg,32a).
288

7) Ocorrência de SN totalmente isolado:

- E: E como foi a reação aqui na casa da senhora, com relação à exclusão


do Brasil, né? Da copa? (...) Pra oitenta e seis, o Brasil ganhará?
- F: A Itália, eu acho que é um time melhor do que o nosso. (...) Mas eu num
intendo. Escuto, vejo o que eles falam e vô tirando os pedacinho das minhas
conclusões. (Ari30,fg,43a);

- A senhora quiria... Um quilo de camarão (...). Mais essa senhora chorô


tanto esse camarão: umas deiz vezes! E eu tava...saturado!
(Jan03,mp,57a);

- Não sei se as condições financera que ele tinha na época mas eu juro, pelo
tapa que eu tomei, eu queria botá ele pra fora da polícia.
(Ubi21,mg,20a).

8) Primeira ou segunda ocorrência de SN, seguida e/ou precedida de

SNs ou de pronomes marcados e não marcados, e de SNs generalizantes,

ou seja, contexto misto:

- E: Você não acha que isso é uma conseqüência de um não preparo


político?
- F: (...) Que a maioria que se interessa por política, veja bem, é que
menos...teria interesse em...fazê mudá certas coisas siria a classe média.
(...) Que OS ISTUDANTES... Os istudantes universitários têm uma
participação política ativa. Qué dizê, pelo menos, vamos supô, 80% DOS
ISTUDANTES... Se... ELES... Eles se engajam, né? E... Por uma... Bom, que
O ESTUDANTE, primeiro, porque qué renová, né? Primeiro, porque ELE tem
uma otra idéia, primeiro que... ELE vem com coisas nova, né? Que nóis
os...os...os velhos já...já temo que dá lugar realmente. Mais, segundo,
também, porque ELES estudaram, então ELES, sabe? ELES é...
(Mor45,mc,51a);

- A gente saía de manhã, chegava às quatro hora da tarde...ÀS...ÀS DUAS


HORAS, mudava de ropa, (...) QUATRO HORA ia no Infantil Clube (...).
Carnaval é assim aqui. (Fat23,fg,15a);

- Olha, o dia que eu vô à junta médica - são 60 MÉDICO (...) ELES passam
um aparelho (...) ELES vão mostrando tudo - Olha eu fico ali bem dizê umas
três hora com aqueles médico todinho. Aí vem um aperta aqui, outro aperta
ali, pra vê, né? (Nil12,fp,45a).

Os oito fatores da variável Pluralidade do contexto descritos e

exemplificados acima, em função da primeira ou não primeira ocorrência


289

ou ocorrência isolada e em função do tipo de contexto ao seu redor, se total

ou parcialmente plural ou se misto, têm os seus resultados apresentados na

tabela 6.3.2.1, a seguir.

TABELA 6.3.2.1
A PLURALIDADE DO CONTEXTO
FATORES Apl./Total % Prob.
1a.ocorrência do SN com pronome 26/39 = 67 0,70
pessoal PLURAL antes e/ou depois
1a.ocorrência do SN com repeti-
ção do SN TOTALMENTE marcado 68/82 = 83 0,76
(e pronome plural) depois
2a.ocorrência do SN precedida e/
ou seguida de SN TOTALMENTE mar- 76/99 = 77 0,71
cado (e de pronome PLURAL)
1a.ocorrência do SN seguida de 14/50 = 28 0,33
SN NÃO totalmente marcado
2a.ocorrência do SN seguida e/ou
precedida de SN NÃO totalmente 9/62 = 15 0,20
marcado
SN isolado seguido e/ou precedi-
do de SNs singulares generalizan- 14/37 = 38 0,40
te/ou pronomes pessoais no
singular (contexto generalizante)
SN totalmente isolado 249/518 = 48 0,47
1a. ou 2a.ocorrência de SN segui-
da e ou precedida de SN ou de 28/61 = 46 0,44
pronomes marcados ou não marca -
dos (contexto misto)

Através dos resultados da tabela 6.3.2.1, podemos verificar a

existência de três grandes linhas de atuação da variável Pluralidade do


290

contexto sobre a existência de SNs parcial ou totalmente marcados,

independentemente de ser ou não a primeira ocorrência do SN:

1) A presença da SNs totalmente marcados e/ou a presença de

pronomes pessoais plurais nas vizinhanças do SN analisado favorece(m) a

incidência de todas as marcas nos SNs plurais(0,70/0,76/0,71).

2) A presença de SNs não totalmente marcados nas vizinhanças do

SN analisado desfavorece a incidência de todos as marcas nos SNs

plurais(0,33/0,20).

3) A presença de contexto generalizante, a ausência de pronomes

plurais ou de qualquer sintagma totalmente marcado ou não totalmente

marcado (SN isolado) e a presença do contexto misto apresentam influência

intermediária sobre a incidência de marcas nos SNs plurais(0,40/0,47/0,44).

A influência da Pluralidade do contexto, da forma por nós analisada,

constitui um fato completamente novo. Ela reflete, a nível do discurso, "a

tendência geral de formas particulares ocorrerem juntas", o que se configura

como uma tendência bastante geral que se pode estabelecer sobre

fenômenos lingüísticos de diversas línguas e sobre fenômenos lingüísticos

diversos de uma mesma língua, a se apresentar em detalhes no capítulo 7.

Diante destes resultados, é interessante agora compará-los a outros

resultados encontrados por Guy (1981a), também para a concordância de

número no SN.

Ao lado do estudo do efeito das variáveis Tonicidade, Contexto


291

fonológico seguinte, Posição, Marcas precedentes (Informação plural

precedente no SN), Processos morfofonológicos de formação do plural

(Categoria morfológica), Guy verifica também a influência do que ele

denomina de restrições funcionais, a respeito das quais apresenta duas

etapas: (1) Correlação entre marca de plural no SN sujeito e marca de plural

no verbo e (2) Efeito do lugar da informação adicional de plural (cf. 1981,

p.191).

Para justificar a inclusão do estudo deste tipo de restrição, Guy afirma

o seguinte:

A razão para incluir tal grupo de fatores é para investigar


a questão do funcionalismo: será que o falante é
restringido de alguma forma para evitar cancelamento ou
omissão de elementos que trazem uma alta carga
funcional? Poplack 1979 investiga esta questão em
detalhes, e conclui que fatores funcionais restringem de
forma significante o cancelamento do -S plural: quando há
uma informação adicional de plural presente no discurso,
uma dada marca de plural é mais provável de ser omitida
do que quando não há tal informação adicional. Poplack
investigou dois tipos de informação no plural: morfológica
e não morfológica. Nenhuma diferença significante entre
as duas foi relatada, e a posição da informação adicional
não era também aparentemente importante. (GUY, 1981a,
p.190)98

Guy explicita em seu texto que a presença de um numeral e a

presença de um SN mais alto indicando a pluralidade no SN foram

consideradas na variável Marcas precedentes e então a sua discussão seria

confinada à informação de plural desambiguante fora do SN. Coloca ainda

que tentou distinguir todos os tipos de informação, observando,

(...) por exemplo, a presença e a posição do verbo com


marca de plural do qual o SN sob consideração era o
sujeito, a ocorrência de SN como o complemento de uma
sentença copular com o sujeito e/ou verbo plurais,
292

e a ocorrência de informação semântica ou lexical que


poderia indicar a pluralidade da palavra sob consideração.
(GUY, 1981, p.190-1).99

Observa finalmente que muitas categorias eram raras e

insignificantes e que ele iria apresentar somente resultados das categorias

com maior quantidade de dados. Apresenta, portanto, os resultados parciais,

em uma tabela sob o rótulo de "Correlação entre marcas de plural no SN

sujeito e marcas de plural no verbo", com dois fatores: verbo seguinte com

marca de plural, com probabilidade 0,62, e verbo seguinte sem marca de

plural, com probabilidade de 0,55 (cf. p.191).

Com base nestes resultados afirma que

esta tendência vai contra a hipótese funcionalista, porque


ela favorece marcas de plural precisamente naqueles
contextos onde há outra informação de plural disponível.
(...) Isto é análogo à tendência em direção à concordância
a nível do SN que Poplack relata para o EPR /Espanhol
de Porto Rico/. Isto poderia resultar de um tipo de efeito
estilístico: quando um falante procura marcar mais o
plural, ele o fará no SN e no SV simultaneamente. (GUY,
1981a, p.191-2)100

Continuando, Guy afirma que a sua análise final sobre a informação

adicional de plural teve como objetivo buscar um efeito local, conforme

relatado por Poplack para a concordância verbo-sujeito no Espanhol de Porto

Rico (cf. GUY, 1981a, p.192). A seguir apresenta seus resultados em outra

tabela sob o rótulo de "Efeito do lugar da informação adicional de plural na

CSN" (concordância no sintagma nominal), através de três fatores, com as

respectivas probabilidades: (1) informação adicional de plural precedendo o

SN: 0,24; (2) nenhuma informação adicional de plural: 0,63 e (3)

informação adicional de plural seguindo o SN: 0,65 (cf. p.192). Considerando

estes novos resultados, afirma então o seguinte:


293

A diferença entre os dois últimos fatores (nenhuma


informação de plural e informação de plural seguinte) não
é significante. A diferença entre os dois últimos fatores e o
primeiro fator é estatisticamente significativa, mas ela tem
o grande defeito de conter somente 1 1/2% dos dados,
opondo isto a todo o resto. Entretanto, os resultados estão
em concordância com a tendência notada previamente
neste dialeto de marcar a pluralidade na primeira
oportunidade, e então omiti-la em situações subseqüentes
'redundantes'. Isto segue no mínimo uma linha
funcionalista: há uma taxa baixa de marcas de plural num
contexto onde a marca teria uma carga funcional mais
baixa. /Grifos nossos/ (GUY, 981a, p.192-3)101

Já tivemos oportunidade de mostrar no item 6.2.3 deste nosso

trabalho (ver p.142-241), quando discutimos a relação entre as variáveis

Posição linear, Classe gramatical e Marcas precedentes, que a situação não

é bem como a colocada por Guy (1981a) e por todos os pesquisadores que o

antecederam, especialmente por Braga (1977) e Scherre (1978). Vimos

neste item que, nos SNs de três ou mais elementos, uma segunda marca

conduz a mais marcas no segmento seguinte do que um zero após a

primeira marca. A existência de uma marca na primeira oportunidade não é,

pois, condição suficiente para que as demais marcas redundantes

desapareçam, embora, na maioria dos casos, seja condição necessária.

Diante então dos resultados que obtivemos (1) para a variável Marcas

precedentes, a nível de SN, (2) para a variável Pluralidade do contexto, a

nível da relação entre os SNs no discurso, e diante dos resultados relatados

por Guy (1981a), apresentados acima, decidimos fazer uma etapa de

análise, com uma parte dos nossos 948 SNs de três ou mais elementos,

cujos resultados podem ser comparáveis, mesmo que indiretamente, aos

resultados apresentados por Guy (1981a).102 Tal tarefa não se colocava


294

impossível, uma vez que, na codificação da variável Pluralidade do contexto,

estabelecêramos um total de 21 fatores que, transformados em 16, se

resumiram finalmente a oito, conforme apresentamos nas páginas anteriores.

A codificação assim detalhada nos permitia controlar o "Local da informação

adicional de plural", se antes e/ou depois, através de referências pronominais

ou de repetição de SNs.

Eliminados os casos impossíveis de serem comparados aos de Guy

(1981a), obtivemos uma etapa de análise com 850 SNs, na qual se inclui a

variável "Local da informação adicional de plural", constituída pelos seguintes

fatores:

1) informação adicional de plural antes do SN analisado;

2) informação adicional de plural somente depois do SN analisado;

3) nenhuma informação adicional de plural ao SN analisado ou SN

isolado.

Fizemos esta etapa de análise em duas subetapas, ou seja, na

primeira, analisamos a variável Local da informação adicional de plural junto


à variável Pluralidade do contexto e, na segunda, eliminamos a variável

Pluralidade do contexto, analisando assim somente o efeito da variável Local

da informação adicional de plural. Os resultados probabilísticos, para ambas

as subetapas, são apresentados na tabela 6.3.2.2, a seguir. Nesta mesma

tabela, transcrevemos também os resultados de Guy (1981a).


295

TABELA 6.3.2.2
SOBRE O EFEITO DO LOCAL DA INFORMAÇÃO ADICIONAL DE
PLURAL
FATORES Com pluralidade Sem pluralidade Guy (1981a)

Informação
precedente (0,48) 0,44 0,24

Informação
seguinte (0,59) 0,56 0,65

Nenhuma
informação (0,43) 0,50 0,63

Na subetapa de análise com o efeito da Pluralidade do contexto, a

variável Informação adicional de plural não é selecionada como

estatisticamente relevante, embora as probabilidades apresentem uma leve

oposição entre a Informação precedente favorecendo a ausência de marcas

(0,48) e a Informação seguinte favorecendo a presença de marcas (0,59), na

direção prevista por Guy (1981a). A subetapa sem o efeito da Pluralidade

apresenta resultados semelhantes aos anteriores. Neste caso, a variável

Informação adicional é, todavia, selecionada em último lugar num total de

oito selecionadas, enquanto na primeira etapa, em que se considerou

também o efeito da Pluralidade do contexto, a Pluralidade continua a ser a

primeira variável selecionada, apresentando praticamente os mesmos

resultados probabilísticos, que podem ser vistos na tabela 6.3.2.3 a seguir,

na qual se repetem os resultados da análise original, para efeitos

comparativos.
296

TABELA 6.3.2.3
A PLURALIDADE DO CONTEXTO

FATORES Todos os Comparação


dados com Guy
(1981a)

Apl./Total % Prob. Prob.


1a.ocorrência do SN com
pronome pessoal PLURAL 26/39 = 67 0,70 0,67
antes e/ou depois
1a.ocorrência do SN com
repetição do SN TOTAL- 68/82 = 83 0,76 0,73
MENTE marcado (e do
pronome PLURAL) depois
2a.ocorrência do SN pre-
cedida e/ou seguida de 76/99 = 77 0,71 0,67
SN TOTALMENTE marcado
de pronome PLURAL)
1a.ocorrência do SN se-
guida de SN NÃO totalmen- 14/50 = 28 0,33 0,33
te marcado
2a.ocorrência do SN se-
guida e/ou precedida de 9/62 = 15 0,20 0,20
SN NÃO totalmente marcado
SN isolado seguido e/ou
precedido de SNs singula-
res generalizantes e/ou 14/37 = 38 0,40 xxx
pronomes pessoais no sin-
gular (c.generalizante)
SN totalmente isolado 249/518 = 48 0,47 0,44
1a. ou 2a.ocorrência de
SN seguida e ou precedi-
da de SN ou de pronomes 28/61 = 46 0,44 xxx
marcados ou não marcados
(contexto misto)

As probabilidades acima mostram a coerência e sistematicidade


297

do efeito da variável Pluralidade do contexto mesmo diante da inserção de

outra variável candidata a estar com ela em competição.

Antes de concluirmos, duas observações merecem ser

feitas.

A primeira delas é a seguinte: se Poplack (1979), em "Function and

process in a variable phonology", conclui que fatores funcionais restringem

de forma significativa o cancelamento do -S plural, conforme afirma Guy (cf.

1981a, p.190), ela já não faz o mesmo, em "The notion of plural in Puerto

Rican Spanish: competing constraints on /S/ deletion"; em "Deletion and

Disambiguation in Puerto Rican Spanish" e em "Mortal phonemes as plural

morphemes", conforme já tivemos oportunidade de verificar. Objetivando

precisar suas idéias, vejamos passagens (algumas já parcialmente vistas)

destes três textos.

No primeiro deles, Poplack afirma que

(...)fatores funcionais têm um efeito pequeno mas regular


sobre o cancelamento, na direção que confirma uma
hipótese funcionalista. Presença de informação adicional
de plural, seja morfológica ou não morfológica, favorece o
cancelamento de alguma forma, ao passo que a ausência
de informação adicional favorece a retenção.
Entretanto fatores funcionais como um todo afetam o
cancelamento menos que qualquer outro grupo de fatores
estudado, exceto acento seguinte.
(...) o propósito do grupo funcional é averiguar o efeito
de fatores funcionais na eliminação da redundância.
Embora os fatores funcionais tenham um efeito
relativamente menor que os outros, a ordenação dos
fatores nos grupos funcionais é clara. (...) Esta é uma
tendência, mas um tanto fraca. /Grifos nossos/
(POPLACK, 1980a, p.62).103

No segundo texto, Poplack também afirma que


298

considerações funcionais desempenham um papel


regular, embora não muito forte, na retenção de uma
marca de plural.
(...) Fatores funcionais não mostram efeito maior no
cancelamento do (S) do SN do que outras categorias de
fatores estudadas. (POPLACK, 1980b, p. 379 e 383)104

E, no terceiro texto, Poplack continua afirmando que

embora fatores funcionais sejam significativos para o


cancelamento do (S) plural em contraste com aspiração,
eles não afetam a retenção da marca mais do que fatores
fonológicos e gramaticais.
(...) Deveria ser relembrado que a hipótese
funcionalista conforme colocada (...) é realmente que
padrões de marcas superficiais que podem conter
informação tenderão a ser conservados na gramática. O
efeito funcional mais fraco encontrado aqui contra
cancelamento do (S) não é deste tipo. Ele ocorre
somente nas sentenças onde o (S) realmente carrega
toda a informação plural que deve ser conservada. Assim
considerações funcionais não têm resultado no
condicionamento estritamente gramatical (i.e.
morfossintático ou lexical) determinando a retenção do
(S).
Aqui nós temos um caso em que efeitos estruturais e
efeitos informacionais desempenham papéis competitivos,
e onde restrições de natureza puramente fonológica são
igualmente importantes. /Grifos nossos/ (POPLACK,
1981, p.61-2)105

Os nossos resultados, quer a nível do SN internamente, quer a nível

da relação entre os SNs, apontam para a seguinte conclusão: na competição


entre os dois tipos de variáveis mencionadas por Poplack, emerge uma

possível vencedora: a de natureza não informacional, usando os termos de

Poplack. Os efeitos das Marcas precedentes e os efeitos da Pluralidade do

contexto sobre o fenômeno em questão têm se mostrado consistentemente

mais fortes do que os efeitos das demais variáveis. Convém lembrar ainda

que, como já vimos, a fronteira de morfema não


299

exerce influência sobre a presença ou ausência de marcas plurais no SN em

Português.

Mesmo Guy e Poplack, que buscavam explicitamente comprovar as

idéias funcionalistas no sentido kiparskiano do termo, encontraram também

resultados não funcionalistas, o que mostra que efeitos "não informacionais"

sobre o fenômeno em estudo são tão fortes que eles são encontrados

mesmo quando não explicitamente perseguidos.

Guy (1981a), ao estudar também a Concordância Verbal, encontra

igualmente efeitos não informacionais (cf. p.249-54). Mesmo assim, não

totalmente convencido, chega a sugerir que "(...) a regra de cancelamento do

-S é realmente inibida pela presença de uma fronteira de morfema antes do -

S final." (p.164-5)106 Neste caso, ele afirma que esta restrição, colocada em

termos estruturais, "(...) poderia também ser considerada como uma restrição

funcional favorecendo a retenção da informação gramatical." (p.165)107 Guy

coloca, todavia, que este efeito não ocorre no caso de desnasalização,

porque tal restrição só funciona quando a estrutura de morfema e a função

coincidem. A marca de plural nos verbos é um traço suprassegmental

(nasalização de uma vogal), conseqüentemente não pode ser definida

estruturalmente por colocações do tipo "presença de uma fronteira de

morfema precedente". Ele considera então que restrições "funcionais" talvez

apareçam somente nas circunstâncias em que elas podem ser expressas

em termos estruturais (cf. p.165).

Estas considerações de Guy, a nosso ver, são fruto da hipótese que

perseguia, a qual, conforme pudemos ver através dos diversos resultados

que apresentamos até o presente momento, não é a mais forte para dar

conta das marcas de plural no SN.


300

A segunda observação que queremos fazer constitui mais uma prova

indireta do não funcionamento de uma hipótese do tipo funcionalista nos

moldes aludidos acima. Numa pequena amostra de SNs de dois elementos,

observamos o tipo de "indefinido" precedente ao substantivo, conforme se

pode ver na tabela 6.3.2.4.

TABELA 6.3.2.4
SOBRE A INFLUÊNCIA DO TIPO DE INDEFINIDO
NA QUANTIDADE DE MARCAS PLURAIS NO
SUBSTANTIVO EM SNS DE DOIS ELEMENTOS
TIPO DE
INDEFINIDO Apl./Total %
outro/outra 22/29 = 76

muito/muita 46/87 = 76

vário/vária 13/20 = 65

algum/alguma 11/18 = 61

tanto/tanta 8/13 = 61

quanto/quanta 6/11 = 55

A pequena amostra apresentada acima indica que a informação

semântica do item léxico não tem influência sobre o número de marcas no

substantivo seguinte: os dois primeiros casos ilustram isso muito bem. Se a

configuração sintagmática dos SNs de dois elementos tem algum efeito

sobre o número de marcas plurais aí encontradas, certamente não o será

devido à hipótese funcionalista do tipo kiparskiana.108

Concluindo, vimos que a variável Pluralidade do contexto exerce,


301

a nível da relação entre os diversos SNs, o mesmo tipo de influência que a

variável Marcas precedentes exerce a nível de SN internamente.

Semelhantemente, a influência destas duas variáveis tem a mesma

importância estatística. Conseqüentemente, explicam-se pela mesma razão:

tendência geral de formas gramaticais particulares ocorrerem juntas.

Consideramos que uma questão maior de processamento envolve a

influência das variáveis em questão. A sua forma de atuar cria uma harmonia

discursiva formal, tornando o discurso mais coeso. Isto é análogo ao que

Naro & Votre (1986) colocam a propósito do estudo da ordem SV/VS em

"Emergência da sintaxe como um efeito discursivo", a nível de conteúdo.

Segundo eles,

a manutenção de um mesmo ponto de referência em um


texto mais ou menos longo é, de fato, essencial para o
funcionamento do discurso natural, uma vez que
mudança rápida de ponto de referência tenderia a
produzir um discurso com baixo grau de textualidade.
(NARO & VOTRE, 1986, p.457)

Diríamos que o mesmo ocorre na repetição de SNs totalmente

marcados ou de SNs parcialmente marcados, ou na preferência por

seqüências sss ou s00. A alternância excessivamente rápida chegaria a

produzir, a nosso ver, estranheza na comunicação. Certamente, esta é uma

das múltiplas variáveis que influenciam a quantidade de marcas plurais nos

SNs. Há uma série de outras que também estão em jogo e que atuam no

sentido de provocar alternâncias mais ou menos rápidas das formas.

Estamos simplesmente afirmando que a tendência aqui apresentada é uma

das mais fortes. A segunda mais forte é a Relação entre os elementos

nucleares e não nucleares do SN que será retomada a seguir com a

Configuração sintagmática do SN.


302

6.3.3 - Buscando novas explicações

6.3.3.1 - Sobre a configuração sintagmática do SN

No item 6.2.3.7, concluímos que a quantidade de marcas plurais nos

elementos nominais não nucleares é função da sua relação com o núcleo do

SN: se antepostos, o número de marcas aumenta e, se pospostos, o número

diminui. Concluímos também que os núcleos nominais têm os seus índices

de marcas em função da posição que ocupam dentro do SN: são mais

marcados na primeira do que nas demais posições e, se substantivos ou

substantivados, chegam a elevar ligeiramente o seu número de marcas na

terceira posição (ver p.198-241).

A hipótese que levantamos para explicar as conclusões acima foi a

da Coesão sintagmática, que tem no seu bojo o Princípio da Iconicidade nos

moldes de Haiman (1983).

Conforme colocamos na introdução deste item, decidimos analisar

minuciosamente a Configuração sintagmática dos 948 SNs de mais de dois

constituintes dos dados dos falantes adultos, com o objetivo de verificar se

outras explicações de natureza também não estritamente formal poderiam

existir, para as conclusões já obtidas. Já no item 6.2.3.7, entrevíramos que a

Configuração sintagmática como um todo poderia estar influenciando o

índice de marcas plurais no SN.

A análise inicial dos dados nos revelou de imediato contrastes


interessantes que podem ser observados em algumas construções nas

tabelas 6.3.3.1 e 6.3.3.2, a seguir.


303

TABELA 6.3.3.1
SOBRE A CONFIGURAÇÃO SINTAGMÁTICA DO SN
CONFIGURAÇÃO Apl./Total %

1a) quant. + art.def. + SUBST. 62/78 = 82


(todas as coisas)
1b) art.def. + subst. + QUANT. 7/18 = 39
(as coisa toda)

2a) art.def. + poss. + SUBST. 95/136 = 70


(os meus filhos)
2b) poss. + subst. + {QUANT.} 3/11 = 27
{ADJ.}
(minhas prova todinha)
2c) -art.def. + subst. + POSS. 2/8 = 25
(três colega meu)

3a) art.def. + card. + SUBST. 46/92 = 50


(as duas pista)
3b) card. + subst. + ADJ. 5/23 = 22
(quatro quarto reservado)

4a) det. + adj. + SUBST. 19/33 = 56


(umas boas palmadas)
4b) det. + subst. + ADJ. 86/216 = 40
(as perna bonita)

5a) dem. + adj. + SUBST. 7/14 = 50


(esses trinta dia)
5b) dem. + subst. + ADJ. 16/44 = 36
(essas estradas nova)
304

A tabela 6.3.3.1, na página anterior, contém quatro agrupamentos de

configurações sintagmáticas contrastantes entre si. A classe gramatical

diferenciadora de cada conjunto, posta em evidência, é que ocupa a última

posição do SN: ela é ou um substantivo ou um não substantivo e, neste caso,

pode ser um adjetivo, um quantificador ou um possessivo.

Consistentemente com a conclusão já conhecida, sempre que o SN

tiver um substantivo como o seu último constituinte, ele tende a se

apresentar mais marcado do que o seu correspondente, que tem como último

constituinte um não substantivo. Então, a título de exemplo, podemos

observar os casos 1 e 3. Nos casos do tipo 1a, a estrutura [quant. + art.def. +

SUBST.] (todas as coisas) tem 82% dos SNs com todas as marcas,

enquanto, nos casos do tipo 1b, a estrutura [art.def. + subst. + QUANT.] (as

coisa toda) tem apenas 39% dos SNs com todas as marcas. Podemos

observar o mesmo contraste em 3a e 3b. Os casos de 3a, cujo último

elemento um é SUBST. (as duas pista), têm 50% com todas as marcas,

enquanto os seus correlatos em 3b, cujo último elemento é um ADJ. (quatro

quarto reservado), têm apenas 13% totalmente marcados. A diferença


percentual mínima entre os elementos dos conjuntos apresentados é de 13%

e encontra-se no agrupamento 5a/5b.

Os agrupamentos apresentados na tabela 6.3.3.2, a seguir, neste

caso aos pares, mostram ainda que a maior incidência de SNs com todas as

marcas é também função do tipo categorial do primeiro elemento do SN.


305

TABELA 6.3.3.2
SOBRE A CONFIGURAÇÃO SINTAGMÁTICA DO SN
CONFIGURAÇÃO Apl./Total %
1a) ART.DEF. + poss. + subst. 95/136 = 70
(os meus netos)
1b) POSS. + card. + subst. 6/13 = 46
(meus dez dias)
2a) ART.DEF. + subst. + adj. 45/92 = 49
(as pessoas ricas)
2b) -ART.DEF. + subst. + adj. 41/124 = 33
(umas pessoas ricas)
(aqueles rolos inorme)
(tantas coisas boa)
(meus filhos casado)
(duas cenoura descascada)
3a) ART.DEF. + subst. + quant. 7/18 = 39
(os pano todo)
3b) POSS. + subst. + quant. 15/86 = 17
DEM.
(meus filho todo)
(esses bairro todo)
4a) ART.DEF. + card. + subst. 46/92 = 50
(os três meses)
4b) UNS + card. + subst. 65/122 = 53
(uns quatro anos)

Os três primeiros agrupamentos feitos evidenciam sistematicamente

que, se o SN tem um artigo definido como seu primeiro constituinte, o

percentual de marcas se eleva e, se tem uma categoria diferente do artigo

definido, este percentual se abaixa. Apenas o último par, com subs-


306

tantivo na última posição, apresenta-se quase que indistintamente marcado,

chegando a elevar ligeiramente o índice de SNs marcados com a categoria

uns na primeira posição do SN. A nosso ver, isto mostra que o efeito da

classe gramatical da última posição do SN é mais forte do que o da classe

gramatical da primeira posição do SN. Se compararmos as diferenças entre

os agrupamentos da tabela 6.3.3.1 com os da 6.3.3.2, podemos ver que as

diferenças relativas aos primeiros são mais fortes do que as relativas aos

segundos.

É interessante observar ainda que o tipo de SN mais marcado é o

que apresenta a configuração [quant. + art.def. + subst.] (todas as coisas)

que contém dois elementos de referência globalizante juntos, altamente

definidores. Como já vimos na tabela 6.3.3.1, 82% dos SNs deste tipo têm

todas as marcas. É oportuno observar também que todos os falantes de

qualquer nível de escolarização apresentam estas estruturas com um índice

alto de marcas: os do colegial com 83%, os do ginasial com 81% e os do

primário com 76%. Em verdade, as diferenças no comportamento lingüístico

dos falantes com respeito ao fenômeno estudado são mais quantitativas do

que qualitativas, principalmente com respeito à influência do tipo

sintagmático do SN. A configuração [dem. + subst. + quant.] (essas coisa

toda, aquelas vantagens todas), que é uma dentre as configurações menos

marcadas, apresenta-se com os seguintes percentuais de marcas em todos

os elementos: colegial, 35%, ginasial, 13% e primário, 4%, ou seja,

apresenta-se com todos os percentuais baixos, comparativamente aos

percentuais da configuração [quant. + art.def. + subst.].


307

As diferenças internas são função do grau de escolarização do

falante e não do tipo sintagmático em jogo.

As distribuições apresentadas nas tabelas 6.3.3.1 e 6.3.3.2 nos

levaram a considerar que, no mínimo, o índice de SNs com todas as marcas

é função também da classe gramatical do primeiro constituinte do SN, além

de ser função da classe gramatical de seu último constituinte.

Estabelecemos, portanto, uma variável denominada Configuração

sintagmática do SN, categorizada em seis grandes fatores. Cinco deles

levam em conta o tipo categorial do primeiro e do último constituinte do SN.

Apenas o último fator, de natureza diferente, tenta captar a relação composta

que se pode estabelecer entre substantivo+adjetivo ou entre

substantivo+substantivo, independentemente do tipo categorial do primeiro

elemento do SN. A decisão de colocar estes SNs em fator separado ocorreu

em função de a própria tradição gramatical brasileira registrar a inexistência

de marcas no substantivo dos compostos substantivo+substantivo nas

situações em que o "segundo (...) limita a significação geral do primeiro"

(ROCHA LIMA, 1983, p.78), em casos como bananas-maçã; canetas-tinteiro.

Observamos finalmente que os SNs que têm como último elemento

uma categoria substantivada ficaram separados dos que terminam em

substantivo, objetivando-se assim verificar novamente as semelhanças de

comportamento entre a categoria substantivada e os substantivos. Eles

perfazem um total de apenas 14 dados e são todos eles iniciados por um

artigo definido.

Após tais considerações, apresentamos a seguir a descrição su-


308

cinta dos seis fatores que constituem a variável Configuração sintagmática

do SN:

1) SN cuja estrutura tem no seu início um quantificador ou um artigo

definido e, no seu final, um substantivo (todos os dias/os meus filhos);

2) SN cuja estrutura tem no seu início qualquer classe gramatical que

não seja um quantificador ou um artigo definido e, no seu final, um adjetivo,

um quantificador ou um possessivo (umas patada firme);

3) SN cuja estrutura tem no seu início um não artigo definido e, no

seu final, um substantivo (uns bons filhos);

4) SN cuja estrutura tem no seu início um artigo definido e, no seu

final, um adjetivo, um quantificador ou um possessivo (as coisa toda);

5) SN que tem na primeira posição um artigo definido seguido de

categorias substantivadas (os melhores possíveis);

6) SN de estrutura composta (três salário mínimo).

Na tabela 6.3.3.3, na próxima página, apresentamos as percentagens

relativas à aplicação da regra em função da variável Configuração.

Os resultados percentuais da tabela 6.3.3.3 nos mostram o seguinte:


1) A presença de artigo definido, com ou sem quantificador, nas

primeiras posições do SN e a presença do substantivo ou categoria

substantivada, na sua última posição, são duas forças poderosas no sentido

de provocarem a presença de todas as marcas de plural em todos os

elementos flexionáveis do SN, ou seja, favorecem nitidamente a existên-


309

cia de SNs totalmente marcados: o fator [+artigo definido ... +substantivo]

apresenta 66% dos SNs com todas as marcas de plural e [+artigo definido ...

categoria substantivada], 86%.

TABELA 6.3.3.3
SOBRE CONFIGURAÇÃO SINTAGMÁTICA DO SN
CONFIGURAÇÃO Apl./Total %
+ART.DEF. ... +SUBST.
+QUANT.
(todos os dias) 261/398 = 66
(os meus filhos)
(as boas ações)
-ART.DEF. ... -SUBST.
(vários jogadores bons)
(essas carne congelada)
(aquelas rendas todas) 57/211 = 27
(esses homi todo)
(algumas colega minha)
(três colega meu)
-ART.DEF. ... +SUBST.
(umas segundas lojas)
(tantas outras famílias) 90/166 = 54
(esses trinta dia)
(essas grande fábrica)
+ART.DEF. ... -SUBST.
+QUANT.
(as pessoas ricas)
(os lábios vermelho)
(as danças todas) 61/128 = 48
(as coisa toda)
(os camarada meu)
(todas amiga minha)
+ART.DEF. ... CAT.SUBST.
(os melhores possíveis) 12/14 = 86
(os maiores prejudicado)
ESTRUTURA COMPOSTA
(duas fragata-brasileira)
(esses médicos-psiquiatra) 3/31 = 10
(sete salário-mínimo)
(três banana-prata)

2) A presença de qualquer outra classe gramatical que não seja artigo

definido na primeira posição do SN e a presença do adjetivo, do possessivo


310

ou do quantificador, na sua última posição, são igualmente duas forças

poderosas no sentido de desfavorecerem a presença de SNs com todas as

marcas: [-artigo definido ... -substantivo] tem percentual associado de 27%.

3) O cruzamento das classes mencionadas em 1 e 2 mostra o

equilíbrio das duas forças: [+artigo definido ... -substantivo] e [-artigo definido

... +substantivo] apresentam, respectivamente, 48% e 54% de possibilidade

de influenciar SNs com todas as marcas.

4) A estrutura sintagmática composta desfavorece a existência de

SNs totalmente marcados: apenas 10% dos casos apresentam todas as

marcas.

Gostaríamos de retomar agora a questão dos SNs de estrutura

composta. Bechara coloca explicitamente que somente

o primeiro elemento varia (...) nos compostos de dois


substantivos, onde o segundo exprime a idéia de fim,
semelhança
Navio-escola - navios-escola (=para escola)
Salário-família - salários-família
Manga-rosa - mangas-rosa (=semelhante a rosa)
Peixe-boi - peixes-boi (BECHARA, 1982, p.82).

Segundo o autor acima citado, os demais casos de compostos do tipo

carta-bilhete, segunda-feira, cirurgião-dentista apresentam-se totalmente


marcados como em: cartas-bilhetes, segundas-feiras e cirurgiões-dentistas

(cf. BECHARA, 1982, p.82 e, também, ROCHA LIMA, 1983, p.78).

Diante disso, consideramos interessante separar todos os SNs

contendo formas compostas. Não os separamos em função de serem ou


311

não iniciados por um artigo definido pelo fato de termos poucos dados:

somente 31 casos, com apenas três com todas as marcas no SN. Mesmo

assim, dos três casos totalmente marcados, dois são de artigo definido, em

10 ocorrências (20%) e um de não artigo definido em 21 ocorrências (5%).

Os casos por nós levantados são do seguinte tipo:

- uns navios-patrulhas (Cas46,mg,62a);


- os ares-condicionados (Mar22,fc,17a);
- os piores nomes-feios (Ire17,fp,52a);
- dois filhos-homi (Dal18,fp,71a);
- mil metros-quadrado (Mag47,fc,53a);
- dois caças-americano (Cas46,mg,62a);
- os médico-pediatra (Dav42,mc,31a);
- três banana-prata (Nil12,fp,45a);
- quatro salário-mínimo (Cid32,fg,57a).

Com base nos resultados obtidos, podemos afirmar que o número de

marcas, em qualquer caso de composto, é pequeno. A tendência nítida é,

portanto, para a inexistência de marca nos dois elementos dos compostos,

sejam quais forem as suas constituições ou os seus tipos. Dentre todos os 31

casos levantados, 10%(3/31) têm marcas nos dois elementos; 20%(6/31) têm

marcas em um dos elementos dos compostos (no substantivo, do

composto substantivo+substantivo ou adjetivo) e 70%(22/31) não têm

marca em nenhum dos elementos dos compostos. Nestes casos, há

marca de plural apenas no primeiro elemento do SN.

Com relação à classificação feita pela nossa tradição gramatical,

percebe-se que, dos três casos com todas as marcas, um é do tipo em


312

que se prevê a ausência de marcas no segundo substantivo: do tipo de

navios-escola, ocorre navios-patrulhas e não navios-patrulha, com as duas

marcas, portanto. Por outro lado, prevê-se que a forma cirurgião-dentista

apresente-se com marcas nos dois elementos do item composto. Mas o

nosso caso deste tipo, médico-pediatra, apresenta-se sem marca nos dois

elementos do composto. Além disso, casos do tipo de banana-maçã, nos

quais se prevê a existência da marca no primeiro substantivo, apresentam-se

também sempre sem marcas nos dois elementos. Acrescentam-se a estes

todos os casos constituídos por salário-mínimo, que não têm marca em

nenhum dos dois constituintes.

Concluindo, reafirmamos que a possibilidade de haver marcas nos

dois elementos dos substantivos compostos independe de sua constituição

ou de seu tipo. A tendência geral é de não se ter marca em quaisquer dos

dois elementos, sendo que a marca formal de plural fica apenas nos

elementos não nucleares antepostos ou então tem-se a marca semântica de

plural no numeral. A nossa conclusão torna-se mais evidente ainda ao

depararmos com casos não registrados pela nossa tradição gramatical, de

constituição substantivo + substantivo, sem marca no segundo substantivo,

do tipo formas-padrão. Tais casos são comuns em textos escritos e são,

inclusive, usados por nós dentro deste próprio texto.

Fora as constatações acima, cumpre ainda perguntar se o segundo

substantivo do composto cirurgião-dentista, por exemplo, também não "limita

a significação geral do primeiro", conforme coloca Rocha Lima (cf., 1983,

p.78), da mesma forma que maçã em banana-maçã ou caneta em caneta-

tinteiro. Em outras palavras, cumpre saber se a subclasse de


313

compostos estabelecida por nossa tradição gramatical tem alguma razão de

ser. Os nossos resultados acima indicam que não.

Pelos resultados neste item, conclui-se, indubitavelmente, que a

Configuração sintagmática como um todo exerce influência sobre o número

de marcas de plural dentro do SN. Resta saber se a única explicação para tal

influência é a da Coesão sintagmática.

6.3.3.2 - Sobre novas explicações para o efeito da


Configuração sintagmática

Considerando agora o fato de que o tipo categorial do primeiro

elemento do SN também influencia a concordância nominal, levantamos

novas hipóteses, que pudessem também explicar a influência da variável

Configuração.

A primeira delas coloca o seguinte: a quantidade de marcas formais

de plural presentes no SN é também função do tipo de relação que se

estabelece entre os elementos dentro do texto. Os SNs menos marcados são

aqueles que estabelecem uma referência dentro do texto, ou referência

anafórica, remetendo-se explicitamente a elementos já presentes no contexto

anterior e, conseqüentemente, trazendo menor carga semântica, por ser ela

redundante, e os SNs mais marcados são os que não estabelecem

referência textual explícita, o que faz com que sua carga semântica seja

maior, por ser ela não redundante. A grande maioria dos primeiros tipos de

SNs iniciam-se por demonstrativos.


314

Esta hipótese surgiu por termos observado inicialmente em nossos

dados que, dentre 80 SNs de estrutura [dem. + subst. + quant.] (essas coisa

toda/esses homi todo), 50 são resumitivos (62%) e, dentre estes 50, apenas

cinco (10%) são totalmente marcados. Por outro lado, dentre 76 SNs do tipo

[quant. + art.def. + subst.] (todas as coisas), apenas quatro (5%) são

resumitivos e, destes quatro, dois (50%) são totalmente marcados.

Decidimos então quantificar o que passamos a denominar de Função

textual do SN, ao lado da Configuração sintagmática e da Pluralidade do

contexto já referenciadas, a fim de verificarmos a validade da hipótese

levantada. Esta variável reanalisa a Função sintática, transformada em

Função resumitiva, quando da análise das partes do SN. É uma análise bem

mais detalhada como veremos no momento oportuno.

A segunda hipótese levantada diz respeito ao papel da topicidade ou

da centralidade que pode ser atribuído aos SNs dentro de um texto (cf.

CHAFE, 1976, p.50-5; GIVÓN, 1983, p.5-10; PONTES, 1986, p.16-9;177-

236; PONTES, 1987, p.11-40; BRAGA, 1986, p.393-453; HOPPER, 1979,

p.213-6; HOPPER & THOMPSON, 1980, p.281-99 e NARO & VOTRE, 1986,

p.454-66). Não vamos codificar os nossos SNs propriamente em termos das

oposições tópico x não tópico; figura x fundo ou central/ polar x periférico, por

uma série de razões a serem apresentadas no item 6.3.3.2.2. Vamos nos

limitar a analisar os SNs em questão em função da sua localização em

relação à oração ou ao verbo, que de certa forma reflete a questão do grau

de topicidade ou de centralidade do SN. A nossa expectativa é que os SNs

que se colocam à esquerda da oração


315

ou do verbo apresentam-se mais marcados por estarem numa posição de

centro ou pólo da informação. Vamos verificar também a relação entre

localização do SN e o seu tipo sintagmático, uma vez que o nosso objetivo

central é exatamente o de buscar outras explicações para a forte influência

da Configuração sintagmática do SN.

A terceira hipótese levantada diz respeito ao Status informacional do

SN (cf. CHAFE, 1976; PRINCE, 1981; GORSKY, 1981; BRAGA & SILVA,

1984; NARO & VOTRE, 1986). Uma vez que os SNs com artigo definido

apresentam-se mais marcados do que os SNs com não artigo definido e uma

vez que se considera que a informação velha tende a ser veiculada pelos

SNs definidos e a informação nova pelos indefinidos, decidimos analisar

também a influência do Status informacional do SN, correlacionando-o à sua

Configuração sintagmática. Se o fenômeno aqui sob análise tiver alguma

influência do status informacional do SN, é de se esperar que a informação

nova seja mais codificada do que a informação velha.

Estas duas últimas hipóteses são de certa forma conflitantes, pois

encontra-se na literatura lingüística que as informações novas tendem a vir à

direita do verbo (cf., especificamente, NARO & VOTRE, 1986, p.469).

Estamos codificando as duas situações exatamente para ver se é o Princípio

da Topicidade (ou o Princípio da Tensão Baixa) ou o Princípio da Economia

que tem mais força sobre a concordância na sua perspectiva não atomística.

Surge ainda uma quarta hipótese: a relacionada com a Formalidade

do sintagma, refletida através de constituintes léxicos informais, do tipo de

gírias, e de constituintes léxicos de grau diminutivo/aumentativo.


316

Esta variável foi codificada por nós ao estudarmos apenas os substantivos e

adjetivos na análise atomística. Já vimos que algumas estruturas são

tipicamente informais e que havia, inclusive, uma interferência entre

Formalidade e Função resumitiva (cf. nota 97). É então importante

reintroduzir também a variável Formalidade e verificar a sua inter-relação

com as variáveis Configuração e, inclusive, com a Função textual.

Um quinto aspecto a ser estudado é o que vamos denominar de

Pluralidade do SN, considerando que há SNs que não são do tipo pluralia

tantum, mas que tendem a ocorrer predominantemente no plural e que, se

ocorrerem no singular, têm um sentido diferente do plural correspondente, do

tipo os valores humanos; as nossas raízes. Se estes SNs têm alguma

relação com a Configuração sintagmática, é também o que objetivamos

verificar.

Finalmente, como sexto ponto, decidimos reanalisar a variável

Animacidade, tendo em vista que um número considerável de SNs ocorrem

em estruturas do tipo [art.def. + poss. +subst.] (os meus filhos), as quais são

muito marcadas. Podemos desta forma verificar a inter-relação entre este


aspecto e a Configuração sintagmática do SN.

Se estas seis variáveis agora focalizadas - Função textual do SN,

Localização do SN, Status informacional do SN, Formalidade do SN,

Pluralidade do SN e Animacidade do SN - tiverem relação estreita com a

variável Configuração sintagmática e se elas derem conta do porquê da

influência nítida e marcante da variável Configuração, é de se esperar que,

ao analisarmos as sete conjuntamente, a variável Configuração seja eli-


317

minada e que seu peso probabilístico seja atribuído às outras seis variáveis

sob consideração.

Para que nos façamos mais claros, vamos apresentar as nossas

idéias na seguinte ordem:

- descrição e exemplificação da variável Função textual do SN;

- descrição e exemplificação da variável Localização;

- descrição e exemplificação da variável Status informacional do SN;

- descrição e exemplificação da variável Formalidade do SN;

- descrição e exemplificação da variável Pluralidade do SN;

- descrição e exemplificação da variável Animacidade do SN e

- resultados probabilísticos obtidos para as sete variáveis analisadas.

6.3.3.2.1 - A Função textual do SN

Com base no grau de ligação das idéias dentro de um texto, refletida

através da estrutura sintagmática, e com base na relação entre determinadas

estruturas e idéias fora do texto, decidimos estabelecer seis tipos do que

estamos denominando de funções textuais: resumitiva, dêitica, retomada,

atributiva, textual e circunstancial.

A função resumitiva é constituída, como já se sabe, por SNs que


318

funcionam como resumo de idéias já presentes no texto, ou que exercem

apenas uma função fática, sem qualquer ligação sintática com qualquer

oração.

Alguns casos de resumitivos podem ser vistos a seguir:

- Já saímos de melindrosa, de Pedrita, de... Que mais? Empregadinha.


Essas bestera toda.(Fat23,fg,15a);
- Talvez por... Em termos de cidade grande hoje, as coisas sejam mais
agressivas, a pessoa...tem uma atitude mais agressiva ou de medo, né? De
assalto, disso, de violência, essas coisas todas. (Hel44,fc,44a).

A função denominada dêitica é aquela exercida pelos SNs que

estabelecem algum tipo de relação espacial, indicando tipos e fazendo

exemplificações. Ela encontra-se exemplificada em:

- E: E a mãe era rígida também?


- F: Não, a minha mãe não. Mais a minha mãe era muito assim, é daquelas
mães antigas que tudo que o pai diz, diz amém, que o marido diz, concorda.
Só faz estritamente o que o marido concorda. (Lau28,fc,43a);

- E depois, lá em Teresópolis, tem uma coisa... Já foi o tempo que


Teresópolis era muito bom, sabe? ... Não existia ladrão ... Você podia dormir
de porta aberta ... Agora, com essas istradas nova, vai muita gente de...de
Caxias, daqui do Rio mesmo, e aí roubam, sabe? Assaltam as casa.
(Mag,fc,53a).

O fator retomada é constituído por SNs que, semelhantemente aos

resumitivos, remetem-se a idéias anteriores, mas, diferentemente,

encontram-se inseridos dentro de uma oração e não exercem função fática.

Exemplificando:

- Esse meu filho é desquitado, tem dois filhos homens. Um com 21 anos.
Está na faculdade lá em Viçosa. Fazendo Agronomia. E o otro feiz 19 e quer
fazer Veterinária. Também quer fazer lá em Viçosa, porque lá é mais
indicado, né? Então veja bem. Mas esses meus netos não me procuram,
porque não falam com o pai. (Dal18,fp,71a);
319

- Conheço uma pução de praia, sabe? Rio das Ostras, Iguaba, essas praia
toda eu já fui em ixcursão, né? (Nad36,fg,57a).

Em verdade os fatores função resumitiva e função retomada são

casos especiais de dêixis, ou seja, são anafóricos, pois se remetem a

elementos dentro do próprio texto (cf. CÂMARA JR., 1977, p.49, BECHARA,
1981, p.263-5).

A função atributiva, ilustrada abaixo, é exercida pelos predicativos.

- Nós éramos, parece que...não sei, uns dezesseis casais. (Dor29,fg,44a);

- Uma das coisas boas da vida é os seus filho e melhor ainda são os netos.
(Ago33,mp,60a);

- Eu sou um dos poucos patriotas. (Leo38,mc,18a);

- Grajaú e Urca são os dois bairro em que não pudia ter ladrão.
(Geo31,mg,58a).

Os SNs que foram denominados textuais são aqueles que aparecem

no texto sem resumir, sem estabelecer relação espacial, sem retomar idéias,

conforme podemos ver pelos exemplos a seguir:

- E: E você acha que tem que ter coisas que só homens gostam e tem
coisas que só as mulheres gostam?
- F: Não...mulhé tem que fazê... Tem que tê os mesmos direitos que o
homem. (Val24,fg,15a);

- A Luanda levô um tiro... É a coisa que eu me lembro... Num dá pra mim


ficá (...) prestando atenção muito na novela, por causa do meus filho, que
o...a hora que eles tão acabando de jantar... Aí fico gritando com eles.
(Lei04,fp,25a);

- Meu pai tinha uma...uma preocupação social... Quando a gente foi pra lá,
ais casas todas foram arrebentadas, essas de sapê foram construídas novas.
(Hel44,fc,44a).
320

O fator rotulado circunstancial envolve todos os casos de referência a

tempo, espaço, medida e valor. São exemplos deste fator os casos listados a

seguir.

- Há uns três anos atrás, nosso barraco... (Joa10,fp,27a);

- Uma cervejinha lá deve tá uns duzentos e cinqüenta cruzeiro.


(Jal25,mg,30a);

- Ele tinha uns dez a doze quilo na época. (Ago33,mp,60a);

- Mas essa senhora chorou tanto esse camarão: umas dez vezes e eu ...
(Jan03,mp,56a);

- Eu não sei fazê nada disso nesses...nesses lugar todo, né?


(Seb09,mp,39a).

A tabela 6.3.3.4 contém os resultados percentuais relativos a esta

variável.

TABELA 6.3.3.4
SOBRE A FUNÇÃO TEXTUAL DO SN
FUNÇÃO Apl./Total %

Resumitiva 9/57 = 16

Dêitica 17/54 = 31

Retomada 13/32 = 41

Atributiva 19/47 = 40

Textual 320/589 = 54

Circunstancial 106/169 = 63

Através dos resultados percentuais acima, pode-se perceber que

todos os SNs que contêm informação redundante se apresentam com


321

menos marcas, ou seja, os de função resumitiva, dêitica, retomada e

atributiva são os que menos favorecem a presença de todas as marcas de

plural e os textuais e os circunstanciais, os que mais favorecem a presença

de marcas. Resta saber se os resultados probabilísticos serão semelhantes

aos percentuais.

6.3.3.2.2 - A Localização do SN

Conforme já colocamos acima, não codificamos os SNs de nosso

estudo propriamente como tópico x não tópico, figura x fundo ou central/polar

x periférico, por razões diversas, dentre as quais cumpre destacar as

seguintes. Trabalhamos com toda a espécie de SN plural e com todo e

qualquer estilo discursivo, o que em parte dificulta classificações nas bases

acima especificadas. Além disso, com relação especificamente às noções de

figura x fundo ou central/polar x periférico, já observáramos, na tabela


6.3.3.4, contrariamente a expectativas existentes, que SNs tipicamente fundo
ou periféricos - os circunstanciais - tendem até a ter mais marcas que os

demais. Vimos também no item 6.2.5, quando analisamos a variável Função

sintática, que as probabilidades associadas aos adjuntos eram semelhantes

às associadas aos sujeitos, agentes ou não, os quais são candidatos a


serem o centro ou o pólo discursivo.

Com relação à oposição tópico x não tópico, não verificáramos

nenhuma tendência evidente que justificasse uma classificação refinada,


322

quer em função de tópico sintático quer em função de tópico discursivo.

Sendo assim, limitamo-nos a analisar os SNs em questão em termos

de sua localização linear em relação à oração ou simplesmente em relação

ao verbo que, como já dissemos, reflete a questão da topicidade ou da

centralidade do SN. Os SNs tópicos ou centrais ocorrem à esquerda da

oração ou à esquerda do verbo, conforme afirmam Pontes (cf. 1986, p.16-9;

177-236; 1987, p.11-40 e Naro & Votre (cf. 1986, p.454-66), embora nem

todo SN que ocorra à esquerda do verbo ou da oração possa ser

classificado consistentemente como tópico ou como central.

Os SNs abaixo sublinhados certamente seriam classificados como

construções tópicas por Pontes, mas não como figura ou centrais/polares

por Naro & Votre.

- E: E aqui o Carnaval é muito grande?


- F: Ah! O Carnaval é... Carnaval eu gosto. Todos os anos eu vô assisti
iscola di samba. (Dor29,fg,44a);

- E: Como é a rotina do seu dia?


- F: (...) Terças e quintas eu vô pro curso... (...) assim, de tarde, assim, de
seiz às sete, eu faço ginástica; terças e quintas, também. Nos oto dias eu
saio, pego um cinema, ou estudo, depende assim... (Mar22,fc,17a).

O que importa para nós no momento não é a coincidência de

classificação entre os diversos autores até então citados, mas, sim, o fato de

os SNs todos os anos e nos otos dias ocorrerem à esquerda da oração.

Estamos assumindo que a posição à esquerda da oração ou do verbo coloca

o SN em evidência, numa posição mais saliente, mesmo os circunstanciais, e

que por esta razão eles tendem a vir mais marcados do


323

que os que se situam à sua direita. Como alguns casos não evidenciam

posição nítida, decidimos codificá-los como indistintos, em vez de

"interpretar" a sua posição.

A variável localização do SN ficou então constituída de três fatores,

abaixo exemplificados.

1) Localização à esquerda:

- Todas as ruas, né? Pintaram... (Jos35,fp,59a);


- As outras pessoa taca garrafa... (Sam01,mp,18a).

2) Localização à direita:

- A gente não consegue levar todas as informações, né? (Par41,mc,26a);


- Pelé teve seus momento bão. (Car19,mg,20a).

3) Localização indistinta:

- Eu devia ter o que? Uns dezoito anos... (Ana40,fc,18a);

- Que nem os nosso pai... (San39,fc,16a).

Os percentuais de marcas de plural com relação a esta variável

encontram-se na tabela 6.3.3.5, a seguir.

TABELA 6.3.3.5
SOBRE A LOCALIZAÇÃO DO SN
LOCALIZAÇÃO Apl./Total %

Á esquerda da oração 112/178 = 63

Á direita da oração 349/712 = 49

Indistinta 23/58 = 40
324

Os resultados da tabela 6.3.3.5 apontam também para a direção

esperada: os SNs que se localizam à esquerda da oração são mais

marcados (63%) do que os que ocupam a posição à direita (49%) ou que se

encontram em posição indistinta (40%).

6.3.3.2.3 - Status informacional do SN

Conforme já colocamos, decidimos codificar esta variável com base

no fato de se fazer normalmente uma certa relação entre a forma de

apresentar a informação e a Configuração sintagmática dos SNs. Já se sabe

bem que, se o falante embalar uma mensagem nova com um SN definido

sem colocar nenhuma âncora ou sem que este SN seja de alguma forma

"disponível" na memória do ouvinte, corre-se o risco de provocar ruído na

comunicação. Esta situação é bem típica, pois favorece, por parte do ouvinte,

perguntas surpresas do tipo: O que? Quem? Onde?, quando se introduz uma

informação nova-em-folha através de uma construção definida.

Não vamos discutir aqui todos os detalhes que envolvem a forma de


embalar a informação. Para maiores detalhes, remetemos o leitor aos textos

de Chafe (cf. 1976, p.30-3); Prince (cf. 1981, p.223-55); Gorsky (cf. 1981,

p.44-7) e Braga & Silva (cf. 1984, p.27-39). Vamos apresentar aqui a nossa

forma de codificar os dados que, embora se baseie nos textos acima, não

apresenta identidade absoluta com nenhum deles. Todavia, é importante

observar que a nossa classificação encontra relação bastante estreita com a

de Prince e a de Gorsky. Vamos também fazer menção ao


325

texto de Naro & Votre (cf. 1986, p.466-71), pois a nossa classificação

coincide também, em algumas partes, com a efetuada por eles, embora não

tenha sido baseada nela.

Após uma classificação bastante detalhada, decidimos estabelecer as

seguintes categorias para esta variável:

1) informação nova-em-folha;

2) informação nova ancorada;

3) informação nova disponível;

4) informação inferível;

5) informação velha e redundante;

6) não entidade.

A informação denominada nova-em-folha, como a própria

terminologia já o coloca, é uma informação introduzida pela primeira vez no

discurso sem nenhuma âncora, não sendo também previsível no texto, nem

disponível e nem inferível, "culturalmente ou situacionalmente".

Apresentamos abaixo dois exemplos deste tipo de SN. No primeiro caso um

falante está relatando a procura de emprego e, no segundo, outro falante

emite a sua opinião sobre política.

- Eu tava desempregado. (...) Precisava arrumá...uma ocupação... Aí


comecei a procurá no jornal... Aí arrumei um... Fui na Uruguaiana. Aí cheguei
lá e tinha umas oito ou deyz pessoas na frente. Aí eu esperei a minha vez.
(Cla27,mg,32a);

- E: E a política por aqui? - F: (...) Eu tenho assim uma simpatia por ela.
Pela Sandra. Mays eu acho que eu não vô votar nela não. (...) Votá em
branco. Acho que é melhor. - E: Vai dexá em branco também? - F: Acho
que vô dexá. Se num me derem umas ixplicações muito correta, pra mim ver
se intendo um pouquinho, eu dexo (...) em branco. (Ari30,fg,43a).
326

Dentre os 948 SNs analisados, só encontramos 29 casos de novos-

em-folha. O pequeno número de dados deste tipo é compatível com as

colocações de Gorsky (cf. 1981, p.83) e Naro & Votre (cf. 1986, p.469) de

que o SN novo-em-folha é raro, pois o falante, para manter a coesão do

discurso, ou seu alto grau de textualidade, introduz poucas informações

totalmente novas. As informações tendem a ser velhas e, se novas, tendem a

ser fortemente ancoradas, como veremos a seguir. Diferentemente, Braga

(1986), em seu trabalho sobre construções tópicas, encontra muitos SNs

novos ao analisar o "Status informacional do referente do SN mais à

esquerda", porque inclui na categoria novos todos os casos denominados de

novos-em-folha, novos ancorados e novos disponíveis (não usados) (cf.

p.402), consoante com as suas idéias expostas em 1984 de que

uma lista de referentes novos não usados parece-nos


uma solução ingênua (...) Sugerimos que a categoria
novo não-usado seja abandonada e que se utilize apenas
a categoria totalmente novo ou, simplesmente, novo com
as suas ramificações: ancorado e não ancorado. (BRAGA
& SILVA, 1984, p.33)

Os novos ancorados perfazem um total de 127 dados e são

caracterizados em termos de se apoiarem na pessoa do falante através de

pronomes possessivos, ou de virem introduzidos através de outros tipos de

âncora como orações relativas e adjuntos adnominais. Estes casos foram

assim classificados quando inseridos pela primeira vez no discurso. Caso

contrário, classificaram-se ou como inferíveis ou como velhos. São exemplos

de novos ancorados os SNs sublinhados no texto a seguir.


327

- E: E você já, assim, já viveu alguma situação difícil, de tensão?


- F: Ah! Um dia a gen... Eu tinha ido cuns amigos meu lanchá no Bob's, lá de
Copacabana. Aí a gente resolveu voltá, né? Dando a volta por tudo:
Ipanema, Leblon, aquelas coi... Aí... (Mar22,fc,17a);

- Tem pessoas que você se dá melhor do que com otras, né? (...) Agora se é
uma cabeça boa, se tem uma visão mais aprofundada dos valores humanos,
elas (as filhas) se relacionam perfeitamente, nunca tiveram problemas de
relacionamento. Elas chegam a...mesmo a fazer todas as baguncinhas que
todo mundo faz normalmente. (Eve43,fc,42a).

A informação nova disponível (cf. GORSKY, 1981, p.64-6) se

caracteriza pelo fato de ser facilmente acessada pelo ouvinte, embora não

se trate de informação já mencionada ou detectável no contexto. Diríamos

que estes SNs são depreensíveis do contexto cultural que rodeia o falante e

podem inclusive vir com artigos definidos sem que haja qualquer

estranhamento por parte do ouvinte. Eles são do tipo considerado por Prince

de referência única, só que, no nosso caso, como estamos trabalhando com

SNs plurais, jamais haverá a referência única. Nos termos de Gorsky,

"entidades deste tipo estão disponíveis no universo espacial e cultural dos

participantes do discurso." (p.66)

Um exemplo bastante típico deste fator pode ser encontrado no


segundo texto transcrito para a exemplificação do novo ancorado. Trata-se

do sintagma os valores humanos que surge no texto neste momento sem

nenhuma menção prévia, sem nenhuma âncora, e com artigo definido, não

provocando, todavia, nenhuma quebra de coesão ou de textualidade no

discurso. Mais dois exemplos deste fator são apresentados a seguir:


328

- E: E com relação ao trabalho na igreja, né? O que a senhora faz? (...)


- F: Há douze anos que nós organizamos o Natal dos velhinhos pobres.
Esse Natal é maravilhoso. (Mgl48,fc,52a);

- E: Vem cá! Você foi vê os cegos, né? Cumé que eles são? O que é que
eles pensam? (...)
- F: (...) O dia que eu fui, então, tinha muitos parentes lá. (...) Eu acho que
tem uns que são órfãos, né? Ainda... Além de ser (ininteligível) e cegos, são
órfãos. Intão, as... As otras pessoas, intão, dão mais atenção ainda,
entendeu? (San39,fc,16a).

A informação inferível, ancorada ou não, se caracteriza por ser

dedutível do contexto via raciocínio lógico ou através de elementos

morfologicamente explícitos, sem que se faça a repetição ou substituição dos

itens léxicos. Os casos relacionados abaixo são bons exemplos desta forma

de embalar a mensagem:

- Ela (a casa) tem um terraço, tem um terreno aqui por trás, tem goiabera
que me dá umas goiabas bunitas. Num deu esse ano, porque eu fui podá e
não sei podá, e estraguei a goiabera, sabe? (Jov26,mg,32a);

- O dia em que eu for campião regional daqui...todos os time dessa


redondeza jogam. (Man12,mp,56a);

- De todos os assuntos da vida, o que eu menos liguei sempre foi...a política.


Então ais pessoas...só dizem isso: política é uma sujeira. (...) Que roubam,
que fazem, que enchem o bolso, que põem seus parentes lá dentro... Eu
acredito que alguma coisa boa vá saí... Mas cumo dizem que todos...todos
os político tem aquele lado mau que é como a corrupção tremenda, sô eu
que vô dizê que num vai sê o que vai sê? (Mgl48,fc,52a).

A informação velha, no sentido apenas de velho textual, como o

próprio nome já indica, já foi mencionada no contexto precedente. São

exemplos, os casos abaixo:

- Essa semana mesmo o Paulo...ganhô e deu pra ele uns pés de coqueiro.
(...) Já tinha dado uns três pés pra ele, agora demo mais três. E carambola...
(Mag47,fc,53a);

- E: Cumé que faiz pra armá uma barraca?


- F: Olha, a gente leva a barraca. Minha barraca pesa quarenta quilos...
329

- E: Cêis acampam em camping ou...


- F: Não, não. Eu acampo adoidado. Onde eu achá melhó e não fô proibido
a área, eu tô chegando. Negócio eu num gosto muito não, porque tem
formalidade (...). Pra onde eu vô, não. A gente... Tem o pessoal dais otras
barraca, a gente leva... Canta, samba a noite toda... (Dav42,mc,31a).

Este fator, além de envolver todos os casos clássicos de informação

velha, envolve também todos o SNs classificados como fáticos, resumitivos e

dêiticos. Estes últimos foram colocados neste fator, porque, a nosso ver, eles

veiculam informação velha, principalmente os resumitivos, que retomam

através de uma nova lexicalização o conteúdo de idéias anteriores.

Os fáticos talvez pudessem ser classificados mais como disponíveis

de referência irrelevante (cf. NARO & VOTRE, 1986, p.23), se é que têm

alguma referência. Quanto aos SNs rotulados de dêiticos, e aqui colocados

no mesmo fator de informação velha, são classificados por Naro & Votre

como parcialmente novos, numa subcategoria denominada de novos

atenuados, como sendo aqueles "indicados por um demonstrativo anafórico,

uma breve explicação ou descrição, a partícula aí etc." (1986, p.16) A

categoria dos parcialmente novos de Naro & Votre, além de incluir estes

casos, inclui também os novos ancorados.


Poderíamos até modificar a nossa forma de analisar os nossos dados

para fazê-la mais comparável à de Naro & Votre, mas cremos que esta não

seria a decisão mais acertada. Os novos ancorados de nossa amostra

apresentam 63% de marcas, os velhos 53% e os dêiticos 31%. Podemos ver

que, em termos de comportamento, faz menos sentido colocar os dêiticos

junto aos novos ancorados do que junto aos velhos. De


330

qualquer forma, mesmo efetuando-se a mudança, não acreditamos que se

fizessem grandes diferenças nos resultados que já obtivemos. Gostaríamos

de já adiantar que esta variável não foi considerada estatisticamente

significativa, o que não justifica uma reanálise de 948 SNs, com 54 SNs

dêiticos e 17 SNs fáticos. Se os SNs dêiticos fossem agrupados ao fator

novo ancorado, o percentual do novo ancorado passaria de 63% para 54%.

Todavia, não acreditamos que isto mudaria a configuração geral dos

resultados que já temos em mãos. Além do mais, Naro & Votre fizeram uma

classificação própria, específica para o fenômeno que estavam analisando

(cf. 1986, p.467), a qual pode, portanto, não ser necessariamente apropriada

para o estudo que estamos empreendendo. Em verdade, a categorização

segundo o Status informacional do SN é muito polêmica dentro da literatura

lingüística sobre o assunto.

O último fator desta variável É constituído por todos os SNs que são

não entidades. Ele agrupa todos os casos de função circunstancial e função

atributiva, já devidamente exemplificados nas páginas 319-320. Não

apresentamos aqui as percentagens relativas a esta variável, pois todos os


comentários relativos a ela serão feitos por ocasião da apresentação dos

resultados probabilísticos e da sua comparação com a variável Configuração.

6.3.3.2.4 - Formalidade do SN

A Formalidade é uma variável já estudada no item 6.2.5, quando

analisamos os substantivos e adjetivos separadamente. Utilizamos basi-


331

camente os mesmos critérios lá especificados para caracterizar um SN como

informal ou não informal, ou seja, qualquer SN que tivesse um item do tipo

cara, outro, besteira, bobagem, grilo, lance, papo, merda, goró, brabão etc,

tipicamente usado como gíria, foi considerado informal. Além disso,

classificaram-se também como informais os SNs com núcleo coisa de função

fática ou resumitiva e as construções do tipo um montão de; uma pá de; um

bando de; um monte de.

Considerando ainda que o número de seqüências de três ou mais

elementos com diminutivo/aumentativo (32) e com itens informais (66) era

relativamente pequeno, se comparado ao número de seqüências com grau

normal e não marcadas quanto à informalidade (850); e considerando

também que os itens diminutivos/aumentativos e os itens informais

apresentam o mesmo comportamento (cf. item 6.2.6, páginas 265-277),

decidimos agrupá-los nesta etapa de nossa análise.

Esta variável ficou então sendo formada por dois fatores: o primeiro

deles constituído por SNs que contenham pelo menos um item lexical

informal ou diminutivo/aumentativo e o segundo, pelos demais SNs. Os

percentuais de concordância apontam também para a direção esperada: os

SNs denominados informais se apresentam com apenas 15% de marcas e

os não informais com 55%.

6.3.3.2.5 - A Pluralidade do SN

Procuramos captar com a variável denominada Pluralidade do SN o

fato de determinados SNs tenderem a aparecer predominantemente no


332

plural. A codificação desta variável é passível de discussão, considerando

que não há marcas textuais ou critérios rigidamente definidos para se

estabelecê-la. A base de codificação, à exceção de um dentre os três fatores,

é essencialmente intuitiva.

Consideramos, então, que há SNs que se referem a conceitos,

situações, eventos ou entidades que são necessariamente ou comumente

mais de um. Os casos abaixo são exemplos destes SNs:

- minha mãe nunca interferiu no meus problemas. (Ari39,fg,43a);

- ficam brincando com os nossos direitos. (Hel44,fc,44a);

- nós não damos tanto valor às nossas raízes. (Mgl48,fc,52a);

- me identifico muito com isso, com as nossas coisas, né? (Pac20,mc,26a);

- vejo Arqueologia nas horas vagas. (Mar22,fc,17a);

- eu comecei a pensar...nos meus atos. (Par41,mc,26a);

- voltar às minhas origens. (Eve43,fc,42a);

- uma pessoa, né, que tinha os mesmos valores, né? (Par41,mc,26a);

- você sabe por suas próprias mão. (Jos35,fp,59a).

Em outro fator, consideramos os SNs que fazem referência a partes

do corpo, com quase todas as ocorrências listadas abaixo:

- desde que os seus olhos gostaram. (Dav24,mc,31a);


333

- ficam com as cabeças é, como se diz? pertubadas,né? (Hel34,fg,62a);

- começaram a ingessá as duas perna. (Leo38,mc,18a);

- tá com os lábio vermelho, Patrícia. (Joa10,fp,27a);

- tinha isso aqui bem largo, as perna bem feita, né? (Nil12,fp,45a);

- uns cabelo tudo arrepiado. (Jov26,mg,32a);

- alisá a cabecinha do velho, com aqueles cabelim branquim.

(Sue05,fp,24a);

- tinha aqueles cacho escorridinho. (Nil21,fp,45a);

- diz que tá cos peito todo doendo. (Lei04,fp,25a).

Embora mesmo neste fator haja SNs de classificação discutível, estes

seriam os casos menos dúbios. É interessante observar que há algumas

partes do corpo que são inerentemente duas (olhos, lábios, pernas), já há

outras que, em verdade, são apenas um (peito, cabeça) e há os casos em

que as duas situações acima não se colocam: cacho/cabelo. No caso do SN

que se refere à cabeça, sem dúvida não se trata da cabeça de uma só

pessoa, mas, no caso de peito, a referência é a um só indivíduo. O último


fator engloba todos os casos em que se considera que a referência não é

necessariamente mais de um, ou seja, as construções não são

necessariamente plurais como as do primeiro caso.

Os percentuais relativos aos três fatores desta variável apontam

também em direção ao esperado: os SNs "necessariamente mais que um

não inerente" se apresentam com 75% totalmente marcados, os referentes a

partes do corpo com apenas 21% e os demais com 49%.


334

6.3.3.2.6 - Animacidade do SN

A variável Animacidade do SN foi também codificada nos moldes da

codificação feita para os substantivos no item 6.2.6.3, ficando na sua forma

final com dois fatores: [+humano] x [-humano]. A diferença percentual é,

como já vimos, bastante pequena, mas na direção esperada: dentre os SNs

com o núcleo [+humano], 59% são totalmente marcados e, dentre os com

núcleo [-humano], 55% o são.

Vamos passar agora à apresentação dos resultados probabilísticos

para as sete variáveis sob consideração.

6.3.3.2.7 - Resultados probabilísticos

Gostaríamos de relembrar que os resultados probabilísticos que

vamos apresentar agora estão inseridos em uma análise que considerou,

além das sete variáveis agora focalizadas, também a variável Pluralidade do


contexto, já apresentada, e a variável Processos de formação do plural,

ainda por se apresentar, juntamente com três variáveis sociais estratificadas:

Escolarização, Sexo e Idade. Estas últimas serão discutidas nos capítulos 8

e 9. Como já mencionamos, a variável Pluralidade do contexto foi

selecionada em primeiro lugar com significância 0,0, em conformidade com a

análise dos elementos do SN. Ainda coerentemente com a análise dos

elementos do SN, que selecionou a variável Relação entre os elementos do

SN em quarto lugar com significância também 0,0, a variável Configuração

sintagmática foi selecionada em segundo lugar


335

com igual significância, dentre nove variáveis selecionadas. A partir do

terceiro nível, selecionam-se as seguintes variáveis, com as respectivas

significâncias:

1) Escolarização: 0,000;

2) Sexo: 0,000;

3) Saliência dimensão processos: 0,000;

4) Formalidade: 0,001;

5) Pluralidade do SN: 0,010;

6) Função textual: 0,018;

7) Localização do SN: 0,018.

Os níveis de significância acima evidenciam pequenas diferenças

estatísticas entre os sete grupos restantes selecionados. Nesta etapa de

análise, não são selecionadas as seguintes variáveis:

1) Status informacional;

2) Animacidade e

3) Faixa etária.

É importante observar ainda que, no primeiro nível de análise, havia

cinco variáveis com significância 0,0:

1) Pluralidade do contexto, com oito fatores;

2) Configuração sintagmática, com seis fatores;

3) Escolarização, com três fatores;

4) Sexo, com dois fatores e

5) Formalidade, com dois fatores.


336

Neste primeiro nível, a variável Pluralidade do contexto foi

selecionada em primeiro lugar porque apresentava log likelihood mais

próximo de zero. No segundo nível, apenas a variável Configuração

sintagmática apresentou significância 0,0.

As variáveis Pluralidade do contexto e Configuração sintagmática

são, pois, do ponto de vista estatístico, indubitavelmente as melhores: o que

confirma a análise feita para as partes do sintagma.

Então, as seis variáveis codificadas não constituem explicação para a

variável Configuração, mas junto com ela influenciam a ausência ou

presença de SNs total ou parcialmente marcados. As variáveis codificadas só

constituiriam explicação para a variável Configuração se todos os seus

valores se aproximassem de 0,50. Todavia, como veremos na tabela 6.3.3.6,

isto não ocorre.

Vamos apresentar os resultados probabilísticos e, paralelamente,

vamos mostrar que estes resultados refletem fielmente a distribuição

lingüística dos dados analisados.

A tabela 6.3.3.6, a seguir, contém os resultados probabilísticos da

variável Configuração sintagmática. Nesta tabela, apresentamos, além das

percentagens, as probabilidades iniciais (Prob.1) sem interferência de

qualquer outra variável e as probabilidades finais (Prob.9) com o peso

probabilístico relativo atribuído Às nove variáveis selecionadas. Fizemos a

apresentação desta forma pelo fato de estarmos querendo verificar as

possíveis inter-relações entre, principalmente, a variável Configuração e as

demais variáveis lingüísticas aqui focalizadas. Este procedimento foi


337

adotado em quase todas as tabelas subseqüentes. Algumas delas apre-

sentam inclusive outros níveis probabilísticos. O número de níveis

probabilísticos usados em cada tabela foi função das necessidades de se

mostrarem as sobreposições entre as diversas variáveis estudadas. Feitas

estas considerações, vejamos os resultados da tabela 6.3.3.6 na página

seguinte.

Os resultados da tabela 6.3.3.6 mostram que praticamente não existe

diferença entre percentagens, probabilidades iniciais e probabilidades finais,

o que confirma as conclusões descritas no item 6.3.3.1, feitas apenas em

bases percentuais, novamente colocadas aqui:

1) A presença de artigo definido ou do quantificador, na primeira

posição do SN, e a presença de substantivo ou categoria substantivada, na

última posição do SN, são duas forças poderosas no sentido de provocarem

a presença de todas as marcas de plural em todos os elementos flexionáveis

do plural do SN, com probabilidades de 0,68 e 0,80.


338

TABELA 6.3.3.6
CONFIGURAÇÃO SINTAGMÁTICA DO SN
CONFIGURAÇÃO Apl./Total % Prob.1 Prob.9

+ART.DEF. ... +SUBST.


+QUANT.
(todos os dias) 261/398 = 66 0,68 0,68
(os meus filhos)
(as boas ações)

-ART.DEF. ... -SUBST.


(vários jogadores bons)
(essas carne congelada)
(aquelas rendas todas) 57/211 = 27 0,29 0,37
(esses homi todo)
(algumas colega minha)
(três colega meu)

-ART.DEF. ... +SUBST.


(umas segundas lojas)
(tantas outras famílias) 90/166 = 54 0,57 0,57
(esses trinta dia)
(essas grande fábrica)

+ART.DEF. ... -SUBST.


+QUANT.
(as pessoas ricas)
(os lábios vermelho)
(as danças todas) 61/128 = 48 0,51 0,50
(as coisa toda)
(os camarada meu)
(todas amiga minha)

+ART.DEF. ... CAT.SUBST.


(os melhores possíveis) 12/14 = 86 0,87 0,80
(os maiores prejudicado)

ESTRUTURA COMPOSTA
(duas fragata-brasileira)
(esses médicos-psiquiatra) 3/31 = 10 0,11 0,13
(sete salário-mínimo)
(três banana-prata)

2) A presença de qualquer outra classe gramatical que não seja artigo

definido ou quantificador, na primeira posição do SN, e a presença do


339

adjetivo, do possessivo ou do quantificador, na última posição do SN, são

igualmente duas forças poderosas no sentido de desfavorecer a presença de

SNs com todas as marcas, com probabilidade de 0,37.

3) O cruzamento das classes mencionadas em 1 e 2 mostra o

equilíbrio das duas forças, com probabilidades de 0,57 e 0,50 de influenciar a

presença de SNs com todas as marcas.

4) A estrutura sintagmática composta desfavorece a existência de

SNs totalmente marcados, com probabilidade de 0,13.

Poder-se-iam levantar objeções ao significado lingüístico da variável

Configuração, afirmando-se que a sua seleção em segundo lugar ocorreu por

causa dos valores extremos (0,80 e 0,13) atribuídos aos dois últimos fatores

que contêm poucos dados. Sendo assim, poderíamos supor que, se todas as

variáveis tivessem sido selecionadas, todos os valores da variável

Configuração se aproximariam de 0,50. Tivemos o cuidado de fazer este

teste, pois o instrumental estatístico que estamos usando nos permite ver isto

através do step-down, onde se medem os pesos de todas as variáveis

conjuntamente, para se verificar se as variáveis não selecionadas são


também eliminadas. Neste teste, desconsideramos os fatores extremos a fim

de se eliminar a possibilidade de "ajuda" na seleção.

Os resultados obtidos neste teste podem ser vistos na tabela 6.3.3.7,

na página seguinte. Em Prob.1, temos as probabilidades isoladas e, em

Prob.12, temos as probabilidades com todas as variáveis, inclusive as não

selecionadas.

Podemos verificar, pelos resultados desta tabela, que os valores

probabilísticos permanecem praticamente inalterados e não se aproximam de

0,50 mesmo com todas as variáveis juntas.


340

O fato de haver pouca diferença entre as percentagens, as

probabilidades iniciais e as finais da variável Configuração indica que ela é

realmente uma variável forte e que, mesmo apresentando sobreposições

com outras variáveis, recebe praticamente toda a distribuição relativa dos

pesos probabilísticos.

TABELA 6.3.3.7
CONFIGURAÇÃO SINTAGMÁTICA DO SN
CONFIGURAÇÃO Apl./Total % Prob.1 Prob.12
+ART.DEF. ... +SUBST.
+QUANT.
(todos os dias) 261/398 = 66 0,67 0,65
(os meus filhos)
(as boas ações)

-ART.DEF. ... -SUBST.


(vários jogadores bons)
(essas carne congelada)
(aquelas rendas todas) 57/211 = 27 0,28 0,35
(esses homi todo)
(algumas colega minha)
(três colega meu)

- ART.DEF. ... +SUBST.


(umas segundas lojas)
(tantas outras famílias) 90/166 = 54 0,56 0,54
(esses trinta dia)
(essas grande fábrica)

+ART.DEF. ... -SUBST.


+QUANT.
(as pessoas ricas)
(os lábios vermelho)
(as danças todas) 61/128 = 48 0,49 0,47
(as coisa toda)
(os camarada meu)
(todas amiga minha)
341

O fator da variável Configuração sintagmática que apresenta uma

diferença digna de nota entre a probabilidade inicial e a probabilidade final é

o constituído por [-art.def. ... -subst.], que se apresenta com uma

probabilidade associada de 0,28 no primeiro nível de análise, e de 0,35 no

último, conforme se pode ver na tabela 6.3.3.7. Não existe, todavia, inversão

na ordem das percentagens, probabilidades iniciais e finais. Em verdade, a

variável Configuração é que altera a ordem das percentagens atribuídas à

variável Função textual, variável esta que foi a primeira a ser codificada com

o objetivo de buscarmos novas explicações não formais para a forte

influência da variável Configuração.

Os resultados probabilísticos atribuídos à variável Função textual na

tabela 6.3.3.8, a seguir, mostram que o seu peso probabilístico não segue a

mesma hierarquia que o seu peso percentual. Antes de qualquer outro

comentário, consideramos oportuno observar que, nesta tabela,

apresentamos as probabilidades relativas a quatro níveis de análise: primeiro

nível (N.1), terceiro nível (N.3), sétimo nível (N.7) e nono nível (N.9).
342

TABELA 6.3.3.8
FUNÇÃO TEXTUAL DO SN
FUNÇÃO PROBABILIDADES
Freq. % N.1 N.3 N.7 N.9
Resumitiva 9= 16 0,22 0,31 0,52 0,54
57

Dêitica 17= 31 0,41 0,55 0,57 0,57


54

Retomada 13= 41 0,51 0,46 0,39 0,36


32

Atributiva 19= 40 0,51 0,44 0,32 0,38


47

Textual 320= 54 0,64 0,56 0,54 0,52


589

Circunstancial 106= 63 0,72 0,67 0,66 0,67


169

No primeiro nível de análise, as probabilidades relativas à variável

Função textual mantêm a mesma hierarquia das percentagens. No nível 3,

ao se comparar a influência relativa das variáveis Configuração e Função

textual, observa-se que os pesos probabilísticos dos fatores da variável

Função já se alteram, estabelecendo-se uma identidade entre as

probabilidades dos SNs dêiticos e dos SNs textuais, até então bastante

diferenciados. As modificações são mais fortes ao se atribuir, no nível 7, o

peso relativo das variáveis considerando também a variável Formalidade. O

fator resumitivo sofre mudança radical no seu peso probabilístico. Neste

nível, igualam-se o comportamento dos fatores resumitivo e


343

dêitico com o do fator textual, três fatores bastante diferenciados no

primeiro nível probabilístico.

Configuração e Função se sobrepõem, porque quase todos os SNs

resumitivos e dêiticos têm a configuração [demonstrativo + substantivo +

quantificador] (essas coisa toda). E, como a variável Configuração é

considerada estatisticamente mais poderosa, o peso probabilístico é

atribuído À Configuração e retirado do grupo Função. A sobreposição com a

variável Formalidade também se dá porque a quase totalidade dos

resumitivos é constituída de SNs informais. Além disso, a variável

Formalidade é considerada também mais forte estatisticamente, o que retira

bastante do peso probabilístico que seria atribuído à variável Função.

Diferentemente do que ocorre com a variável Função, os resultados finais da

variável Formalidade mantêm a mesma hierarquia das probabilidades do

primeiro nível, conforme podemos ver pelos resultados da tabela 6.3.3.9.

TABELA 6.3.3.9
GRAU E FORMALIDADE DO SN
GRAU/FORMALIDADE Apl./Total % Prob.1 Prob.9
Informal e/ou
Diminutivo/aumentativo 15/98 = 15 0,28 0,37
Não informal
Não diminutivo 469/850 = 55 0,72 0,63
Não aumentativo

Em verdade, quase todos os valores probabilísticos dos fatores da

variável Função se alteram, quando juntos às variáveis Configuração e


344

Formalidade. O efeito da variável Função que se observa nos valores

percentuais e nos valores probabilísticos do primeiro nível em direção a uma

possível "eliminação de redundância" é apenas aparente. Ele é apenas um

reflexo da Configuração sintagmática e da Formalidade do SN.

Chegamos a fazer um cruzamento entre Configuração e Função, esta

recodificada em dois fatores: redundante e não redundante. Pelo resultado

deste cruzamento, verificamos, por exemplo, que 66% (125/190) dos SNs

com informação redundante são de estrutura [-art.def. ... -subst.] e, destes,

apenas 24% (30/125) são marcados. Constatamos, por outro lado, que os

outros SNs desta mesma constituição, os não redundantes, têm também

apenas 31% (27/86) totalmente marcados, enquanto os demais redundantes

chegam a ter 45% dos SNs com todas as marcas (28/62).

Conseqüentemente, somos levados a refutar a primeira hipótese por

nós levantada: a Função textual não explica o forte condicionamento

exercido pela Configuração sintagmática. Além disso, a sua influência não

chegou a ser sistemática, pois as probabilidades finais relacionadas na

tabela 6.3.3.8 não apresentam uma hierarquia razoável. Por um lado,

apresentam-se os fatores retomada e atributivo, ambos com informação

redundante, com probabilidades baixas; respectivamente 0,36 e 0,33; mas,

por outro, apresenta-se o fator resumitivo, indubitavelmente redundante, com

probabilidade 0,54, a qual é praticamente igual à probabilidade do fator

textual: 0,52. Por último, o fator circunstancial é quem exerce a influência

mais forte: apresenta uma probabilidade 0,67 em favor de SNs totalmente

marcados. Não há dúvidas de que o que tentamos captar


345

com a variável Função textual exerce alguma influência sobre a quantidade

de marcas plurais no SN, mas não da forma por nós analisada. Análises

futuras deverão ser feitas para que se verifique a realidade dos fatos.

Cumpre, ainda, observar que esta variável, na linha de raciocínio adotada

neste trabalho, sempre se apresenta como uma das últimas selecionadas

mesmo na análise atomística dos dados, na sua forma final binária.

A Localização do SN em relação à oração foi outra hipótese

levantada para também explicar a forte atuação da Configuração

sintagmática do SN. Os valores probabilísticos finais a ela atribuídos são

praticamente idênticos às percentagens e às probabilidades iniciais,

conforme se pode observar na tabela 6.3.3.10.

TABELA 6.3.3.10
LOCALIZAÇÃO DO SN
LOCALIZAÇÃO Apl./Total % Prob.9

À esquerda da oração 112/178 = 63 0,61

À direita da oração 349/712 = 49 0,47

Indistinta 23/58 = 40 0,42

Os resultados acima observados são consistentes em termos

discursivos: os SNs à esquerda, na posição de tópico ou de centro da

informação, são os que mais se apresentam com todas as marcas. Os da

direita e os de posição não definida são os que menos se apresentam com

todas as marcas. Os resultados são interessantes, mas em nada afetam

também a variável Configuração sintagmática. Estes resultados novamente

refletem a distribuição lingüística real dos dados. Efetuamos também


346

um cruzamento entre Configuração sintagmática e Localização do SN em

relação à oração e concluímos que não existe qualquer correlação entre

Configuração sintagmática e a Localização do SN, conforme se pode ver

pela tabela 6.3.3.11.

TABELA 6.3.3.11
RELAÇÃO ENTRE CONFIGURAÇÃO SINTAGMÁTICA E LOCALIZAÇÃO
DO SN
CONFIGURAÇÃO LOCALIZAÇÃO
Esquerda Direita Indistinta Total
+art.def. ... +subst. 95 (24%) 286 (72%) 17 ( 4%) 398

-art.def. ... -subst. 25 (12%) 168 (80%) 18 ( 9%) 211

-art.def. ... +subst. 21 (13%) 138 (83%) 7 ( 4%) 166

+art.def. ... -subst. 26 (20%) 94 (73%) 8 ( 6%) 128

+art.def. ... categoria


subst.. 6 (43%) 5 (36%) 3 (21%) 14

Estrutura Composta 5 (16%) 21 (68%) 5 (16%) 31

Total 178 (19%) 712 (75%) 58 ( 6%) 948

Observando a última linha da tabela 6.3.3.11, podemos verificar que

19% do SNs ocorrem à esquerda da oração, 75% à direita e 6% em posição

não definida. Observando-se as ocorrências em função do tipo sintagmático

do SN, verifica-se que, com exceção da Configuração [+art.def ... categoria

substantivada], com apenas 14 SNs, todos os demais tipos sintagmáticos

ocorrem na mesma proporção à esquerda, à direita ou na posição indistinta.

O que seria mais interessante saber, num outro momento, é o porquê da

predominância de SNs plurais de mais de dois elementos à direita da oração.

Seria mais interessante ainda saber se todos os SNs plurais, mesmo aqueles
347

de um só elemento, também ocupam preferencialmente a posição à direita

da oração e ver que função discursiva há por detrás desta distribuição.

Segundo Naro, em comunicação pessoal, os SNs singulares também

ocorrem predominantemente à direita da oração. Afirma ele que isto deve

acontecer porque a informação nova vem à direita e não adianta muito ficar

falando de coisas velhas. Consideramos oportuno observar que, realmente,

todos os SNs classificados por nós como totalmente novos ocorrem à direita.

Todavia, eles constituem apenas 27 casos e, além disso, são os menos

marcados: 22% (6/27). Os demais (velhos/inferíveis; disponíveis; novos

ancorados e não entidades) distribuem-se de maneira regular em função da

posição em relação à oração. Todos eles ocorrem mais à direita do que à

esquerda da oração.

Voltando à correlação entre Configuração sintagmática e Localização

do SN, é importante observar também que os percentuais de concordância

em função do cruzamento destas duas variáveis mostra novamente a maior

relevância do tipo sintagmático do que da Localização do SN, sobre a

concordância nominal. A tabela 6.3.3.12, a seguir, evidencia estes

percentuais.
348

TABELA 6.3.3.12
RELAÇÃO ENTRE CONFIGURAÇÃO SINTAGMÁTICA E LOCALIZAÇÃO
DO SN
CONFIGURAÇÃO LOCALIZAÇÃO
Esquerda Direita Indistinta Total
% % % %
68 = 72 183 = 64 10 = 59 261 = 66
+art.def. ... +subst. 95 286 17 398
11 = 44 44 = 26 2 = 11 57 = 27
-art.def. ... -subst. 25 168 18 211
15 = 71 70 = 51 5 = 71 90 = 54
-art.def. ... +subst. 21 138 7 166
11 = 42 47 = 50 3 = 37 61 = 48
+art.def. ... -subst. 26 94 8 128
+art.def. ... cat. 6 =100 3 = 60 3 =100 12 = 85
subst. 6 5 3 14
1 = 20 2= 9 0= 0 3 = 10
Estrutura Composta 5 21 5 31
112 = 63 349 = 49 23 = 40 484 = 51
Total 178 712 58 948

Observando-se os percentuais acima e focalizando-se especialmente

os quatro primeiros agrupamentos de tipos sintagmáticos, podemos ver que

as diferenças entre os diversos fatores destas duas variáveis são bastante

regulares. Todavia, enquanto a maior diferença entre os diversos tipos

sintagmáticos é da ordem de 48% (59% - 11%) e a menor de ordem de 1%

(72% - 71%), a maior diferença entre localização à


349

esquerda e à direita é da ordem de 20% (71% menos 51%), e a menor, da

ordem de -8% (42% menos 50%). Isto mostra que os pesos probabilísticos

atribuídos aos diversos fatores da variável Configuração e da variável

Localização, bem como a ordem de seleção entre estas duas variáveis,

refletem a realidade distribucional dos dados lingüísticos.

Portanto, verifica-se realmente que a variável Localização, embora

relevante, também não constitui explicação para o forte condicionamento da

Configuração sintagmática: ela, além de não excluir a variável Configuração,

é a última a ser selecionada dentre as nove variáveis selecionadas.

A variável Formalidade é a quinta variável selecionada e, como

pudemos ver através dos resultados da tabela 6.3.3.9, apresenta as

probabilidades de primeiro nível de análise hierarquicamente iguais às do

último, apenas reduzidas em magnitude.

Neste caso, os resultados probabilísticos novamente correspondem

Às oposições detectadas em termos percentuais: os SNs com o traço da

informalidade são menos marcados (0,37) do que os demais (0,63). A

diferença em magnitude em termos das percentagens, probabilidades iniciais

e probabilidades finais, já vista, ocorre devido à sobreposição também já

observada entre Formalidade e Configuração. Como já sabemos, a

metodologia estatística por nós usada atribui pesos probabilísticos relativos

aos fatores das duas variáveis.

A variável Pluralidade do SN foi também selecionada como

estatisticamente relevante, em sétimo lugar, e, como as demais, evidencia a

sua influência sobre a quantidade de SNs totalmente marcados sem


350

também provocar qualquer alteração na variável Configuração. Seus

resultados encontram-se relacionados na tabela 6.3.3.13, a seguir.

TABELA 6.3.3.13
A PLURALIDADE DO SN
FATORES Apl./Total % Prob.1 Prob.9

Mais de um não inerente 57/76 = 75 0,76 0,78

Pode ser apenas um 424/858 = 49 0,51 0,63

Partes do corpo 3/14 = 21 0,23 0,14

Observa-se, pelos resultados da tabela acima, que há a mesma

hierarquia entre as percentagens, as probabilidades iniciais e finais,

modificando-se também a magnitude da diferença probabilística entre os

fatores "partes do corpo" e "pode ser apenas um".

Os resultados acima, ressalvadas todas as discussões quando da

descrição desta variável, mostram que, se o SN se refere a fatos, eventos,

entidades que comumente se apresentam no plural - tanto que a forma

singular tem significado diverso da forma plural (as minhas raízes não é

simplesmente plural de a minha raiz) - ele tende a ter todas as marcas de

plural.

Os resultados mostram também que, se o SN se refere a partes do

corpo, ele tende a não ter todas as marcas de plural. Em verdade, como já

tivemos oportunidade de observar, os SNs que se referem a partes do corpo

são muitas vezes usados também no singular com o mesmo sentido de

plural. É possível em português expressões do tipo: "Rafael, cê tá


351

com a mão suja. Vai lavá a mão pra cumê.", em situações em que as duas

mãos estão sujas e que as duas mãos são lavadas: trata-se, neste caso, de

posse inerente e, às vezes, de cristalização da estrutura.

Os demais SNs, classificados como se referindo a "o que pode ser

apenas um", apresentam-se também muito marcados, embora menos do que

aqueles cuja referência é "mais de um não inerente". Acreditamos que um

estudo das formas singulares relacionadas às formas plurais, com as suas

possíveis alterações de significado, e a obtenção de critérios seguros com

relação à lexicalização ou cristalização de estruturas seriam de grande valia

para o esclarecimento de aspectos que envolvem esta variável. O seu

estudo, mesmo intuitivo, nos trouxe uma certeza: o morfema de plural

em português não indica simplesmente "mais de um". Às vezes, nem isso

ele indica. Tal aspecto merece, pois, um estudo bem mais profundo do que o

que apresentamos neste trabalho.

Merece destacar aqui o cuidadoso trabalho de Pereira (1984),

"Gênero e Número em Português", numa abordagem gerativa. Entre uma

série de idéias interessantes, afirma ela que "nem sempre o SN singular tem

interpretação singular e pode ter interpretação plural" (p.135), com o que

concordamos inteiramente, embora não tenhamos feito este tipo de estudo

nos dados do nosso corpus. Pereira chega a sugerir que a questão da

escolha entre, por exemplo, muito livro e muitos livros talvez pudesse ser

abordada no "arcabouço da teoria da variação". (p.171)

É importante relembrar aqui que a seleção dos dados por nós

estudados teve uma base sociolingüística, ou seja, interessava-nos estudar


352

os SNs semanticamente plurais que a Gramática tradicional e a Gramática

gerativa colocam como subjacentes a um processo formal obrigatório de

concordância plural, com base no dialeto padrão. Uma vez que estruturas

semanticamente plurais do tipo muito livro são descritas pelas duas

abordagens acima como não sujeitas obrigatoriamente ao processo formal

de concordância plural, não nos interessava estudá-las no momento.

Consideramos, todavia, que seria bastante esclarecedor um estudo sobre (1)

os fatores que determinam a escolha de muito livro x muitos livros; lavar o pé

x lavar os pés; essa coisa toda x essas coisas todas, por exemplo; (2) o

processo de concordância nas construções pluralia tantum; e (3) a influência

do traço semântico PLURAL dos coletivos no processo de concordância

nominal. Estudando-se estes aspectos, podemos, sem dúvida, entender um

pouco mais do fenômeno da concordância e do processo de escolha do

plural formal em situações em que se poderia ter o singular formal.

Como já adiantamos, a variável Status informacional do SN não foi

selecionada como estatisticamente relevante. Mesmo assim, consideramos

oportuno fazer algumas observações sobre os seus valores percentuais e

probabilísticos.

Os resultados percentuais e probabilísticos são apresentados na

tabela 6.3.3.14. Na primeira coluna, estão as aplicações e o total de

ocorrências; na segunda, as percentagens; na terceira, as probabilidades do

nível 1, sem qualquer outra interferência; na quarta, as probabilidades do

nível 3 com a interferência da Configuração e, na quinta, e última, as

probabilidades do nível 10, com a interferência de todas as variáveis, ponto

em que poderia ter ocorrido a sua seleção. Vejamos os resultados da tabela

6.3.3.14.
353

TABELA 6.3.3.14
STATUS INFORMACIONAL DO SN
STATUS PROBABILIDADES
Freq. % N.1 N.3 N.10
Novo em folha 6 = 21 0,20 0,31 (0,33)
29
Novo ancorado 80 = 63 0,63 0,56 (0,56)
127
Novo disponível 39 = 70 0,69 0,68 (0,60)
56

Inferível 34 = 44 0,49 0,47 (0,49)


69

Velho 200 = 44 0,44 0,43 (0,50)


451

Não entidade 125 = 58 0,57 0,54 (0,52)


216

Observando os resultados acima, em especial os percentuais e os

probabilísticos do primeiro nível, podemos constatar que os SNs novos-em-

folha são os menos marcados (21% ou 0,20), o que contraria afirmações de

que a informação nova é a mais codificada (cf. DU BOIS, 1984, p.350 e

HAIMAN, 1983, p.802 e 807). Isto não parece aplicar-se de forma coerente

para o fenômeno em estudo, pois, se considerarmos os percentuais ou as

probabilidades isoladas associadas aos outros SNs classificados como novos

- os novos ancorados e os novos disponíveis - , veremos que elas são

maiores do que aquelas associadas aos SNs inferíveis e velhos. Outro

aspecto também intrigante diz respeito ao compor-


354

tamento dos SNs classificados como não entidades que apresentam índices

bastante altos de concordância.

No decorrer da análise, as outras variáveis selecionadas, inclusive a

variável Configuração, vão fazendo com que os valores probabilísticos da

variável Status informacional fiquem bem menos marcados. Os resultados

finais que restam continuam ainda a evidenciar uma oposição entre os

novos-em-folha e os novos disponíveis, para a qual não temos interpretação

lingüística razoável dentro das nossas expectativas, pois desfavorecem a

presença de SNs totalmente marcados, exatamente os SNs classificados

como novos-em-folha. A metodologia estatística que estamos usando não

seleciona os resultados apresentados na tabela 6.3.3.14, porque considera

que eles podem ser devidos ao acaso.

Acreditamos, todavia, que os resultados aqui relatados não são de

todo surpreendentes, uma vez que, nos termos de Poplack 1981, o "S" em

questão não carrega sozinho toda a informação de plural (cf. p.61-2).

A Animacidade foi outra variável não selecionada. Pelas etapas de

análise, verificamos que ela também em nada interfere na variável

Configuração. Os seus resultados são apresentados na tabela 6.3.3.15.


355

TABELA 6.3.3.15
ANIMACIDADE DO SN
ANIMACIDADE Apl./Total % Prob.9

-humano 315/641 = 59 (0,47)

+humano 168/307 = 55 (0,53)

Pelos resultados acima, observa-se que as diferenças percentuais e

probabilísticas, mesmo as isoladas, não são muito fortes. Observa-se ainda,

mesmo na etapa não selecionada no nível 10, as mesmas diferenças

probabilísticas encontradas no primeiro nível: 0,53 para os SNs que têm

núcleo humano e 0,47 para os de núcleo não humano. Novamente,

considera-se que estes resultados também podem ser devidos ao acaso. Já

víramos na análise atomística que as diferenças probabilísticas associadas a

esta variável não eram fortes, embora se manifestassem na direção por nós

esperada. Nesta nova forma de analisar os dados, ela se mostra

estatisticamente não relevante.

Antes de concluirmos, vamos apresentar brevemente a descrição e

os resultados da variável Processos nesta nova forma de se analisarem os

dados.

Decidimos testar, nesta fase da análise, se a influência da variável

Processos era apenas localizada (ver item 6.2.1) ou se ela se expandia para

o SN inteiro.

Codificamos então a variável Processos da seguinte forma:

1) SN que apresenta pelo menos um elemento de plural duplo:


356

- os dois últimos jogos (Fat23,fg,15a).

2) SN que, não apresentando nenhum plural duplo, apresenta pelo

menos um elemento do tipo terminado em -l, com alternâncias

morfofonêmicas na forma plural:

- as posições muito radicais (Pac20,mg,25a).

3) SN que, não apresentando nenhum plural duplo ou nenhum plural

em -l, apresenta pelo menos um elemento do tipo terminado em -ão, com

alternâncias morfofonêmicas na forma plural:

- os piores palavrões (Lau28,fc,43a);

- as associações desorganizadas (Pac20,mg,25a).

4) SN que, não apresentando nenhum plural duplo ou nenhum plural

em -ão ou em -l, apresenta pelo menos um elemento do tipo terminado em -

R:

- os melhores desejos (Ari30,fg,43a);

- vários jogadores bons (Sue05,fp,24a).

5) SN que, não apresentando nenhum caso do tipo 1,2 ou 3,

apresenta pelo menos um elemento do tipo terminado em -S:

- uns quatro meses(Jae25,mg,30a).

6) SN que apresenta todos os elementos com plural regular:

- quatro homens armados (Dor29,fg,44a);

- meus filho casado (Edb07,mp,41a).

Os resultados relativos a esta variável são apresentados na tabela

6.3.3.16.
357

TABELA 6.3.3.16
SALIÊNCIA FÔNICA: DIMENSÃO PROCESSOS
PROCESSOS Apl./Total % Prob.9
Duplo 9/11 = 82 0,85
(olho/ólhos)
-l 23/33 = 70 0,57
anel/anéis)
-ão 32/43 = 74 0,37
(patrão/patrões)
-R 32/47 = 68 0,52
(flor/flores)
-S 27/34 = 79 0,52
(mês/meses)
Regular 361/780 = 46 0,16
(livro/livros)

Pelos resultados da tabela 6.3.3.16, verificamos que os processos

morfofonológicos estendem a sua influência para todos os elementos do SN,

ou seja, basta que o SN tenha pelo menos um item com plural não regular

para que todos os outros elementos do SN, regulares ou não, tendam a vir

totalmente marcados; inversamente, uma seqüência de regulares tende a

desfavorecer a marca de plural em todos os elementos do SN, com exceção

do primeiro elemento, se for flexionável. Observa-se novamente que a

influência dos itens em -ão é menor que a influência dos itens em -l.109

Passemos à conclusão da análise do SN sob a perspectiva não

atomística.
358

6.3.4 - Conclusão

A motivação principal do estudo do SN sob uma perspectiva não

atomística era a de verificar a existência de outras explicações não

estruturais do tipo "coesão sintagmática" entre os elementos do SN. Ao lado

do estudo das diversas variáveis levantadas como hipóteses de explicação

da variável Configuração sintagmática do SN, estudamos também a

Pluralidade do contexto e os Processos morfofonológicos de formação do

plural. Já vimos que estas duas variáveis exercem influência sobre a

concordância também numa perspectiva não atomística e vimos, além disso,

que a variável Pluralidade é a mais forte das três em questão.

Sobre a questão da Pluralidade do contexto, poder-se-ia levantar uma

dúvida quanto à veracidade de sua influência, uma vez que estamos

trabalhando com grupos de falantes de três níveis de escolarização.

Explicando: se as pessoas de maior nível de escolarização têm maiores

índices de concordância e se as pessoas de menor nível de escolarização

tendem a ter menores índices de concordância, a Pluralidade do contexto

poderia ser um mero artefato de junção de grupos homogêneos

internamente, mas de comportamento distinto (cf. BICKERTON, 1977, p.477-

5; 488-9; LABOV, 1975a, p. 223-59; LABOV, 1975b, p.65-129; GUY, 1980,

p.1-35). Ainda explicando: o fator [+pluralidade] do contexto poderia ser

constituído de dados de falantes mais escolarizados e o fator [-

pluralidade], de dados de falantes menos escolarizados. Tais dúvidas não

têm, todavia, o seu lugar neste estudo. Antes de agruparmos os falantes,

vimos que, à semelhança do funcionamento da variável Configu-


359

ração, as diferenças entre os diversos falantes, com relação à variável

Pluralidade do contexto, eram também mais quantitativas do que

propriamente qualitativas, ou seja, as diferenças ocorriam apenas na

probabilidade global de aplicação da regra e não com relação aos pesos

probabilísticos dos fatores e à hierarquia entre eles. Para elucidar esta

questão, apresentamos a tabela 6.3.3.17, abaixo, com resultados para esta

variável em função dos três níveis de escolarização de nossos falantes:

primário, ginasial e colegial. Devido ao fracionamento natural dos dados, os

oito fatores da variável Pluralidade do contexto encontram-se amalgamados

em função das três grandes oposições detectadas, as quais se relacionam

aos contextos de [+pluralidade], [-pluralidade] e misto/isolado.

TABELA 6.3.3.17
PLURALIDADE DO CONTEXTO POR ESCOLARIZAÇÃO
FATORES FALANTES

Primário Ginasial Colegial Todos


Plural F. 33= 59% 54= 80% 64= 85% 170= 77%
56 67 75 220
P. 0,70 0,79 0,76 0,73
Não F. 9= 17% 9= 22% 5= 26% 23= 21%
Plural 52 40 19 112
P. 0,31 0,27 0,21 0,28
Isolado F. 67= 33% 88= 44% 113= 62% 291= 46%
ou 203 200 181 616
Misto P. 0,48 0,41 0,53 0,48
Todos F. 112= 35% 155= 50% 217= 66% 484= 51%
323 311 314 948
P. 0,30 0,55 0,65 0,51
360

Pelos resultados apresentados na página anterior, podemos ver que

todos os agrupamentos de falantes, independentemente do seu grau de

escolarização, apresentam SNs mais marcados nos ambientes de

[+pluralidade] do que nos de [-pluralidade]. Respectivamente, para os

falantes do primário, temos as probabilidades 0,70 e 0,31; para os do

ginasial, 0,79 e 0,27; para os do colegial, 0,76 e 0,21. Os SNs em contexto

misto ou os SNs isolados se apresentam, também para os três

agrupamentos de falantes, com percentuais de concordância intermediária:

primário, 0,48; ginasial, 0,41 e colegial, 0,53. Os resultados probabilísticos

atribuídos aos três fatores dos três grupos de falantes são extremamente

semelhantes entre si e, conseqüentemente, extremamente semelhantes aos

resultados de todos os falantes que se encontram nas últimas colunas da

tabela. O número total de ocorrências e o número total de dados não

constitui a soma exata dos subgrupos, porque estes, quando analisados

separadamente, apresentam alguns fatores com comportamento categórico,

devido ao fracionamento natural dos dados.

Conclui-se, então, que esta variável não constitui um artefato de

junção de falantes de comportamento distinto. Sua influência é

absolutamente sistemática. As diferenças entre os agrupamentos de falantes

são, pois, indubitavelmente, quantitativas e não qualitativas, no mínimo com

respeito à variável Pluralidade do contexto e à Configuração sintagmática, as

duas variáveis lingüísticas mais fortes. Pelos resultados nas últimas linhas da

tabela, percebem-se as diferenças quantitativas, diretamente proporcionais

aos níveis de escolarização.


361

Voltando à motivação inicial do estudo do SN sob uma perspectiva

global, que era a de entender melhor a relação entre Classe gramatical e

Posição dos elementos do SN, buscando novas explicações não formais,

pudemos verificar que nenhuma das hipóteses levantadas - o que resultou na

codificação de seis outras variáveis - mostrou-se significativa para explicar a

forte influência da Relação entre os elementos do SN, numa perspectiva

atomística, e da Configuração sintagmática do SN, numa perspectiva global.

As variáveis Formalidade do SN, Pluralidade do SN e Localização do

SN , com resultados consistentes, têm as suas próprias explicações.

Conforme já colocamos no item 6.2.5.2, a atuação da Formalidade se

explica pelo fato de a Formalidade léxica ser índice do grau de formalidade

da situação da conversa: quanto mais informais os itens léxicos mais

informalidade discursiva e quanto mais informalidade discursiva menor o

número de marcas formais de plural no SN, pois as pressões sociais não

estão exercendo a sua forte influência no sentido de inibir formas

estigmatizadas.

A atuação da Pluralidade do SN tem a sua explicação em termos da

relação semântica entre as formas singulares e plurais, no sentido de as

formas plurais serem ou não diferentes das singulares em algo mais do que a

simples relação mais de um. É possível, também, que haja formas plurais do

tipo pelas minhas próprias mãos, nos seus devidos lugares, os valores

humanos, as minhas raízes, os meus atos etc., que estejam caminhando

para uma cristalização e que, portanto, são dadas


362

"prontas", já na forma "plural", sem que aí interfira a liberdade do falante, que

pode ser vista como uma das causas da variação.

A atuação da Localização do SN, com os SNs à esquerda

favorecendo o índice de SNs com todas as marcas e os demais

desfavorecendo-os, conforme já colocamos, tem a sua explicação em termos

discursivos. A posição à esquerda é a posição tópica ou de centralidade, a

de maior evidência e, por isto, sempre mais marcada. Esta atuação não é

das mais fortes no sentido estatístico do termo, mas se mostra relevante.

Neste ponto do trabalho, é interessante observar novamente que o

Status informacional do SN nem foi considerado como estatisticamente

relevante. Isto é, no mínimo, coerente com as colocações de Du Bois, no

sentido de que há línguas mais orientadas para a "topicidade", línguas não

ergativas, e há línguas mais orientadas para "o fluxo da informação", as

línguas ergativas (cf. 1984, p.353-63). O Português tem sido considerado

uma língua muito tópica (cf., novamente, PONTES, 1986 e PONTES, 1987) e

esta sua característica tem se mostrado mais relevante nas explicações de

fenômenos diversos do que o próprio Status informacional do SN (cf.

MOLLICA, 1986, p.365-8; BRAGA, 1986, p.442; NARO & VOTRE, 1986,

p.459; 461 e 469). Aliado a este aspecto, já observamos que o grau de

novidade do morfema de plural, exceto daquele que ocupa a primeira

posição, é bastante relativo, pois todos os SNs analisados têm, no mínimo,

uma marca formal ou semântica de plural.

Algumas reflexões adicionais sobre a Configuração sintagmática do

SN ainda merecem ser feitas.

Em primeiro lugar, merece menção a força do artigo definido, junto ou

não ao quantificador todo anteposto ao núcleo do SN, favorecendo o


363

índice de marcas de plural. Já é também conhecido na literatura lingüística

que o traço [+definido], aqui especificamente o do artigo definido, é

discursivamente marcado e, como tal, coerentemente com a linha geral de

nosso trabalho, favorece a presença de marcas plurais.

Em segundo lugar, é bom relembrar que a influência favorecedora do

substantivo e a desfavorecedora do não substantivo no final do SN já foi

explicada pela existência da "coesão sintagmática" associada ao Princípio da

Iconicidade, nos moldes colocados no item 6.2.2. Todavia, necessitamos

rediscutir este ponto com base num fato novo, que diz respeito à influência

altamente desfavorecedora da estrutura composta do SN.

O que define uma estrutura composta é exatamente um grau maior

de coesão entre os seus elementos constitutivos, que podem, com o tempo,

até deixar de apresentar a idéia de composto, aglutinando-se e passando a

serem vistos como uma única forma. Então, este caso quebra,

aparentemente, a relação diretamente proporcional estabelecida por nós:

quanto mais coesão, mais marcas; e quanto menos coesão, menos marcas.

Embora o comportamento dos compostos pareça contraditório, ou no

mínimo paradoxal, é possível verificar que isto não se aplica especificamente

ao Português. Segundo Cornish (1986), esta situação também ocorre nos

compostos de Francês, onde o alto grau de coesão é marcado pela falta de

concordância formal (cf. p.187), como em grand-mére, que não apresenta

concordância de gênero na forma grande-mére (cf. p.187).


364

É interessante apresentar aqui a exposição completa de Cornish

(1986) a respeito da noção de distância estrutural que, segundo ele,

(...) é definível em termos da noção de coesão, que em si


mesma é um conceito mais relativo do que absoluto.
Distância estrutural se refere ao grau em que dois
elementos estão integrados em termos de alguma
relação gramático-semântica dentro de uma estrutura de
nível mais alto. (CORNISH, 1986, p.187)110

Então, segundo Cornish, podem-se estabelecer três níveis de

distância estrutural. Para o primeiro, que se aplica aos compostos, ele coloca

o seguinte:

o grau mais baixo de distância estrutural que existe entre


dois elementos é representado pela dependência mútua
de morfemas dentro da palavra, entre aos quais não é
possível inserir qualquer elemento. (...) Este status é
marcado pela falta de concordância formal (...).
(CORNISH, 1986, p.187)111

O segundo grau mais baixo de distância entre dois elementos envolve

casos de artigos e outros determinantes antepostos que "(...) podem somente

preceder o seu núcleo sendo a sua ordem mútua altamente restringida (...)."

(p.187).112 Este grau de coesão pressupõe a indicação

(...) de relações de concordância entre dois elementos. A


concordância obtida entre os dois elementos que
manifestam este grau de distância estrutural é sempre
(como esperado) formal (i.e., puramente gramatical) e
não de natureza semântico-referencial. (CORNISH, 1986,
p.187)113

Continuando, afirma também que

o terceiro grau de distância estrutural é aquele


representado pelas relações obtidas por sintagmas
dentro das orações. As relações obtidas entre sujeitos e
predicados (...) são refletidas em sua grande propensão
365

para a concordância em termos de traços semântico-


referenciais relevantes de seus controladores.
(CORNISH, 1986, p.187)114

Resumindo, o primeiro nível de distância estrutural, com o grau

máximo de coesão, se refere a palavras compostas, em que a

impossibilidade de inserir qualquer elemento entre os dois constituintes dos

compostos se reflete na falta de concordância. O segundo nível de distância

estrutural, coesão mediana, envolve a relação interna ao SN, no que diz

respeito aos artigos e outros determinantes antepostos ao núcleo, com

ordem bem rígida. Neste caso, a concordância marca este grau de distância

estrutural, mas é puramente gramatical. O terceiro nível de distância

estrutural existe na relação entre os sintagmas dentro de uma mesma

cláusula, que é marcado não pela concordância gramatical, mas pela

concordância semântico-referencial.

Se tomarmos a concordância como um mecanismo que estabelece

harmonia formal, como um mecanismo gramatical, como temos feito até o

presente momento, poderíamos dizer que o terceiro nível de distância

estrutural descrito por Cornish - o de menor coesão - apresenta também

menor concordância formal, ou no mínimo, conflito de concordância formal.

Em verdade, os extremos no eixo da coesão não estabelecem concordância

formal ou estabelecem-na menos, seja o grau de coesão 1, o caso dos

compostos, seja o grau de coesão 3, ainda não visto neste estudo. O grau de

coesão 1 explica, portanto, o baixo índice de marcas de concordância formal

nos SNs de estrutura composta e o grau de coesão 3 prevê um baixo índice

de concordância formal entre, por exemplo, o sujeito e o predicativo.

Ao estudarmos, no futuro, a relação de concordância entre o sujeito e

o predicativo, poderemos verificar o que ocorrerá no terceiro nível de


366

distância estrutural estabelecido por Cornish (1986). Exemplificando com a

concordância do gênero (cf. p.208), Cornish coloca que estas relações "são

refletidas por sua grande propensão para a concordância em termos de

traços semânticos-referenciais de seus controladores" (p.188),115 em vez de

propensão à concordância gramatical. Acreditamos que, para a concordância

de número, a previsão que podemos fazer é a de que a relação entre sujeito

e predicativo será fortemente marcada pela ausência de marcas formais no

predicativo, em direção à nossa colocação de que o menor grau de coesão

sintagmática é marcado pelo menor número de marcas formais.

O estudo que fizemos até o presente momento se situa no segundo

nível de distância estrutural conforme caracterizado por Cornish, onde,

segundo ele, ocorre a concordância puramente gramatical. Vimos, todavia,

que, dentro do âmbito do SN, os elementos antepostos ao núcleo

apresentam entre si e o núcleo uma relação mais coesa do que a que é

estabelecida entre os elementos pospostos e o núcleo correspondente. É,

portanto, possível postular a existência de dois graus de coesão dentro do

segundo nível de distância estrutural estabelecido por Cornish, com base

exatamente na possibilidade de se inserir ou não elementos entre os

constituintes do SN. Vimos que somente os constituintes pospostos ao

núcleo admitem a possibilidade de inserção de elementos entre eles e os

seus núcleos correspondentes e, coerentemente, são estes constituintes


367

os menos marcados. Aqueles constituintes que não admitem ser separados

de seus núcleos - os antepostos - são os mais marcados. Desta forma,

estabelece-se uma relação direta entre grau de coesão e número de marcas

no segundo nível de distância estrutural dentro da escala estabelecida por

Cornish.

O próprio Cornish fala da diferença de coesão existente entre o

adjetivo anteposto ou posposto ao seu núcleo, no Francês, evidenciando-se

maior coesão entre o adjetivo anteposto ao núcleo do SN do que entre o

adjetivo posposto a este mesmo núcleo; sem, contudo, retomar estas idéias,

ao estabelecer os graus de distância estrutural, correlacionados ao grau de

coesão e à presença/ausência de concordância formal ou semântico-

referencial como índices de tais aspectos coesivos (cf. 1986, p.183-4).

Resumindo, consideramos que o traço [+definido], discursivamente

marcado, e o Princípio da Coesão Sintagmática, vinculado ao Princípio da

Iconicidade nos termos de Haiman (1983), explicam a forte influência da

Configuração sintagmática sobre a incidência de SNs com todas as marcas

de plural.

Restam, em último lugar, algumas observações sobre a freqüência

das configurações sintagmáticas analisadas. Nem todas as configurações

sintagmáticas têm a mesma freqüência de ocorrência. As tabelas 6.3.3.18 e

6.3.3.19 apresentam a distribuição da configuração sintagmática dos SNs

que têm como último elemento um substantivo, com altas e baixas

freqüências respectivamente, e as tabelas 6.3.3.20 e 6.3.3.21 apresentam as

mesmas distribuições para os SNs que têm um não subs-


368

tantivo na sua última posição. Como o maior percentual de ocorrência de um

tipo sintagmático específico é da ordem de 14% (136/948), na estrutura

[art.def. + poss. +subst.] (os meus filhos), consideramos freqüência alta até

1% de ocorrência e freqüência baixa, um percentual menor do que 1%.

Vejamos as tabelas nas páginas seguintes.


369

TABELA 6.3.3.18
TIPOS SINTAGMÁTICOS DE BAIXA FREQÜÊNCIA EM SNS COM A
CATEGORIA SUBSTANTIVO NA TERCEIRA POSIÇÃO
CONFIGURAÇÃO Apl./Total %

1) quant. + dem. + subst. 1/2 = 50


(todas essas decisões)
2) art.def. + ord. + subst. 1/3 = 33
(nos primeiros dia)
3) uns + adj. + subst. 3/3 = 100
(uns bons filhos)
4) uns {ind.} 4/6 = 67
ind {adj.2} subst.
(uns outros colégios)
(umas certas palavras)
(algumas outras coisa)
5) uns + ord. + subst. 1/1 = 100
(umas segundas lojas)
6) dem. + adj. + subst. 1/3 = 33
(esses pequenos trabalhos)
7) dem. {poss.} subst. 1/3 = 33
{ind.}
(esses meus netos)
(essas outras vez)
8) poss. + adj.2 + subst.
(meus próprios irmão)
TOTAL 12/23 = 52
370

TABELA 6.3.3.19
TIPOS SINTAGMÁTICOS DE ALTA FREQÜÊNCIA EM SNS COM A
CATEGORIA SUBSTANTIVO NA TERCEIRA POSIÇÃO
CONFIGURAÇÃO Apl./Total %

1) quant. + art.def. + subst. 62/78 = 82


(todos os temperos)

2) art.def. + poss. + subst. 95/136 = 70


(os meus filhos)

3) art.def. {ind.} subst. 36/51 = 71


{adj.2}
(os outros colégios)
(os mesmos direitos)

4) art.def. + adj. + subst. 14/26 = 54


(as más empregadas)

5) art.def. + card. + subst. 46/92 = 50


(as duas coisas)

6) uns + card. + subst. 65/122 = 53


(uns três meses)

7) dem. + card. + subst. 6/11 = 55


(esses trinta dia)

8) poss. + card. + subst. 6/13 = 46


(meus doze filhos)

9) art.def. + ... + ... + subst. 9/12 = 75


(os dois melhores time)

TOTAL 339/541 = 63

Pela comparação dos tipos sintagmáticos das tabelas 6.3.3.18 e

6.3.3.19, é fácil verificar, por exemplo, que os SNs que terminam em

substantivo, se combinados com [quant + art.def.]; [art.def. + poss. ou +

{ind./adj.2/adj. e card.}] (casos 1, 2, 3, 4 e 5 da tabela 6.3.3.19), são de alta

freqüência, mas existe restrição de ocorrência entre [quant. + dem.] e


371

[não art.def. + {adj./adj.2/ind./poss.}] (casos 1, 3, 4, 5, 6, 7 e 8 da tabela

6.3.3.18). Não artigo definido só ocorre com substantivo, em níveis altos de

freqüência, se for mediado por um cardinal. Trata-se dos casos 6 a 8 da

tabela 6.3.3.19, especialmente do caso de número 6.

As tabelas 6.3.3.20 e 6.3.3.21, a seguir, mostram também

distribuições interessantes.

TABELA 6.3.3.20
TIPOS SINTAGMÁTICOS DE BAIXA FREQÜÊNCIA EM SNS COM A
CATEGORIA NÃO-SUBSTANTIVO NA TERCEIRA POSIÇÃO
CONFIGURAÇÃO Apl./Total %

1) poss. + subst. + adj. 1/5 = 20


(seus lançamento preciso)

2) poss. + subst. + quant. 2/6 = 33


(meus filhos todo)

3) art.def. + subst. + poss. 0/1 = 0


(os camarada meu)

4) ind. + subst. + poss. 0/2 = 0


(alguns companhero meu)

5) quant. + subst. + poss. 0/1 = 0


(todas amiga minha)

6) uns + subst. + poss. 1/3 = 33


(uns colega meu)

7) card. + subst. + poss. 1/3 = 33


(duas amigas minha)

8) -art.def. + ...+subst. -subst. 0/3 = 0


(umas vinte telas pintada)

TOTAL 7/24 = 29
372

TABELA 6.3.3.21
TIPOS SINTAGMÁTICOS DE ALTA FREQÜÊNCIA EM SNS COM A
CATEGORIA NÃO-SUBSTANTIVO NA TERCEIRA POSIÇÃO
CONFIGURAÇÃO Apl./Total %

1) art.def. + subst. + adj. 45/92 = 49


(os irmãos mais novos)

2) uns + subst. + adj. 10/30 = 33


(umas épocas mais fraca)
(umas borracha grande)

3) dem. + subst. + adj. 16/44 = 36


(aqueles vocabulário meio pesado)
(aquelas igreja famosa)

4) ind. + subst. + adj. 8/17 = 47


(muitos colégio público)
(muitas coisas boas)

5) card. + subst. + adj. 5/23 = 22


(duas lâmpada acesa)
(três crianças maravilhosas)

6) art.def. + subst. + quant. 7/18 = 39


(os problemas todo)
(os direito todo)

7) dem. + subst. + todo 13/80 = 16


(aqueles tomates todos)
(esses degrau todo)
(essas coisa toda)

8) art.def. + ... subst. -subst. 7/11 = 63


(as perna toda marcada)
(os meus filhos todos)

TOTAL 111/315 = 35

Com base nas tabelas 6.3.3.20 e 6.3.3.21, podemos ver que os tipos

consistentemente menos freqüentes são os de possessivo na última posição:

casos 3, 4, 5, 6 e 7, da tabela 6.3.3.20, especialmente quando o possessivo


373

se conjuga com o artigo definido ou com o quantificador na primeira posição:

casos 3 e 5 desta mesma tabela.

Os tipos mais freqüentes podem ser vistos nos números 1 e 7 da

tabela 6.3.3.21, quando se conjugam, [art.def ... adj.1] e [dem. ... quant.].

Além disso, consideramos interessante observar que os tipos sintagmáticos

de alta freqüência que têm em sua última posição um não substantivo

combinam-se mais com não artigos definidos na primeira posição (20%:

194/948) do que com artigos definidos também na primeira posição (13%:

121/948). No caso dos substantivos, esta situação é exatamente inversa e

ainda mais polarizada. Com artigos definidos, temos 40% (383/948) dos

casos e com não artigos definidos, 16% (148/948). Além do mais, enquanto

SNs do tipo [art.def. + subst. + poss.] (os camarada meu) são praticamente

inexistentes, o seu correlato [art.def. + poss. + subst.] (os meus filhos) é o

tipo sintagmático de freqüência mais alta: caso 2 da tabela 6.3.3.19, com 136

ocorrências, num total de 948 dados, ou seja, 14 do total.

Com base nestas observações, podemos nos perguntar por que há

restrição de ocorrência entre, por exemplo:


1) demonstrativo + adjetivo + substantivo (esses pequenos

trabalhos)?

2) quantificador + demonstrativo + substantivo (todas essas

decisões)?

3) indefinido + indefinido + substantivo (algumas outras coisa)?

4) artigo definido + substantivo + possessivo (os camarada meu)?


374

Será que estas restrições de ocorrência são explicadas a nível

estritamente semântico em termos de incompatibilidade de traços ou será

que, embora estas estruturas existam, elas não exercem função discursiva

alguma e por tais razões não ocorrem no discurso? Este é um estudo que

precisa ser empreendido, principalmente num momento em que há duas

posições teóricas em jogo defendendo duas posições bem distintas: uma que

afirma que as estruturas existem e que, então, são usadas para uma

determinada função e outra, no pólo oposto, que afirma que o que existe é a

função, a qual é a determinadora das estruturas. Conforme já vimos, estas

duas posições teóricas, por enquanto antagônicas, são rotuladas por Du Bois

de, respectivamente, Estruturalismo autônomo e Funcionalismo transparente

(cf. DU BOIS, 1984, p.342-47).

Não podemos responder agora a estas indagações, porque o

caminho que tomamos no estudo dos dados que temos em mãos - o da

Sociolingüística Quantitativa - nos levou sempre a olhar mais detidamente

para os dados de alta freqüência do que para os de baixa. Dentro desta

perspectiva, são aqueles dados e não estes que são mais interessantes no
sentido de se evidenciarem as grandes tendências variáveis de uma língua,

passíveis de sistematização. Mas, ao analisarmos os nossos dados, não

pudemos deixar de ver a peculiaridade das distribuições envolvendo a

Configuração sintagmática dos SNs com mais de dois elementos. No tipo de

dado que analisamos, pudemos ver ainda que a Configuração [substantivo +

adjetivo + adjetivo] (problemas existenciais muito atual) ocorre apenas uma

única vez, o que nos mostra que esta configuração é praticamente

inexistente, embora seja prevista em termos gerativos.


375

Mesmo outras construções previstas por uma gramática do tipo

gerativo jamais foram encontradas em nossos dados, como a possibilidade

de uma construção que combine adjetivo anteposto com adjetivo posposto

do tipo problemáticas comunidades agrícolas ou do tipo que combine dois

adjetivos antepostos a elegante velha senhora (cf. LEMLE, 1979, p.7 e 9).

Além do mais, como já vimos, a classe de adjetivos que ocorre antes do

substantivo, nos dados com os quais trabalhamos, é altamente restrita. Ela é

constituída apenas dos "avaliativos", ou simplesmente "intensificadores",

que fazem parte de um inventário fechado, enquanto os adjetivos que podem

ocorrer pospostos aos substantivos são de subclasses diferentes e

encontram-se num inventário aberto, embora finito. O mais interessante é

que tal comportamento não é específico do Português, pois o Francês,

segundo Cornish, pelo menos no que toca ao adjetivo anteposto, apresenta

também semelhante configuração (cf. CORNISH, 1986, p.184).

As últimas observações que acabamos de fazer nos levam a ver que

o estudo da Configuração sintagmática do SN não tem importância apenas

com referência à concordância de número entre os elementos nominais, mas

pode trazer mais esclarecimentos sobre a própria forma da língua se

estruturar através de funções discursivas diversas ou sobre como ela usa as

diversas possibilidades estruturais para funções discursivas diferentes.


376

6.4 - Conclusão

A análise da concordância gramatical de número entre os elementos

do sintagma nominal em Português sob a perspectiva atomística e não

atomística mostrou-se pertinente.

As variáveis Saliência fônica, Relação entre os elementos do

SN/Configuração sintagmática do SN, Marcas precedentes e

posição/Pluralidade do contexto e Formalidade léxica/Formalidade do SN

atuam sobre os elementos do SN e sobre o SN como um todo, evidenciando-

se definitivamente as tendências sistemáticas da variação.

Há outras variáveis que só atuam de forma atomística ou só de forma

global. Do ponto de vista atomístico, temos, por exemplo, a influência do

contexto fonético/fonológico seguinte; e, do ponto de vista global, temos a

localização do SN em relação à oração e a Pluralidade do SN, com

influências positivas. O Status informacional do SN - também uma

propriedade global - não se mostrou relevante. Dúvidas sobre a definição de

seus fatores e sobre a conseqüente codificação podem ser levantadas.

Acreditamos, todavia, que a sua influência realmente inexiste. Pesquisas

futuras poderão confirmar ou não os resultados por nós obtidos.

A Função resumitiva ou a Função textual a nível atomístico e global,

respectivamente, não apresentou comportamento consistente. Do ponto de

vista atomístico, binariamente codificada, apresentou sempre comportamento

uniforme. Mas, do ponto de vista não atomístico, com uma codificação mais

detalhada, não apresentou resultados finais interessantes. Isto pode

evidenciar que: (1) os critérios de classificação não


377

foram precisos e, por isto, não captamos as regularidades lingüísticas

existentes; (2) ou este tipo de variável não tem a relevância lingüística que

julgávamos ter. De atuação também não consistente revelou-se a variável

Animacidade: a nível atomístico, a oposição, embora regular, já se mostrava

fraca; e, a nível global, não se mostrou estatisticamente pertinente.

Novos estudos terão oportunidade de corroborar ou não as nossas

conclusões. Dentro da nossa própria amostra, o estudo dos SNs de dois

constituintes, por exemplo, é um campo fértil para testar a generalidade das

conclusões não atomísticas. Estamos assumindo que a análise que fizemos

se aplica com precisão a todo e qualquer SN plural do Português falado no

Brasil.

Vamos passar agora ao capítulo 7, no qual fazemos a apresentação

de fenômenos de línguas diversas, bem como a apresentação de diversos

fenômenos do próprio Português, que evidenciam um condicionamento

comum, o qual mostra, nos termos de Schiffrin, a tendência de formas

gramaticais particulares ocorrerem juntas (cf. 1981, p.51-5).


378

7 - O PAPEL DO PROCESSAMENTO NA VARIAÇÃO


LINGÜÍSTICA

7.1 - Introdução

Para explicarmos a influência das variáveis Marcas precedentes, a

nível do sintagma nominal, e Pluralidade do contexto, a nível das relações

entre os diversos sintagmas nominais, lançamos mão da influência que o

processamento exerce sobre o uso das formas lingüísticas.

A moda de uma forma geral, quer no vestuário, quer na configuração

arquitetônica dos prédios, reflete bem como o ser humano é influenciado

"pelas semelhanças". A própria necessidade da formação de grupos reflete o

aspecto do "ser parecido". Estamos, então, invocando uma força de

motivação externa (cf. DU BOIS, 1984, p.353) para explicar, não a estrutura

da língua, mas o funcionamento das estruturas no seu uso efetivo.

A utilização de princípios gerais que envolvem a forma da mente

humana operar na colocação de hipóteses sobre a estruturação das

unidades lingüísticas não constitui nenhuma novidade. As hipóteses da

análise fonológica de linha estruturalista servem como uma boa ilustração (cf.

TROUBETZKOY, 1976, p.33-55; PIKE, 1976, p.67-173 e CÂMARA JR.,

1977, p.29-45).

Coloca-se, por exemplo, que, se dois sons foneticamente

semelhantes estiverem em distribuição complementar, eles devem ser

considerados como variantes combinatórias ou condicionadas de um só

fonema. Diante disto, normalmente se pergunta: Por que? E normalmente se

responde: é porque onde um ocorre o outro não ocorre, ou porque eles se


379

excluem nos mesmos ambientes, e a distribuição dos dois configura a

distribuição completa em função dos seus ambientes de ocorrência (cf.

TROUBETZKOY, 1976, p.50-2 e PIKE, 1976, p.84-104). Em verdade, tais

respostas não constituem respostas, mas simplesmente paráfrases da

primeira colocação. Estas paráfrases ocorrem porque a resposta não está na

língua, mas está na forma da mente humana operar, ou seja, duas entidades

parecidas que nunca são vistas juntas no mesmo ambiente são sempre

captadas pela mente humana como uma só. Esta forma da mente operar se

manifesta na grande confusão que se faz entre irmãos parecidos nunca

vistos juntos e se verifica também no uso amplo que os filmes ou telenovelas

fazem da "dupla personalidade" ou de "duas entidades" que parecem uma,

até que se desfaça o suspense, através da "distribuição equivalente com

oposição" ou através da "distribuição análoga", ou da efetiva demonstração

da "distribuição complementar".

Então, dois sons foneticamente semelhantes que estão em

distribuição complementar são variantes ou alofones condicionados de um só

fonema (ou de uma só entidade fonológica), porque é assim que a nossa

mente os capta: como uma só entidade, com realizações diferentes. Em

outras palavras, a explicação é externa à língua e não "tem caráter

estritamente gramatical" (cf. LOBATO, 1986, p.97).

Mas como bem coloca Du Bois,

uma força funcional externa ao sistema, uma vez


evocada, não pode ser simplesmente abandonada.
Volumes do então chamado funcionalismo estão repletas
de apelos ingênuos à percepção, cognição ou outros
domínios funcionais externos ao sistema, que são usados
para "explicar" porque a língua em questão simplesmente
tem de ter uma particularidade gramati-
380

cal - quando num momento de reflexão posterior mostrar-


se-ia que uma outra língua bem conhecida, ou mesmo
até o dialeto mais próximo, tem uma estrutura gramatical
diametralmente oposta no parâmetro relevante. (p.
353)116

Pretendemos agora evidenciar que lançar mão da força externa do

processamento na produção de formas lingüísticas específicas não constitui

um apelo ad hoc e nem um apelo "ingênuo" que será rapidamente

abandonado. Temos evidências deste tipo de influência sobre o

funcionamento do Espanhol, do Inglês, do Francês, do Quechua, do Crioulo

Caboverdiano e do Português, o que nos autoriza a considerá-la como uma


influência geral.

Na conclusão deste capítulo, pretendemos discutir ainda dois outros

aspectos: um diz respeito à interdependência entre duas ocorrências de uma

mesma variável dependente, nos termos colocados por Sankoff & Laberge

(1978), e o outro se refere à questão das "motivações em competição",

conforme discutido por Du Bois (1984).

Antes da apresentação das evidências em questão, é importante

fazermos as seguintes considerações:

1) Todos os trabalhos a serem citados utilizaram dados do

desempenho e não dados da intuição lingüística e todos, exceto dois, fazem

estudos dentro da linha da Sociolingüística Quantitativa ou Teoria da

Variação.

2) A variável a ser focalizada recebe diversos rótulos, mas, quando

estivermos falando sobre ela de forma geral, usaremos o rótulo Paralelismo

formal, por ser este o aspecto comum a todos os trabalhos, incluindo os não

variacionistas.
381

3) A caracterização precisa da amostra de cada estudo não será aqui

explicitada, por este aspecto não ser relevante para as três questões em

jogo.

4) Os estudos apresentados agrupam-se em primeiro plano por tipos

de língua: Espanhol, Francês, Inglês, Quechua, Crioulo Caboverdiano e

Português e, em último, pela época de realização: de 1977 a 1987.

7.2 - Evidências da força do processamento no uso lingüístico

7.2.1 - No Espanhol

o primeiro trabalho que temos em mãos no qual se aborda a

influência da variável agora denominada de Paralelismo formal é o de

Poplack,117 intitulado "The notion of the plural in Puerto Rican Spanish:

competing constraints on /s/ deletion", publicado em Locating Language in

Time, Space and Society, em 1980 (1980a), livro organizado por William

Labov, já citado inúmeras vezes no corpo deste trabalho.

Em outras publicações suas, Poplack retoma esta variável, sempre

sob a denominação de Posição do elemento na seqüência e Marcas

precedentes para comparações e conclusões diversas. Podemos, portanto,

localizá-la em pelo menos mais dois artigos, já referenciados no capítulo 6,

os quais são: (1) "Deletion and disambiguation in Puerto Rican Spanish",

publicado também em 1980 (1980b), na revista Language, volume 56,


número 2 e (2) "Mortal phonemes as plural morphemes", publicado em 1981,

em Variation omnibus.
382

Como já sabemos, nos três artigos em questão, Poplack discute a

hipótese funcionalista de Kiparsky, afirmando com base em seus resultados

que, embora fatores funcionais - rotulados de fatores informacionais em 1981

- desempenhem papel regular sobre o cancelamento do /s/ no Espanhol de

Porto Rico, seu efeito é fraco e é menor do que o efeito de fatores não

informacionais. Entre estes, destaca-se a atuação da Posição e Marcas

precedentes, no sentido de que a conclusão mais interessante é de que

marcas conduzem a marcas e zeros conduzem a zeros (cf. 1980a, p.63-4;

1980b, p.376-83 e 1981, p.61-2).

Segundo Poplack, o efeito da Posição e Marcas precedentes da

forma em que se dá parece se vincular à aplicação da teoria do menor

esforço de Martinet (cf. 1980a, p.65), colocada em 1962, nos seguintes

termos:

Concordância é redundância, e ao contrário do que seria


esperado, redundância resulta, como uma regra, do
menor esforço: as pessoas não se importam em repetir
se o esforço mental é por isto reduzido. (cf. MARTINET,
1962, p.55)118

No primeiro texto de 1980, Poplack já atribui, portanto, o fenômeno

em foco a uma questão de processamento. No segundo texto de 1980,

através de nota de rodapé, ela novamente se refere a esta colocação de

Martinet, sem, todavia, considerá-la o centro da questão. A nosso ver, isto se

coloca desta forma porque, em verdade, Poplack queria apresentar

evidências para a hipótese funcionalista de Kiparsky e não para a de

Martinet. Neste segundo texto, ela coloca, explicitamente, que a variável

Posição e Marcas precedentes funciona de uma forma diferente do que seria

esperado (cf. POPLACK, 1980b, p.377).


383

Em todos os seus textos, Poplack considera que estamos diante de

um caso claro em que os efeitos estruturais e informacionais desempenham

papéis competitivos, tendo cuidado em apresentar fartas evidências de que,

embora a influência de fatores "funcionais ou informacionais" não seja tão

forte, o falante sempre tem uma forma de desambiguar a informação, a qual

nunca é perdida (cf., por exemplo, POPLACK, 1981, p.62).

7.2.2 - No Inglês

Em 1977, Weiner & Labov realizaram um estudo quantitativo das

variáveis que determinam a seleção da passiva sem agente, em vez da

ativa, em amostras de fala espontânea de falantes do Inglês, com

características sociais diferenciadas.119

Dentre outras variáveis estudadas, como a influência da oposição

Velho x Novo, Weiner & Labov verificam o efeito da estrutura superficial

(p.32), observando se o objeto lógico, ou seja, o sujeito da passiva, era ou

não co-referencial ao SN na posição de sujeito da oração anterior.


Os dois autores concluem que

tal paralelismo da estrutura superficial parece ser um fator


poderoso na determinação da escolha da ativa ou passiva,
e passivas são favorecidas quando o objeto lógico se move
para uma posição paralela aos seus co-referentes.
A distribuição global desta restrição prova ser de
alguma forma mais ampla do que o efeito velho versus
novo. Quando os SNs co-referenciais estavam localizados
na posição de sujeito nas orações precedentes, o objeto
lógico da oração passiva sem agente aparecia na posição
de sujeito paralela 58% das vezes, ou seja, a alternativa
com a passiva foi escolhida. Quando isto
384

não era o caso, a escolha da passiva foi realizada


somente 29% das vezes. (WEINER & LABOV, 1977,
p.32)120

A seguir, Weiner & Labov mostram que a análise probabilística

também atribui diferenças estatísticas mais significativas aos fatores da

variável Paralelismo de estrutura superficial do que aos da variável Status

informacional. Afirmam ainda que esta conclusão tem como efeito reforçar

(...) nossa primeira decisão de tratar a escolha da


ativa e da passiva como duas formas alternativas de dizer
"a mesma coisa", uma vez que ela é condicionada por
fatores sintáticos, formais, mais do que por influência do
velho x novo. Poder-se-ia argumentar que seqüências
paralelas são também características de escolhas
semanticamente significativas: há uma tendência
cognitivamente determinada para manter-se falando
sobre a mesma coisa. (WEINER & LABOV, 1977, p.38-
9)121

Objetivando mostrar que não há uma tendência cognitivamente

determinada influenciando a escolha da passiva, Weiner & Labov observam

que a variável Paralelismo estrutural é uma categoria mista, pois envolve co-

referencialidade e ordem superficial. Para mostrar então que há uma

influência puramente sintática (p.39), Weiner & Labov introduzem uma nova

variável: presença ou ausência de estrutura passiva precedendo a passiva

sob análise, independentemente da co-referência (cf. p.39).

Weiner & Labov concluem que a análise acrescida desta variável não

altera de forma significativa os resultados dos valores probabilísticos

atribuídos aos fatores das outras variáveis, além de mostrar-se

estatisticamente melhor. Evidenciam ainda que a passiva precedente se


385

mostra como um fator condicionante independente e poderoso, o que reforça

a sua conclusão de que a escolha da passiva sem agente é condicionada

por considerações sintáticas. Com estes resultados em mãos, Weiner &

Labov citam o primeiro trabalho de Poplack, afirmando que uma análise

informacional preveria que um /s/ precedente deveria favorecer a ausência

de um zero seguinte, o que, entretanto, não se constata. Observam então

que ambos os resultados são de natureza semelhante (cf. p.40). Weiner &

Labov consideram finalmente que

a distribuição da informação no discurso não deixa de ter


influência, mas ela é um fator relativamente menor
comparado à tendência mecânica para preservar a
estrutura paralela: primeiro na sucessão das construções
passivas, segundo na retenção da mesma posição
estrutural para o mesmo referente em sentenças
sucessivas. Há indubitavelmente um fator estilístico
operando (...) /grifos nossos/. (WEINER & LABOV, 1977,
p.43)122

Pelo que Weiner & Labov apresentam, podemos verificar que eles
trabalham restrições informacionais e formais, evidenciando que, se elas
estiverem em competição, as forças formais tendem a prevalecer. Além
disso, pudemos ver que Weiner & Labov descartam a explicação do
funcionamento desta variável na base de uma tendência cognitivamente
determinada para manter-se falando sobre a mesma coisa e atribuem-na à
uma tendência mecânica para preservar a estrutura paralela, havendo um
fator estilístico operando.
Queremos, todavia, levantar uma hipótese de que a tendência
mecânica ou a semelhança de estilo são reflexos de uma tendência geral
que rege uma das formas da mente humana operar, qual seja, a de
aproximar formas pelas suas semelhanças. Certamente, a demonstração
386

desta hipótese foge do escopo desse trabalho. Tal tipo de empreendimento


nem seria propriamente lingüístico.

Já tivemos inclusive oportunidades de mostrar que, no fenômeno que

estamos estudando, a influência da variável Paralelismo formal não é

simplesmente mecânica, pois o /S/ que não tem informação de plural não

acarreta outro /S/ (cf. tabela 6.2.3.30).

Em 1981, Schiffrin faz uma análise quantitativa da alternância do

presente histórico e do passado em narrativas orais do Inglês. Observa ela

que

(...) há uma tendência para verbos no mesmo tempo


ocorrerem juntos. Tanto os verbos no presente histórico e
no passado são mais freqüentes quando o verbo anterior
está no mesmo tempo. Em orações de complicação da
ação não iniciais, 62 dos 368 verbos do presente
histórico ocorrem depois de um presente histórico na
oração anterior, e 82 dos 847 verbos no passado
seguem um verbo no passado na oração anterior. Então
seqüências com alternância rápida entre o presente
histórico e o passado não são típicas. (SCHIFFRIN, 1981,
p. 51)123

Segundo Schiffrin, Wolfson (1979), apresentando resultados

similares, conclui que

a tendência para verbos em um só tempo ocorrerem


juntos tem explicação funcional, no nível discursivo: a
manutenção de um tempo agrupa eventos em uma cena
ou episódio, enquanto a mudança separa eventos uns
dos outros. (SCHIFFRIN, 1981, p. 52)124

Continuando, Schiffrin afirma que seus resultados

(...) dão suporte à hipótese de Wolfson de que a


mudança de tempo separa eventos.
Entretanto, isto não significa que a manutenção de um
tempo tenha efeito oposto - de unir atos em um evento.
387

De preferência, parece ser uma tendência geral para


formas gramaticais particulares ocorrerem juntas. Assim
Weiner & Labov 1977 verificaram que a probabilidade de
se usar passiva aumenta se a passiva já ocorreu no
discurso precedente. E Sankoff & Laberge 1978 relatam
para o Francês que, quando on e tu/vous ocorrem numa
seqüência de sentenças coordenadas ou justapostas, sua
média de mudança é mais baixa do que a sua proporção
geral. Tais restrições seqüenciais sugerem que o que
influencia a primeira ocorrência de uma forma não
precisa ser o mesmo que influencia as ocorrências
subseqüentes. É perfeitamente possível que a mudança
de tempo funcione no discurso para separar eventos,
mas que a manutenção em um tempo não tenha uma
função discursiva comparável. Diferentemente, o último
pode resultar de uma restrição mais mecânica na
continuação de uma forma a não ser que haja razão para
mudar. /Os últimos grifos são nossos/ (SCHIFFRIN, 1981,
p.55-6).125

Semelhantemente à Weiner & Labov, Schiffrin afirma que há uma

restrição mecânica envolvendo a tendência geral de formas particulares

ocorrerem juntas, sem vincular tal situação a qualquer tipo de força externa

que pode atuar sobre o funcionamento das formas lingüísticas.

7.2.3 - No Francês

Em 1978, Sankoff & Laberge, sem querer jogar por terra "a hipótese

da independência" de ocorrência das diversas formas lingüísticas, discutem o

efeito da proximidade sintagmática em dados de ocorrência sucessiva.

Abordam três fenômenos sobre a evolução do sistema pronominal do

Francês de Montreal, com base no trabalho de Laberge (1977) sobre on/tu-

vous e no de Sankoff & Laberge sobre on/ils e nous/on (cf. p.119).


388

Os autores em questão definiram três tipos de proximidade

sintagmática entre dois dados, além dos casos de hesitação, focalizando a

relação da segunda em função da primeira ocorrência. Consideraram que a

hipótese de trabalho subjacente aos três tipos de proximidade sintagmática

(...)coloca que quanto menor a relação sintagmática


entre os dois dados, maior a chance de mudar a variante
quando o segundo dado é enunciado. (SANKOFF &
LABERGE, 1978, p.121)126

Os três tipos de proximidade sintagmática estudados foram os

seguintes:

1) Restrições de encaixe: "(...) quando um único referente é o sujeito

de duas (ou mais) sentenças, uma das quais está encaixada na outra."

(p.120)127

2) Restrições seqüenciais: "(...) quando um único referente é um

subconjunto de uma seqüência de duas ou mais sentenças independentes

que são coordenadas ou simplesmente justapostas". (p.120)128


3) Ausência de restrições 1 e 2: quando duas ocorrências de uma

mesma variável estão distantes, não sendo possível caracterizar as

restrições dadas em 1 e 2 (cf. p.121).

Segundo os autores, as comparações mais interessantes envolvem

as restrições seqüenciais, onde se observa que as segundas ocorrências em

questão apresentam tendência para não mudar, mostrando uma taxa maior

de ocorrência, o que rejeita a hipótese da independência da segunda

ocorrência em relação à primeira. Afirmam também que, embora os dados

sejam esparsos, os encaixes restringem as mudanças mais fortemente do

que as seqüências (cf. p.122).

Os autores então se perguntam:


389

A restrição seqüencial é uma forma de coerência textual,


embora quantitativa, operando sobre variáveis co-
referenciais em unidades sintagmáticas adjacentes, ou
isto simplesmente reflete homogeneidade estilística
dentro de passagens relativamente curtas na
conversação? /Grifos nossos/ (SANKOFF & LABERGE,
1978, p.122)129

Segundo eles,

a primeira opção é no mínimo parcialmente válida (...),


/uma vez que/ as taxas de mudança para os pares não
restringidos não são claramente diferentes das
proporções gerais das variantes, indicando pouco ou
nenhum efeito da homogeneidade estilística." /grifos
nossos/ (SANKOFF & LABERGE, 1978, p.122 e 126)130

Os autores acima mostram a influência da primeira sobre a segunda

ocorrência, sem, todavia, atribuir este fato a uma simples tendência

mecânica de repetição das formas ou à homogeneidade estilística, mas sim

ao que eles denominam de coerência textual, não tecendo considerações

mais detalhadas a respeito desta questão. Resta saber se entre os pares não

restringidos existe diferença entre os de maior e os de menor proximidade.

7.2.4 - No Quechua

Em 1981, em "Variation in plural marking: the case of Cuzco

Quechua", Lefebvre estuda a flexão nominal e verbal no Quechua e compara

seus resultados aos obtidos por Poplack (1979). Embora esteja estudando

uma língua bastante diferente das até agora apresentadas, ela conclui

também que há restrições em competição agindo nesta língua indígena da

América do Sul falada na região andina.

Com relação aos fatores que afetam a flexão plural do nome e do

pronome, afirma o seguinte:


390

o fato de que há uma alta probabilidade de flexão plural


nos nomes que não são precedidos por um quantificador
está de acordo com a hipótese funcionalista.
(LEFEBVRE, 1981, p.80) 131

No caso acima, não se verifica restrição em conflito, pois o

fenômeno de flexão nominal em curso não envolve processos de

concordância. Já com relação à flexão verbal, que envolve mecanismos de

concordância, Lefebvre apresenta dois tipos de conclusão: uma em direção

à hipótese funcionalista e outra em direção ao Princípio do Processamento

com Paralelismo, conforme podemos ver a seguir.

Se olharmos a contribuição do tipo de informação plural


contida no SN sujeito nós encontramos os seguintes
resultados. Nos casos em que os pronomes sujeitos não
aparecem na estrutura superficial, a probabilidade de
flexão plural dos verbos é muito alta. Este fato se amolda
à hipótese funcionalista (...); inversamente no caso de um
nome quantificado ou sujeito coordenado a probabilidade
de flexão plural dos verbos é muito baixa (...)
Os outros fatores, entretanto, não confirmam a hipótese
funcionalista como tal. Isto envolve dois tipos de casos
para os quais não há informação de plural no SN sujeito
(...) e para os quais há informação de plural no SN sujeito
(...) A hipótese funcionalista preveria que a primeira
categoria favoreceria a flexão plural nos verbos a fim de
preservar informação plural a nível de sentença,
enquanto a segunda categoria permitiria menos flexão
no verbo uma vez que a pluralidade já está marcada no
sujeito. Os resultados mostram a tendência contrária. Eu
sugiro a seguinte explicação para estes fatos: parece
haver um fenômeno de concordância superficial que dá
conta da flexão de plural nos verbos quando o SN sujeito
está flexionado com o plural e ausência de flexão quando
o SN sujeito não está flexionado. /Grifos nossos/
(LEFEBVRE, 1981, p.81-2)132
391

Lefebvre conclui então que a sua análise com base nos dados de

Quechua, à semelhança da análise feita para o Espanhol, parece mostrar

que há dois processos em competição, evidenciando-se assim que línguas

diferentes como o Quechua e Espanhol são governadas pelas mesmas

restrições (cf. p.83).

Os resultados de Lefebvre são extremamente interessantes, não

apenas pelas conclusões explícitas sobre o funcionamento das restrições em

competição e, especialmente, sobre o funcionamento do Paralelismo Formal,

mas, também, pelo fato de apresentarem exatamente a mesma influência

vista para o Português do Brasil por Naro (1981b), num estudo sem qualquer

conexão com o seu ou com o de Poplack.

7.2.5 - No Crioulo Caboverdiano

Em 1982, Braga defende sua tese de doutorado, intitulada "Left-

dislocation and topicalization in Capeverdean Creole". O seu objetivo, ao

fazer esse estudo, era determinar as propriedades e as funções discursivas


das topicalizações e deslocamentos para a esquerda no Crioulo

Caboverdiano, que é normalmente considerada como língua de ordem fixa

(cf. p.1-5; 154).

Embora não estivesse analisando especificamente a influência da

variável Paralelismo Formal, conclui que a menção do referente no discurso

imediatamente precedente favorece tanto os deslocamentos para a

esquerda (cf. p.97) quanto as topicalizações (cf. p.131).

O Crioulo Caboverdiano é, pois, um exemplo de um outro tipo de


392

língua, sincronicamente tão natural quanto qualquer outra, mas

diacronicamente diferente, que evidencia a consistência da força do

Paralelismo Formal sobre o uso lingüístico.

7.2.6 - No Português do Brasil

O efeito do Paralelismo formal tem se mostrado relevante em


diversos fenômenos do Português do Brasil, principalmente na área da

sintaxe e da morfossintaxe. Há pelo menos dez trabalhos, excluindo o nosso

ora apresentado, que evidenciam a influência desta variável em situação de

discurso livre na modalidade oral ou em situação de elicitação de dados

orais ou escritos.

Vamos apresentar, por ordem de tipo de fenômeno e, então, por

ordem cronológica, primeiro os trabalhos que analisam apenas o discurso

livre na modalidade oral semi-espontânea e, em segundo, aqueles que

analisam também dados lingüísticos obtidos através de questionários, quer

orais, quer escritos. Estes últimos trabalhos mostram a influência do efeito

denominado "gatilho" por Emmerich 1977 (cf. p. 397), em situação de

pergunta-resposta, quer através de diálogos, quer através de questionários.

O primeiro estudioso a falar sobre a influência do Paralelismo formal

na modalidade oral semi-espontânea em discurso livre, no Português do

Brasil, é Omena que, em 1978, realizou a sua Dissertação de Mestrado sob

o título "O pronome pessoal de terceira pessoa: suas for-


393

mas variantes em função acusativa." na modalidade de fala analisada,

Omena coloca que praticamente não ocorreu a forma pronominal oblíqua o,

fato que limitou a sua "observação ao uso do pronome de caso reto em

função de objeto direto e ao cancelamento do pronome" (p.30), portanto, nas

sua formas respectivas ele e zero (0).

Num estudo piloto, Omena testa a influência de sete variáveis, dentre

as quais destacamos a que ela denomina neste ponto do trabalho de Classe

de palavras a que pertencia o antecedente. As suas expectativas diante

desta variável são colocadas inicialmente da seguinte forma:

pela natureza do fenômeno lingüístico em observação, o


pronome seria um item lexical que substituiria um nome
já anteriormente expresso, para evitar repetição. Assim
esperávamos uma alternância no uso do pronome.
Pensávamos que para maior clareza na comunicação
seria mais provável ocorrer um apagamento quando o
sintagma antecedente fosse um nome, do que quando
fosse um pronome, achando que, uma vez ocorrido um
pronome, a tendência seria o falante utilizar numa
referência subseqüente o nome do ser a que se referia,
ou, repetir o pronome. (OMENA, 1978, p.32)

Realizado o estudo piloto, Omena conclui que a diferença entre o

efeito do tipo categorial do antecedente, se pronome ou se nome, é neutro,

pois a diferença probabilística entre eles é de apenas 0,04 (cf. p.43).

No estudo definitivo, com uma amostra constituída apenas de

falantes semi-escolarizados, Omena decidiu reanalisar a variável Classe

gramatical do antecedente. Segundo ela, observou-se que

muitas vezes, além do pronome antecedente, havia,


posteriormente, um ou mais apagamentos da forma, para
só depois ocorrer o pronome (ou o seu cancela-
394

mento) em função de objeto direto. Outro fator observado


foi que havia frases em que o antecedente aparecia
cancelado, dedutível apenas pelo contexto, para depois
surgir o cancelamento ou o emprego do pronome objeto.
Também foi visto que o antecedente (nome ou pronome)
podia aparecer repetidamente, antes da ocorrência ou
cancelamento do pronome objeto. /Grifos nossos/
(OMENA, 1978, p.54)

Com base nas observações acima, Omena reorganizou esta variável

em três fatores: 1) antecedente formalmente ausente, mas dedutível do

contexto; 2) antecedente nome ou pronome, seguido ou não de algum

cancelamento (não reforçado) e 3) antecedente reforçado, isto é, "ou

aparecia um nome e um pronome (ou vice-versa), ou agrupavam-se ora

nomes, ora pronomes". (p.54-5 e p.64)

O estudo desta variável sob a nova perspectiva levou Omena a

concluir o seguinte:

Outro fator a inibir a aplicação da regra foi a


referência reiterada ao elemento que constituía o assunto
do discurso. A idéia de que o falante tenderia a apagar o
pronome objeto mais facilmente em seguida ao
apagamento de um substantivo, do que ao aparecimento
de um pronome pessoal que já seria uma cópia, mostrou-
se, na prática, irrelevante. Pensávamos em uma
regularidade na seqüência dos itens lexicais, tendo em
vista seu conteúdo semântico (...)
A lógica lingüística revelou-se outra. Nossos falantes
tendem mais a usar o pronome objeto, quando antes já
aparece uma seqüência de nomes e/ou pronomes.
Parece influenciar aí o mecanismo enfático da repetição.
/Grifos nossos/ (OMENA, 1978, p.100)

Pelas conclusões de Omena, podemos ver novamente a influência da

repetição sobre o uso das formas lingüísticas. E, por suas palavras, podemos

ver também que tal tipo de influência não fazia parte de suas hipóteses

iniciais: o esquadrinhamento dos dados foi que revelou a importância da

variável Paralelismo formal. Todavia, é importante observar


395

que Omena mediu também a influência de outras variáveis do tipo

Acumulação de função sintática, quando o pronome exerce uma função na

oração principal e na oração encaixada (deixei ela sair), concluindo que

o SN pronominal que acumula em um dado contexto


duas funções sintáticas tende a se realizar formalmente
no discurso. A ausência deste fator favoreceria o
cancelamento da forma. (OMENA, 1978, p.98)

Continuando a sua exposição, ela coloca que

uma forma, que representa na estrutura superficial o


objeto de uma oração dominante e o sujeito de uma
oração encaixada, tenderia a se manter, dada a
necessidade de clareza na comunicação. (OMENA,
1978, p.99)

Com a influência destas duas variáveis, podemos ver dois princípios

ou motivações diferentes em competição: o Princípio da Economia ou

Motivação Econômica (cf. HAIMAN, 1980 e 1983; DU BOIS, 1984) e o

Princípio do Processamento por semelhança formal, ou Princípio do

Processamento com Paralelismo, agora em proposição. O primeiro conduz à

manutenção da forma em função da "clareza na comunicação", enquanto o

segundo conduz ao Paralelismo formal independentemente deste aspecto.

Em 1981, também com base em dados do Português do Brasil,

produzidos por falantes semi-escolarizados, Naro analisa a possibilidade de

ocorrência de sujeitos vazios com verbos de terceira pessoa do plural em

função de duas variáveis: o tipo de desinência da forma verbal - se forte ou

fraca - e o tipo de desinência plural do verbo - se presente ou se ausente,

neste segundo caso neutralizada.


396

Seu objetivo final é discutir, com base no uso real da linguagem, a

visão difundida de que, em línguas como o Português, a existência de

pronomes vazios é possível pelo fato de a desinência da concordância verbal

ser suficiente para indicar a mesma informação que um sujeito explícito (cf.

1981b, p.351).

Naro deseja discutir a colocação acima porque, segundo ele, ela

apresenta pelo menos duas pressuposições fundamentais: uma de que a

concordância não é uma questão de grau e outra de que a concordância é

uma regra obrigatória que sempre produz distinções explícitas na língua que

permite sujeitos vazios (cf. 1981b, p.351).

Pelo estudo da relação entre os sujeitos vazios com verbos que

apresentam concordância e o tipo de desinência verbal explícita - forte ou

fraca -, Naro conclui que há mais sujeitos vazios com verbos com desinência

forte do que com verbos de desinência fraca. Segundo ele, estes resultados

tendem

(...) a dar suporte à idéia de que 'onde você tem


concordância explícita você pode cancelar o sujeito' (...)
Além disso, podemos acrescentar que, quanto mais
explícita for a concordância, mais sujeitos podem ser
cancelados. (NARO, 1981b, p.356)133

Segundo Naro, pelo fato de a concordância ser uma questão de grau,

a generalização correta "(...) não é 'tente preservar a marca', mas 'tente

eliminar a redundância'". (p. 354),134 o que, todavia, não se aplica aos casos

de verbos sem concordância. Pelo estudo da relação entre os sujeitos vazios

com verbos que não apresentam concordância e o tipo de


397

desinência verbal não explícita - forte ou fraca, Naro conclui que há também

mais sujeitos vazios com verbos fortes sem concordância do que com verbos

fracos sem concordância, verificando-se o mesmo padrão dos verbos com

concordância. Sendo assim o princípio tente eliminar redundância não se

aplica a estes casos, pois não há desinências explícitas e,

conseqüentemente, não há redundância a ser eliminada (cf. p.354).

Afirma ele também que

se a única consideração relevante fosse a preservação


da marca explícita de categorias tais como o plural, o
sujeito deveria aparecer mais freqüentemente /com
verbos sem concordância/ do que com verbos com
concordância, porque tais categorias não são marcadas
na desinência da forma sem concordância. Além disso,
esperaríamos mais sujeitos explícitos com verbos fortes
sem concordância do que com as suas contrapartes
fracas. Entretanto, nenhuma destas expectativas são
confirmadas(...). (NARO, 1981b, p.354)135

As expectativas acima não são confirmadas porque, além de sujeitos

vazios aparecerem mais também com verbos fortes sem concordância, os

sujeitos vazios são também mais freqüentes com os verbos sem


concordância do que com os verbos com concordância, pelos resultados

apresentados por Naro (cf. 1981b, p.354-6).

A preferência de sujeitos vazios com verbos fortes sem concordância

significa, segundo Naro, que falantes evidenciam uma grande inclinação

para evitar conflito superficial entre o sujeito e o verbo com verbos de

desinência forte. Assim, o princípio aqui é 'elimine conflito' (cf. 1981b, p.355).

Concluindo, Naro coloca que


398

é importante se ter em mente, entretanto, que no mundo


real há muitos verbos sem concordância. O fato de que
estes também permitem sujeitos vazios, e na mesma ou
maior proporção do que verbos com concordância,
mostra que a hipótese da concordância explícita, mesmo
na sua forma relativizada, não é correta. O princípio
subjacente geral por trás do comportamento de ambos os
tipos de construção é a redução na quantidade de
marcas superficiais. Para verbos com concordância, isto
reduz a redundância sujeito/verbo e para verbos de não
concordância isto reduz conflito sujeito/verbo. Observe-se
que neste segundo caso, o processo de marcar é
reduzido mesmo com o custo de se perderem todas as
marcas superficiais de categorias semânticas. (NARO,
1981b, p.356)136

No resumo parcial do artigo de Naro que acabamos de fazer,

interessa-nos destacar a correlação entre sujeitos vazios e verbos com ou

sem concordância. Neste ponto específico, podemos perceber novamente

que formas semelhantes tendem a se agrupar: por um lado, sujeito explícito

com desinência explícita e, por outro, sujeito vazio com desinência plural não

explícita, ou seja, forma sujeito zero com desinência zero. Aplicam-se com

precisão aqui as palavras de Poplack: marcas levam a marcas e zeros levam

a zeros. Conforme já observáramos, estas conclusões são extremamente


semelhantes às de Lefebvre para o Quechua, evidenciando-se a importância

da variável Paralelismo formal.

Os resultados relativos a verbos com desinência forte ou fraca

interessam-nos também na medida em que eles mostram, a nosso ver, um

outro princípio envolvido, que é o Princípio da Economia Lingüística.

Em 1982, Lira realiza a sua tese de Doutoramento, intitulada

"Nominal, Pronominal and Zero Subject in Brazilian Portuguese", objetivando

estudar a alternância entre sujeito pronominal e sujeito zero (cf. p.1).

No estudo da influência de uma variável denominada Referentes

novos e velhos, Lira efetua uma subdivisão dos referentes velhos em função
399

do número de orações anteriores em que ele foi mencionado, considerando

(1) a oração imediatamente precedente, (2) duas orações precedentes e (3)

três ou mais orações precedentes (cf. p.148).

As suas expectativas, com base na análise desta variável, eram que

"um referente sujeito novo e um referente que já fosse mencionado três ou

mais cláusulas antes favorecesse os sujeitos pronominais." (p.148)137

Embora Lira tenha codificado esta variável com as expectativas

estabelecidas acima, os resultados que obtém encontram-se praticamente na

razão inversa de suas expectativas, pois, não apenas os sujeitos novos

desfavorecem o aparecimento da forma pronominal, mas, conforme afirma

ela, "(...) o reverso acontece. Se o sujeito está presente em uma oração

antes, o pronome tem a probabilidade mais alta de ser realizado."

(p.149)138

Buscando uma explicação para tal situação, Lira coloca o seguinte:

O fato de que o sujeito pronominal ocorre mais


freqüentemente quando o referente foi mencionado uma
oração antes poderia ser explicado por algum tipo de
paralelismo ou concordância na superfície. /Grifos
nossos/ (LIRA, 1982, p.150)139

A seguir, Lira cita o estudo de Poplack, em sua tese de

Doutoramento, o de Weiner & Labov (1977) e o de Schiffrin (1981).

Com relação à inesperada influência dos sujeitos novos, favore-


400

cendo o cancelamento, Lira afirma que tais casos são pronomes

generalizantes, o que explica os resultados, pois, segundo ela, o sujeito de

uma sentença generalizante não é importante para a inteligibilidade da

mensagem (cf. p.151-2).

Podemos então observar que os resultados de Lira mostrando a

influência da proximidade entre as formas também foram obtidos ao acaso. A

hipótese explicitamente colocada era exatamente o inverso dos resultados

obtidos. Podemos novamente ver que a influência deste tipo de variável é tão

forte que, mesmo quando não analisada conscientemente, ela emerge no

estudo de outras variáveis sob hipóteses opostas.

Omena, em 1978, concluíra que o mecanismo da repetição exercia

influência no uso explícito do pronome pessoal ele na sua função acusativa.

Esta conclusão emergiu do estudo de uma variável que não tinha por

objetivo testar o mecanismo da repetição, conforme ela o coloca.

Em 1986, Omena efetua um outro estudo, agora sobre as formas de

referência à primeira pessoa no discurso na sua forma plural com as

seguintes realizações: nós, a gente e zero (0).


Ao estudar as formas nós x a gente na função sujeito, ela analisa

uma série de variáveis condicionantes, dentre as quais a mais forte é a

Mudança de referente. Fora esta variável, a outra mais evidente é a que

reflete a tendência à repetição de formas semelhantes, denominada

seqüências das formas no discurso. Segundo Omena,

é interessante observar que, no caso da primeira escolha,


não há influência da seqüência no discurso sobre a
variável: a probabilidade fica em torno de .5. (...) No
401

entanto, uma vez escolhida a forma, essa escolha atua


sobre o uso das formas subseqüentes. (OMENA, 1986,
p.295)

Continuando, ela coloca ainda que

a influência da forma do sujeito explícito antecedente


sobre o uso das formas é uma tendência à repetição.
/Grifos nossos/. Veja-se que nos dados das Crianças
essa influência em relação ao uso de nós é tão forte que
não importa a mudança de referente. É uma tendência
assinalada em outros fenômenos sintáticos. (OMENA,
1986, p.295)

No estudo do sujeito zero, relacionado às formas nós e a gente,

Omena estuda também a influência de uma série de variáveis condicionantes

e, dentre tudo o que ela coloca, destacamos a parte referente à variável

seqüência das formas no discurso. Com relação a este aspecto, Omena

afirma que

a ausência de sujeito em oração anterior favorece nova


ausência, a presença de a gente /fala/ propicia 0 V +
des. de 3a. P. /fala/ e a de nós /falamos/ propicia 0 V +
des. De 4a. P. /falamos/. (OMENA, 1986, p.307)

Ela afirma ainda que a primeira referência, semelhantemente ao que

ocorre no sujeito explícito, não é influenciada pela seqüência no discurso (cf.

p. 306).

A influência da variável Seqüência das formas no discurso se torna


ainda mais evidente na parte em que Omena estuda "a ocorrência de nós e

a gente em outras funções", especificamente nos casos de complemento

adverbial e adjunto adverbial. Segundo ela, nestes casos

verifica-se que é a seqüência do discurso o fator mais


atuante na escolha de uma das formas. Propicia as
ocorrências de a gente o fato de haver no contexto
antecedente a gente. (...) Para que ocorra nós (e seus
derivados) deve existir antes uma manifestação dessa
forma (...) Quando se faz uma referência isolada à
402

primeira pessoa do plural, ou quando se trata de


referência inicial, há uma tendência ao uso de a gente
(...). (OMENA, 1986, p.314)

É oportuno observar que, neste estudo, Omena coloca explicitamente

que o Paralelismo formal envolve não apenas a repetição da forma com

presença de substância, mas envolve também a repetição da forma zero, ou

seja, a repetição da ausência de substância.

Omena mostra novamente que há duas forças em competição: uma

que provoca a mudança de forma, subjugada, portanto, ao Princípio da

Iconicidade ou Isomorfismo forma/significado, e outra que conduz à

manutenção da forma, compelida pelo Princípio do Processamento com

Paralelismo. Segundo ela, a primeira é mais forte do que a segunda de forma

geral, mas há alguns momentos em que a segunda motivação é que assume

a liderança.

Também em 1986, Braga, ao estudar as construções de tópico (CTs)

no discurso oral de falantes cariocas, na sua relação com o objeto direto e

indireto, mostra, em última instância, que a menção prévia de um constituinte

é fundamental para desencadear uma construção tópica (cf. p.422).

Inicialmente, tanto em relação às construções de tópico com objeto

direto e construções de tópico com objeto indireto, ela analisa uma série de

variáveis, mostrando que elas "não constituem condicionadores no sentido

estrito da palavra, funcionando antes como caracterizadores do formato de

uma CT." (p.417 e p.418)


403

Braga afirma que todas as construções de tópico e objeto direto

analisadas, quer as classificadas como reiteradoras; quer as condicionadas

por fatores estritamente mecânicos; quer as que estabelecem contraste,

destacam elementos dentro de uma série ou apresentam justificativas; quer

as que exercem outras funções não definidas, todas elas revelam uma

característica comum:

a retomada de um item já evocado anteriormente ou a


menção a constituintes de conceitos também já referidos.
Esta volta ao texto anterior parece ser a macro-função
das CTs da qual os grupos listados anteriormente
constituem tão somente uma especialização. Esta
característica das CTs aponta para e, enquanto tal,
caracteriza-se como um dos mecanismos coesivos de
que dispõe o falante. (BRAGA, 1986, p.412)

Embora evidencie a característica comum às CTs sob análise, Braga

estabelece uma distinção forte entre, por exemplo, as CTs reiteradoras e as

condicionadas por fatores estritamente mecânicos. Segundo ela, a CT

reiteradora mostra uma relevância, sob a perspectiva do falante, na

repetição do enunciado prévio e a CT condicionada por fatores mecânicos

surge em função de uma pergunta do interlocutor, "o efeito gatilho referido

por Emmerich (1984)". (BRAGA, 1986, p.405)

Ao analisar especificamente as CTs e objeto indireto, Braga retoma

todos os agrupamentos feitos e, através de um último exemplo, que tem

como única função a de simplesmente retomar uma menção anterior, Braga

coloca explicitamente que

as menções prévias favorecem a ocorrência do SN em


posição inicial não restando ao locutor outra possibilidade
de predicar sobre o mesmo, produzindo uma CT.
(BRAGA, 1986, p.422)

A seguir, apresenta um exemplo hipotético, mostrando que


404

a oração com ordem neutra constituirá uma perturbação


do ritmo frásico utilizado pelo falante e, enquanto tal,
será evitada. Já a CT, permitindo-lhe combinar a
estrutura frásica e predicação sobre o elemento em
questão, será preferida.(BRAGA, 1986, p.422)

Com base em todos os tipos de construções de tópico observados,

especialmente com relação ao tipo de função sem classificação, Braga

conclui então que tal situação

sugere que os fatores mecânicos, referidos na seção


anterior, quando da análise de ODs, devem ser
ampliados de forma a englobar CTs que ocorrem como
respostas a perguntas, CTs que reiteram uma anterior e
CTs cujo SN à esquerda retoma um referente recém-
mencionado no discurso anterior. Esta possibilidade de
uma construção motivar a ocorrência de uma outra com o
mesmo formato superficial /grifos nossos/ já havia sido
aventada por Weiner & Labov (1977), em seu estudo
sobre passivas sem agente em inglês. Em nosso trabalho
sobre DEs e TOPs em Crioulo Caboverdiano, também
mostramos que paralelismo de estrutura superficial era
um condicionamento atuante.(BRAGA, 1986, p.423)

Com o trabalho de Braga, temos mais um estudo sobre o Português

do Brasil, diferente de todos os demais até então arrolados, evidenciando a

influência da variável Paralelismo formal. Também através de suas palavras,

já tivemos oportunidade de ver evidências da influência do Paralelismo

formal sobre uma outra língua diacronicamente diferente das línguas até

então citadas: o Crioulo Caboverdiano.

Já é do nosso conhecimento que, em 1981, Guy estudou, entre

outros aspectos, a concordância de número no sintagma nominal (CSN) e a

concordância verbo/sujeito (CVS) em amostras da fala do Português do

Brasil, produzidas por pessoas semi-escolarizadas.

É interessante relatar aqui algumas conclusões suas a respeito da

concordância verbal, que trazem também informações importantes sobre a


405

influência do Paralelismo formal através dos resultados da variável Tipos de

sujeito.

Analisando as ocorrências com sujeitos explícitos, Guy verifica a

influência de diversos tipos de sujeitos. Interessa-nos especificamente os

resultados obtidos para três tipos de sujeitos: singulares coordenados, plurais

com ausência de alguma marca e plurais com todas as marcas. Os

resultados obtidos mostram que SNs com todas as marcas de plural

favorecem mais as marcas de plural no verbo do que os SNs que se

apresentam com ausência de alguma marca e os SNs singulares

coordenados são os que mais favorecem a ausência de desinência de plural

nos verbos.

Segundo Guy,

esta indicação de que as duas regras tendem a covariar


aparece no nosso exame da CSN no capítulo 5. Isto seria
um reflexo do grau de auto-monitoração, um efeito
"estilístico" mais sutil do que nós estamos sendo capazes
de discriminar com a nossa medida de estilo de fala
relativamente crua, medida com base no assunto do
estilo da fala. (GUY, 1981a, p.252)140

Após uma série de considerações sobre um quarto fator da variável

Tipos de sujeito, denominado Pluralidade no discurso, Guy rejeita a hipótese

funcionalista perseguida por Poplack (cf. GUY, 1981a, p.249-54), e, após

uma breve observação sobre o fator sujeito singular coordenado, conclui

definitivamente que

portanto o que nós temos, então, é uma covariância


relativamente forte entre CNS e CVS, que pode ser
resumida dizendo que, quando a primeira deixa de se
aplicar, a última é também mais provável de se deixar
406

de se aplicar. Estes dados dizem respeito naturalmente


às sentenças com sujeito superficial(...) (GUY, 1981a,
p.254)141

Acabamos de ver, portanto, que Guy encontra também influência de

marcas levando a marcas e zeros levando a zeros. Ele interpreta esta

influência como sendo uma questão de efeito estilístico, à semelhança do

que colocam Weiner & Labov para o uso das passivas sem agente no Inglês.

Embora Guy tenha trabalhado apenas com sujeitos explícitos e

afirme que suas conclusões só se aplicam a estes casos, é oportuno lembrar

que Naro (1981b) mostra que os verbos semanticamente plurais, mas sem

desinência formal explícita, tendem a aparecer com sujeitos vazios e não

com sujeitos explícitos, o que nos levaria a estabelecer generalizações cada

vez mais amplas sobre o efeito do Paralelismo formal.

Em 1987, Lage estudou a concordância verbal em expressões

quantitativas do tipo um grupo de crianças passou x um grupo de crianças


passaram, também no discurso oral (cf. p.13-6).142

Infelizmente, o número de dados deste tipo encontrado em 48 horas


gravadas foi muito pequeno, num total de apenas 46. Mesmo assim, a

variável denominada Plenitude do SN, que observa a presença/ausência de


marcas formais de plural no sujeito "a maior parte dos meus amigos falam",

"uma porção de motoqueiro parou", mostrou-se estatisticamente relevante

em direção ao Paralelismo formal encontrado em todos os fenômenos até

agora relatados (cf. p.20-1;28).


407

Lage observou que, quando o SN sujeito apresentava-se com todas

as marcas formais de plural explicitadas, o verbo tendia a apresentar mais

marcas formais explícitas de plural; a ausência de marcas formais no SN

sujeito também provocava ausência de marcas formais na forma verbal

correspondente (cf. p.28). Esta conclusão é absolutamente consistente com

a encontrada por Guy (1981a) ao analisar a concordância verbal em

amostras de fala de pessoas semi-escolarizadas.

Temos então, nas palavras de Lage, as seguintes colocações:

A variável mais condicionante, sendo assim mais


importante, é a que trata da plenitude do SN contido no
Sprep (expressão quantitativa), isto é, quando o SN não
está em total concordância de número (...), a freqüência
da aplicação da regra em estudo é baixíssima, quase
ínfima em relação à situação contrária (...).
A plenitude do SN foi, desde as etapas preliminares,
o único grupo selecionado como estatisticamente
relevante (...). Isto vem ratificar a idéia de que uma forma
plural atrai um flexão neste número do elemento próximo.
(LAGE, 1987, P.28)

Os resultados obtido por Lage são extremamente interessantes, por

duas razões: primeiro, eles não foram obtidos ao acaso. Lage coloca

explicitamente como uma de suas hipóteses a busca do Paralelismo formal,

através do estudo da variável denominada Plenitude do SN; segundo, eles

evidenciam que a influência do Paralelismo formal é tão forte que emerge

mesmo de uma pequena quantidade de dados. Do total de dados

trabalhados por Lage, restaram ao final, após a retirada de dados

neutralizados e os de influência categórica, apenas 34, nos quais se

evidenciou a forte influência da variável em foco (cf. p.28).


408

O efeito extremo da variável Paralelismo formal, na sua atuação

estritamente mecânica, é encontrado por Emmerich num estudo do

Português como uma língua de contato no Alto Xingu.

Em 1977, numa comunicação intitulada "Um traço propulsor numa

língua de contato", Emmerich inicia o estudo de

uma variável, bastante produtiva, que funciona como


estímulo ou, como a denominamos tentativamente, como
traço propulsor ou mesmo gatilho, na língua de contato.
Ela consiste na produção de formas verbais
decalcadas da pergunta, quando esta é imediatamente
precedente, inibindo a realização da forma verbal de
pessoa correspondente ao contexto da resposta.
(EMMERICH, 1977, p. 396-7)

Com base na forma de coletar os dados: “gravações de conversa

livre, diálogos dirigidos e aplicações de questionários," (cf. 1977, p.397),

Emmerich codifica a variável Traço propulsor e conclui que

o gatilho do traço propulsor ocorre (..) com bastante


freqüência sendo o índice de variação (...) mais do que o
dobro, se o compararmos com os percentuais de
variação na conversa livre.(EMMERICH, 1977, p.398)

Como Emmerich observou a influência do Paralelismo formal apenas

na relação entrevistado/entrevistador, ela desenvolve uma discussão no

sentido da sua inclinação de considerar "o traço propulsor como uma variável

de natureza sociolingüística" (cf. 1977, p.390), sem ignorar que

estudos realizados no âmbito da psicolingüística,


particularmente da aquisição da linguagem, registram
variação análoga ao do falante da língua de contato na
fala infantil. (EMMERICH, 1977, p.399)

Continuando a sua discussão, ela conclui que


409

em face dessa semelhança entre o processo de


aquisição da linguagem na criança e no adulto bilingüe,
nos parece pertinente formular a hipótese de que também
variáveis psicolingüísticas tenham função relevante na
formação e funcionamento de uma língua de contato.
(EMMERICH, 1977, p.399)

Em 1984, estudando o fenômeno da concordância da primeira

pessoa verbal nesta mesma língua de contato, Emmerich continua afirmando

que

a observação de diversas situações da interação verbal


nos levou a admitir a existência de maior autonomia no
emprego da regra de concordância de pessoa verbal
quando o locutor não estava na dependência direta do
interlocutor. Denominou-se esta variável de Traço
Propulsor. Ela consiste basicamente em decalcar na
reposta a forma não flexionada da pergunta. Este
mecanismo de cópia se reflete na tendência a inibir o uso
de regra em situações dialógicas. EMMERICH, 1984,
p.132)

Emmerich caracteriza a variável Traço propulsor binariamente:

discurso livre e gatilho. Neste trabalho afirma ela que

como gatilho foi entendido o contexto em que o


enunciado, com forma verbal de primeira pessoa
singular, era inevitavelmente precedido por pergunta
com forma semelhante, enquanto o contexto do discurso
livre é o da fala espontânea, não dirigida. (EMMERICH,
1984, p.132)

Emmerich conclui novamente que o fator denominado gatilho inibe

sensivelmente a concordância da pessoa, enquanto o discurso livre a

favorece. Buscando explicações para os resultados obtidos, Emmerich afirma

agora que

a variável em questão leva a admitir o funcionamento de


condicionamentos psicolingüísticos, pois realizações
análogas ocorrem na aquisição do Português pela
criança. (...) O traço propulsor representa, assim, em sua
410

essência, a permeabilidade do indivíduo exposto a


situações de contato em códigos diferenciados, devendo
ser entendido, pela sua generalidade, como um princípio
atuante em estágios aquisitivos da linguagem, seja da
primeira ou segunda língua. (EMMERICH, 1984, p.222-3)

Em verdade, o efeito que Emmerich denomina de gatilho não

funciona apenas em processos de aquisição da linguagem ou na relação

entre entrevistador/entrevistado. Neste caso, ele é apenas mais evidente.

Ele funciona também na interação natural entre as pessoas e mesmo na fala

de um só indivíduo, se admitirmos a possibilidade de generalizar todos os

fenômenos estudados até agora como sujeitos ao efeito gatilho.

No estudo dos fenômenos lingüísticos, há evidências explícitas de

que os pesquisadores eliminam de seu conjunto de dados aqueles em que

se constata a influência da pergunta. Assim, Omena relata que houve

supressão de dados que apareciam nas situações que o


falante respondia a uma pergunta do entrevistador ou
repetia o que ele acabava de afirmar. O conjunto de tais
dados demonstrou que o falante ora cancelava ou usava
o pronome objeto numa mera imitação da fala do
entrevistador, ora emitia a referência anafórica ao item já
expresso na pergunta que lhe era dirigida, imitando em
parte a fala do interlocutor. (OMENA, 1978, p.48-9)

Em 1977, Gryner, em sua Dissertação de Mestrado sobre "A variação

da concordância verbal com os verbos impessoais na cidade de Petrópolis",

chega a eliminar de sua análise final todo um subconjunto de dados, devido

à interferência na forma de obtenção dos dados a serem analisados.

Gryner coletou seus dados através de aplicação de testes em

situação artificial, num laboratório de línguas, porque o fenômeno que ela


411

pretendia estudar ocorria pouco nos textos livres (cf. p.2-3; 32). E, então,

afirma ela que

para neutralizar a interferência da flexão dos verbos


constituintes das frases apresentadas (...), eles serão
apresentados ora no singular (...), ora no plural (...) (além
de dois exemplos de "tem" (sg) e "têm" (pl)). (GRYNER,
1977, p.39)

Mesmo com a cautela revelada na citação acima, Gryner codifica

inicialmente seus dados em função também de uma variável que ela

denomina de Forma com que o verbo foi apresentado, categorizada em: (1)

verbo apresentado no singular; (2) verbo apresentado no plural e (3) verbo

apresentado ambíguo (cf. p.48).

Ela observa então que não há diferença probabilística entre o verbo

plural e o verbo ambíguo, mas que "é evidente a interferência da forma

plural" (p.49) apresentada no questionário. Conclui, portanto, que a forma

singular da pergunta favorece a forma singular da resposta e a forma plural

ou ambígua da pergunta favorece a forma plural da resposta.

Podemos assim verificar que, mesmo querendo evitar o Paralelismo

formal entre resposta e pergunta, Gryner não o consegue. E, como seu

objetivo não era estudá-lo, ela o controla, e passa a trabalhar apenas com

as respostas obtidas através de perguntas feitas com o verbo no singular.

É interessante observar que o primeiro trabalho sobre o Português

que fala deste tipo de efeito, embora de forma marginal, é exatamente o de

Gryner. Sua dissertação foi apresentada no primeiro semestre de 1977. No

segundo semestre deste mesmo ano, Emmerich apresenta a sua

comunicação, falando sistematicamente deste tipo de efeito, na sua forma de

atuar estritamente mecânica.


412

Em 1981, Macedo apresenta também um estudo sobre um outro

fenômeno do Português do Brasil. Este estudo constitui a sua Tese de

Doutorado, sob o título de "O uso do futuro do subjuntivo em Português:

regularização de uma forma verbal".

Macedo trabalhou com dados obtidos através de três formas

diferentes: discurso livre, testes escritos e testes orais. Justifica a aplicação

dos testes também pela pouca freqüência deste tipo de dado em discurso

livre (cf. p.56-9). Igualmente preocupada com a possível influência da forma

de coletar os dados, o que tenta evitar, inclui uma variável denominada Efeito

da forma verbal no teste para controlar a situação (cf. p.54; p.127-8).

Após a análise dos dados afirma que

dadas as formas de pretérito do indicativo, constatamos


que há maior probabilidade de se flexionar o futuro do
subjuntivo no irregular. O contrário acontece quando as
frases são apresentadas no presente, e a regularidade é
ainda maior se o "gatilho" no teste for o próprio infinitivo.
(MACEDO, 1981, p.128, cf., também, p.157)

Macedo mostra ainda, através de outra variável denominada

Paralelismo morfossintático, que

se, num período com coordenação, o primeiro elemento


verbal for regular, o morfossintático é responsável por
um tipo de rima morfológica que faz subir o índice de
regularização da regra em estudo. (MACEDO, 1981,
p.129)

Fora as conclusões acima, consideramos oportuno colocar que

Macedo encontra o efeito da variável denominada por ela de Paralelismo


413

morfossintático não apenas em testes escritos e orais, mas também nos

dados de entrevistas gravadas. O mais importante disto é que, além de se

mostrar que esta variável também influencia o discurso livre, mostra-se

também que a sua influência é neste caso bem mais polarizada (cf. p.130 e

147).

Temos então, nas palavras de Macedo, o seguinte:

o efeito "gatilho" das construções coordenadas em que o


item precedente é um verbo regular apresenta-se como
interferente com acentuada diferença entre os dois
fatores (...) - o que comprova a importância deste grupo
de fatores na variação em estudo. (MACEDO, 1981,
p.147)

Após resultados consistentes para o efeito do Paralelismo formal

através de duas variáveis, nos textos escritos e orais e no discurso livre, em

amostras de fala de crianças, adolescentes e adultos, Macedo cita

Emmerich (1977); Sankoff & Laberge (1978) e apresenta uma reflexão sobre

este tipo de influência que consideramos a mais arrojada dentre todas as

que vimos até o presente momento. Na íntegra, ela diz o seguinte:

O chamado efeito "gatilho" da forma precedente tem sido


pouco estudado pela teoria lingüística. Teríamos nestes
casos a atuação dos elementos do discurso, que
interferem uns sobre os outros. Estes fenômenos
operam em níveis bastante superficiais da sintaxe: a
forma precedente atua como propulsora da forma
subseqüente, tanto para manter a irregularidade, caso a
forma precedente seja irregular, como para aumentar a
probabilidade de emprego da forma regularizada, caso o
antecedente seja um verbo regular(ver o efeito da forma
verbal no modelo e o efeito da presença de construção
coordenada).
Os fatores acima discutidos podem ser generalizados
como fatores que, de um modo ou de outro, atuam sobre
a memória em níveis bastante superficiais da sintaxe.
Conseqüentemente, suscitam a rediscussão de conceitos
de "competência" e desempenho, pois os níveis
superficiais a que nos referimos seriam mais próximos do
414

que a Teoria transformacionalista definiria como fatores


de desempenho, que, todavia, atuam de maneira
sistemática sobre as regras de gramática. (MACEDO,
1981, p.165-6)

Por tudo que apresentamos até aqui, temos apenas um ponto na

conclusão de Macedo para refutar: que o efeito "gatilho" tem sido pouco

estudado dentro da teoria lingüística. Conforme acabamos de ver, ele foi

bastante explorado, mesmo antes ou concomitantemente à realização de seu

trabalho. Ele apenas não foi explicitamente incorporado pela teoria


lingüística, como um reflexo de motivação externa, ao lado de outras

variáveis que refletem, por exemplo, a Motivação Icônica, a Motivação

Econômica, a Motivação pelo Fluxo da Informação, ou a Motivação pela

Centralidade ou Topicidade da Informação (cf. HAIMAN, 1981; DU BOIS,

1984 e NARO & VOTRE, 1986).

Cumpre finalmente mencionar o trabalho de Saraiva & Bittencourt

(1987), "A concordância verbal em estruturas com SN complexo no

Português: um caso de interferência de fatores metonímicos e metafóricos",

embora ele tenha sido desenvolvido numa abordagem bastante diferente dos

anteriores: além de não seguir um linha quantitativa, apresenta uma outra

forma de coletar e analisar os dados.

Mesmo sendo um trabalho diferente dos anteriormente apresentados,

Saraiva & Bittencourt mostram que a força da proximidade linear é

fundamental na determinação da concordância plural entre o sintagma verbal

e o SN mais próximo, inclusive nos casos em que o SN não é o controlador

da concordância pela tradição gramatical brasileira, como,


415

por exemplo, "o casamento deles não deram certo" e "quando ocorre a

anteposição do advérbio, o significado das orações se alteram".

Para a concordância plural especificamente, afirmam então as

autoras que

o SN que determina as flexões número-pessoais do


verbo (...) é o SN anteposto que se acha mais próximo
dele na cadeia linear, ou seja, a linearidade tem papel
atuante. (SARAIVA & BITTENCOURT, 1987, p.21)

A seguir colocam que

somos levadas a postular o seguinte: no discurso oral e


escrito o SN anteposto, linearmente mais próximo ao
verbo independentemente do seu nível hierárquico, é o
candidato mais provável de comandar o processo de
concordância verbal. (SARAIVA & BITTENCOURT,
1987, p.21)

Em suma, Saraiva & Bittencourt mostram que plural conduz a plural,

mesmo quando o núcleo do SN complexo que não está linearmente próximo

ao verbo é singular.
Para explicar o fenômeno estudado, as autoras se utilizam dos

conceitos de metonímia e metáfora, que não pretendemos discutir aqui, por

não ser o momento oportuno. Consideramos, todavia, que é a variável

Paralelismo formal que está comandando também estes casos de

concordância verbal, à semelhança do que pudemos ver nos trabalhos de

Guy (1981a) e Lage (1987).


416

7.3 - Conclusão

Três aspectos serão retomados nesta conclusão: (1) a questão da

interdependência entre as diversas ocorrências de uma variável dependente;

(2) a questão de que princípios ou motivações externas ou internas estão

atuando sobre o uso lingüístico e (3) a questão das motivações em

competição atuando sobre um domínio do uso lingüístico.

Sobre a primeira questão, os trabalhos de Weiner & Labov (1977),

Sankoff & Laberge (1978), Omena (1978), Poplack (1980a e 1980b),

Schiffrin (1981), Lira (1982) e Omena (1986) mostram explicitamente que a

segunda ocorrência é formalmente dependente da primeira, na busca do

Paralelismo formal. Os nossos resultados relativos à variável Pluralidade do

contexto evidenciam, além disso, que a primeira ocorrência de uma série, ou

a primeira ocorrência de um conjunto de duas ocorrências, é também afetada

pela segunda ocorrência. A primeira ocorrência de um SN seguida de outro

SN com todas as marcas de plural tem 0,76 de probabilidade de ter também

todas as marcas, enquanto a primeira ocorrência do SN seguida de SN

parcialmente marcado tem apenas 0,33 de probabilidade de ter todas as

marcas de plural e o SN que ocorre isolado apresenta um comportamento

neutro: ele tem 0,47 de probabilidade de receber todas as marcas de plural

(cf. tabela 6.3.2.1).

Os nossos resultados mostram então que temos que estar atentos a

esta questão e não assumir simplesmente que a primeira ocorrência

independe da segunda, sem efetuar uma codificação que separe a

ocorrência isolada dentre as primeiras ocorrências que aparecem seguidas

de outra(s).
417

As nossas conclusões e as dos autores acima mencionados trazem

então à tona a discussão de um aspecto apontado por Sankoff & Laberge.

Segundo eles,

tem sido ainda aceita a prática de tratar sucessivas


ocorrências de uma variável, mesmo no mesmo
enunciado, como um experimento binomial
independente. Aqueles que usam este modelo
reconhecem, naturalmente, que vários tipos de relações
de coocorrência podem se estabelecer entre dados
vizinhos de uma variável (...). Entretanto nós geralmente
procedemos sob esta hipótese (independência), não
somente porque ela simplifica a análise, mas também
porque, em termos de sua não freqüência nos dados,
relações de coocorrência não afetariam seriamente os
resultados dos procedimentos estatísticos para estimar
os efeitos de outras restrições lingüísticas e
sociolingüísticas. /Grifos nossos/ (SANKOFF &
LABERGE, 1978, p.119)143

Consideramos que, diante de tantas evidências de que as

ocorrências vizinhas de uma mesma variável não são independentes, é

necessário que "compliquemos" a análise se quisermos dar conta dos fatos

de forma adequada, ou seja, qualquer estudioso de qualquer fenômeno tem

de verificar, antes de qualquer outro aspecto, a questão da interferência

recíproca entre as sucessivas ocorrências de uma mesma variável. Esta

questão se coloca ainda como mais imperiosa se pudermos comprovar que

tais tipos de dados não são assim tão infreqüentes.

Observando os nossos 948 SNs codificados em função da

Pluralidade do contexto, pudemos ver (cf. tabela 6.3.2.1) que há 293

ocorrências vizinhas, primeiras ou segundas, ou seja 31% dos dados, e há

518 isoladas, ou seja, 53% dos dados. O percentual de ocorrências vizinhas

não é nada desprezível, ou melhor, é suficientemente alto até para "afetar

seriamente os resultados dos procedimentos estatísticos para estimar os


418

efeitos de outras restrições lingüísticas e sociolingüísticas." Dizemos até,

porque ainda não realizamos este teste. A forma de fazê-lo seria a seguinte:

efetuar uma análise dos 293 SNs, por um lado, e dos 518, por outro,

mantendo-se as demais variáveis, e verificar se os resultados probabilísticos

para as demais variáveis permanecem os mesmos. O número de dados de

que dispomos não nos permite análises separadas confiáveis. Este ponto fica

como sugestão para o futuro.

O que é irrefutável é que, se codificarmos os dados relativos a

qualquer fenômeno sem olharmos para as interferências mútuas entre as

ocorrências vizinhas, estamos deixando de captar generalizações

importantes que envolvem fenômenos lingüísticos de qualquer língua.

O segundo ponto em questão é o que envolve a existência de

motivações externas ou internas sobre o uso lingüístico.

A influência da variável Paralelismo formal se mostrou como uma

força muito poderosa sobre os diversos fenômenos arrolados. Mostrou-se

também de caráter geral, pois, além de envolver diversos fenômenos

lingüísticos de uma mesma língua, o Português do Brasil, envolve fenômenos


de línguas diversas como o Espanhol, o Inglês, o Francês, o Quechua e o

Crioulo Caboverdiano.

A força do Paralelismo formal não encontra explicação em

motivações internas do tipo "nivelamento paradigmático" (cf. DU BOIS,

1984) e nem nos diversos tipos de motivação externa até agora conhecidos

por nós dentro da literatura lingüística. Os autores por nós pesquisados falam

dos seguintes princípios ou motivações externas:


419

1) o Princípio da Iconicidade ou Motivação Icônica (ou Isomorfismo

entre forma/significado) (cf. HAIMAN, 1980 e 1983; DU BOIS, 1984);

2) o Princípio da Economia ou Motivação Econômica (ou a tendência

a eliminar ou a codificar menos o que é previsível) (cf. HAIMAN, 1980 e

1983; DU BOIS, 1984);

3) o Princípio do Fluxo de Informação Preferido ( ou a pressão

discursiva para se codificar a informação nova) (cf. DU BOIS, 1984);

4) o Princípio da Topicidade (pressão discursiva para se codificar

tópico/agente) (cf. DU BOIS, 1984);

5) o Princípio da Natureza Comunicativa Periférica da Oração VS (ou

o Princípio da Baixa Tensão) (cf. NARO & VOTRE, 1986).

Pelo menos os dois primeiros princípios têm sido também discutidos

por estudiosos que pertencem a linhas teóricas que observam mais

influências internas do que externas. Então, com acepções um pouco

diferentes, pois não consideram que os fenômenos lingüísticos possam ser

influenciados por pressões discursivas ou por forças que regem o

comportamento humano ou a própria estrutura do mundo, vamos encontrar

estas discussões, como já vimos, em Kiparsky, através das Condições de

Distintividade (cf. 1972, p.195) ou em Martinet, através da Economia da

língua (cf. 1973, p.181-5).

Os princípios 3 e 4 são discutidos por Du Bois (1984) e apresentados

como forças motivadoras externas que atuam para determinar a configuração

de línguas ergativas ou línguas não ergativas.


420

O princípio 5 é apresentado por Naro & Votre para dar conta de

construções VS ou SV em Português e relaciona-se ao Princípio 4 de Du

Bois.

Nenhum destes princípios trata da questão do Paralelismo formal,

pois ele não tem nenhum vínculo (1) com a necessidade de codificar mais

ou menos uma determinada informação ou (2) com a possibilidade de

eliminação ou redução de formas lingüísticas e (3) sequer está ligado à forma

de se estruturar a informação nova/velha ou à questão de se colocar em

relevo, numa situação central ou periférica, as informações transmitidas.

Poplack coloca que a influência do Paralelismo formal estaria ligada

à lei do menor esforço, conforme estabelecida por Martinet em 1962.

Retranscrevendo a citação de Martinet, temos o seguinte:

Concordância é redundância, e contrário ao que seria


esperado, redundância resulta, como uma regra, do
menor esforço: pessoas não se importam de repetir se o
esforço mental é então reduzido. (MARTINET, 1962,
p.55)144

Embora admitamos que a variável Paralelismo formal esteja ligada a

algum princípio mental de repetição, que pode até implicar redução de

esforço, consideramos que a colocação de Martinet insinua que o falante têm

uma influência consciente neste processo de repetição, o que diríamos não

ser o que ocorre, inclusive no discurso oral livre. Em verdade, a forma de

atuar da variável Paralelismo formal mostra que os falantes são compelidos a

usar formas semelhantes por algum princípio mental associativo, que pode

estar ligado a uma das formas da mente humana operar, refletido no

comportamento humano em geral.


421

Além disso, a idéia que Martinet transmite em 1973 sobre a lei do

menor esforço é diferente da encontrada em seu texto de 1962, ou seja,

afirma ele em 1973 que o comportamento humano obedece

à lei do menor esforço, de acordo com a qual o homem


só desprende energia na medida em que esta permita
atingir os objetivos que pretende(...)
Em cada estágio da evolução, realiza-se um equilíbrio
entre as necessidades da comunicação, que requerem
unidades mais numerosas, mais específicas, cada uma
das quais apareça com menor freqüência nos
enunciados, e a inércia do homem, que o leva a
empregar um número restrito de unidades de valor mais
geral e de uso mais freqüente. /Grifos nossos/
(MARTINET, 1973, p.181)

Também através de Haiman, percebe-se que normalmente se

considera a Lei do menor esforço atuando junto à Motivação Econômica. Em

suas palavras temos o seguinte:

A oposição formal transparente x opaco corresponderá


assim à oposição pragmática não usual x familiar. A
motivação para a redução, e conseqüentemente para a
opacidade, é presumivelmente econômica: 'o princípio
do menor esforço'. (HAIMAN, 1983, p.802; cf., também,
p.814)145

Sendo assim, é no mínimo paradoxal a dupla forma de interpretar a

relação da Lei do menor esforço com as motivações associadas aos

fenômenos lingüísticos aqui focalizados.

Por outro lado, tivemos a oportunidade de ver que Naro estabelece

um princípio geral para explicar também a existência de sujeitos vazios com

verbos sem concordância nos seguintes termos:


422

O princípio subjacente geral por trás do comportamento


de ambos os tipos de construções é a redução na
quantidade de marcas superficiais. Para verbos com
concordância, isto reduz a redundância sujeito/verbo e
para verbos sem concordância isto reduz o conflito
sujeito/verbo. (NARO, 1981b, p.356)146

Todavia, consideramos que o princípio estabelecido por Naro não dá

conta de forma adequada da relação entre verbos sem concordância e

sujeitos vazios, por um lado, e verbos com concordância e sujeitos explícitos,

por outro, pois não se trata da redução de quantidade de marcas

superficiais, mas sim do processamento com paralelismo. É exatamente

neste ponto que se coloca a variável Paralelismo formal: sujeito zero com

verbo de desinência zero e sujeito explícito com verbo de desinência

explícita. A generalização correta neste caso é então Processe com

paralelismo formal. Este princípio pode estar ligado a um princípio mais geral

ainda: Processe com paralelismo (cf. MOLLICA, 1978, p.68-75). Neste

sentido, o princípio específico estabelecido por Naro, para estes casos, é

mais adequado, qual seja: elimine conflito (cf. 1981b, p.355).

Usando as palavras de Macedo (1981), este tipo de processamento


se coloca a níveis bem superficiais da memória, mas exerce uma influência

sistemática no uso que o ser humano faz de sua língua, o que,

inevitavelmente, provocará, ao longo do tempo, alterações na forma de sua

gramática.

Se este tipo de variável exerce uma influência sistemática e geral,

uma teoria lingüística que queira dar conta da sistematicidade e da

generalidade que envolvem o uso lingüístico, com conseqüências na forma

ao longo do tempo, tem de incorporar o Princípio do Processamento com

Paralelismo, ao lado dos demais princípios já arrolados.


423

A atuação deste princípio no uso lingüístico é regular. Ele opera até

que haja alguma outra razão discursiva para que se passe a usar uma outra

forma. Alguns tipos de razões discursivas são apontadas explicitamente nos

trabalhos de Schiffrin (1981) e Omena (1986).

Segundo Schiffrin, a mudança de tempo tem a função de separar

certos eventos, embora a sua manutenção não tenha efeito de agrupá-los (cf.

p.55) e, segundo Omena, a alternância das formas ocorre em função da

mudança de referente, embora também se possa manter a mesma forma,

mesmo com a mudança de referente (cf. p.295).

Com as colocações acima, entramos então no terceiro ponto de

nossa conclusão, que é o da existência das motivações em competição. O

Princípio do Processamento com Paralelismo pode estar em competição

com um ou outro princípio, dentre os arrolados anteriormente, em função do

fenômeno específico estudado.

O nosso caso, o da concordância gramatical de número entre os

elementos do sintagma nominal, que envolve um mecanismo redundante,

tem como principal competidor o Princípio da Economia ou Motivação


Econômica que traz em seu bojo "a verdade do axioma geralmente aceito de

que o que é previsível recebe menos codificação do que o que não é", nas

palavras de Haiman 1983 (cf. p.807). Também nas palavras de Naro (1980),

temos que

/a/ (...) redundância, não apenas o status de um


morfema, é o fator relevante no cancelamento. (...) Então
nós podemos formular de forma tentativa um universal:
cancelamento de um segmento morfêmico é mais
provável do que o cancelamento do segmento correspon-
424

dente não morfêmico se o morfema é redundante(...) (cf.


NARO, 1980, p.166)147

Todavia, esta expectativa nem sempre é satisfeita. A nível do SN,

uma segunda marca conduz a mais marcas do que a sua ausência. Em

verdade, sendo a segunda posição do SN não marcada, a subseqüente será

quase que categoricamente não marcada. A nível do discurso, um SN com

todas as marcas influencia a presença de outro SN, igual ou semelhante,

também com todas as marcas, sendo o inverso também verdadeiro. Todavia,

é a Motivação Econômica que, a nosso ver, permite, no caso sob estudo, a

possibilidade de variação. A competição entre motivações diferentes para o

fenômeno da concordância é colocada explicitamente por Poplack (1980a),

a partir do próprio subtítulo de seu artigo: "Competing Constraints on (S)

Deletion". Poplack recoloca esta questão nas suas outras duas publicações,

sem, entretanto, discutir explicitamente o seu relacionamento com

motivações de natureza externa, envolvendo o fenômeno estudado.

Ao final de um de seus textos, em 1980, ela chega a manifestar uma

certa perplexidade diante de seus resultados, afirmando o seguinte:

Entretanto, nós temos visto também que, de forma geral,


fatores funcionais afetam o cancelamento da marca
menos do que qualquer outro grupo de fatores estudado,
com exceção do acento seguinte, um resultado que não é
prontamente interpretável. Se isto ocorre porque o
cancelamento do (S) no Espanhol de Porto Rico não está
suficientemente avançado para requerer o
funcionamento de fatores funcionais permanece para ser
investigado. Os resultados deste estudo indicam, além
disso, que problemas levantados por estas restrições em
competição não podem ser resolvidos conclusivamente
pelo exame apenas do SN. Resposta a estas questões
podem também residir em outra área
425

da estrutura lingüística, tal como o sintagma verbal. Um


estudo funcional da variabilidade na marcação verbal
nos permitiria extrair conclusões claras sobre o
cancelamento e desambiguação no Espanhol de Porto
Rico. /Grifos nossos/ (POPLACK, 1980a, p.66-7)148

Por todas as variáveis discursivas que apresentamos ao analisarmos

as restrições lingüísticas globais, no item 6.3 do capítulo anterior, e pelo

exame da concordância verbal em Português por outros estudiosos,

pudemos ver que os resultados obtidos são "prontamente interpretáveis" pelo

Princípio do Processamento com Paralelismo e pudemos ver ainda mais

que, na competição entre o Princípio da Economia e o Princípio do

Processamento com Paralelismo, aponta-se este segundo como o candidato

a vencedor. E, com base em todos os estudos já efetuados, incluindo o

nosso, podemos considerar o Princípio do Processamento com Paralelismo

como candidato a universal.

Resta saber ainda uma questão: há evidências de que os falantes

analfabetos da área rural do Português do Brasil praticamente não

apresentam o mecanismo da concordância nominal: eles tendem a marcar a

pluralidade do SN apenas no seu primeiro elemento. Então, que princípio

motivou a existência deste sistema: o Princípio da Economia ou o Princípio

do Processamento com Paralelismo?149 Esta é uma questão que se coloca,

a qual não temos condições de responder neste trabalho, embora, no

próximo capítulo, tenhamos como objetivo (1) apresentar os resultados das

variáveis sociais convencionais que envolvem a concordância nominal, e (2)

fazer, nos termos de Labov (1981), as melhores inferências a respeito da

mudança em progresso que os dados sincrônicos de tempo aparente podem

nos oferecer.
426

8 - RELAÇÃO ENTRE VARIAÇÃO E MUDANÇA

8.1 - Introdução

O nosso objetivo central nesta parte do trabalho é trazer evidências

que apontem para uma possível resolução da polêmica que se instalou a

respeito da concordância de número em Português, no caso específico a

nominal, em termos de se ela reflete ou não um processo de mudança

lingüística em progresso, em direção a um sistema sem concordância,

conjuntamente ou não a um processo aquisitivo individual "imitativo", ou se

ela reflete um fenômeno de variação estável precedido de um processo

aquisitivo descrioulizante, no sentido literal deste processo.

Como já vimos no item 6.2.2, Braga (1977), Scherre (1978), Ponte

(1979) e Carvalho Nina (1980) consideram que esta regra está num processo

de mudança caminhando para um sistema sem concordância, num processo

de perda, portanto. Naro (1981a), por sua vez, afirma que se podem

constatar tendências opostas: uma que evidencia um processo lento de

perda da regra e outra um ressurgimento do uso desta mesma regra (cf.

p.87) e Guy (1981 e 1986), por outro lado, afirma que não há evidência de

mudança em progresso e que o estágio atual é de variação estável,

precedido de um processo aquisitivo na forma de descrioulização do

Português (cf. 1981, p.198; 238-304 e 1986, p.8-9).

Pretendemos, neste capítulo, fazer as melhores conjecturas sobre

que tipo de fenômeno reflete a regra sob análise, uma vez que, segundo

Labov, "qualquer afirmação sobre mudança é naturalmente uma inferên-


427

cia, pois é muito difícil observar a mudança diretamente (...)." (1981,

p.177).150

8.2 - Sobre a configuração de variáveis sociais

8.2.1 - O comportamento de variáveis sociais na variação


lingüística estável

A influência de variáveis sociais em fenômenos lingüísticos variáveis,

principalmente nos casos em que uma das variantes é estigmatizada, não

constitui nenhuma novidade dentro da literatura lingüística. Já é do

conhecimento de todos que, em situação de variação que não envolve

mudança, ou seja, na variação estável, normalmente se verifica uma relação

diretamente proporcional entre Classe social ou Escolarização e uso de

formas de prestígio (cf. LABOV, 1975a, p.115-7; 124 e 127; 1980, p.253-4 e

1981, p.180; KEMP, 1981, p.5-8 e OLIVEIRA, 1982, p.72). Além disso, é

normalmente aceito que em tais situações os falantes do sexo feminino

tendem a se aproximar da norma estabelecida mais do que os falantes do

sexo masculino, mesmo se forem crianças (cf. CHAMBERS & TRUDGILL,

1980, p.73), embora se considere que a diferença entre o comportamento

lingüístico dos dois sexos ocorra mais na fala cuidada do que na fala

espontânea (cf. LABOV, 1972, p.243 e OLIVEIRA, 1982, p.75). No que tange

ao papel da Idade, afirma-se que, nestas situações, ela apresenta ou uma

distribuição plana sem gradação etária ou uma distribuição curvilinear,

indicando gradação etária, com o ápice das for-mas de prestígio sendo

encontrado nas faixas etárias intermediárias de-


428

vido a pressões do mercado de trabalho, por exemplo (cf. CHAMBERS &

TRUDGILL, 1980, p.91-3 e OLIVEIRA, 1982, p.74-5).

8.2.2 - O comportamento de variáveis sociais na mudança


em progresso

A análise de variáveis sociais tem também trazido grandes

contribuições para se detectar mudança lingüística em progresso com base

em dados sincrônicos. Afirma-se, antes de mais nada, que só se pode falar

em mudança lingüística através de resultados de análises sincrônicas se se

constatar diferença etária, o que ainda não pode ser considerado como

condição suficiente para a existência de mudança, uma vez que diferenças

etárias podem indicar apenas gradação de idade.

No lugar da distribuição curvilinear, essencialmente característica de

variação estável, tem-se então uma distribuição inclinada, com o ápice das

formas inovadoras na fala dos jovens e o ápice das formas conservadoras

nos mais velhos (cf. CHAMBERS & TRUDGILL, 1980, p.92-3).

Uma vez que apenas a distribuição etária não é suficiente para

indicar mudança em progresso, buscam-se outros padrões associados por

exemplo ao comportamento do Sexo e da Classe social ou aos Anos de

escolarização, a fim de se tentar resolver as dúvidas que surgem (cf. LABOV,

1981, p. 183-6).

Com relação ao comportamento da variável Sexo, afirma-se, de forma

geral, que, numa situação de mudança lingüística em direção ao


429

padrão, a liderança cabe às mulheres da classe média e, caso contrário, aos

homens da classe trabalhadora (cf. CHAMBERS & TRUDGILL, 1980, p.97-

8).

Mesmo com esta diretriz inicial a respeito da variável Sexo, pode-se

ver na literatura lingüística que o seu papel, especialmente o do sexo

feminino, na questão da mudança, não é muito claro. Labov, por exemplo, já

afirmava, em 1972, que as mulheres usam mais formas avançadas na fala

casual e menos na fala formal (cf. p.301), mas, em 1981, desvincula a

questão da formalidade da conversa, e mesmo da Classe social, ao afirmar

que

(...) para comunidades onde mulheres favorecem a forma


de prestígio de marcadores estáveis, uma variável que
mostra mulheres na liderança pode ser muito bem uma
nova mudança em progresso (...).(LABOV, 1981,
p.185)151

Além do mais, interpretando literalmente a colocação acima, podemos

concluir que as mulheres lideram mudanças que se afastam da norma

quando elas usam formas de prestígio em variação estável. Considerando-se

que tem sido universalmente aceito que as mulheres são mais sensíveis às

formas de prestígio do que os homens na situação de variação estável (cf.,

também, OLIVEIRA, 1982, p.75), o seu comportamento contrário, distante da

norma, deveria ser realmente interpretado como um índice de mudança (cf.,

ainda, CHAMBERS & TRUDGILL, 1980, p.97).

Para evidenciar que a questão é ainda mais complexa do que

inicialmente parece, faz-se importante relatar a conclusão a que chegou um

grupo de pesquisadores do Rio de Janeiro, através de recente levantamento

bibliográfico. Em seu relatório, o grupo conclui que a "manifesta


430

preferência feminina pelas formas aceitas socialmente se verifica tanto nos

fenômenos de variação estável como nos fenômenos de mudança em curso."

(NARO et alii, 1986, p.25) Esta conclusão mostra então que o

comportamento do Sexo, especialmente o das mulheres, não contribui muito

para se definir se uma dada variação, com gradação etária inclinada, reflete

um fenômeno lingüístico estável ou um fenômeno lingüístico em mudança.

Trazendo mais evidências da inoperância da variável Sexo na

resolução das questões que estão sob foco, podemos ver que Naro utiliza o

comportamento padrão da mulher como uma das evidências de mudança

lingüística (cf. 1981a, p.86) e Guy utiliza o mesmo raciocínio para concluir

sobre variação estável (cf. 1981a, p.198 e 1986, p.11-2), envolvendo o

mesmo fenômeno lingüístico: o da concordância de número em Português.

Além do mais, Oliveira afirma que os homens, e não as mulheres, é que

estão liderando o cancelamento de /R/ no Português do Brasil falado em Belo

Horizonte, capital do Estado de Minas Gerais, o que ele interpreta como

sendo devido à maior mobilidade que os homens têm na sociedade


brasileira. Segundo ele, "em nossa sociedade as tendências ainda não são

estabelecidas pelas mulheres." (1982, p.86; cf., também, p.84-5). Por outro

lado, segundo Callou a liderança da fricativização e posteriorização do /R/

na fala urbana culta do Rio de Janeiro cabe às mulheres (cf. 1979, p.40; 63;

80; 81; 87; 103 e 150). Com relação ao cancelamento do /R/ final, ela

não encontra nenhum condicionamento social significativo (cf. 1979,

p.164).

Diante das observações acima, a conclusão mais segura que pa-


431

rece se poder estabelecer até o presente momento é que há uma tendência

geral de as mulheres se aproximarem do padrão e de os homens se

distanciarem dele, independente de o fenômeno lingüístico envolver variação

estável ou mudança lingüística.

Com relação à influência da Classe social e da Escolarização dos

falantes, tem-se afirmado que um padrão curvilinear configura uma mudança

em progresso. Neste caso, as formas mais inovadoras são encontradas nos

grupos que se localizam no centro da hierarquia (cf. LABOV, 1975a, p.133-4

e 1980, p.254). Todavia, Oliveira discute estas colocações, pois afirma que

pode não ocorrer padrão curvilinear para todos os informantes e mesmo

assim haver mudança em progresso, se se constatar uma distribuição social

acentuada para os jovens e não acentuada para os velhos (cf. p.78-83).

Conseqüentemente, Oliveira considera que as mudanças não

necessariamente se iniciam nos grupos sociais intermediários, podendo

também se iniciar nos grupos das extremidades, dependendo da

configuração da sociedade cuja língua é analisada. No seu caso específico,

ele considera que a mudança se inicia no grupo social mais baixo (cf. p.83-

5).

Oliveira relembra ainda que todas "as explicações de Labov se

apóiam basicamente na noção de prestígio" (p.86). Contudo, ele considera


que a estratificação social não se apóia necessariamente em noções desta

espécie e propõe então que

a estratificação social é um resultado direto da maneira


pela qual a sociedade se organiza. Uma vez que
sociedades diferentes se estruturam de modos diferen-
432

tes, é de se esperar que diferentes padrões de


estratificação social de linguagem sejam encontrados. As
novas mudanças serão levadas adiante, nos centros
urbanos, por aqueles grupos cujas características sociais
determinam as características sociais gerais da
comunidade. (...) Nos países não industrializados, ou
naqueles onde o processo de industrialização é recente,
estes grupos intermediários não se constituem o grosso
da população. (OLIVEIRA, 1982, p.88)

Oliveira conclui assim que o fato de a mudança lingüística que

envolve o cancelamento do /R/ estar sendo liderada pelos homens jovens de

classe baixa constitui um "reflexo direto da estrutura da sociedade na cidade

de Belo Horizonte." (p.88)

8.2.3 - Sobre o cruzamento de variáveis sociais

Tem sido também colocado que o cruzamento de variáveis sociais

pode trazer novas luzes a respeito de sua influência, quer com respeito a

fenômenos de variação estável, quer com respeito a fenômenos de mudança

em progresso.
Kemp, em seu artigo "Major sociolingüistic patterns in Montreal

French", afirma que conclusões interessantes emergem

(...) somente quando certas combinações dos quatro


fatores básicos, idade, atividade econômica, sexo e
escolarização são levadas em considerações. (KEMP,
1981, p.4)152

Do cruzamento de variáveis como Sexo e Idade, sugere-se, por

exemplo, que
433

mulheres mais velhas são mais sensíveis a variantes


padrão do que os homens do mesmo grupo de idade.
Mulheres mais velhas parecem usar mais variantes
padrão na conversação normal, mas adicionalmente,
dada à inconsistência relativa de uma variável para outra,
é mais provável que elas façam uso mais amplo de
mudança de estilo. (KEMP, 1981, p.4-5)153

Conforme acabamos de ver no item anterior, Oliveira (1982) utiliza-se

do cruzamento de variáveis como Classe social e Faixa etária, por um lado, e

Classe social e Sexo, por outro, a fim de mostrar que a ausência de padrão

curvilinear na Classe social como um todo não é condição suficiente para se

descartar a possibilidade de um dado fenômeno variável sob estudo refletir

um processo de mudança lingüística em progresso. Neste trabalho, vamos

também fazer análises cruzadas, objetivando trazer maiores esclarecimentos

sobre as questões aqui colocadas.

8.3 - Reflexões sobre a mudança em progresso

Por tudo que apresentamos nos itens 8.2.1 a 8.2.3, já se constata que

é uma tarefa difícil concluir se um fenômeno lingüístico variável reflete uma


mudança em progresso ou um estágio de variação estável. Estas dúvidas

foram surgindo com o desenrolar dos estudos variacionistas e culminam num

texto de Labov em 1981. Neste texto, intitulado "What can be learned about

change in progress from synchronic descriptions?", Labov afirma que

muitas mudanças discutidas sob este rótulo não estão


provavelmente em progresso, mas em variação que pode
estar sendo estável por séculos. (LABOV, 1981,
p.177)154
434

A seguir, Labov (1981) coloca que o lapso temporal ideal para se

detectar uma mudança lingüística em progresso, permitindo encontrar

mudanças relevantes e permitindo eliminar a possibilidade de movimento

reverso, seria correspondente, no mínimo, à metade de uma geração e, no

máximo, a duas gerações (p.177), ou seja, se situaria num intervalo

aproximado de 12 a 50 anos.

Labov afirma também que, mesmo com estudos que consideram a

comunidade e os indivíduos, com dados do tempo aparente e dados do

tempo real, não se pode afirmar com certeza absoluta que estamos diante de

uma mudança em progresso ou diante de uma variação estável (cf. p.182).

Segundo ele, a única forma de se ter certeza sobre os aspectos em

discussão consiste em estudar um fenômeno numa época determinada e,

posteriormente, voltar ao mesmo local e reestudar o mesmo fenômeno,

procurando ver o que ocorreu, à semelhança do caso clássico e único

ocorrido em Charmey na Suíça. Segundo ele, neste estudo, Gauchat realizou

análises de uma série de fenômenos lingüísticos em 1905, postulando a

existência de seis mudanças em progresso, e Hermann em 1929 reestudou

os mesmos fenômenos concluindo que realmente quatro dos fenômenos

estudados eram mudanças em progresso, mas os dois restantes eram casos

de variação estável (cf. p.177). Estas mudanças em progresso foram

detectadas no intervalo de 24 anos. Segundo Labov, o que ocorreu neste

caso clássico é raro, o que implica afirmar que "(...) nós estamos

freqüentemente na posição de tentar as melhores conjecturas que podemos

fazer sobre mudança em progresso a partir de dados sincrônicos."

(p.183)155
435

Há três estudos em Português que apontam explicitamente

fenômenos envolvidos em mudanças em progresso, os quais são: a

concordância de número, por Naro (1981a), a fricativização e posteriorização

do R, por Callou (1979) e o cancelamento do R, por Oliveira (1982). Estes

três fenômenos estão envolvidos em lapsos temporais mais amplos do que o

idealmente colocado por Labov (1981), sugerindo-se que as mudanças em

questão não são tão fortes e sugerindo-se também cautela para futuros

estudiosos, no sentido de considerarem a possibilidade de movimento

reverso.

Para a concordância verbal de número especificamente, Naro situa a

sua origem no processo de desnasalização da sílaba final, que ocorre pelo

menos desde 1901 em Portugal (cf. p.91): intervalo temporal de 75 anos.

As evidências do tempo real apresentadas por Callou datam de 1883,

o que perfaz um intervalo aproximado de 90 anos, considerando que os

seus dados foram obtidos entre 1972 e 1975 (cf. p.17-8).

Se observarmos também atentamente as evidências do

cancelamento do /R/ no tempo real apresentadas por Oliveira, vamos

verificar que, para o cancelamento do /R/ final, encontram-se informações

que datam de meados do século XIX e início do século XX, o que perfaz um

intervalo de, no mínimo, 80 anos, senão de 130. Mesmo as primeiras

evidências relativas ao cancelamento do /R/ interno já se encontram no "final

da década de 30 e início da década de 40, no século XX" (p.78), o que perfaz

um intervalo de aproximadamente 42 anos.

Com relação ainda à concordância de número no Português popular

do Brasil, especialmente no que diz respeito à concordância de núme-


436

ro entre os elementos do SN, há, desde 1920, relatos explícitos dos

dialetólogos sobre a sua variação na fala das camadas populares, que

chegava a se estender até mesmo para o falar das pessoas "educadas e

bem falantes" (cf. AMARAL, 1920, p.14 e Introdução), verificando-se então

um intervalo de 62 anos, pois a nossa amostra data de 1982. Novos relatos

de ausência de concordância nominal são encontrados em Monteiro (cf.

1933, p.63-4), Marroquim (cf. 1945, p.111-3), Melo (cf. 1946, p.63-4) e

Nascentes (cf. 1953, p.81-4).

Melo coloca explicitamente que

até nas camadas acima de médias ainda se pode pescar


aqui e ali no falar descuidado ausência de flexão
numérica nos nomes e nas terceiras pessoas do verbo.
(MELO, 1946, p.64)

Se as supostas mudanças em progresso no Português do Brasil

fossem fortes, seria de se esperar que elas já tivessem se completado, à

semelhança do que ocorreu em Charmey na Suíça.

Como veremos a seguir, o próprio Naro já considera a possibilidade

de movimento reverso envolvendo a concordância de número.

8.4 - Posições controversas sobre a concordância de número no


português popular brasileiro

Em 1981, Naro publica o seu artigo intitulado "The social and

structural dimensions of a syntactic change", que constitui versão ampliada

de um outro artigo seu, feito juntamente com Lemle em 1976, intitulado

"Syntactic diffusion". O Seu objetivo principal é o estabelecimento de


437

uma hipótese geral sobre a mudança sintática (cf. 1981a, p.64). Para tanto,

discute a questão da direcionalidade da mudança lingüística, através do

estudo de variáveis lingüísticas e sociais envolvendo a concordância verbal

de número na terceira pessoa, com base em amostras de fala de pessoas

semi-escolarizadas. No desenrolar de sua demonstração, utiliza-se também

dos resultados obtidos por Votre (1979) relativos ao processo de

desnasalização, e por Scherre (1978), sobre a concordância de número entre

os elementos do sintagma nominal.

Naro considera que a concordância de número em Português,

especificamente a verbal, encontra-se num processo de mudança,

caminhando em duas direções opostas: uma em direção a um sistema sem

marcas; outra em direção a um sistema com marcas. A primeira direção

envolve, portanto, um mecanismo de perda das marcas de concordância e a

segunda, um mecanismo de aquisição destas mesmas marcas.

Dentre quatro variáveis sociais estudadas, destaca o papel da idade

(jovens x velhos) e da Orientação cultural (vicária ou experiencial) no

processo de mudança em questão. A variável Orientação cultural é

caracterizada por Naro em termos do "grau de penetração do indivíduo na

cultura dos níveis sócio-econômicos vizinhos mais altos, como refletido em

seus hábitos de ver televisão." (1981a, p.86)156 Os falantes que

evidenciaram um maior contato com as novelas foram então classificados

como "vicários" e, caso contrário, como "experienciais" (cf. p.84). A

passagem transcrita a seguir reflete com clareza a posição de Naro, com

relação ao funcionamento das duas variáveis sociais em jogo.


438

Por um lado, nós vimos na variável idade a continuação


de um processo lento de morte da regra, relacionado a
mudanças similares no SN e em qualquer outra parte.
Esta variável é, por assim dizer, exterior ao falante,
impingindo sobre ele sem qualquer motivação interna. A
variável Orientação, por outro lado, reflete o
ressurgimento no uso da mesma regra que vem de
dentro do falante, dependendo de sua orientação
cultural.(NARO, 1981a, p.87)157

Naro observa, todavia, que a variável Orientação cultural tem um

efeito maior do que a variável Idade e, além disso, afirma que ela tem mais

efeito entre os jovens do que entre os velhos. Com base nisto, considera que

se a orientação vicária continuar a se espalhar entre os


falantes jovens, dada a diferença de Idade relativamente
pequena, a situação poderia brevemente atingir um ponto
onde aquele grupo produziria uma taxa mais alta de
concordância do que os falantes mais velhos. Uma vez
que não há barreiras sociais entre os dois subgrupos de
orientação cultural, a certo ponto no tempo o
ressurgimento no uso da regra de concordância poderia
até se espalhar através do grupo jovem,
independentemente da variável orientação, e produzir um
reverso na tendência em direção à eliminação da regra.
Estudos futuros determinarão se há alguma validade
nesta especulação. (NARO, 1981a, p.88)158

O estudo das variáveis lingüísticas, por sua vez, possibilita a Naro o

estabelecimento da hipótese geral sobre a mudança sintática, com base no

Princípio da saliência.

Dentre as variáveis lingüísticas analisadas, observa, sob a

perspectiva do Princípio da saliência, a Tonicidade dos itens lexicais na sua

forma plural, a Diferenciação material fônica na relação singular/plural e a

Posição do sujeito em relação ao verbo. Ele considera então mais salientes

os itens acentuados, os que apresentam maior diferenciação na relação

singular/plural e os que são antepostos ao verbo. Examina estas dimensões

também na concordância nominal, verificando relações bastante


439

paralelas. Especialmente com relação à variável Posição do elemento

nominal dentro do SN, considera que o fato da incidência de plural ocorrer de

forma decrescente em função da primeira, segunda, terceira, quarta e quinta

posição confirma a operação do Princípio da Saliência da mesma forma que

grupo da posição verbal (cf. NARO, 1981a, p.95).

Fazendo também alusões ao trabalho de Votre (1979), coloca então

que é possível se estabelecer o ponto inicial da mudança bem como os

ambientes para os quais ela se espalha. O seu modelo estabelece, portanto,

o seguinte:

(...) a mudança sintática se inicia no ponto onde


diferenciação superficial entre o sistema novo e o velho é
zero (ou quase); mais tarde ela se difunde através da
língua na proporção inversa ao grau de saliência das
diferenças superficiais entre sistemas em cada ambiente
particular. (NARO, 1981a, p.63; cf., também, p.96-7)159

Naro coloca ainda que a hierarquia da saliência é uniforme para todos

os falantes e que a diferença entre grupos mais ou menos avançados

repousa apenas na probabilidade global de uso da regra (cf. p.88-90 e 97).

Após algumas considerações sobre a forma da mudança se

implementar, admite finalmente que uma nova estrutura pode ser

(...) parcialmente bloqueada por um certo período de


tempo. É somente a longo prazo, não no seu início ou
progresso, que mudança lingüística produz resultados
relativamente 'naturais' e uniformes. (NARO, 1981a,
p.97)160

Uma posição diferente da de Naro é colocada em 1981 por Guy,


440

em "Linguistic variation in Brazilian Portuguese: aspects of the phonology,

syntax, and language history" e, novamente em 1986, em "Saliency and the

direction of syntactic change".

Conforme já é do nosso conhecimento, Guy analisou todos os dados

do corpus do projeto desenvolvido por Lemle e Naro, cujos resultados foram

publicados em 1977, em Competências básicas do português. Sobre a

concordância verbal, Guy analisou então basicamente os mesmos dados

analisados por Naro, com variáveis lingüísticas e sociais comuns e

diferentes. Como também já sabemos, os dados de Scherre (1978) relativos

à concordância nominal, para os falantes semi-escolarizados, foram

igualmente obtidos através do projeto referido acima. Sendo assim, parte dos

dados de Scherre, cujos resultados são usados por Naro, são também

reanalisados por Guy em 1981 e reutilizados em 1986.

Com base nas variáveis sociais Idade e Sexo e com base em

resultados de Braga (1977) e Scherre (1978) a respeito da diferença de uso

da concordância nominal em função da Classe social ou Anos de

escolarização, Guy (1981a e 1986) conclui que a regra de concordância de

número reflete uma variação sociolingüística estável. Além disso, considera

que esta variação é precedida de um processo aquisitivo descrioulizante, a

partir de um suposto crioulo de base portuguesa e gramática africana.

Para argumentar que o fenômeno em questão é um caso de variação

estável, afirma ele o seguinte:

1) a Idade mostra uma distribuição plana;

2) o Sexo evidencia as mulheres usando mais formas de prestígio do

que os homens e
441

3) a Classe social mostra uma distribuição inclinada, com formas

estigmatizadas nas classes mais baixas e formas de prestígio nas mais altas.

Conclui então, com base em Labov (1981), que os indicadores acima

configuram uma variação estável e não um processo de mudança em

progresso.

Para sustentar a hipótese de que a variação estável da concordância

de número no Português popular brasileiro vem da descrioulização de um

suposto crioulo de léxico português e gramática africana, Guy apresenta

dois tipos de argumentos: um de natureza histórica e outro de natureza

lingüística.

No que diz respeito ao argumento de natureza histórica, Guy coloca

que a história social do Brasil é semelhante à das áreas nas Américas onde

línguas crioulas se desenvolveram. (cf. 1981a, p.283-8; 309-13 e 1986, p.10

e 63). Com relação ao argumento de natureza lingüística, Guy apresenta

uma longa exposição a respeito da explicação mais plausível para o fato de a

marca de plural em Português tender a ocorrer na primeira posição do SN,

com base em características de diversas línguas africanas, além de

considerar que a escala da Saliência fônica não ocorre da forma encontrada

por Scherre (1978) (cf. GUY, 1981a, p.294-305 e 1986, p.41-50.).161

Uma vez que considera que a regra de concordância de número,

neste estágio de variação estável, é precedida de um processo de aquisição,

Guy discute o papel do Princípio da saliência neste processo, considerando

então que ele funciona de forma exatamente contrária à proposta por Naro

(1981a), ou seja, a regra é adquirida a partir dos ambientes


442

mais salientes para os menos salientes, progressivamente (cf. 1981a, p.294-

9 e 1986, p.10-21;39).

Embora Guy seja muito enfático ao colocar que a sua proposta difere

da de Naro, é importante salientar que esta forma de funcionamento do

Princípio da Saliência encontra-se explicitamente prevista em Naro & Lemle,

como se pode constatar na seguinte passagem:

(...) embora não tenhamos evidências firmes, nós


supomos que mudança sintática implementada por hi-
percorreção ou por aprendizagem funcionaria de forma
oposta, surgindo nos ambientes mais salientes. (NARO &
LEMLE, 1976, p.237; 1977, p.267)162

Esta posição é reiterada por Naro, em 1986, como veremos a seguir.

Uma série de outras discussões são apresentadas por Guy, mas

destacamos aqui apenas os tópicos que achamos interessante retomar e

para os quais temos resultados lingüísticos e sociais que podem validar ou

refutar questões por ele propostas (cf. 1981a, p.304-9; p.51-8).

Antes de mais nada, é oportuno observar que Naro (1986), em

"Comments on 'Saliency and the direction of syntactic change'", discute uma

série de colocações de Guy, dentre as quais cumpre destacar a que diz

respeito à questão da origem descrioulizante do Português popular brasileiro.

Segundo Naro, esta hipótese, embora sedutora, não tem base na realidade,

pois não há nenhuma possibilidade de se comprovar a existência de um

crioulo de léxico português com gramática africana, uma vez que

simplesmente não há dados disponíveis (cf. p. 2-4). Além disso, Naro afirma

que, já em 1976, Naro & Lemle não estabelecem direcionalidade no

funcionamento do Princípio da saliência, podendo este princípio fun-


443

cionar em ambas as direções, dependendo se a mudança caminha para um

sistema com ou sem marcas. Então, segundo Naro,

(...) dado somente um corte sincrônico de um fenômeno


variável qualquer que obedece à restrição da saliência
não há forma de se determinar se uma mudança está
atualmente em progresso ou se ela foi interrompida por
alguma razão antes de se completar, assim como é em
princípio impossível de se estabelecer qual é (ou era) a
direção da mudança. As questões são mais complicadas
pela consideração do local da mudança - na comunidade
como um todo, em subcomunidades, ou no indivíduo.
(NARO, 1986, p.1)163

Naro relembra que ele tratou a concordância verbal no Português

popular brasileiro como um caso de mudança em progresso natural,

caminhando para um sistema sem marcas, como uma característica da

comunidade e que tratou a mudança em direção contrária como uma

característica dos indivíduos, admitindo que ela podia se estender à

comunidade, enquanto Guy admite apenas a mudança como um processo

aquisitivo em termos de comunidade, num processo de descrioulização, para

o qual não se tem documentação disponível. Segundo ele, as evidências

existentes são inclusive contrárias à existência do suposto crioulo (cf.

NARO, 1986, p.1-4). Sendo assim, após uma série de outros comentários,

Naro conclui que as idéias de Guy não diferem das suas em princípio, mas

apenas em grau, uma vez que a sua grande e principal tese - a da

descrioulização - é impossível de ser comprovada (cf., também, p.9).

Naro considera finalmente que é possível e interessante se

empreenderem estudos que evidenciem que

(...) houve uma convergência de motivos para a atuação


da perda da CVS e CSN no Brasil: 1) desenvolvi-
444

mento interno natural da língua (Naro 1981); 2)


comportamento pidginizante da parte dos Europeus
(como visto em Naro 1978, mas para um período anterior
e sob condições sociais diferentes); 3) aprendizagem
imperfeita pelos falantes de diversas bagagens
lingüísticas. (NARO, 1986, p.10)164

Feitas estas considerações, passemos a apresentar os resultados

das variáveis de nossa pesquisa.

8.5 - Sobre os resultados das variáveis sociais

Com base nas diversas idéias existentes sobre variação e mudança,

codificamos os nossos dados em função das características sociais

estratificadas da nossa amostra.

Vamos então apresentar resultados probabilísticos obtidos em função

das seguintes variáveis sociais, com suas respectivas categorizações:

1) Anos de escolarização: um a quatro anos (antigo primário); cinco a

oito anos (antigo ginasial) e oito a 11 anos (antigo colegial);

2) Sexo: feminino e masculino;

3) Faixas etárias: sete a 14 anos; 15 a 25 anos; 26 a 49 anos e 50 a

71 anos.

É importante relembrar que sempre fizemos a análise dos dados

dos falantes de sete a 14 anos, as crianças, separada da análise dos demais

falantes, os adultos, a fim de observarmos as semelhanças e/ou diferenças

entre o comportamento destes dois grupos de falantes. Nesta parte, vamos

apresentar também análises conjuntas sempre que isto se mostrar

interessante para os objetivos que temos em mente.


445

A tabela 8.5.1, a seguir, contém os resultados relativos às variáveis

Anos de escolarização, Sexo e Faixas etárias dos falantes adultos.

TABELA 8.5.1
VARIÁVEIS SOCIAIS DOS ADULTOS
ANOS DE ESCO-
LARIZAÇÃO Apl./Total % Prob.
1a 4 2413/3903 = 62 0,32
5a 8 2605/3613 = 72 0,53
9 a 11 2843/3453 = 82 0,65

SEXO
Feminino 4397/5680 = 77 0,59
Masculino 3464/5289 = 65 0,41

FAIXA
ETÁRIA
15/25a 2244/3126 = 72 0,49
26/49a 2891/3845 = 75 0,54
50/71a 2726/3998 = 68 0,47

Os resultados relativos aos Anos de Escolarização evidenciam que

há uma relação diretamente proporcional entre o aumento dos anos de

escolarização e o índice de plural nos SNs: um a quatro anos de

Escolarização com probabilidade de 0,32; cinco a oito com 0,53 e nove a 11

com 0,65.

Os resultados relativos à variável Sexo mostram que as mulheres se

aproximam do padrão mais do que os homens, com probabilidades

respectivas de 0,59 e 0,41.

Os resultados relativos às Faixas etárias apresentam uma distribuição

curvilinear não acentuada: os falantes das três faixas etárias apresentam,

respectivamente, as seguintes probabilidades: 0,49; 0,54 e 0,47. Para termos

as probabilidades relativas também aos falantes de sete a


446

14 anos, efetuamos uma etapa de análise com todos os falantes e obtivemos

os seguintes resultados probabilísticos:

1) 7 - 14 anos: 0,45;

2) 15 - 25 anos: 0,51;

3) 26 - 49 anos: 0,56;

4) 50 - 71 anos: 0,48.

A distribuição etária considerando todos os falantes continua a se

mostrar levemente curvilinear: a maior diferença encontrada é de 0,09 entre

os falantes de sete a 14 anos e os de 26 a 49 anos.

Os resultados acima nos levam inicialmente a corroborar as

colocações de Guy 1981a e 1986 no sentido de que a concordância de

número entre os elementos do sintagma nominal reflete um fenômeno de

variação estável, uma vez que (1) as formas de prestígio e as formas

estigmatizadas são encontradas, respectivamente, nos grupos de maior ou

menor grau de escolarização; (2) as mulheres, por sua vez, apresentam


menor uso de formas estigmatizadas e (3) a distribuição das faixas etárias
não revela nenhum ápice de uso de formas pelos jovens, quer as de prestígio

quer as estigmatizadas.

Pela configuração acima, seríamos levados a concluir que o

fenômeno lingüístico estudado reflete uma variação lingüística estável, com

uma gradação etária pouco acentuada.

Os resultados relativos Às variáveis Anos de escolarização e Sexo

nos falantes de sete a 14 anos contribuem para esta possível conclusão

como se pode ver na tabela 8.5.2.


447

TABELA 8.5.2
VARIÁVEIS SOCIAIS DAS CRIANÇAS
ANOS DE ESCO- Apl./Total % Prob.
LARIZAÇÃO

1a4 544/890 = 61 0,45


5a8 841/1231 = 68 0,55

SEXO
Feminino 738/1065 = 69 0,59
Masculino 647/1056 = 61 0,41

As meninas e não os meninos se aproximam mais do padrão e,

embora com menor polarização, os falantes de cinco a oito anos de


escolarização também se aproximam mais do padrão do que os de um a

quatro anos de escolarização.

Guy encontrou uma configuração semelhante no que diz respeito á

variável Sexo trabalhando apenas com dados de falantes semi-escolarizados

e nós obtivemos os resultados acima agrupando falantes de diversos anos

de escolarização. Parece bastante sedutora esta uniformidade de

comportamento em falantes de níveis de escolarização diversos.

Todavia, tendo em mente as idéias de Guy de que o estágio atual de

variação sociolingüística estável é reflexo de um processo descrioulizante,

fruto da aquisição parcial das regras de concordância do dialeto padrão (cf.

1981a, p.340-2 e 1986, p.8-9), decidimos tentar obter em nossos dados

suportes empíricos para a sustentação ou não desta hipótese.

Para alcançar este objetivo, reagrupamos os falantes adultos de


nossa amostra em função de dois aspectos: o seu tipo de ambiente de

origem e o seu grau de concordância, categorizados binariamente.

Obtivemos assim quatro agrupamentos:


448

1) falantes de ambiente humilde e concordância baixa;

2) falantes de ambiente não humilde e concordância alta;

3) falantes de ambiente humilde e concordância alta;

4) falantes de ambiente não humilde e concordância baixa.

Os falantes de ambiente humilde e concordância baixa constituem o

protótipo do falante não descrioulizado, pois são de ambientes do qual se

espera pouca concordância e apresentam-na da forma esperada; os falantes

de ambiente não humilde e concordância alta são falantes que sequer

passaram por processo de descrioulização, pois participam de um ambiente

que lhes propiciou a aquisição de um sistema padrão, pressupostamente

sem nenhuma característica crioula. Estes dois grupos constituem

exatamente os extremos da situação lingüística que se imagina ter existido

no Português do Brasil.

Vamos ainda encontrar dois agrupamentos intermediários de falantes:

os de ambiente humilde mas de concordância alta, que são os falantes em

processo de descrioulização, ou já descrioulizados, ou seja, eles são de

ambiente humilde, no qual se pressupõe uma baixa concordância, mas

apresentam-na alta; e os de ambiente não humilde, de onde se espera um

nível de concordância alto, mas cujos percentuais são relativamente baixos.

Com base na história de vida dos falantes, delineada pela socióloga

Marta Helena Rosa por ocasião de sua participação na equipe do Projeto

Censo, e com base em depoimentos orais de uma das entrevistadoras da

equipe, Maria da Conceição A. de Paiva, hoje participante ativa


449

da equipe científica do referido projeto, classificamos os 48 falantes adultos

de nossa amostra em função do seu ambiente de origem.

Após o processo classificatório, obtivemos o seguinte quadro:

1) 16 falantes de ambiente humilde;

2) 15 falantes de ambiente não humilde e

3) 17 falantes de ambiente mais ou menos humilde.

Tivemos o cuidado de separar os casos intermediários, a fim de que

pudéssemos trabalhar apenas com os falantes de ambientes inequívocos,

ou seja, com 31 dos 48 falantes adultos.

Através do índice individual de concordância, obtivemos quatro

grupos naturais:

1) 10 falantes de ambiente humilde e concordância baixa;

2) 11 falantes de ambiente não humilde e concordância alta;

3) seis falantes de ambiente humilde e concordância alta;

4) quatro falantes de ambiente não humilde e concordância baixa.

Dos 10 falantes de ambiente humilde e concordância baixa, cinco são

do sexo feminino e cinco, do sexo masculino. Para este grupo, a distribuição

de sexo é equilibrada, quer em termos de número de falantes, quer em

termos do grau de concordância.


450

Mas, dos 11 falantes de ambiente não humilde de concordância alta,

apenas um é do sexo masculino, enquanto os outros 10 são do sexo

feminino: este aspecto já é suficiente para mostrar porque a variável Sexo

apresenta resultados lingüísticos favorecedores da presença de

concordância para as mulheres e não para os homens na análise geral (ver

tabela 8.5.1). O favorecimento do sexo feminino encontra também respaldo

na distribuição dos quatro falantes de ambiente não humilde e concordância

baixa: apenas um é mulher e os outros três são homens. É na distribuição

dos seis falantes de ambiente humilde e concordância alta que as mulheres

perdem a supremacia de concordarem mais: quatro deles são homens e

apenas dois são mulheres. Entretanto, é interessante desde já adiantar que,

dentro dos quatro novos subagrupamentos, os percentuais de concordância

dos homens são sempre superiores ao das mulheres, o que não se deve

necessariamente à variável Sexo. Sabemos que há, por exemplo, uma única

mulher de ambiente não humilde e concordância baixa que apresenta menos

concordância do que os outros três falantes de igual característica. Mas,

enquanto esta mulher só cursou o primário, dois dos três homens cursaram o

colegial e o terceiro cursou o ginasial.

A distribuição etária destes 31 falantes é bem equilibrada no grupo de

ambiente humilde e concordância baixa e no grupo de ambiente não humilde

e concordância alta.

Dos 10 falantes do primeiro caso,

1) quatro têm de 15/25 anos;


451

2) dois, de 26/49 anos e

3) quatro, de 50/71 anos.

Dos 11 falantes do segundo caso,

1) quatro têm de 15/25 anos;

2) quatro, de 26/49 anos e

3) três, de 50/71 anos.

A distribuição etária dos outros dois grupos não é completa, pois não

há falantes nas três faixas etárias.

Dos seis falantes do grupo de ambiente humilde e concordância

baixa,

1) quatro têm de 15/25 anos e

2) dois, de 26/49 anos.

Dos quatro falantes de ambiente não humilde e concordância baixa,

1) dois têm de 15/25 anos e

2) dois, de 50/71 anos.

Mesmo assim, podemos afirmar que, com um número tão pequeno de

falantes, a distribuição etária é bastante regular.

A distribuição mais irregular desta nova forma de agrupar os falantes

diz respeito aos Anos de escolarização. Os de ambiente humilde

concentram-se no primário e os de ambiente não humilde, no colegial.

Vejamos a distribuição grupo a grupo:


452

1) dos 10 falantes de ambiente humilde e concordância baixa, sete

são do primário (70%), dois do ginasial (20%) e um do colegial (10%);

2) dos 11 de ambiente não humilde e concordância alta, 10 são do

colegial (91%) e um do ginasial (9%);

3) dos seis de ambiente humilde e concordância alta, três são do

primário (50%), dois do ginasial (33%) e um do colegial(17%);

4) dos quatro falantes de ambiente não humilde e concordância

baixa, um é do primário (25%), um é do ginasial (25%) e dois do colegial

(50%).

Embora haja uma correlação bastante estreita entre tipo de ambiente,

grau de escolarização e grau de concordância, vista a olho nu, o percentual

de falantes do primário de ambiente humilde com concordância alta é

bastante significativo: 50% (3/6). Também é significativo o percentual de

falantes do colegial de ambiente não humilde com concordância baixa:

igualmente 50% (2/4). Consideramos interessante observar detidamente

estes casos, uma vez que eles fogem da correlação esperada e normalmente

estabelecida, em se tratando de variação sociolingüística estável.

Antes de apresentarmos os resultados para os 31 falantes adultos

subdivididos em termos de ambiente e de grau de concordância, gostaríamos

de observar que temos consciência de que o número de falantes com todas

as características sociais em questão (ambiente, grau de concordância, sexo,

faixa etária e anos de escolarização), por célula, ficou extremamente

subdivido: em nenhuma das possíveis combinações temos


453

cinco falantes com as mesmas características e há combinação possível

totalmente vazia. O número de cinco falantes por célula tem sido considerado

como um número ideal para que padrões sociais regulares possam emergir

(cf. LABOV, 1981, p. 197 e TARALLO, 1985, p.29-30). Mas, considerando

que (1) dispomos de muitos dados; (2) possuímos um instrumental estatístico

apropriado para tratar destas situações e (3) estamos no campo das

conjecturas, achamos válido apresentar os resultados obtidos, extraindo

deles as melhores conclusões possíveis. Vejamos então os resultados na

Tabela 8.5.3.
454

TABELA 8.5.3
VARIÁVEIS SOCIAIS: TIPO DE AMBIENTE E GRAU DE CONCORDÂNCIA
VARIÁVEIS FALANTES
Ambiente Ambiente Ambiente Ambiente
humilde não hum. humilde não hum.
conc.baixa conc.alta conc.alta conc.baixa
FAIXA ETÁRIA
15/25 anos F. 276= 47% 681= 85% 671= 78% 266= 65%
581 804 857 412
P. 0,38 0,44 (0,46) 0,38
26/49 anos F. 295= 54% 934= 92% 538= 87%
546 1010 621 xxx
P. 0,59 0,64 (0,54)
50/71 anos F. 427= 53% 789= 85% 301= 66%
812 924 xxx 452
P. 0,53 0,41 0,62
ANOS DE ESCO-
LARIZAÇÃO
1a4 F. 738= 52% 398= 75% 156= 61%
1428 xxx 529 254
P. (0,47) 0,33 0,33
5a8 F. 129= 48% 534= 89% 460= 81% 132= 68%
268 598 568 194
P. (0,47) (0,53) 0,47 0,57
9 a 11 F. 131= 54% 1870= 87% 351= 92% 279= 67%
243 2140 381 416
P. (0,56) (0,47) 0,70 0,60
SEXO
Feminino F. 525= 50% 2322= 88% 313= 80% 156= 61%
1043 2648 389 254
P. (0,48) (0,42) (0,52) (0,39)
Masculino F. 473= 53% 82= 91% 896= 82% 411= 67%
896 90 1089 610
P. (0,52) (0,58) (0,48) (0,61)
455

Pelos resultados da Tabela 8.5.3, podemos verificar que os dois grupos

extremos apresentam duas distribuições etárias distintas: no grupo de

ambiente humilde e concordância baixa, ela é inclinada, com o ápice de

formas não padrão (0,38) no segmento mais jovem (15/25 anos) e com

aumento sensível de formas padrão (0,59 e 0,53) nas outras duas faixas

etárias (26/49 e 50/71 anos); no grupo de ambiente não humilde e

concordância alta, a distribuição etária é curvilinear, mostrando igual

probabilidade de formas não padrão (0,44 e 0,41) no segmento mais jovem

(15/25 anos) e no segmento mais velho (50/71 anos). O ápice das formas de

prestígio (0,64) é encontrado nos falantes do segmento etário intermediário

(26/49 anos). A primeira configuração etária pode ser interpretada com índice

de mudança lingüística em direção a um sistema sem marcas de

concordância e a segunda, como índice de variação estável com gradação

de idade. Neste segundo caso, considera-se que os mais jovens apresentam

menos concordância, porque lingüisticamente eles são mais influenciados

pelos seus pares do que por outros segmentos da sociedade e, à medida

que vão se inserindo em redes mais coesivas que envolvem pressões de uso

do padrão, como o mercado de trabalho, aumentam a taxa de concordância,

assumindo mais as formas de prestígio. Quando diminuem as suas

atribuições sociais, após os 50 anos de idade, diminuem-se as pressões e,

conseqüentemente, diminuem-se as formas de prestígio (cf. CHAMBERS &

TRUDGILL, 1980, p.91-2).

O padrão etário inclinado, sugerindo mudança lingüística em direção

a um sistema sem marcas, é também encontrado nos falantes de ambiente

não humilde e concordância baixa, uma vez que os falantes mais jovens

(15/25 anos) e os mais velhos (50/71 anos) apresentam, res-pectivamente,

0,38 e 0,62 de probabilidade de presença de concordância.


456

Os falantes de ambiente humilde e concordância alta não tiveram a

Faixa etária selecionada, embora as percentagens e as probabilidades finais

indiquem menos formas de prestígio nos falantes de 15/25 (0,46) anos e

mais nos de 26/49 anos (0,54). Como falta o último segmento etário, não

temos como saber que configuração aí se vislumbraria: se inclinada ou se

curvilinear. Neste caso, surge um outro dado: os Anos de escolarização se

mostram como variável relevante, evidenciando-se probabilidades de

concordância diretamente proporcionais ao aumento dos anos de

escolarização: 0,32 (1 a 4); 0,48 (5 a 8) e 0,70 (9 a 11). Estes falantes foram

considerados por nós como os possíveis "descrioulizantes" ou

"descrioulizados". Podemos ver, todavia, que não existe padrão etário aí

envolvido e se existir ele não apresentará índice de formas de prestígio nos

falantes mais jovens. De qualquer forma, não se trata de aquisição no

sentido etário do termo. Trata-se de aumento dos índices de concordância

em função da influência elitizante da escola, que não tem relação direta

com a faixa etária, e sim com os anos que se passam em exposição ao

padrão, fora da faixa etária de aquisição natural da língua, o que não implica

mudança na comunidade, mas sim sobreposição de sistemas a nível

individual.

A influência da variável Anos de escolarização se evidencia também

sobre os falantes de ambiente não humilde e concordância baixa. Neste

subagrupamento, desempenham papéis importantes tanto a Faixa etária

quanto os Anos de escolarização. Esta segunda variável está atu-


457

ando exatamente sobre os subgrupos de comportamento lingüístico ines-

perado em termos de ambiente de origem. Estes dois subgrupos evidenciam

dois movimentos interessantes. O de ambiente humilde e concordância alta,

por um lado, evidencia sim um processo aquisitivo de concordância, mas que

não tem relação com a faixa etária e sim com a influência da escola. Por

outro lado, o grupo de ambiente não humilde e concordância baixa, embora

sensível à exposição da escolarização, apresenta nitidamente um padrão

etário de perda, em direção, também, a um sistema não padrão, como o

subgrupo humilde de concordância baixa.

Nos subgrupos dos extremos, a influência da escola pouco se faz

sentir porque aí ambiente e escolarização praticamente se confundem. No

primeiro extremo, verifica-se a tendência natural da mudança lingüística,

conforme preconizada por Lemle & Naro (1976) e Naro (1981a) e, no

segundo extremo, a variação sociolingüística estável conforme estabelecida

por Guy (1981a e 1986). Diferimos de Guy no sentido de que estamos

mostrando um padrão de variação sociolingüística estável com gradação

etária, num grupo de maior grau de escolarização. É provável que se Guy

tivesse separado os seus informantes em termos de concordância alta ou

baixa, padrões etários pudessem emergir e ele chegasse também à

conclusão de que os de concordância baixa evidenciassem movimento de

perda da concordância e os de concordância alta evidenciassem variação

sociolingüística estável. De uma certa forma, Naro (1981a) fez isto. Dos cinco

falantes classificados por ele de "vicários", quatro apresentavam os mais

altos índices de concordância, enquanto, dos 12 falantes classificados como

"experienciais", nove apresentavam índices de concordância abaixo da

média e os outros três apresentavam índices de concordância abaixo dos

índices dos quatro falantes "vicários" acima referenciados (cf. NARO, 1981a,
458

p.81 e 84). O corte que fizemos neste trabalho foi ad hoc, mas ele

certamente reflete algum aspecto análogo à "Orientação cultural", conforme

estabelecida em Naro (1981a).

Menção particular merece agora a variável Sexo. Ela não foi

selecionada em nenhum dos novos agrupamentos feitos. Para três deles,

poder-se-ia dizer que a questão é simplesmente distribucional, conforme já

mencionamos. Mas para o quarto restante - o constituído pelos falantes de

ambiente humilde e concordância baixa -, tal argumento não se coloca: há

igualmente cinco homens e cinco mulheres dentre os seus 10 constituintes.

Mesmo assim, não se seleciona a variável Sexo. Nesta nova forma de

agruparmos os informantes, quando padrões etários de mudança em

progresso emergem, a variável Sexo deixa, portanto, de evidenciar o padrão

característico de variação sociolingüística estável: quando mulheres usam

mais formas de prestígio do que os homens. Se bem que já concluímos,

através da literatura lingüística existente, que o comportamento da variável

Sexo é problemático para esclarecer se um fenômeno de variação está ou

não em mudança. Mas, mesmo assim, estamos tentando utilizá-lo.

Em etapas de análises anteriores, não apresentadas em detalhes

aqui, tivemos oportunidade de observar separadamente o comportamento

dos falantes em função dos Anos de escolarização. Verificamos que os do

primário não apresentavam diferenças probabilísticas fortes para os dois

sexos: 0,54 para elas e 0,46 para eles, enquanto os do ginasial e os


459

do colegial apresentavam-nas: respectivamente, 0,63 x 0,37 e 0,62 x 0,38.

Os resultados destas etapas de análise relativos às faixas etárias dos

falantes já mostravam também um dos padrões que ocorre nos novos

agrupamentos feitos: o padrão curvilinear nos falantes do colegial - 0,41

(15/25 anos); 0,65 (26/49 anos) e 0,44 (50/71 anos) - e novamente nos

falantes de ambiente não humilde de concordância alta - 0,44 (15/25 anos);

0,64 (26/49 anos) e 0,41 (50/71 anos). O que os agrupamentos tradicionais

não evidenciavam com nitidez, e nem o podiam, é o movimento de perda da

concordância nos falantes de baixa concordância, quer de ambiente humilde,

quer de ambiente não humilde. A análise tradicional deixa, todavia, entrever

que os falantes do ginasial estão num processo aquisitivo - 0,59 (15/25

anos); 0,53 (26/49 anos) e 0,38 (50/71 anos). Esta configuração não emerge

em nenhum dos novos agrupamentos feitos, seja porque ela em verdade

não existe ou seja simplesmente por acaso: dos 31 falantes novamente

categorizados, 11 são do primário (36%); 14, do colegial (45%) e apenas seis

são do ginasial (19%).

Em resumo, os padrões etários consistentes que temos são:

distribuição curvilinear nos falantes não humildes de concordância alta,

indicando variação sociolingüística estável com gradação etária e distribuição

inclinada nos falantes de baixa concordância, independentemente do

ambiente de origem, apresentando um padrão de perda, ao lado também da

influência aquisitiva em função dos Anos de escolarização. Os falantes de

ambiente humilde com concordância alta não evidenciam qualquer sinal de

aquisição em termos da Faixa etária e apresentam-se influenciados em

termos diretamente proporcionais aos Anos de escolarização:


460

quanto mais aumentam-se os anos de escolarização, mais aumenta-se a

probabilidade de presença de concordância.

A variável Sexo, por sua vez, só mostra a sua influência no conjunto

completo de falantes e, pelos novos subagrupamentos feitos, o seu efeito é

absolutamente neutro, não tendo sido selecionada para nenhum dos

subgrupos. Relembramos, todavia, que os falantes de ambiente não humilde

com concordância alta são predominantemente do sexo feminino: 91%

(10/11).

Em termos das variáveis sociais, os novos resultados obtidos não

corroboram, portanto, a hipótese da descrioulização levantada por Guy. Além

disso, não evidenciam nenhum padrão etário aquisitivo, correlacionado à

hipótese de Naro a respeito do ressurgimento da regra no grupo jovem, se a

orientação "vicária" continuasse a se espalhar neste grupo (cf. 1981a, p.88).

Os nossos últimos resultados mostram, portanto, que a variação da

concordância nominal reflete um fenômeno de variação mais complexo do

que imaginavam os estudos iniciais, e do que revelam os nossos primeiros

resultados, obtidos através da análise de todos os falantes adultos (ver

tabela 8.5.1, p.445).

Gostaríamos de observar agora os resultados de algumas variáveis

lingüísticas conforme os novos subagrupamentos de falantes, a fim de

verificarmos se eles trazem alguma contribuição para as discussões em

pauta.
461

8.6 - Sobre resultados de variáveis lingüísticas

Se um determinado fenômeno lingüístico sobre estudo apresenta

comportamento uniforme dentro de uma comunidade de fala, os resultados

obtidos para o grupo certamente são o reflexo do comportamento dos

indivíduos. Sendo assim, num caso de variação sociolingüística estável e

inerente, a expectativa é de que o comportamento lingüístico dos diversos

falantes seja influenciado da mesma forma pelas variáveis lingüísticas,


constatando-se, então, uma independência entre variáveis lingüísticas e

variáveis sociais.

Caso não haja uniformidade no comportamento lingüístico dos

diversos falantes com relação às probabilidades atribuídas aos diversos

fatores de uma mesma variável, quer nos seus pesos relativos, quer na

hierarquia entre os seus pesos, ou mesmo na hierarquia da seleção das

diversas variáveis, a literatura lingüística apresenta para isso pelo menos

duas possíveis interpretações: estas diferenças podem estar indicando

diferenças dialetais ou processos de mudança lingüística ocorrendo na


comunidade de fala analisada (cf. LABOV, 1972b, p.223-37; FASOLD, 1978;

GUY, 1975 e 1980; NARO, 1981a).165

Neste trabalho, não temos condições de contrapor indivíduo a

indivíduo em relação ao grupo, pois os nossos dados foram obtidos a partir

de apenas uma hora de gravação para cada informante, o que poderia

desvirtuar a convergência dos resultados, simplesmente pelo esfacelamento

natural dos dados (cf. GUY, 1975 e 1980). No entanto, podemos fazer

comparações entre o comportamento do grupo e dos subgrupos de


462

indivíduos em função das já conhecidas características sociais estratificadas,

usadas na configuração da nossa amostra, bem como em função dos novos

subgrupos formados em função do ambiente de origem e do grau de

concordância. Nesta parte do trabalho, interessa-nos especialmente ver o

comportamento das variáveis lingüísticas para estes segundos casos.

Até o presente momento, apresentamos os nossos resultados

relativos a todos os dados comparando basicamente apenas o

comportamento lingüístico dos adultos e das crianças, exceto na parte

relativa à saliência fônica, no item 6.2.2.166 Com relação a este aspecto,

fizemos uma comparação em termos de subagrupamentos de falantes

adultos, considerando apenas a variável Anos de escolarização. Na parte

relativa às variáveis lingüísticas globais, item 6.3, comparamos os resultados

de subagrupamento de adultos também em termos de Anos de

escolarização, apenas com relação à variável Pluralidade do contexto.

No desenrolar de nosso trabalho, temos então assumido

implicitamente que as diferenças de comportamento lingüístico dos diversos

subagrupamentos dos indivíduos adultos ocorrem predominantemente na

percentagem global de aplicação, ou seja, são propriamente mais

quantitativas do que qualitativas (cf. NARO, 1981a, p. 88-90 e 97; GUY,

1981a, p. 338-9). Nas comparações feitas, tivemos oportunidade de observar

que as influências dos diversos fatores das diversas variáveis são, se não

idênticas, bastante semelhantes para todo e qualquer subagrupamento de

falantes, no que se refere à hierarquia entre as diversas probabilidades de

cada variável lingüística. Até que ponto a diferença global


463

reflete ou não ou mudança lingüística é também um ponto que tem sido

colocado em discussão (cf. SILVA, 1982, p.390-1).

Dentre as cinco variáveis lingüísticas finais, estudadas a nível dos

elementos do sintagma nominal, com base em todos os dados, quatro delas

são de fundamental importância na discussão aqui colocada. São elas:

Marcas precedentes e posição, Relação entre os elementos nucleares e não

nucleares e Saliência fônica (envolvendo as dimensões Processos e

Tonicidade). Esta última variável, com as suas duas dimensões separadas, e

a variável Posição do elemento no SN, contida nas nossas duas primeiras,

são utilizadas por Naro & Lemle (1976) e por Naro (1981a), para proporem o

modelo universal de mudança sintática brevemente descrito no item 8.4. A

dimensão Processos e a variável Posição do elemento no SN são retomadas

por Guy, conforme também vimos no item 8.4, para apresentar argumentos

da parte lingüística de sua hipótese sobre a crioulização e a descrioulização

do Português popular do Brasil. Vamos então retomar a discussão destas

variáveis lingüísticas com base nos nossos resultados. Primeiro, vamos

apresentar a variável que envolve Processos e Tonicidade, agora

denominada Saliência fônica e, segundo, vamos apresentar a variável

Posicional, contida em Marcas e Relação.


464

8.6.1 - Saliência fônica

Desenvolvemos no item 6.2.2 uma análise detalhada da Saliência

fônica, demonstrando que a melhor análise é aquela que considera

Processos e Tonicidade como uma só variável: esta análise foi denominada

de análise 3. Desenvolvemos antes uma análise que considera Processos e

Tonicidade como duas variáveis distintas, denominada análise 1. Sempre

que necessário nos referiremos a estas duas análises através destes rótulos.

Vamos apresentar na Tabela 8.6.1 os resultados obtidos para a

variável Saliência nos moldes da análise 3, tendo em vista os quatro

agrupamentos de falantes em função do tipo de ambiente e do grau de

concordância. Estes resultados são baseados nos dados que envolvem

apenas os substantivos, adjetivos e categorias substantivadas, por razões já

explicitadas no item 6.2.1.3.


465

TABELA 8.6.1
SALIÊNCIA FÔNICA DOS SUBSTANTIVOS, ADJETIVOS E CATEGORIAS
SUBSTANTIVADAS POR SUBAGRUPAMENTOS DE FALANTES

SALIÊNCIA FALANTES
FÔNICA

Ambiente Ambiente Ambiente Ambiente


humilde não hum. humilde não hum.
conc.baixa conc.alta conc.alta conc.baixa
Duplo F. 13= 87% 14=100% 4=100% 9= 90%
(olho ) 15 14 4 10
(ólhos) P. 0,89 + + 0,79
-l F. 6= 67% 32= 91% 12=100% 8=100%
(casal ) 9 35 12 8
(casais) P. 0,76 0,56 + +
-R F. 21= 60% 57= 95% 47=100% 21= 91%
(flor ) 35 60 47 23
(flores) P. 0,61 0,60 + 0,85
-ão F. 11= 46 51= 94% 40= 98% 16= 84%
(patrão ) 24 54 41 19
(patrões) P. 0,46 0,59 0,85 0,66
-S F. 42= 71% 60= 94% 21= 78% 23= 85%
(rapaz ) 59 64 27 27
(rapazes) P. 0,68 0,50 0,42 0,67
Regular oxíto- F. 14= 39% 44= 96% 15= 79% 3= 43%
no e monossí- 36 46 19 7
labo tônico P. 0,41 0,71 0,43 0,30
Regular pro- 6= 20% 42= 88% 8= 80% 1= 20%
paroxítono 30 48 10 5
P. 0,12 0,35 0,46 0,12
Regular paro- F. 143= 15% 1015= 79% 449= 67% 147= 36%
xítono 934 1291 673 414
P. 0,13 0,21 0,27 0,17

Comparando-se os resultados do subgrupo de ambiente humilde e


466

concordância baixa (coluna 1) com os do subgrupo de ambiente não humilde

e concordância alta (coluna 2), podemos perceber a existência de cortes

categoriais distintos ao longo do eixo da Saliência. Neste segundo subgrupo,

com exceção do plural duplo, percebe-se com nitidez uma oposição maior

em termos da Tonicidade: os itens em -l (0,56), em -R (0,60), em -S (0,50) e

em -ão (0,59) não se opõem entre si. Além disso, os regulares oxítonos

chegam a ser mais marcados que estes próprios itens (0,71). Esta grande

categoria, predominantemente de itens oxítonos, se opõe aos demais

regulares que apresentam, por sua vez, uma suboposição entre regulares

paroxítonos (0,21) e regulares proparoxítonos (0,35). O que mais importa

para o grupo que apresenta indícios de variação sociolingüística estável é,

pois, a Tonicidade dos itens lexicais e não o Grau de diferenciação fônica na

relação singular/plural, ou seja, Processos. Isto é corroborado pela análise 1,

que contém Processos e Tonicidade como duas variáveis distintas, também

feita para este grupo, na qual Tonicidade é selecionada como variável

relevante em detrimento de Processos. Estes resultados continuam a ser

corroborados por uma outra análise feita só para os não regulares, incluindo

os de plural duplo, na qual a variável Processos não é selecionada, e por

uma última, feita só com os regulares, na qual a Tonicidade é selecionada.

Os resultados do subgrupo de ambiente humilde e concordância

baixa por sua vez não evidenciam um corte nítido em termos da Tonicidade e

em termos dos Processos. Ambos os aspectos são relevantes. Sem contar

também o plural duplo, pode-se perceber uma oposição bastante nítida entre

os itens em -l (0,76), em -R (0,61) e em -S (0,68), por


467

um lado, e os itens em -ão (0,46) por outro. Entre os três primeiros, constata-

se também uma suboposição entre os itens em -l (0,76) e os em -R (0,61),

colocando-se os em -S (0,68) numa faixa intermediária entre os dois.

Observando o comportamento dos itens regulares, vamos verificar que não

existe suboposição entre os paroxítonos (0,13) e os proparoxítonos (0,12)

entre si, mas eles se opõem conjuntamente aos demais itens, em graus

distintos de diferenciação. Todavia, os regulares oxítonos (0,41) têm

comportamento diferenciado dos demais regulares, favorecendo mais do que

estes a concordância nominal. Processos e Tonicidade entram, portanto, em

jogo nos dados deste subgrupo de falantes. Esta conclusão é corroborada

em vários momentos: pela análise 1, que seleciona as variáveis Processos e

Tonicidade; pela análise dos itens não regulares, que seleciona, pela

primeira e única vez, a variável Processos e pela análise dos itens regulares,

que também seleciona a variável Tonicidade. Para este subgrupo de

falantes, que apresenta indícios de perda da concordância, importam os dois

aspectos da Saliência fônica: Processos e Tonicidade. Processos interessa

em primeiro plano, pois é uma variável selecionada em segundo lugar com

significância 0,0 e Tonicidade o é em quinto com significância 0,000.

Na coluna 3 desta mesma tabela, temos os resultados do subgrupo

de ambiente humilde e concordância alta, que é exatamente o que se

apresenta influenciado pela ação da escola, sem nenhum padrão etário de

aquisição. Este subgrupo, diferentemente dos dois anteriormente

comentados, demonstra um comportamento quase que inanalisável em

termos de escala da saliência. As três primeiras categorias (duplo, -l, e -R)


468

são totalmente marcadas. Os itens em -ão (0,85) são também muito

marcados. O comportamento destes últimos itens (os em -ão) é deveras

peculiar, pois eles são bem pouco marcados no subgrupo de ambiente

humilde e concordância baixa. Em outras palavras, é muito marcado pelo

subgrupo que está adquirindo a concordância através da influência da escola

e pouco marcado por um subgrupo que, praticamente sem a influência da

escola, está perdendo a concordância, como indicam as probabilidades

relativas às faixas etárias, já vistas na tabela 8.5.3.

Neste subgrupo agora focalizado, os itens menos marcados são,

consistentemente, os regulares paroxítonos (0,27) que se opõem aos

regulares proparoxítonos (0,46) e oxítonos (0,43), os quais não apresentam

nenhuma suboposição interna. Neste subgrupo, os itens em -S (0,42),

diferentemente dos outros dois subgrupos de falantes, se comportam como

os regulares oxítonos (0,43) e paroxítonos (0,46). A análise 1 corrobora a

não nitidez dos resultados agora descritos: se consideramos todos os dados,

seleciona-se a variável Tonicidade; se consideramos apenas os substantivos,

adjetivos e categorias substantivadas, seleciona-se a variável Processos, o

que não se verifica nos dois subgrupos anteriores. Isto ocorre porque,

quando analisamos todos os dados, a categoria -l apresenta-se com um

dado não marcado, tendo quatro categorias na variável Processos (-l, -ão, -S

e regular), com um conseqüente peso maior para os oxítonos, uma vez que

os itens em -l são predominantemente oxítonos. Quando analisamos só as

classes pertinentes, os itens em -l se apresentam categoricamente

marcados, no sentido positivo, restando três


469

categorias na variável Processos: -ão, -S e regulares, favorecendo então a

sua seleção. A análise dos itens não regulares isolados, por sua vez, foi

impossível de ser feita, pela grande quantidade de ambientes categóricos, e

a análise dos regulares não apresenta a seleção da variável Tonicidade. Este

fato novamente corrobora a não nitidez do eixo da Saliência, quer com

relação a Processos, que com relação à Tonicidade, para o subgrupo de

falantes que apresenta padrão aquisitivo ao longo dos Anos de

escolarização.

Vamos observar agora, ainda na Tabela 8.6.1, os resultados do

último grupo de falantes: os de ambiente não humilde e concordância baixa.

Semelhantemente aos falantes humildes de concordância baixa, podemos

ver mais nitidez no eixo de Processos. A diferença pertinente localiza-se nos

itens em -ão (0,66) que se apresentam mais marcados, embora não tanto

quanto aos itens em -l, os quais são sempre marcados. Este subgrupo de

falantes, embora de comportamento etário semelhante ao do subgrupo

humilde com concordância baixa (processo de perda), tem a diferença de ser

também influenciado pela variável Anos de escolarização, o que explicaria

maiores índices de plural nos nomes em -ão. Com relação aos itens

regulares, verifica-se também a identidade de comportamento entre

paroxítonos (0,17) e proparoxítonos (0,12) em oposição, menos acentuada,

aos oxítonos (0,30). Na análise 1, a variável Processos é também

selecionada e Tonicidade não o é, corroborando-se assim a maior influência

de Processos no eixo da Saliência fônica. Todavia, na análise dos não

regulares isoladamente, a variável Processos não é selecionada e, na

análise dos regulares, Tonicidade também não o


470

é: o número de dados relativos tanto aos regulares oxítonos quanto aos

proparoxítonos, neste caso, é, indubitavelmente, o responsável pela não

seleção da Tonicidade.

Em resumo, podemos concluir que os subgrupos de falantes que

apresentam indícios etários de perda da concordância (colunas 1 e 4) são

mais sensíveis ao eixo da Saliência fônica, especialmente na sua dimensão

Processos, do que os grupos que não apresentam estes indícios. O

subgrupo mais influenciado pela escola (coluna 3) é exatamente o que

apresenta menor sensibilidade à escala da Saliência fônica, quer na sua

dimensão Processos, quer na sua dimensão Tonicidade. Esta sensibilidade

chega a ser menor do que a do grupo de ambiente não humilde e

concordância alta, que apresenta um padrão nítido de influência da dimensão

da Tonicidade.

Os grupos de concordância baixa, além de apresentarem padrões

etários que corroboram a hipótese de que a concordância de número no

Português popular brasileiro está em processo de mudança em direção a um

sistema sem marcas, apresentam também evidências lingüísticas (embora

baseadas em dados escassos e com uma hierarquia não tão rigidamente

estabelecida) de que

a mudança sintática se inicia no ponto onde diferenciação


superficial entre o sistema novo e o velho é zero (ou quase);
mais tarde ela se difunde através da língua na proporção
inversa ao grau de saliência das diferenças entre estes
sistemas em cada ambiente particular. (NARO, 1981a, p.63;
cf., também, p.96-7)167

É, portanto, em condições naturais que estamos vendo a atuação da

Saliência fônica emergir de forma forte nos dados da nossa amostra,


471

uma vez que o subgrupo que a apresenta com maior nitidez é exatamente o

de ambiente humilde e de baixa concordância, diferente, portanto, do que é

colocado por Guy (1981a e 1986).

Os resultados lingüísticos aqui apresentados mostram, todavia, que,

com relação à variável Saliência fônica, os grupos de falantes não divergem

apenas na propensão geral de uso da regra, conforme colocado por Naro (cf.

1981a, p.97), mas diferem também na hierarquia entre alguns fatores,

principalmente os flutuantes, constituídos pelos itens em -S e em -ão,

conforme amplamente discutido no item 6.2.1, e diferem também na nitidez

da escala da saliência no eixo dos Processos e no eixo da Tonicidade.

O padrão encontrado para o grupo não reflete nenhum dos padrões

encontrados nestes subgrupos. Para o grupo como um todo encontramos as

seguintes oposições:

1) plural duplo: 0,80;

2) itens em -l (0,69), em -R (0,65), em -ão (0,59) e em -S (0,56);

3) regulares oxítonos: 0,38 e

4) regulares proparoxítonos (0,21) e regulares paroxítonos (0,17).

Os resultados aqui apresentados mostram ainda mais que os grupos

sociais convencionais em termos de Sexo, Anos de escolarização e Faixa

etária, sem alguma subcategorização mais sutil do tipo aqui apresentado, em

função do ambiente de origem e grau de concordância, ou sem alguma

variável do tipo "Orientação cultural", conforme proposta por Naro (1981a),

podem deixar de apresentar aspectos lingüísticos interes-


472

santes com relação a variáveis que permitem discutir a direcionalidade da

mudança lingüística.

Vamos passar, neste momento, à discussão da outra variável em

pauta: a Posição do elemento no SN.

8.6.2 - Posição do elemento no SN

Scherre (1978) analisa a variável Posição que o elemento nominal

ocupa no SN e conclui, para falantes semi-escolarizados, que a primeira

posição é a que mais favorece a incidência de marcas de plural, enquanto as

demais posições a desfavorecem, com probabilidades decrescentes, até a

ausência total de marcas na última posição. Naro (1981a) considera que

estes resultados constituem evidências de que a primeira posição é mais

marcada por ser mais saliente e as demais são menos marcadas por serem

menos salientes, consoante com a sua hipótese da mudança lingüística estar

ocorrendo ao longo do eixo da saliência. Guy (1981 e 1986) considera que a

primeira posição do SN é a mais marcada, não por ser mais saliente, mas

simplesmente pelo fato de ter havido um crioulo de base portuguesa e

gramática africana que marcava a pluralidade do SN na posição inicial, por

influência de línguas africanas que marcam a pluralidade no início da

construção. Guy afirma, portanto, que o fato de o Português popular

brasileiro tender a marcar o primeiro elemento do SN não é uma

tendência universal, mas específica deste dialeto dadas às circunstâncias

da crioulização (cf. 1981a, p.299-304 e 1986, p.45-50).


473

No item 6.2.1 deste trabalho, apresentamos uma reanálise minuciosa

das variáveis Posição linear, Marcas precedentes e Classe gramatical, onde

demonstramos que (1) conclusões do tipo apresentado por Scherre (1978)

relativas às variáveis Posição linear; (2) conclusões relativas à variável

Classe gramatical apresentadas por Cedergreen (1973) e Poplack (1980a,

1980b e 1981) e (3) conclusões relativas à variável Marcas precedentes da

forma apresentada por todos os estudiosos que se ocuparam do estudo da

concordância nominal em Português não dão conta de forma adequada dos

fatos. Propusemos, então, uma reanálise destas três variáveis em duas,

denominadas (1) Marcas precedentes e posição, nos moldes de Poplack, e

(2) Relação entre os elementos nucleares e não nucleares no sintagma

nominal, nos moldes de nossa análise.

Vamos apresentar a seguir tabelas contendo os resultados relativos a

estas duas variáveis com o objetivo de ver o seu comportamento entre os

subagrupamentos de indivíduos em função do ambiente de origem e do grau

de concordância. Nas tabelas 8.6.2 e 8.6.3, apresentamos, respectivamente,

os resultados dos subgrupos dos extremos e dos subgrupos intermediários,

relativos à variável Relação. Repetimos os resultados de todos os falantes na

primeira coluna para tornar mais clara a exposição.


474

TABELA 8.6.2
RELAÇÃO ENTRE OS ELEMENTOS DO SN POR
SUBAGRUPAMENTOS DE FALANTES
FATORES FALANTES
Todos Ambiente Ambiente
humilde não hum.
conc.baixa conc.alta
Subst. na F. 153= 95% 6= 67% 72= 99%
primeira 161 9 73
posição P. 0,66 0,35 0,88

Subst. na F. 2756= 53% 200= 21% 969= 80%


segunda 5176 964 1206
posição P. 0,23 0,16 0,19

Subst. na F. 317= 62% 25= 28% 117= 85%


terceira 514 89 137
posição P. 0,38 0,32 0,44

Classe não F. 4291= 97% 734= 96% 1099= 98%


nuclear 4406 762 1125
anteposta P. 0,87 0,91 0,84

Classe não F. 242= 43% 13= 16% 127= 73%


nuclear 565 83 175
posposta P. 0,25 0,38 0,24

Categoria F. 59= 64% 13= 65% 20= 91%


subst. na 92 20 22
2a. posição P. 0,33 0,68 0,32

Categoria F. 16= 70% 1= 20% 9=100%


subst. na 23 5 9
3a. posição P. 0,48 0,13 +

Pronome F. 12=100% 4=100% 1=100%


pessoal na 12 4 1
1a. posição P. + + +

Pronome F. 27= 82% 6= 86% 2=100%


pessoal na 33 7 2
2a. posição P. 0,72 0,92 +
475

TABELA 8.6.3
RELAÇÃO ENTRE OS ELEMENTOS DO SN POR
SUBAGRUPAMENTOS DE FALANTES
FATORES FALANTES
Todos Ambiente Ambiente
humilde não hum.
conc.alta conc.baixa
Subst. na F. 153= 95% 12=100% 10= 91%
primeira 161 12 11
posição P. 0,66 + 0,83

Subst. na F. 2756= 53% 467= 77% 177= 43%


segunda 5176 668 414
posição P. 0,23 0,30 0,20

Subst. na F. 317= 62% 47= 77% 14= 35%


terceira 514 61 40
posição P. 0,38 0,78 0,17

Classe não F. 4291= 97% 661= 98% 346= 97%


nuclear 4406 676 357
anteposta P. 0,87 0,75 0,96

Classe não F. 242= 43% 29= 47% 13= 42%


nuclear 565 62 31
posposta P. 0,25 0,52 0,19

Categoria F. 59= 64% 5= 46% 7= 64%


subst. na 92 11 11
2a. posição P. 0,33 0,17 0,41

Categoria F. 16= 70% 2=100%


subst. na 23 xxx 2
3a. posição P. 0,48 +

Pronome F. 12=100% 1=100%


pessoal na 12 1 xxx
1a. posição P. + +

Pronome F. 27= 82% 5=100% 3=100%


pessoal na 33 5 3
2a. posição P. 0,72 + +
476

Os resultados probabilísticos das tabelas 8.6.2 e 8.6.3 evidenciam

novamente, e de forma bastante uniforme, que não é simplesmente a

primeira posição do SN que determina o índice de marcas plurais, mas sim a

colocação da classe não nuclear em relação ao núcleo e o núcleo em relação

à posição que ele ocupa no SN. São, então, mais marcados todos os

elementos não nucleares antepostos e menos marcados todos os elementos

nucleares propostos ao núcleo. São mais marcados os núcleos da primeira

posição do que os núcleos das demais posições, mas é possível também se

verificar, de forma geral, um aumento de marcas nos núcleos que ocupam a

terceira posição, em relação À probabilidade associada aos núcleos da

segunda posição. Os resultados das categorias substantivadas e dos

pronomes pessoais não merecem comentários uma vez que, relativamente, o

número de dados, por subagrupamento, é muito pequeno. Mesmo o total

respectivo para todos os falantes já não é alto, conforme se pode ver nos

dados da primeira coluna das respectivas tabelas.

É importante observar que, numa etapa de análise preliminar com

todos os falantes adultos, separamos os elementos nucleares antepostos e

os pospostos em função da posição e obtivemos os seguintes resultados:

- anteposto na primeira posição: 0,89;

- anteposto na segunda posição: 0,87;

- posposto na segunda posição: 0,32;

- posposto na terceira posição: 0,14.

Os resultados acima nos levaram a considerar, para as análises

futuras, apenas as duas grandes oposições: anteposição e posposição


477

em relação ao núcleo. Além disso, verificamos a existência destas duas

grandes oposições, através do exame exaustivo da relação entre Posição e

Classe gramatical no item 6.2.1. Observamos ainda que os antepostos na

terceira posição nos dados dos adultos só ocorreram duas vezes, o que nos

levou a agrupá-los com os de segunda.

Os resultados que temos em mãos são suficientemente claros para

se mostrar que as colocações de Guy (1981a e 1986) sobre a variável

Posição linear devem ser repensadas. O que está em jogo nesta variável,

conforme já discutimos, é a questão da coesão sintagmática e não a

influência das línguas africanas.

Além disso, os resultados da tabelas 8.6.4 e 8.6.5, relativos à variável

Marcas precedentes e posição, vão nos mostrar também, para três dos

quatro subagrupamentos de falantes, a consistência das conclusões já

obtidas com base nos dados de todos os 48 falantes adultos.


478

TABELA 8.6.4
MARCAS PRECEDENTES EM FUNÇÃO DA POSIÇÃO POR
AGRUPAMENTOS DE FALANTES
MARCAS E FALANTES
POSIÇÃO
Todos Ambiente Ambiente
humilde não hum.
conc.baixa conc.alta
Ausência F. 4213= 97% 726= 96% 1090= 98%
4223 754 1116
P. 0,79 0,85 0,61

Zero na 1a. F. 105=100% 27=100% 23=100%


posição 105 27 23
P. + + +

Numeral na F. 886= 58% 99= 31% 290= 90%


1a.pos. 1529 316 323
P. 0,63 0,74 0,85

-S na 1a. F. 2205= 55% 134= 20% 811= 80%


posição 3974 672 1018
P. 0,55 0,51 0,69

ss(s) F. 258= 70% 8= 33% 119= 81%


368 24 147
P. 0,60 0,43 0,54

y(s)x F. 207= 54% 23= 27% 69= 81%


382 84 85
P. 0,41 0,47 0,53

x(y)0 F. 13= 6% 1= 2% 2= 12%


200 53 16
P. 0,06 0,05 0,03

Sprep(x)s F. 11= 69% 1= 50% 8=100%


16 2 8
P. 0,74 0,55 +

Sprep0(0) F. 68= 38% 6= 18% 23= 70%


177 34 33
P. 0,42 0,57 0,51
479

TABELA 8.6.5
MARCAS PRECEDENTES EM FUNÇÃO DA POSIÇÃO POR
AGRUPAMENTOS DE FALANTES
MARCAS E FALANTES
POSIÇÃO
Todos Ambiente Ambiente
humilde não hum.
conc.alta conc.baixa
Ausência F. 4213= 97% 622= 98% 340= 97%
4223 634 350
P. 0,79 0,92 (0,72)

Zero na 1a. F. 105=100% 12=100% 9=100%


posição 105 12 9
P. + + +

Numeral na F. 886= 58% 97= 31% 65= 53%


1a.pos. 1529 114 123
P. 0,63 0,90 (0,42)

-S na 1a. F. 2205= 55% 408= 70% 133= 42%


posição 3974 584 315
P. 0,55 0,70 (0,35)

ss(s) F. 258= 70% 38= 70% 15= 54%


368 54 28
P. 0,60 0,41 (0,80)

y(s)x F. 207= 54% 25= 69% 7= 30%


382 36 23
P. 0,41 0,31 (0,53)

x(y)0 F. 13= 6% 2= 10% 2= 22%


200 20 9
P. 0,06 0,02 (0,39)

sprep(x)s F. 11= 69% 1= 33% 1=100%


16 3 8
P. 0,74 0,30 +

sprep0(0) F. 68= 38% 16= 48% 5= 31%


177 33 10
P. 0,42 0,57 (0,26)
480

Os resultados acima mostram, para o grupo e para os subgrupos, o

seguinte:

1) A ausência fora do SN e ausência no primeiro elemento provocam

um índice alto de marcas no segmento seguinte. Em alguns casos do

primeiro fator e em todos do segundo, a sua influência é categórica no

sentido positivo.

2) O numeral da primeira posição influencia mais a marca no

segmento da segunda posição do que o próprio morfema de plural nesta

mesma posição.

3) Não é qualquer elemento na terceira posição que é pouco

marcado: seu índice de marcas depende da presença ou ausência de marca

precedente. Se ela estiver ausente, a probabilidade do item seguinte ser

marcado é próxima de zero. Se ela estiver presente, o segmento da terceira

posição tem, relativamente, mais chances de ser marcado.

Os resultados dos fatores Sprep(s) s- e Sprep0(0) não se mostram

consistentes para todos os subgrupos por simples escassez de dados, e os

resultados do grupo de ambiente não humilde e concordância alta, embora

não selecionados, apresentam a hierarquia esperada. A questão da sua não

seleção é estatística. O programa só seleciona resultados com significância a

nível máximo de 0,05 e a significância, no nível em que esta variável seria

selecionada, foi de 0,064.

Concluímos novamente, a partir destes resultados, que a questão em

jogo não é, portanto, simplesmente posição linear, mas posição e tipo de

marca precedente, o que refuta mais uma vez a argumentação lingüística de

Guy (1981a e 1986) relativa à questão da existência de um crioulo


481

de léxico português e gramática africana com marcas apenas na primeira

posição da construção.

Os resultados acima evidenciam, ainda, que mesmo agrupamentos

com um número relativamente pequeno de indivíduos podem revelar padrões

regulares, que emergem na análise dos dados de todos os falantes. Com

relação a estas duas variáveis não há dúvidas de que a análise de dados

suficientes de qualquer falante de qualquer característica social evidenciará

diferenças apenas na "propensão geral de aplicação da regra" e não no peso

relativo de cada fator e, conseqüentemente, na hierarquia entre eles.

Usando as palavras de Guy (1980), poderíamos dizer que, para estas

variáveis,

as normas dos grupos não são apenas artefatos do ponto de


vista macrocósmico, representando meras médias de um
agrupamento de normas individuais amplamente dispersas.
Ao contrário, elas resumem as normas uniformes gerais dos
indivíduos. (GUY, 1980, p.12)168

Fizemos comparações dos resultados de subgrupos de falantes

adultos apenas para as variáveis lingüísticas mais fortes, as quais nos

permitiam discutir, através de seus resultados, a relação entre variação e

mudança envolvendo a concordância de número no sintagma nominal. Por

isto, as demais variáveis envolvendo todos os dados não foram aqui

abordadas, quais sejam: Contexto seguinte e Função.

Passemos à conclusão deste capítulo.


482

8.7 - Conclusão

Do estudo feito por nós neste capítulo, podemos concluir que a

concordância de número entre os elementos do sintagma nominal é um

fenômeno lingüístico variável que apresenta duas tendências inequívocas em

dois subagrupamentos distintos de falantes:

1) variação estável com gradação etária nos falantes de ambiente

não humilde e concordância alta;

2) processo de mudança lingüística em direção a um sistema sem

marcas nos falantes de ambiente humilde e concordância baixa.

Os resultados etários dos falantes de ambiente não humilde e

concordância baixa e dos falantes de ambiente humilde e concordância alta

sugerem a possibilidade de generalização das conclusões acima:

1) variação estável com gradação etária nos falantes de concordância

alta e

2) processo de mudança lingüística em direção a um sistema sem

concordância nos falantes de concordância baixa.

A variável Sexo não se mostra relevante nos dados dos falantes do

mesmo ambiente e com o mesmo grau de concordância, mas evidencia-se

como relevante no conjunto de todos os dados, com as mulheres

favorecendo as formas de prestígio.

A influência da variável Anos de escolarização, por sua vez, indica


483

que, à medida que os falantes passam mais anos na escola, mais

concordância eles "adquirem", o que pode até provocar um movimento

reverso no processo de perda da concordância. Essa influência confirma

parcialmente as conclusões de Naro (1981a), feitas com base no estudo da

variável Orientação cultural. Não detectamos, todavia, nenhum padrão etário

de aquisição, embora não descartemos a possibilidade de sua existência.

Os resultados das variáveis sociais de nossa amostra nos

subagrupamentos de falantes em função do tipo de ambiente e do grau de

concordância não apresentam, portanto, apenas a configuração inicial de

variação sociolingüística estável com leve gradação etária e não apresentam,

também, suporte empírico para a existência de um processo descrioulizante,

no sentido literal do termo, precedendo a variação estável que se evidencia

nos falantes de ambiente humilde e concordância alta.

Os resultados das variáveis lingüísticas também não corroboram a

hipótese da crioulização e conseqüente descrioulização do português popular

brasileiro.

A Saliência fônica se mostra mais evidente nos falantes de ambiente

humilde e concordância baixa, ou seja, nos que são menos influenciados por

"empréstimos" do dialeto padrão; e se mostra menos evidente nos falantes

de ambiente humilde e concordância alta, os supostamente descrioulizados

ou em processo de descrioulização. A tendência que se vislumbra é, em

verdade, a seguinte: para os falantes de baixa concordância, atua em

primeiro plano a dimensão Processos da variável Saliência fônica e, para os

falantes de alta concordância, a dimensão Tonicidade.


484

A variável Posição não tem efeito desvinculado da Classe gramatical

nem das Marcas precedentes, evidenciando-se que a marca formal de plural

tende a ocorrer não apenas no elemento nominal que ocupa a primeira

posição no SN, mas sim em qualquer elemento não nuclear anteposto ao

núcleo do SN e também em elementos até da terceira posição precedidos de

elementos marcados. Os princípios que explicam as variáveis Relação e

Marcas, nas quais a Posição se encontra inserida, são de natureza geral,

regendo o funcionamento de línguas diversas, quais são: o Princípio da

Economia, o Princípio da Iconicidade e o Princípio do Processamento

Paralelo, já vistos. Explicações de natureza particular não têm, a nosso ver,

lugar na análise da concordância de número entre os elementos do sintagma

nominal no Português do Brasil.


9 - NOVAS PERSPECTIVAS DE INFLUÊNCIAS SOCIAIS

9.1 - Introdução

No capítulo 8, analisamos a influência de três variáveis sociais

tradicionalmente conhecidas: Anos de escolarização, Sexo e Faixa etária.

Estas variáveis, além de tradicionais, são estratificadas, uma vez que foram

usadas na configuração da nossa amostra. Com base na análise destas três

variáveis, nos subgrupos de falantes em função do ambiente de origem e do

grau de concordância, concluímos e generalizamos que há, pelo menos,

duas situações envolvendo a concordância de número entre os elementos do

SN: (1) variação estável com gradação etária nos falantes de concordância

alta e (2) mudança em direção a um sistema de perda da concordância nos

falantes de concordância baixa. Neste capítulo, pretendemos apresentar a

análise de três variáveis não convencionais, cujos resultados apontam para

novas perspectivas de influências sociais sobre fenômenos lingüísticos

considerados estigmatizados, corroborando em parte resultados obtidos no

capítulo 8. As três variáveis não convencionais, e não estratificadas,

recebem as denominações de Mercado ocupacional, Mídia e Sensibilidade

lingüística.

A caracterização destas três novas variáveis e a metodologia de sua

mensuração foram desenvolvidas pela equipe de pesquisadores do Projeto

Censo, já referenciada, e encontram-se descritas no primeiro volume do seu

último relatório final de pesquisa apresentado à FINEP em dezembro de

1986 (cf. NARO et alii, p.1-29).


486

Vamos apresentar no item 9.2 uma síntese do que se encontra neste

relatório, no que diz respeito à caracterização e mensuração das variáveis

em jogo e, a seguir, vamos apresentar resultados do fenômeno que estamos

estudando, considerando também estas três variáveis. Foi impossível

verificar a influência destas três novas variáveis nos subagrupamentos de

falantes em termos do ambiente de origem e do grau de concordância, pela

inevitável atomização dos dados. Sendo assim, os resultados aqui

apresentados só podem ser comparados aos anteriores de forma indireta:

eles dizem respeito a todos os falantes e, também, a subgrupos em função

do Sexo, por questões estritamente metodológicas a serem esclarecidas no

corpo deste capítulo.

9.2 - Caracterização das variáveis não convencionais

Por Mercado ocupacional, entende-se a correlação entre o tipo de

atividade profissional desenvolvida pelo indivíduo ao longo de sua vida e a

necessidade do uso de formas lingüísticas de prestígio, na linha de Bourdieu

(1975) e Sankoff & Laberge (1978). Com o seu estudo, pretende-se verificar

se existe uma correlação diretamente proporcional entre o uso de formas

lingüísticas consideradas corretas e atividades profissionais que propiciam

o uso de tais formas.

A Sensibilidade lingüística é caracterizada em termos do grau de

consciência do falante em relação à diversidade lingüística e da sua atitude

com relação a ela. No estudo desta variável, pretende-se, também,


487

verificar se há ou não uma relação diretamente proporcional entre a

Sensibilidade lingüística e o uso de formas padrão.

A variável Mídia diz respeito ao grau de exposição do falante aos

meios de comunicação de massa. Considerou-se indiferentemente a

influência da televisão, do rádio, de jornais e de revistas. Indubitavelmente, o

tempo de exposição à televisão é maior, de acordo com o depoimento dos

próprios falantes, e, conseqüentemente, a sua influência deve ser mais forte

do que a de qualquer outro meio de comunicação. Há, inclusive, trabalhos

que utilizam a influência da mídia como diagnóstico de atitude de vida. A

variável Orientação cultural apresentada no capítulo 8, conforme

desenvolvida por Naro, foi estabelecida em função do tipo de contato do

falante com a TV (cf. NARO, 1981a, p.84). No trabalho aqui sintetizado, não

foi possível descer a estes detalhes de classificação, e a equipe considerou

então a influência dos meios de comunicação de massa de forma geral.169

Com o estudo desta variável, objetiva-se semelhantemente testar se a maior

ou menor exposição à mídia influencia um maior índice ou menor índice de

formas de prestígio.

Considerando-se que a ausência de concordância de número entre

os elementos do SN, pelo menos em alguns ambientes lingüísticos, é

considerada estigmatizante, espera-se que haja uma relação direta entre o

uso de formas com concordância e (1) a cotação positiva no Mercado

ocupacional, (2) a cotação positiva de Sensibilidade lingüística e (3) a

cotação positiva de exposição à Mídia. Inversamente, espera-se relação

entre formas sem concordância e (1) a cotação negativa no Mercado


488

ocupacional, (2) a cotação negativa de Sensibilidade lingüística e (3)

cotação negativa de exposição à Mídia.

9.3 - Metodologia de mensuração das variáveis não


convencionais

Para as três variáveis em foco, adotou-se o critério de classificação

dos falantes em termos de mais (+), menos (-) ou mais ou menos (+). A

classificação positiva (+) ou negativa (-) foi atribuída aos falantes que se

apresentavam nitidamente polarizados. A classificação intermediária foi

reservada para os casos duvidosos, por que razão fosse: carência de

informação para uma classificação segura, falta de consenso entre os

avaliadores ou, ainda, porque os falantes apresentavam características

realmente intermediárias.

A mensuração objetiva destas três variáveis não é fácil. A equipe

tentou tomar todos os cuidados necessários para alcançar o máximo de

objetividade. No caso da variável Mercado ocupacional, por exemplo, dois

problemas precisavam ser contornados: (1) evitar se fazer a caracterização

dos falantes em função de outras variáveis sociais como o seu Grau de

escolarização, a sua Faixa etária, ou a sua Classe social; (2) evitar que a

classificação fosse feita por membros da equipe, uma vez que eles já tinham

conhecimento de todas as características sociais dos falantes.

A transcrição abaixo dá uma idéia de como a equipe procedeu para

contornar os dois problemas mencionados acima.


489

Para a avaliação da importância do Mercado


ocupacional em cada falante, adotou-se o seguinte
procedimento: para cada falante fez-se uma ficha
contendo informações sobre as suas atividades
pregressas e as atuais. Evitou-se fornecer dados acerca
da escolaridade do falante, local de moradia, classe
social e outras que pudessem provocar confusão.
O teste de julgamento foi feito por estudantes de
graduação com curso de Sociolingüística e por um
professor de pós-graduação. Pediu-se a cada um deles
que atribuísse, para cada perfil de informante, um valor
positivo, negativo ou intermediário de acordo com o seu
julgamento do grau de necessidade da linguagem
/considerada/ correta. Preferiu-se impor aos juízes o
número de graus (três) possíveis de serem atribuídos,
não se permitindo que cada um estipulasse a sua própria
escala. Este procedimento visava facilitar a obtenção da
média (NARO et alii, 1986, p.35).

A classificação dos informantes com relação às variáveis Mídia e

Sensibilidade lingüística foi feita por dois membros da equipe

separadamente, para evitar distorções.

Com relação À Mídia especificamente, a classificação se deu com

base em informações já existentes sobre os falantes, contidas numa ficha

social feita antes da entrevista propriamente dita, e com base também em

informações adicionais obtidas através da leitura das entrevistas. Para a

classificação dos falantes conforme a Sensibilidade lingüística, os

pesquisadores se basearam em "respostas dos falantes a perguntas que

buscaram captar suas opiniões acerca da diversidade lingüística." (NARO et

alii, 1986, p.34; cf., também, SILVA & FERREIRA, 1988). Consideram-se

então como "indícios de sensibilidade lingüística a percepção e/ou


valorização de diferenças lingüísticas etárias, educacionais ou regionais,

assim como a correção e a preocupação com modelos lingüísticos." (NARO

et alii, 1986, p.5)

Após a classificação feita, obteve-se a seguinte distribuição dos

informantes:
490

1) Mercado ocupacional: 10 de cotação positiva, 15 de cotação

negativa e 23 de cotação intermediária;

2) Mídia: 20 de cotação positiva, 5 de cotação negativa e 22 de

cotação intermediária;

3) Sensibilidade lingüística: 16 de cotação positiva, 5 de cotação

negativa e 27 de cotação intermediária.

O número maior de falantes na categoria intermediária ocorre porque

a equipe foi extremamente rigorosa na atribuição da classificação positiva ou

negativa, para que os resultados, em se tratando de variáveis sociais pouco

estudadas, fossem confiáveis. Os valores probabilísticos considerados

importantes para nós são os das categorias polarizadas. A equipe só não

desconsiderou os falantes de classificação intermediária porque eles não

são necessariamente os mesmos para todas as variáveis.

9.4 - Resultados das variáveis convencionais e não


convencionais

De posse da classificação dos 48 falantes adultos com respeito a

estas três variáveis, recodificamos os nossos dados, acrescentando-as. A

sua codificação não ocorreu conjuntamente com a das variáveis

estratificadas porque esta nova classificação dos informantes foi posterior à

análise que apresentamos nas páginas anteriores. Refizemos então algumas

etapas de análises que são apresentadas a seguir.


491

Na tabela 9.4.1, temos duas colunas de resultados. Na primeira,


apresentamos os resultados já obtidos para as variáveis convencionais sem
a interferência das novas variáveis (análise I) e, na segunda, apresentamos
também os resultados das mesmas variáveis convencionais, na análise que
considera também as variáveis não convencionais (análise II).

TABELA 9.4.1
VARIÁVEIS SOCIAIS CONVENCIONAIS
VARIÁVEIS ANÁLISE I ANÁLISE II
Apl./Total % Prob. Apl./Total % Prob.
ANOS DE ES-
COLARIZAÇÃO
1a 4 2413/3903= 62 0,32 2413/3903= 62 0,40
5a 8 2605/3613= 72 0,53 2605/3613= 72 0,50
9 a 11 2843/3453= 82 0,65 2843/3453= 82 0,60

SEXO
Feminino 4397/5680= 77 0,59 4397/5580= 77 0,58
Masculino 3464/5289= 65 0,41 3464/5289= 65 0,42

FAIXA
ETÁRIA
15/25a 2244/3126= 72 0,49 2244/3126= 72 0,40
26/49a 2891/3845= 75 0,54 2891/3845= 75 0,60
50/71a 2726/3998= 68 0,47 2726/3998= 68 0,50

Pelos resultados da análise II, podemos ver que as diferenças


probabilísticas associadas aos fatores da variável Anos de escolarização se
tornam menos polarizadas, enquanto há uma polarização mais evidente nos
resultados relativos à Faixa etária, evidenciando-se o padrão etário
curvilinear esboçado na análise I. Vamos retomar estas duas questões mais
à frente. Antes disso, vamos apresentar na tabela 9.4.2 os re-
492

sultados obtidos para as variáveis não convencionais para todos os falantes,


ou seja, os demais resultados sociais da análise II.

TABELA 9.4.2
VARIÁVEIS SOCIAIS NÃO CONVENCIONAIS
COTAÇÃO VARIÁVEIS
Mercado Sensibilidade Mídia
Positiva F. 1916= 81% 2635= 74% 3582= 74%
2361 3396 4825
P. 0,69 0,57 0,53

Negativa F. 1931= 61% 799= 71% 926= 64%


3153 1132 1442
P. 0,33 0,47 0,48

Intermediária F. 4014= 74% 4427= 69% 3353= 71%


5454 6440 4701
P. 0,47 0,46 0,49

A variável não convencional de efeito mais forte é o Mercado

ocupacional, pois apresenta resultados polarizados, além de ser uma variável

selecionada antes da Faixa etária com significância 0,0. Os falantes com


cotação positiva no Mercado ocupacional fazem mais concordância (0,69) do

que os de cotação negativa (0,33). A Sensibilidade lingüística também exerce

influência na direção esperada, pois as pessoas com maior sensibilidade

fazem mais concordância (0,57). O efeito da Mídia pouco se faz sentir,

embora haja uma leve oposição entre a cotação positiva (0,53) e a negativa

(0,48).

Nesta análise, que engloba todos os dados, envolvendo 11 variáveis,

cinco lingüísticas e seis sociais, observamos a seguinte ordem de seleção

estatística das variáveis sociais:

3a.) Anos de escolarização, com significância 0,0;


493

5a.) Sexo, com significância 0,0;

6a.) Mercado ocupacional, com significância 0,0;

7a.) Faixa etária, com significância 0,0;

10a.) Sensibilidade, com significância 0,000 e

11a.) Mídia, com significância 0,046.

A ordem da seleção acima continua a mostrar que Anos de

escolarização e Sexo são duas variáveis sociais realmente importantes no

uso da concordância nominal e que a Faixa etária é menos importante do

que o próprio Mercado ocupacional.

Como já observamos, com a introdução das variáveis não

convencionais, acentua-se o padrão etário curvilinear para todos os falantes,

característico dos fenômenos que refletem variação social estável com

gradação etária, com o ápice das formas de prestígio na faixa etária, onde

as pressões de mercado de trabalho mais se fazem sentir. Considerando

também que a análise com as variáveis não convencionais suaviza as

diferenças entre os diversos fatores da variável Anos de escolarização,

decidimos analisar os dados em mãos em termos de possíveis

subagrupamentos de falantes. Os únicos subagrupamentos possíveis que

apresentavam distribuição uniforme em termos destas novas variáveis são os

constituídos pelos homens e pelas mulheres. Fizemos então duas subetapas

de análise considerando só os dados das mulheres e só os dados dos

homens, cujos resultados vamos apresentar a seguir.

Temos na tabela 9.4.3 as probabilidades relativas à variável Anos de

escolarização para os homens e para as mulheres no primeiro e no décimo

nível de sua análise (Prob.1 e Prob.10, respectivamente), ou se-


494

ja, sem a influência de qualquer variável e com a influência de todas as

variáveis.

TABELA 9.4.3
ANOS DE ESCOLARIZAÇÃO E SEXO

ANOS DE SEXO
ESCOLA-
RIZAÇÃO

Feminino Masculino

Freq. % Prob.1 Prob.10 Freq. % Prob.1 Prob.10

1 a 4a 1283=64 0,32 0,35 1130=60 0,42 0,51


2006 1896

5 a 8a 1148=83 0,56 0,53 1457=65 0,48 0,53


1384 2229

9 a 11a 1966=86 0,62 0,62 877=75 0,60 0,46


2289 1164

Os resultados da tabela 9.4.3 são extremamente interessantes.

Através deles, podemos verificar que a variável Anos de escolarização tem

um efeito muito mais efetivo sobre o comportamento lingüístico das

mulheres do que sobre o dos homens. Os dados delas apresentam, do

primeiro ao último nível de análise, probabilidades de concordância

diretamente proporcionais aos Anos de escolarização, enquanto os dos

homens não apresentam esta mesma hierarquia no último nível de análise.

Em verdade, o instrumental quantitativo por nós usado considerou que as

probabilidades associadas aos Anos de escolarização para os homens não

são estatisticamente relevantes: todos os valores se aproximam de 0,50, o

que indica a ausência de influência desta variável. A sua seleção indica que

esta é a real configuração estatística dos dados analisados.


495

Além disso, a variável Anos de escolarização é a última selecionada, ou

seja, a décima.

Considerando que, no primeiro nível de análise (Prob.1), os dados

dos homens apresentam probabilidades de concordância diretamente

proporcionais à variável Anos de escolarização, é importante verificar que

variável ou que variáveis retira(m) os pesos probabilísticos inicialmente

atribuídos aos fatores desta variável. Na tabela 9.4.4, podemos fazer o

acompanhamento dos níveis de análise, para os resultados dos dados dos

homens. Nesta tabela, temos o comportamento estatístico da variável Anos

de escolarização do nível 1 (Prob.1) ao nível 10 (Prob.10). Para maior

clareza, sublinhamos as probabilidades onde ocorrem as mudanças, as quais

eliminam as diferenças bem nítidas que se observam em Prob.3, junto às

variáveis lingüísticas Marcas e Saliência.

TABELA 9.4.4
SOBRE INTERFERÊNCIAS NA VARIÁVEL ANOS DE
ESCOLARIZAÇÃO: DADOS DOS HOMENS
NÍVEIS DE ANÁLISE ANOS DE ESCOLARIZAÇÃO
1a 4 5a 8 9 a 11
Prob. 1 (isoladas) 0,42 0,48 0,60
Prob. 2 (c/ Marcas) 0,39 0,49 0,62
Prob. 3 (c/ Saliência) 0,37 0,50 0,63
Prob. 4 (c/ MERCADO) 0,47 0,47 0,56
Prob. 5 (c/ Relação) 0,47 0,47 0,56
Prob. 6 (c/ SENSIBILIDADE) 0,47 0,50 0,52
Prob. 7 (c/ contexto seguinte) 0,47 0,51 0,52
Prob. 8 (c/ FAIXA ETÁRIA) 0,49 0,52 0,48
Prob. 9 (c/ MÍDIA) 0,51 0,53 0,46
Prob.10 (c/ Todas) 0,51 0,53 0,46

A primeira mudança relevante ocorre em Prob.4 onde se medem os

pesos relativos a Anos de escolarização e Mercado ocupacional. Considera-

se então que a influência dos Anos de escolarização sobre os ho-


496

mens é menos importante: o que mais importa do ponto de vista estatístico é

a influência do Mercado ocupacional. Paulatinamente, as outras três

variáveis destacadas (Sensibilidade, Faixa etária e Mídia) vão também

alterando os valores probabilísticos nos níveis 6, 8 e 9, fazendo com que a

variável Anos de escolarização fique com as suas probabilidades esvaziadas

de qualquer conteúdo estatístico relevante. Esta situação não ocorre com os

dados das mulheres. Podemos fazer semelhante acompanhamento através

dos níveis probabilísticos da tabela 9.4.5, a seguir.

TABELA 9.4.5
SOBRE INTERFERÊNCIAS NA VARIÁVEL ANOS DE
ESCOLARIZAÇÃO: DADOS DAS MULHERES
NÍVEIS DE ANÁLISE ANOS DE ESCOLARIZAÇÃO
1a 4 5a 8 9 a 11
Prob. 1 (isoladas) 0,32 0,56 0,62
Prob. 2 (c/ Marcas) 0,29 0,58 0,64
Prob. 3 (c/ Saliência) 0,28 0,58 0,64
Prob. 4 (c/ Relação) 0,28 0,59 0,64
Prob. 5 (c/ Faixa etária) 0,28 0,58 0,64
Prob. 6 (c/ MERCADO) 0,35 0,55 0,61
Prob. 7 (c/ Função) 0,35 0,54 0,61
Prob. 8 (c/ Contexto seguinte) 0,35 0,54 0,61
Prob. 9 (c/ Mídia) 0,35 0,53 0,62
Prob.10 (c/ Sensibilidade) 0,35 0,53 0,62

Pelos diversos níveis probabilísticos da tabela 9.4.5, podemos

verificar que a única pequena modificação que merece menção é a que se

constata em Prob.6, quando se comparam as variáveis Anos de

escolarização e Mercado ocupacional, o que, entretanto, não compromete a

hierarquia existente. A variável Anos de escolarização nos dados das

mulheres apresenta, portanto, um comportamento uniforme do ponto de vista

da hierarquia entre os pesos probabilísticos atribuídos aos seus três


497

fatores. Estatisticamente, verifica-se, portanto, a atuação ativa desta variável

sobre o comportamento lingüístico das mulheres e a sua inexistência sobre o

dos homens.

Além disso, observamos que, se, para as mulheres, Anos de

escolarização é uma variável selecionada em segundo lugar com

significância 0,0, para os homens, esta variável é selecionada em décimo

lugar com significância 0,049. A variável social que assume a liderança de

seleção nos dados dos homens é o Mercado ocupacional que vem em

terceiro lugar com significância 0,0. Nos dados das mulheres, com igual

significância (0,0), ela só é selecionada em sexto lugar.

Os resultados lingüísticos a respeito da relação entre Anos de

escolarização e Sexo têm a sua contraparte na realidade social em que

vivemos. É do senso comum que as mulheres são mais aplicadas na escola

que os homens: vivemos dentro de uma sociedade que tem como

convenção tácita que elas devem se submeter mais às regras do que eles.

Isto se reflete de forma realmente clara nos novos resultados estatísticos

aqui obtidos. As mulheres não apenas usam mais formas de prestígio, mas

se deixam influenciar mais pelo processo de escolarização do que os

homens, na relação que se pode estabelecer entre este processo e o uso de

formas de prestígio.

Vejamos agora como ficam os resultados para Mercado ocupacional,

Mídia e Sensibilidade lingüística para as mulheres e para os homens, na

tabela 9.4.6.
498

TABELA 9.4.6

RELAÇÃO ENTRE VARIÁVEIS NÃO CONVENCIONAIS E SEXO


COTAÇÃO NO SEXO
MERCADO
OCUPACIONAL
Feminino Masculino
Freq. % Prob.1 Prob.10 Freq. % Prob.1 Prob.10

Positiva 1081=87 0,64 0,69 835=75 0,60 0,73


1248 1113

Negativa 968=68 0,37 0,29 963=56 0,39 0,31


1424 1729

Intermediária 2348=78 0,49 0,52 1666=68 0,52 0,44


3007 2447

COTAÇÃO DA
SENSIBILIDADE
LINGÜÍSTICA

Positiva 2073=81 0,53 0,48 1509=67 0,64 0,76


2563 2262

Negativa 340=57 0,46 0,56 586=69 0,42 0,33


594 848

Intermediária 1984=79 0,51 0,46 1369=63 0,44 0,40


2522 2179

COTAÇÃO DA
EXPOSIÇÃO
À MÍDIA

Positiva 1625=79 0,60 0,54 1010=76 0,51 0,41


2063 1333

Negativa 617=74 0,33 0,51 182=61 0,53 0,60


834 298

Intermediária 2155=77 0,57 0,45 2772=62 0,46 0,49


2782 3658

Os resultados da tabela 9.4.6 mostram que, no que diz respeito ao


peso probabilístico dos fatores, o Mercado ocupacional exerce influência
semelhante para os homens e para as mulheres, o que evidencia a força
499

uniforme das pressões sociais na relação entre tipo de profissão e uso de


formas de prestígio.

Os resultados da variável Sensibilidade lingüística mostram que os

dados dos homens refletem maior correlação entre esta variável e uso

lingüístico de formas padrão. Os que foram cotados como sensíveis fazem

bem mais concordância do que os cotados como menos sensíveis. Isto não

significa que as mulheres sejam menos sensíveis. Os resultados

probabilísticos indicam que elas apenas não reagem a esta situação da

forma esperada. Em Prob.1, as probabilidades das mulheres com relação à

Sensibilidade lingüística estão na linha por nós esperada, embora com

oposição pouco polarizada; e, na etapa em que se mede também o efeito de

Mercado ocupacional, os pesos probabilísticos são invertidos.

A Mídia, por sua vez, exerce leve influência sobre as mulheres na

direção esperada, pois as mulheres com cotação positiva fazem um pouco

mais concordância do que as mulheres com cotação negativa. Todavia, a

influência da Mídia sobre os homens chega a ser inesperada. Os homens

com cotação negativa fazem mais concordância do que os homens com

cotação positiva.

As nossas expectativas eram que o efeito da Sensibilidade lingüística

e da Mídia fosse semelhante para os homens e para as mulheres. Os

resultados relativos à Sensibilidade lingüística são inesperados para nós.

Pelo comportamento das mulheres, relatado neste trabalho e em toda a

literatura lingüística, esperávamos que elas também reagissem

positivamente. Pesquisas futuras precisam ser empreendidas para que se

verifique a consistência destes resultados. Só então poderemos buscar

explicações sociolingüísticas razoáveis. Com relação à influência da Mídia,

levemente positiva para elas e negativa para eles, pode-se levantar a


500

hipótese de que o fato de as mulheres ficarem expostas durante mais tempo

à televisão do que os homens, vendo principalmente novelas, determine esta

diferença. A maior exposição da mulher à televisão foi constatada nas

entrevistas pela equipe do Projeto Censo. Cumpre observar, todavia, que as

probabilidades associadas aos dados das mulheres são extremamente

próximas, contrariando as nossas expectativas de que haveria uma oposição

mais acentuada.

Já observamos que a análise da influência das variáveis não

convencionais por subagrupamentos de indivíduos só foi possível em função

do Sexo. Isto ocorreu por causa da distribuição diversificada dos falantes,

natural em variáveis sociais não estratificadas. A distribuição do Mercado

ocupacional, Mídia e Sensibilidade lingüística em função do Sexo mostrou-

se regular, mas, com relação à Faixa etária e aos Graus de escolarização, o

mesmo não ocorreu. Entre o Mercado ocupacional e Escolarização, por

exemplo, existe uma forte correlação: dentre os 10 falantes cotados

positivamente, seis têm nove a 11 anos de escolarização e apenas um tem

um a quatro anos e, inversamente, para os 15 falantes cotados

negativamente, apenas um está com nove a 11 anos de escolarização,

enquanto 11 estão com um a quatro anos. Esta correlação estreita entre

Mercado ocupacional e Anos de escolarização dos falantes não permite

análises em função de novos subagrupamentos. Distribuição diversificada

existe também entre Anos de escolarização, Mídia e Sensibilidade lingüística,

por um lado, e entre Faixa etária, Mercado ocupacional, Mídia e

Sensibilidade, por outro lado. Por tais razões, limitamo-nos a apresentar


501

os resultados gerais e os resultados por Sexo que apresentam uma

distribuição regular com todas as novas variáveis, mostrando resultados

estatisticamente mais confiáveis e sociolingüisticamente interpretáveis.

Estamos certos de que os resultados aqui obtidos para as variáveis

não convencionais mostram que variáveis desta natureza merecem continuar

a ser investigadas. Pesquisas futuras podem ser empreendidas,

estratificando a amostra em função deste tipo de variável. Desta forma, ter-

se-iam as condições ideais para se refutarem ou não as conclusões por nós

obtidas, através de resultados estatísticos mais representativos. Resta ver

como ficaram os resultados da variável Faixa etária, agora fortemente

curvilinear, em função do Sexo. Os resultados podem ser vistos na tabela

9.4.7, a seguir.

TABELA 9.4.7
FAIXA ETÁRIA E SEXO
FAIXA SEXO
ETÁRIA
Feminino Masculino
Freq. % Prob.1 Prob.10 Freq. % Prob.1 Prob.10

15/25a 1195=72 0,43 0,33 1049=71 0,56 0,44


1656 1470

26/49a 1702=84 0,68 0,60 1189=66 0,49 0,63


2034 1811

50/71a 1500=75 0,47 0,49 1226=61 0,44 0,43


1989 2008

Os resultados acima, nas suas probabilidades finais, trazem para


502

nós um fato novo: padrão etário curvilinear também para os homens. Este

padrão já se mostrava nos dados das mulheres em uma análise por Sexo

somente com as variáveis tradicionais, não apresentadas em detalhes no

corpo deste trabalho, com os seguintes resultados: 0,42; 0,60 e 0,48 para,

respectivamente, mulheres de 15/25 anos; de 26/49 e 50/71. Esta mesma

análise, para os homens, não revelara o mesmo padrão, o qual se mostrava

muito pouco marcado, com um leve aumento de concordância na faixa mais

jovem, em direção, portanto, a um sistema com marcas. Os resultados

probabilísticos para as respectivas idades no caso dos homens eram: 0,57

(15/25 anos); 0,48 (26/49) e 0,45 (50/71 anos), o que também se pode

observar nos valores probabilísticos de Prob.1 da tabela 9.4.7: 0,56; 0,49 e

0,44, respectivamente.

O que vai alterar o padrão levemente inclinado para os homens é

exatamente a entrada das novas variáveis, conforme podemos observar na

tabela 9.4.8.

TABELA 9.4.8
SOBRE A FAIXA ETÁRIA NOS DADOS DOS FALANTES DO SEXO
MASCULINO
FAIXA PROBABILIDADES
ETÁRIA
Isoladas c/Mercado c/Sensibilidade c/Mídia
15/25a 0,56 0,47 0,49 0,46
26/49a 0,49 0,55 0,58 0,60
50/71a 0,44 0,48 0,42 0,43

As variáveis Mercado ocupacional, Sensibilidade lingüística e Mídia

provocam alterações nos valores probabilísticos inicialmente associ-


503

ados aos fatores da variável Faixa etária. As últimas alterações, com

probabilidades finais - 0,43; 0,63 e 0,43 - são provocadas pela variável Anos

de escolarização.

Diante de tais resultados, a conclusão mais segura a se estabelecer

sobre o fenômeno em estudo seria a de variação sociolingüística estável com

gradação etária, e influências de outras variáveis de papel estritamente

sincrônico, como Mercado ocupacional, Sensibilidade lingüística e Mídia.170

Todavia, vimos no capítulo anterior que, além do padrão etário

curvilinear para os falantes de ambiente não humilde e concordância alta,

emerge também um padrão etário inclinado em direção a um sistema de

perda nos falantes de concordância baixa. Para confirmarmos este segundo

padrão, o ideal seria termos os subagrupamentos por ambiente, grau de

concordância e sexo, distribuídos regularmente em termos das demais

variáveis. Conjuntamente com as novas variáveis, isto é impossível pelo

pequeno número de falantes. Mesmo com apenas as variáveis tradicionais,

o número de falantes por célula já é bastante desigual, como podemos ver

no quadro 9.4.9, a seguir.


504

QUADRO 9.4.9
DISTRIBUIÇÃO DOS FALANTES POR AMBIENTE, GRAU DE
CONCORDÂNCIA E SEXO
AMBIENTE E
GRAU DE SEXO
CONCORDÂNCIA
Feminino Masculino
Humilde 5 5
Baixa
Não humilde 10 1
Alta
Humilde 2 4
Alta
Não humilde 1 3
Baixa
Total 18 13

Os subagrupamentos que podem nos trazer algumas evidências mais

seguras sobre o ponto em discussão são os seguintes:

1) mulheres de ambiente humilde e concordância baixa (5);

2) homens de ambiente humilde e concordância baixa (5);

3) mulheres de ambiente não humilde e concordância alta (10).

Dentre os três agrupamentos acima, apenas os das mulheres nos

permitem resultados menos problemáticos: elas apresentam uma distribuição

bastante uniforme em termos dos Anos de escolarização: dentre as cinco de

ambiente humilde, quatro são do primário e uma do ginasial e, dentre as dez

de ambiente não humilde, nove são do colegial e apenas uma é também do

ginasial. Além disso, apenas elas apresentam as três faixas etárias

relativamente bem distribuídas.


505

Sendo assim, vejamos os resultados para estes dois grupos de

mulheres na tabela 9.4.10.

TABELA 9.4.10
SOBRE O COMPORTAMENTO DAS MULHERES
TIPO AMBIENTE E GRAU DE CONCORDÂNCIA
FAIXA Ambiente humilde Ambiente. não humilde
ETÁRIA Concordância baixa Concordância alta
Apl./Total % Prob. Apl./Total % Prob.
15/25a 160/361 = 44 0,36 599/714 = 84 0,45
26/49a 164/302 = 54 0,56 934/1010 = 92 0,65
50/71a 201/375 = 54 0,58 789/924 = 85 0,42

ANOS DE ESCO-
LARIZAÇÃO

1a 4 440/868 = 51 (0,51) xxx


5a 8 85/170 = 50 (0,49) 534/598 = 89 (0,53)
9 a 11 xxx 1778/2050 = 87 (0,47)

Os resultados da tabela 9.4.10 corroboram os dois padrões

anteriormente encontrados: mulheres de ambiente humilde e concordância

baixa apresentam padrão inclinado em direção a um sistema de perda, e

mulheres de ambiente não humilde e concordância alta apresentam variação

sociolingüística estável com gradação etária, o que novamente nos permite

inferir que estes dois padrões ocorrem para todos os falantes de

concordância baixa e de concordância alta, respectivamente.


506

9.5 - Conclusão

À luz de todos os resultados e discussões apresentadas neste

capítulo e no capítulo anterior, concluímos

1) que há influências sociais de natureza estritamente sincrônica, do

tipo Mercado ocupacional, Mídia e Sensibilidade lingüística;

2) que a concordância de número entre os elementos do SN

apresenta dois padrões de comportamento: variação sociolingüística estável

para os falantes de alta concordância e processo de mudança lingüística em

direção a um sistema de perda para os falantes de baixa concordância e

3) que não há evidências de processos descrioulizantes, mas sim de

processos "aquisitivos" através da influência da escola ou de outras variáveis

de natureza semelhante, sem vinculação direta com a faixa etária.

Para se trazerem maiores esclarecimentos em relação às questões

que se colocam, restam ainda testes diversos a serem feitos. Avaliações

subjetivas pela comunidade lingüística, por exemplo, podem apresentar

pistas para se determinar a situação em que se encontra o fenômeno

lingüístico estudado (cf. LABOV, 1972, p.260-325; LABOV, 1981, p.184-96;

TARALLO & DUARTE, s/d). A realização de testes de avaliação também se

faz importante porque, embora o fenômeno por nós estudado seja

estigmatizado, o seu grau de estigmatização não é o mesmo em função de

um ou outro fator de uma ou outra variável. Cremos que a maioria dos

falantes não estranharia, por exemplo, a produção de dois cachorro-quente,

aquelas cruzinha toda; juntamos nossas trouxinha; umas comida braba; um

montão de bestera; uns cara brabão; um punhado de


507

carro parado; mas, certamente, estranharia os meu filho; os melhor jogador;

as ota pessoa; os três avião; as cultura local ou as própria contradição;

indubitavelmente, diria que não fazem parte da língua portuguesa estruturas

do tipo todos o garoto; o meu meninos e ainda lançaria uma interrogação

sobre a existência de na minhas coisas; na casa do meus pais. Há algumas

configurações sintagmáticas que se apresentam sem marcas até na escrita

pressupostamente padrão. Num bilhete de uma escola de classe média num

bairro da Zona Sul do Rio de Janeiro, pudemos ler, por exemplo, "três lápis

preto" (Jardim - segundo semestre), em 1987. Em 1988, numa lista de

material da mesma escola, continuamos a ler "8 lápis preto" (C.P. -primeiro

semestre), embora todas as demais estruturas da referida lista se

apresentassem com todas as devidas marcas de plural.

A nossa certeza sobre a importância de testes de avaliação subjetiva

é inquestionável, mas não tivemos ainda oportunidade de formalizá-los. Esta

questão tem aguçado o nosso interesse, não só pelo fato de termos

possíveis respostas para a relação entre variação e mudança, mas, também,

para refletirmos um pouco mais sobre a relação entre língua e sociedade,

principalmente numa sociedade em que tanto se estigmatizam os indivíduos

em função de seu comportamento lingüístico, alijando-os do processo

produtivo, por puro preconceito lingüístico. Recentemente, num conhecido

jornal do país, o Jornal do Brasil, deparamos com a transcrição de falas de

pessoas, presumivelmente não escolarizadas, onde se podia ver a estrutura

três negão daqueles bem grandão (cf. MONTINNI, JB, 06/03/87, Caderno

Cidade, p.1), que satisfaz a todos os


508

condicionamentos lingüísticos desfavorecedores de marcas de concordância.

No dia seguinte, este mesmo jornal, na mesma seção, apresenta uma

matéria sobre o mesmo assunto, não sabemos se feita pelo mesmo

jornalista, na qual utiliza a construção acima citada, devidamente com aspas,

mas na forma três negões daqueles bem grandões (cf. MONTINNI, JB,

07/03/87, Caderno Cidade, p.3). Por fatos simples como estes, o pesquisador

atento percebe o grau de preconceito lingüístico existente, mesmo nos

grupos profissionais que se utilizam da linguagem a todo momento e que

sabem muito bem o quão variada ela é, e sabem ainda mais que variação

não implica assistematicidade. No mesmo jornal, já tivemos oportunidade de

ler, há tempos atrás, que um senhor fugira do hospital porque o médico que

ia operá-lo não sabia fazer concordância nominal e verbal.171

Cumpre-nos dizer, finalmente, que uma outra conclusão inequívoca

se extrai dos resultados apresentados por nós neste capítulo: a variação

que envolve a concordância de número entre os elementos do sintagma

nominal, refletindo ou não processos de mudança lingüística, é inerente,

uma vez que a influência da maioria das variáveis lingüísticas se dá de forma

bastante consistente sobre os diversos subagrupamentos de falantes.

Podemos, então, realmente afirmar que as diferenças no comportamento

lingüístico dos diversos falantes do Português são mais quantitativas do que

propriamente qualitativas.
10 - CONCLUSÃO

Conforme explicitamos na Introdução deste trabalho, não dedicamos

uma parte específica para a interpretação lingüística dos resultados

estatísticos. No seu decorrer, ao final de cada tópico, fomos apresentando as

conclusões a que chegamos, bem como todas as suas implicações teóricas.

Por esta razão, limitamo-nos, no presente capítulo, a sintetizar as principais

idéias exaustivamente desenvolvidas nos capítulos 6, 7, 8 e 9, com a meta

de avaliar o alcance dos objetivos propostos e, conseqüentemente,

apresentar uma visão de conjunto do trabalho realizado.

Estamos certos de que os quatro objetivos propostos na Introdução

deste trabalho foram alcançados. Esta certeza decorre do fato de que,

primeiro, descrevemos e explicamos o conjunto de variáveis lingüísticas que

regem as tendências sistemáticas da variação que envolve a concordância

de número entre os elementos do SN; segundo, discutimos a hipótese

funcionalista kiparskiana e mostramos a necessidade da teoria lingüística


incorporar mais um princípio de natureza não gramatical, denominado

Princípio do Processamento com Paralelismo, para explicar fenômenos

diversos de línguas diversas; terceiro, demonstramos que o fenômeno

estudado apresenta a configuração de variação estável, para um subgrupo

de falantes, e de processo de mudança em progresso, para outro subgrupo,

evidenciando-se uma situação bem mais complexa do que a estabelecida


pelos estudiosos anteriores; e, quarto, mostramos que a influência de

variáveis lingüísticas importantes se dá de maneira uniforme sobre

agrupamentos de indivíduos, constatando-se a variação inerente.


510

Para alcançar o primeiro objetivo, analisamos os sintagmas nominais

relevantes sob duas perspectivas: uma atomística e outra não atomística.

Concluímos que as variáveis que atuam na perspectiva atomística

são as seguintes:

1) Marcas precedentes e posição;

2) Saliência fônica: dimensões processos e tonicidade;

3) Relação dos elementos não nucleares em função do núcleo e

posição dos elementos nucleares no SN;

4) Formalidade dos substantivos e adjetivos;

5) Grau dos substantivos e adjetivos;

6) Animacidade dos substantivos;

7) Contexto fonético/fonológico seguinte e

8) Função resumitiva.

Sob a perspectiva não atomística, constatamos a influência das

seguintes variáveis:

1) Pluralidade do contexto;

2) Configuração sintagmática do SN;

3) Saliência fônica: dimensão processos;

4) Grau/Formalidade do SN;

5) Pluralidade do SN;

6) Função textual e

7) Localização do SN.
511

Ainda sob esta segunda perspectiva, não se mostraram relevantes as

variáveis Status informacional do SN e Animacidade do SN.

Marcas precedentes e posição, a nível atomístico, e Pluralidade do

contexto, a nível não atomístico, evidenciam que, na relação entre os

elementos dentro do SN e na relação entre os SNs no discurso, marcas

conduzem a marcas e zeros conduzem a zeros. Estas duas variáveis

explicam-se em função do Princípio do Processamento com Paralelismo, que

subjaz à tendência de formas semelhantes se agruparem, através de

processos mentais associativos presentes no desempenho lingüístico.

A Saliência fônica, por sua vez, além de atuar sobre cada elemento

do SN, estende o seu efeito sobre a estrutura sintagmática como um todo.

Sendo assim, além do item lexical não regular ter mais chances de ser

marcado, um SN que contenha pelo menos um constituinte não regular

apresenta também mais chances de conter todas as marcas formais de

plural. A seqüência menos marcada é seguramente constituída de elementos

nominais regulares paroxítonos. A atuação desta variável explica-se pelo

Princípio da Saliência que consiste em estabelecer que formas mais

salientes são mais perceptíveis e, portanto, mais marcadas. No caso em

questão, marcam-se mais as construções que apresentem maior

diferenciação fônica na relação singular/plural ou que tenham marca de

acento na sílaba que recebe o morfema de plural.

A variável Relação dos elementos não nucleares em função do

núcleo e posição dos elementos nucleares no SN, a nível atomístico, e-


512

videncia que os elementos não nucleares antepostos são mais marcados do

que os pospostos e que os núcleos da primeira posição tendem a ser muito

marcados. Esta variável evidencia também que os núcleos da segunda e

terceira posição são menos marcados do que os da primeira, mas não são

igualmente marcados na relação entre si, chegando a se vislumbrar a

possibilidade de os núcleos da terceira posição serem mais marcados do que

os da segunda. A Configuração sintagmática, a nível não atomístico,

corrobora os resultados encontrados na análise atomística, evidenciando que

os SNs que se finalizam com um substantivo tendem a ser mais marcados do

que os que se finalizam com um adjetivo, um quantificador ou um

possessivo. O que explica tais fatos é o Princípio da Iconicidade, uma vez

que o número de marcas num dado segmento ou numa dada seqüência é

função do grau de coesão sintagmática entre os constituintes do SN. Quanto

maior a coesão, mais marcas e, quanto menor, menos marcas. Elementos

não nucleares antepostos estabelecem com seu núcleo maior grau de

coesão do que elementos não nucleares a ele pospostos. Da mesma forma,

sintagmas de mais de dois constituintes, cuja última categoria é um

substantivo, são de um tipo mais coeso do que aqueles cuja última categoria

é um não substantivo.

O Princípio do Processamento com Paralelismo explica a preferência

pelas configurações sss ou s00 e a raridade das configurações s0s ou 00s,

enquanto o Princípio da Iconicidade explica (1) a preferência pela estrutura

sss em SNs cujo último constituinte é um substantivo e (2) a preferência pela

estrutura s00 em SNs cujo último constituinte é um adje-


513

tivo, um possessivo ou um quantificador. O Princípio da Economia, ao qual

relacionam-se as Condições de Distintividade, amplamente utilizado para

explicar o comportamento da Posição que o elemento ocupa no SN ou da

Classe gramatical dos constituintes do SN, como variáveis isoladas, não tem

a posição de destaque que se supunha ter.

A Formalidade e o Grau dos itens lexicais, a nível atomístico, e a

Formalidade/Grau da estrutura do SN, a nível não atomístico, atuam tanto de

forma localizada quanto de forma global. Um item lexical informal ou

diminutivo/aumentativo ou um SN que contenha uma seqüência com pelo

menos um destes itens tende a desfavorecer a presença de marcas formais

de plural. A explicação que subjaz à atuação desta variável é novamente de

ordem não gramatical. É do nosso conhecimento que a formalidade da

situação tende a atuar sobre o comportamento da concordância nominal. Se

a situação é informal, colocam-se menos marcas e, se a situação é formal,

colocam-se mais marcas. Os itens ou estruturas caracterizadas como

informais e os itens diminutivos/aumentativos são próprios de um discurso

mais relaxado e, por isto, propiciam também menos marcas de plural nas

construções nominais.

A Animacidade dos substantivos se mostrou relevante na abordagem

atomística, mas não na abordagem não atomística, embora nesta segunda

perspectiva ainda se mantivesse com probabilidades diferenciadas até o final

da análise. Os substantivos com o traço [+humano] se apresentam

ligeiramente mais marcados do que os com o traço [-humano]. Como

a análise atomística envolve um número de dados consi-


514

deravelmente maior, podemos concluir que a modesta influência desta

variável só se mostra estatisticamente relevante quando há grandes massas

de dados envolvidas. A explicação para a sua influência encontra-se na linha

do Princípio da Saliência de forma mais ampla, considerando que o traço

[+humano] é mais saliente do ponto de vista discursivo.

A influência do Contexto fonético/fonológico seguinte mostra, mais

uma vez, que a busca do padrão silábico CV não norteia a

ausência/presença de marcas de plural no SN. O seu efeito mais forte se

evidencia de forma contrária, com consoantes seguintes favorecendo a

incidência de marcas e vogais desfavorecendo-a, nos itens em -S

(mês/meses). O que subjaz a esta forte influência é o fenômeno da

haplologia sintática, ou seja, a tendência a se eliminarem segmentos

formalmente idênticos que ocorrem de forma contígua. Os resultados desta

variável, considerando somente os itens regulares, não apresentam diferença

entre a presença de uma consoante ou de uma vogal seguinte,

evidenciando-se uma oposição binária entre pausa e não pausa.

Consoante e vogal - não pausa - desfavorecem a presença de marcas e a

pausa favorece-a. Todavia, esta atuação não é polarizada. Igualmente não

polarizada é a atuação que procurou-se verificar em função dos traços das

consoantes. Concluímos que os traços [surdo], [oral] e [velar] tendem a

favorecer ligeiramente a presença de marcas, enquanto os traços [sonoro],

[nasal] e [labial/dental] tendem a desfavorecê-la.

A fraca influência da variável Contexto fonético/fonológico seguinte,

ao lado da forte influência das variáveis Marcas, Relação e Saliência,


515

mostra que a variação que envolve a concordância de número no SN é,

neste estágio do Português, um fenômeno pouco influenciado por razões

fonológicas, sem fortes ligações com a queda do -S de natureza não

morfêmica. A concordância nominal é um fenômeno essencialmente

morfossintático, cujo funcionamento é explicado por forças alheias ao

sistema lingüístico propriamente dito.

Este fenômeno é de natureza morfossintática porque envolve, por

exemplo, categorias do tipo processos de formação do plural, grau dos itens

lexicais, classe gramatical dos constituintes do SN e relação entre estes

constituintes, em termos de posição dos elementos na estrutura sintagmática

e em termos de tipos e posição das marcas de plural, mas é explicado por

forças alheias ao sistema lingüístico propriamente dito, porque os princípios

gerais nele envolvidos - o princípio da Saliência, o Princípio da Iconicidade e

o Princípio do Processamento com Paralelismo - são de natureza não

gramatical, ou seja, são princípios gerais de motivação externa.

Em verdade, o fenômeno da concordância nominal transcende o

limite dos subsistemas lingüísticos tradicionais e se configura também como

um fenômeno discursivo, no sentido de que faz referência a relações que se

estabelecem além das fronteiras oracionais, do tipo a pluralidade do contexto

ao derredor das estruturas nominais analisadas.

A análise da Função sintática em termos tradicionais, sob a perspectiva

atomística, mostrou-se irrelevante para se determinar a incidência


516

de marcas plurais no fenômeno estudado. Ao final da análise, detectamos

apenas uma oposição binária: SNs de função resumitiva, desfavorecendo a

presença de marcas e SNs de função não resumitiva, favorecendo-a. A

explicação final para o funcionamento desta variável teve como base o

Princípio da Baixa Tensão ou o Princípio da Topicidade, uma vez que estes

SNs não são ponto de referência no discurso. A hipótese inicial para a

interpretação desta variável, na sua forma binária, baseava-se no Princípio

da Economia, uma vez que a maioria dos SNs resumitivos se limitam a

retomar conteúdos já transmitidos. A reanálise desta variável, denominada

de Função Textual, na parte não atomística, teve como objetivo perseguir a

idéia de que a concordância se faz menos nas situações em que os SNs

portam informação redundante. Os resultados alcançados não foram,

todavia, satisfatórios, uma vez que inconsistentes com os objetivos

pospostos. Concluímos que os resultados obtidos apontam para o fato de

que há outra espécie de regularidade lingüística por detrás desta variável,

que não conseguimos captar. Certamente não é uma questão ligada à

"tendência à eliminação de redundância". Na análise feita neste trabalho, sob

a perspectiva global, a Configuração sintagmática do SN, a Formalidade do

SN e a Localização do SN revelaram-se mais consistentes do que a Função

textual, a qual apresenta sobreposições com estas outras três variáveis.

O Princípio da Topicidade ou o Princípio da Baixa Tensão continuam,

todavia, a explicar o funcionamento da variável Localização dos SNs, uma

vez que os SNs que se encontram à esquerda da oração tendem a


517

ser mais marcados do que os que se encontram à direita ou em posição

neutra. Este fato é consistente com a idéia de que, em línguas de morfologia

não ergativa como o Português, Princípios desta natureza tenham maior

relevância. Conforme esta idéia, continua sendo consistente o fato de que a

variável Status informacional do SN tenha se mostrado uma variável de

influência irrelevante para o fenômeno da concordância nominal em

Português.

A Pluralidade do SN, de natureza não atomística, indicou que SNs

classificados como "mais de um não inerente" tendem a ocorrer

predominantemente com todas as marcas de plural, enquanto os

classificados como "partes do corpo" encontram-se no pólo oposto. Esta

variável, estudada de forma incipiente neste trabalho, aponta para um estudo

ainda não realizado: a análise dos SNs plurais em relação às suas possíveis

contrapartes singulares. Neste estudo, será necessário verificar os graus de

cristalização de determinadas estruturas que ocorrem predominantemente no

singular ou no plural. Um estudo desta natureza poderá trazer grandes


contribuições a respeito do que determina a escolha da estrutura singular ou

plural, esta parcial ou totalmente marcada, fora a necessidade de se

transmitir a idéia de "mais de um", comumente associada à marca formal de

plural.

Pela análise das variáveis lingüísticas que fizemos neste trabalho, e

que apresentamos em detalhes no capítulo 6 e resumimos nas páginas

acima, tivemos condições de atingir o nosso segundo objetivo: o de discutir a

hipótese funcionalista kiparskiana, associada ao Princípio da Economia.


518

Concluímos que as Condições de Distintividade ou o Princípio da

Economia têm a sua atuação, se é que a têm, apenas sobre a possibilidade

da concordância de número entre os elementos do SN em Português ser um

fenômeno variável. Mas, uma vez que o falante escolhe uma estrutura plural,

formal ou semanticamente marcada na primeira posição, o número de

marcas seguintes não se pauta pelo Princípio da Economia ou pelas

Condições de Distintividade, mas, sim, e principalmente, pelo Princípio do

Processamento com Paralelismo, pelo Princípio da Saliência e pelo Princípio

da Iconicidade.

Consideramos oportuno relembrar que, além das variáveis

analisadas, apresentamos dois tipos de argumentação independente que

evidenciaram a não atuação do Princípio da Economia ou das Condições de

Distintividade. Vimos que "a fronteira de morfema" não tem influência sobre a

presença ou não do -S, ao concluirmos que a presença do -S nos itens

regulares, onde ele é o único segmento que marca a pluralidade, ocorre

menos do que nos itens não regulares, onde ele é apenas um dos

componentes da marca de plural. Além disso, vimos que o tipo de

"indefinido" formalmente plural em SNs de dois constituintes não tem a

menor relevância sobre a marca no segmento seguinte. Não importa se o

indefinido é ou não semanticamente plural. Pela hipótese funcionalista

kiparskiana, resultados contrários aos por nós encontrados é que seriam

esperados.

Outros argumentos contra-funcionalistas, no sentido kiparskiano do

termo, encontram-se listados abaixo.


519

1) A Ausência de marca na segunda posição em SNs de estrutura

[artigo definido + possessivo + substantivo] independe da presença/ausência

de marca na primeira posição.

2) O fator "circunstancial" na variável Função textual apresenta a

probabilidade mais alta de todas.

3) A variável Formalidade dos substantivos evidencia maior

importância probabilística do que a variável Função resumitiva do SN na

análise atomística.

4) A variável Função resumitiva é a última variável lingüística a ser

selecionada na análise atomística.

5) Na análise não atomística, a variável Formalidade/Grau do SN

apresenta resultados mais consistentes do que a variável Função textual do

SN.

Desta forma, fica definitivamente descartada a relevância da hipótese

funcionalista kiparskiana como uma hipótese adequada para explicar, de

forma consistente, a ausência/presença de marcas de marcas formais de

plural nos elementos flexionáveis do SN em Português.

Dentre os três princípios arrolados acima para explicar o fenômeno

em questão, o Princípio do Processamento com Paralelismo tem especial

relevância neste trabalho, no sentido de que ele é capaz, não apenas de

explicar a atuação da variável Marcas precedentes e Posição, a nível

atomístico, e a Pluralidade do contexto, a nível global, mas, também, porque

ele se mostra eficaz para explicar o funcionamento de um expressivo

conjunto de fenômenos do Português do Brasil, bem como o funcionamento

de fenômenos de um número nada desprezível de línguas naturais.


520

A variável comum a todos os trabalhos observados no capítulo 7,

denominada de Paralelismo formal, consistentemente apresentada de forma

direta ou indireta, mostra que o Princípio do Processamento com Paralelismo

é um candidato a universal, atuando sobre o comportamento lingüístico e,

como tal, deve ser incorporado pela teoria lingüística. Até que ponto o

funcionamento deste princípio é capaz de afetar a forma da língua no

decorrer do tempo, é um estudo que está por se fazer. O fato é que a

concordância com o mais próximo em situações normalmente não previstas

já aparece em textos escritos, relidos e revisados. Inclusive no interior deste

trabalho, deparamos, por exemplo, após diversas releituras, com a seguinte

estrutura: "a presença de marcas levam a marcas e a presença de zeros

levam a zeros". Após a "devida" correção, a digitadora do texto corrigido nos

perguntara se nós não nos enganáramos na correção da passagem

supracitada para "a presença de marcas leva a marcas e a presença de

zeros leva a zeros". Fenômenos sistemáticos produzidos no desempenho,

mesmo com explicações de natureza não gramatical, têm de,

necessariamente, provocar alterações na forma da língua, no decorrer do

tempo.

O terceiro objetivo proposto envolve a relação polêmica entre

variação e mudança.

De uma forma geral, vimos que as variáveis Sexo e Grau de

escolarização desempenham papéis importantes no fenômeno estudado. As

mulheres e as pessoas mais expostas à escola se aproximam mais das

formas de prestígio. A explicação para este tipo de comportamento é


521

constante dentro da literatura lingüística: a pressão que a sociedade exerce

em direção às formas lingüísticas legitimadas tem o seu efeito mais efetivo

sobre as mulheres, mais sujeitas às regras, e sobre aqueles que freqüentam

a escola por mais tempo, local onde se atribui especial relevo às formas de

prestígio. A faixa etária, nesta perspectiva, ou seja, no conjunto dos dados,

foi a variável social convencional que menos influência revelou ter. Ela

apresentava uma configuração levemente curvilinear. O comportamento das

três variáveis convencionais parecia indicar, portanto, que a concordância de

número no SN refletia um estágio de variação sociolingüística estável.

Apenas uma análise sob uma perspectiva não usual, que levou em

consideração o ambiente de origem do falante e o seu grau de concordância,

se alto ou baixo, no interior de seu grupo, revelou a influência da faixa etária

de forma mais polarizada e mais interessante. Duas tendências inequívocas

se vislumbram no universo de nossos falantes:

1) variação sociolingüística estável, com gradação etária, para os

falantes de ambiente não humilde e de concordância alta;

2) processo de mudança lingüística, caminhando em direção a um

sistema sem concordância, para os falantes de ambiente humilde e

concordância baixa.

Os resultados da variável Saliência fônica para estes dois

agrupamentos de falantes, mais hierarquizados para o segundo grupo do que

para o primeiro, nos levaram definitivamente a inferir a existência de uma


522

mudança em progresso para o segundo grupo, ao lado da variação estável

para o primeiro.

A hipótese da descrioulização não pôde, portanto, ser confirmada

com os nossos resultados, quer sociais, quer lingüísticos. Na argumentação

lingüística, evidenciou-se também que as marcas não tendem a ocorrer

apenas na primeira posição do SN, mas em todos os elementos não

nucleares antepostos ao núcleo, independentemente da posição, o que

constitui mais uma evidência lingüística contra a hipótese da descrioulização.

O estudo de variáveis sociais não convencionais, atuando

sincronicamente, do tipo Mercado ocupacional, Mídia e Sensibilidade

lingüística, apresentou resultados interessantes, suscitando pesquisas

futuras com amostras estratificadas em função destas variáveis.

A variável Mercado ocupacional revelou-se de particular interesse,

considerando que seus resultados, além de indicarem que a cotação positiva

ou negativa favorece ou desfavorece, respectivamente, a presença de

concordância, evidenciaram, também, que o seu efeito sobre o

comportamento dos homens é mais contundente do que a influência da

escola. Evidenciaram, ainda mais, que as mulheres, além de receberem a

influência marcante da escola, recebem, também, a influência do Mercado

ocupacional no seu desempenho lingüístico.

O quarto e último objetivo, o de mostrar a variação inerente, foi

alcançado ao se detectar a influência uniforme da maioria das variáveis

lingüísticas sobre os agrupamentos de falantes. Evidenciamos esta

uniformidade explicitamente com duas das três variáveis lingüísticas mais


523

fortes: Marcas e Relação. A terceira variável lingüística forte - Saliência

fônica - mostrou algumas diferenças de atuação, mas é precisamente através

desta variável que se pode perceber a direcionalidade da mudança

lingüística que se encontra em andamento. Através dos resultados das

variáveis Marcas e Relação, e também da Pluralidade do contexto, pudemos

concluir que as diferenças entre os diversos subagrupamentos de falantes

são mais propriamente quantitativas do que qualitativas, ou seja, a variação é

inerente.

Somos levados a generalizar que, se um dado falante que faz muita

concordância deixar de fazê-la, ele deixará de colocar marcas de plural

precisamente nos ambientes lingüísticos menos propícios à existência de

marcas e, inversamente, o falante que faz pouca concordância, quando a

fizer, colocará marcas de plural precisamente nos ambientes lingüísticos que

mais provocam a presença de marcas.

Podemos, portanto, prever que, se o falante for do sexo feminino,

com alto grau de escolarização, de meia-idade, com cotação positiva no

mercado ocupacional - o protótipo do falante que faz muita concordância -,

ele tenderá a deixar de colocar marcas, por exemplo,

1) em elementos não nucleares pospostos ao núcleo;

2) em núcleos que ocupam a segunda posição;

3) em elementos da terceira posição precedidos de ausência de

marca na segunda posição;

4) em estruturas contendo seqüências de regulares paroxítonos;

5) em estruturas contendo itens lexicais informais ou

diminutivos/aumentativos;

6) em SNs que se encontram à direita da oração ou


524

7) em contextos discursivos de menor pluralidade.

Por outro lado, se o falante for do sexo masculino, com baixo grau de

escolarização, jovem ou velho, com cotação negativa no mercado

ocupacional - o protótipo do falante que faz pouca concordância -, ele

tenderá a colocar marcas, por exemplo,

1) em elementos não nucleares antepostos ao núcleo;

2) em núcleos que ocupam a primeira ou terceira posição;

3) em elementos da terceira posição precedidos de presença de

marcas na segunda posição;

4) em estruturas contendo itens não regulares;

5) em estruturas contendo itens não informais e de grau normal;

6) em SNs que se encontram à esquerda da oração ou

7) em contextos lingüísticos de menor pluralidade.

Podemos então concluir que, da descrição que fizemos, somos

capazes de prever, com baixa margem de erro, em que contextos lingüísticos

e sociais a marca de plural tenderá a ocorrer.

Finalmente, acreditamos ter demonstrado que este trabalho traz

contribuições a nível da descrição/explicação de gramáticas particulares e a

nível da teoria lingüística geral.


525

11 - NOTAS

11.1 - Notas dos capítulos 1 a 5

1A equipe científica do Projeto Censo é constituída pelos seguintes


professores:

1) Anthony Julius Naro (UFRJ- Faculdade de Letras);


2) Alzira Verthein Tavares de Macedo (UFRJ- Faculdade de Letras);
3) Charlotte Emmerich (UFRJ- Museu Nacional);
4) Giselle Machline de Oliveira e Silva (UFRRJ);
5) Maria Cecília de Magalhães Mollica (UFRJ - Faculdade de Letras);
6) Maria da Conceição Auxiliadora de Paiva (UFJF);
7) Maria Luiza Braga (UFF);
8) Maria Marta Pereira Scherre(UFRJ - Faculdade de Letras);
9) Nelize Pires de Omena (UFRJ - Faculdade de Letras);
10) Sebastião Josué Votre (UFRJ - Faculdade de Letras).

2 Os falantes de cinco anos de escolarização com *(asterisco) são do antigo


primário e, por isto, foram assim classificados.

3Construções do tipo a coisa bonita com sentido de plural não são


encontradas em Português, embora segundo Poplack elas existam no
Espanhol (cf., 1980a, p.61). Todavia, mesmo se existissem, não as
consideraríamos como casos de ausência de inserção de marca de plural,
mas como casos de plural semântico sem marca formal.

4What is less often recognized is than there exists another, fundamentally


different (though logically complementary) mode of theoretical linguistics. (...)
Its scientific objective is to describe, not analytic and theoretical constructs,
but linguistic phenomena themselves. (...) It seeks to make generalizations
about concrete phenomena in language (...). (NICHOLS & WOODBURY,
1985, p.2)

5Linguistic functionalism combines certain theoretical advances of formal


grammar with the concerns and theoretical advances of sociolinguistics and
ethnography of communication. It aims at closing the gap between the study
of language and the study of communication. (NICHOLS, 1984, p.98)

6(...) there is no functionalist theory, although there are preliminary outlines


and accounts of what such a theory would look like and what is would handle
(...) (NICHOLS, 1984, p.102)

7Functionalist statements may be divided into three types: conservative,


moderate, and extreme. The conservative type merely acknowledges the
inadequacy of strict formalism or structuralism, without proposing a new
526

analysis of structure. (...) The moderate type not only points out the
inadequacy of a formalist or structuralist analysis, but goes on to propose a
functionalist analysis of structure and hence to replace or change inherited
formal or structural accounts of structure. (...)
Extreme functionalism denies, in one way or another, the reality of
structure qua structure. It may claim that rules are based entirely on function
and hence there are no purely syntactic constraints; that structure is only
coded function, or the like. (NICHOLS, 1984, p.102-3)
8(...) the only forces which organize language are forces internal to the
system (...) Nothing penetrates from outside: neither iconic motivation nor any
other kind of external motivation. (DU BOIS, 1984, p.345)
9(...) all seemingly autonomous syntactic facts are actually the transparent
results of the speaker's functional goals, etc, so that no arbitrary syntactic
apparatus needs to be postulated for the language (...)
Here the only forces governing 'syntax' (which exists in the sense simply
of ordering of word tokens in utterances) are the positive forces of external
linguistics: perhaps biologically-based processing mechanisms, speaker
intentions, etc. (DU BOIS, 1984, p.345-6)
10No theory of discourse and grammar will ultimately be adequate (...)
without an explicit theory of the competition and systematic reconciliation of
external and internal motivations. (DU BOIS, 1984, p.347)
11If language is said to be adaptive, in that it responds to pressures from the
external 'environment', we must reject the theoretical framework of
autonomous structuralism, which is limited, in its attempts to account for the
structuring of language, to recognizing only system-internal motivating forces.
On the other hand, if language is a said to be system, and as such has on the
least a degree of continuity of existence, we must reject the theatrical
framework of transparent functionalism, which fails to account for the fact that
grammaticized categories (...) are retained for reuse (...) in a more or less
frozen (...) form. More importantly, perhaps, it fails to properly construe the
most fundamental internal aspect of grammar, the process of
grammaticization itself.
As an alternative to rigidly puristic versions of autonomous structuralism or
transparent functionalism, I suggest it will be most fruitful to seek a
synthesizing framework for linguistics, one capable of dealing with the
interaction of external and internal forces, and with their systematic resolution.
(...) Finally, we must seek to understand the nature of the complex interaction
between langue and parole, between discourse and grammar. (DU BOIS,
1984, p.362)
12(...) to add to the theory substantive conditions which pertain not to the
form of grammars (i.e., to the system of rules that generates a language) but
to their output. (KIPARSKY, 1972, p.195)
527

13 A simple illustration of the sort of phenomenon that I will be concerned


with here is found in those varieties of American English which have the rule
that drops word-final -t, usually optionally. Where this -t is the past tense
ending, some speakers drop it only when the present and past tense forms of
the verb show a different stem vowel (...)
The vowel of the stem cannot in the present theory of generative
phonology serve to determine whether or not -t may be dropped. (...) There is
no single point in the derivation at which the crucial information, whether a
vowel change has taken place, is available. (KIPARSKY, 1972, p.197)

14The rule is blocked (or, in some dialects, applied less frequently) when its
application makes the past and present forms indistinguishable
(pass:passed), but applies freely where this distinction is retained because of
the vowel difference (keep:kep'). (KIPARSKY, 1972, p.198)

15We have (...) distinctness conditions, which, as an initial approximation,


state that there is a tendency for semantically relevant information to be
retained in surface structure. (KIPARSKY, 1972, p.195)

16Retention of functional information in surface structure would appear to be


motivated by the requirements of speech perception (...) (KIPARSKY, 1972,
p.195)

17(...) functional factors are to work. (KIPARSKY, 1972, p.198)

18(...) substantive aspects of the morphological conditioning are constant


from language to language. (KIPARSKY, 1972, p.198)

19(...) 'functional' constraints are only operative when form and function go
hand in hand, when structure and meaning are perfectly parallel. (GUY,
1981a, p.345)

20(...) one linguistic (or formal) dimension does correspond directly to a non-
linguistic (or conceptual) dimension (...) (HAIMAN, 1983, p.781)

21(...) the distance between expressions corresponds to the conceptual


distance between the ideas they represent. (HAIMAN, 1983, p.782)

22(...) a correspondence between a linguistic dimension


(transparency/opacity, full/reduced form) and a conceptual dimension
(unfamiliar/familiar, unpredictable/predictable) (...) (HAIMAN, 1983, p.802)

23(...) one could argue that this correspondence is itself iconic at some level.
(HAIMAN, 1983, p.802)

24But the form is not an icon of the concept, or even of the familiarity of the
concept. Reduction of form is an ECONOMICALLY motivated index of
familiarity, not an iconically motivated index. (HAIMAN, 1983, p.802)
528

25(...) bears out the thesis that, the more unpredictable a piece of information
is, the more coding it requires. (HAIMAN, 1983, p.802)

26(...) the truth of the generally accepted axiom that what is predictable
receives less coding than what is not. (HAIMAN, 1983, p.807)

27Du Bois continua esta discussão na Language v.63, no.4, de dezembro


de 1987, em "The discourse basis of ergativity".

28The apparently 'free' variation disappears. Rather, clauses converge on the


basic pattern: a verb followed by one (or, less often, no) full noun phrase
direct argument. (...) But clauses with two full noun phrase direct arguments
are extremely rare. (DU BOIS, 1984, p.348)

29(...) they nevertheless part company in one crucial respect. The single
direct argument with intransitives is most commonly the subject, but with
transitives it is the object. These arguments together, of course, constitute the
class of absolutives in an ergative language like Sacapultec Hence, we
observe a natural unity in discourse to the category of absolutive: it is the
category in which full noun phrases appear. (DU BOIS, 1984, p.348)

30If we examine all the instances of nominal reference items in the


Sacapultec narratives which have the discourse pragmatic status 'new' (as
defined by Chafe 1976), we find that they appear very frequently in certain
grammatical categories but very rarely in others. In particular, new mentions
occur quite freely in the S or O roles (...) but almost never in the A role (...).
This preference of new mentions for the S and O roles. (...) is the basis for
the preference, described earlier, of full noun phrases for the S and O roles.
A new mention of a referent, of course, typically requires the explicit coding
information that a full noun phrase can provide, so that most new mentions
will be realized as full noun phrases (though the reverse implication need not
hold). Conversely, the fact that new information is virtually never introduced in
the A role accounts in large part of the relative scarcity of full noun phrases in
this position. (DU BOIS, 1984, p.349-50)

31We may thus hypothesize that the grammaticization of morphological


ergativity in Sacapultec is ultimately a crystallization of certain patterns in
discourse. (DU BOIS, 1984, p.353)

32(...) the preliminaries to a theory of competing motivations. (DU BOIS,


1984, p.353-9)

33Ver texto original no final da nota 11.

34Ver texto original na nota 10.

35Variável neste trabalho tem o mesmo significado de grupo de fatores.


529

36Trata-se de uma conferência intitulada "A Sociolingüística moderna", que


foi proferida no I Encontro Nacional de Lingüística realizado na PUC-RJ,
embora não se encontre publicado nos Anais deste encontro.

37 A versão 2S do programa VARBRUL não se encontra documentada. A


descrição do seu funcionamento, aqui apresentada, é fruto da experiência,
através de seu uso intensivo e das discussões travadas com o nosso
orientador Anthony J. Naro.

38 Sobre o teste de qui-quadrado, cf., BLALOCK JR., 1960, p.275-87 e


HOEL, 1968, p.197-211.

11.2 - Notas do capítulo 6

39 Embora animacidade não seja um termo usual em Português, não


encontramos outro mais adequado para fazer referência a esta variável.

40 Todavia, é importante relembrar que Braga não codificou formas do tipo


mese como plurais.

41(...) are certainly consistent with the salience hypothesis, but do not
constitute conclusive proof of its effect. (GUY, 1981a, p.189)

42(...) S-Deletion is rare in stressed syllables but occurs in a majority of


unstressed syllables. The same effect is observed, although reduced in
magnitude, in the data on plural marking,(...) (GUY, 1981a, p.163)

43 Itens do tipo próprio, negócio etc. foram classificados como paroxítonos,


por ser esta a sua produção mais natural na fala semi-espontânea.
Conseqüentemente, próprio foi também classificado como dissílabo.

44 O número total de dados da variável Número de sílabas nesta tabela (a


6.2.1.3, p.81) é diferente do total das tabelas anteriores, porque eles foram
obtidos através de uma fase não final. Na etapa final, esta variável já havia
sido também eliminada pela própria pesquisadora, como base nos resultados
estatísticos.

45 Sobre a influência da variável Relação ver item 6.2.3.7, p.198-241, neste


trabalho. Esta variável dá conta da classe gramatical e da posição dos
elementos no SN.

46 Scherre (1978) trabalhou com dados de seis dos 20 falantes que foram
pesquisados por Naro e Lemle, cujos resultados encontram-se em
Competências básicas do português. Guy (1981a) analisou os dados de
todos os 20 falantes.
530

47(...) the factor values would easily be swayed by random fluctuation in the
data and by differing coding systems used in the analysis of other constraints.
(GUY, 1981a, p.187)

48(...) means that there is a very strong colinearity between the factor value
for regular plurals and the input probability (...) In such a situation, small
changes in the data, even in other factor groups, can produce
disproportionately large shifts in the position relative of these two values, and
therefore in the other values in this factor group. (GUY, 1981a, p.188)

49In any case, our own results are to be preferred, since we have more data
(almost 30 than even Scherre) - the sovereign remedy for unstable statistics.
(GUY, 1981a, p.188)

50 Nesta tabela, nos dados dos nomes em -S, não se encontram os tipos
vez/vezes, os quais foram analisados separadamente.

51 Dos quatro falantes escolarizados da amostra de Scherre (1978), três


eram universitários e um cursava o fim do terceiro ano do segundo grau.

52(...) more information risks being lost in this context. (POPLACK, 1981,
p.164)

53An identical effect was found in several studies of Brazilian Portuguese


(Lemle and Naro 1977, Guy and Braga 1976, Votre 1978), and which Naro
has described in terms of phonic salience. (POPLACK, 1981, p.65)

54(...) this inhibitory effect occurs only where morpheme structure and
function coincide. (GUY, 1981a, p.165)

55(...) the weak categories are those which register information that is
relatively redundant. (KIPARSKY, 1972, p.206)

56 Esta é uma idéia de Naro que se aplica a formas verbais como


veio/vieram/vinheram, onde veio é preferido apesar da saliência.

57To test for statistical significance along these lines, we need only find the
difference of the logs of the likelihoods for the two analyses, since twice this
difference should approximate a chi-square distribution if no significant effect
results from the additional factors of the more complex model. The number of
degrees of freedom involved in the distribution is the number of factors
eliminated from groups-or, if an entire group is eliminated, one less than the
number of factors in the group. (NARO, 1981a, p.73)

58 Chegamos a fazer uma análise da posição não linear e constatamos que


é a posição linear o que mais importa. Os resultados desta discussão
encontram-se num relatório de pesquisa enviado ao FINEP, em 1985 (cf.
531

p.71-7), e não serão retomados aqui por não serem pertinentes para as
reflexões que fazemos nesta parte.

59 A forma de codificar a distância em Carvalho Nina é todavia um pouco


diferente. Isto novamente impõe ressalvas na comparação com os seus
resultados.

60 É bom observar que isto ocorre do ponto de vista do falante. Do lado do


ouvinte, elas podem ser necessárias para a análise da cadeia falada.

61 As probabilidades apresentadas pelos estudiosos que trabalham com a


regra de cancelamento, e não de inserção, como Poplack, por exemplo,
encontram-se invertidas para facilitar a comparação entre os resultados.
Aqui, esta inversão foi feita pelo próprio Guy. Sempre que necessário,
adotaremos este procedimento.

62 It is clear that the effects are virtually identical, except for first position.
The small discrepancy there is no doubt due to the frequent occurrence of the
determiner lo (from los) in Poplack's data. (GUY, 1981b, p.90)

63 É importante observar que terceira posição se refere, em verdade, aos


elementos que ocupam a terceira, quarta, quinta e sexta posições. O número
de dados destas três últimas posições é pequeno e na relação entre Classe e
Posição, por exemplo, tornam-se menores ainda. Por isto, na relação entre
Posição e qualquer outra variável, vamos trabalhar com as quatro posições
acima amalgamadas em uma só, sob o rótulo de terceira. Além disso,
relembramos que a simbologia xxx deve ser lida como: não ocorre este tipo
de dado.

64 Em 1981a, Guy considera também a variável Marcas precedentes sem


correlação com a posição, e não considera a variável Classe gramatical (cf.
GUY, 1981, p.157-93).

65 Apresentamos, a seguir, a tabela 6.2.3.3a com a distribuição dos dados


das crianças, para eventuais conferências.
532

TABELA 6.2.3.3a
DISTRIBUIÇÃO DOS DADOS DAS CRIANÇAS EM FUNÇÃO DA CLASSE
GRAMATICAL E DA POSIÇÃO DOS ELEMENTOS NO SN
CLASSE POSIÇÃO
Primeira Segunda Terceira Total
Substantivo 16= 89% 424= 40% 46= 53% 486= 42%
18 1057 86 1161
Categoria xxx 13= 65% 2=100% 15= 68%
Substantivada 20 2 22
Pronome xxx 3= 60% xxx 3= 60%
pessoal de 5 5
3a. pessoa
Adjetivo 4=100% 18=100% 16= 40% 38= 61%
4 18 40 62
Quantificador 23=100% xxx 1= 20% 24= 83%
23 5 28
Possessivo 42= 98% 24= 96% 2= 50% 68= 94%
43 25 4 72
Adjetivo 2 xxx 1=100% 0= 0% 1= 80%
1 1 2
Indefinido 80=100% 6= 68% xxx 86= 97%
80 9 89
Artigo e 672= 98% 14=100% xxx 686= 98%
demonstrativo 688 14 702
Total 837= 98% 503= 44% 67= 50% 1407= 66%
856 1149 138 2143

66(...) An immediately preceding marker leads more (when S, 0S e SS)


precede the token in question, deletion is disfavored (...), zeros leads to
zeros, an effect which is clearly structural (...), and counter-functional, in that
rather than favoring marking patterns with one inflectional marker of plurality,
it favors marking either everywhere(functionally redundant) or nowhere (loss
of function). (POPLACK, 1981, p.61; cf., também, 1980a, p.62-7; 1980b,
p.61-2.)
533

67(...) was found by Guy and Braga for Brazilian Portuguese, a language
that marks plurality on the NP and the VP in much the same way as
Spanish.(POPLACK, 1980a, p.64)
68 Nem sempre o numeral foi codificado isoladamente. A maioria dos
estudiosos codificou "segmento precedente não flexionável", incluindo o
numeral. Todavia, ele constitui a maioria absoluta dos casos.
69 Sabemos, hoje, que esta hipótese não é razoável, pois o /S/ no numeral é
muito pouco colocado por qualquer tipo de falante.
70The most obvious plural context in a person's speech would surely be in an
NP containing a number which specified some plural quantity. So in the
interview situation, the popular dialect speaker who was attempting to
accommodate his speech to the standard dialect of the interviewer could
plausibly be expected to "correct" more in this most obvious plural
environment. (Guy, 1981a, p.180)
71(...) it should not be able to skip over words, producing marked-unmarked-
marked sequences. (Guy, 1981a, p.169)
72 Há apenas dois casos deste tipo porque a ocorrência de estruturas com
teus é de baixa freqüência.
73The most favorable context for marker deletion is precisely when the two
preceding markers have already been deleted. (POPLACK, 1980a, p.62-3)
74 Os testes de percepção feitos por Poplack são relatados na versão
mimeografada do texto de 1980a, datada de 1977.
75 A análise de Guy (1981a) é baseada na de Braga (1977) e na de Scherre
(1978), sobre as quais já falamos. Como os dados de Scherre encontram-se
inseridos nos de Guy e como sua análise é um pouco mais simplificada,
preferimos adotar o seu sistema de codificação e comparar os resultados
aqui obtidos com os seus.
76Since there are so few data involved here, this should not introduce any
significant distortion. (GUY, 1981a, p.177)

77 Embora na tabela 6.2.3.24 haja apenas 60 dados para os adultos e 13


para as crianças, o número total com fatores que implicam presença de
marca categórica é, respectivamente, 135 e 25. Confira este total nas tabelas
6.2.3.14 e 6.2.3.19, p.181 e 194.

78 O número de nove variáveis para os adultos e oito para as crianças


ocorre devido ao fato de que esta etapa contém Processos e Tonicidade
como duas variáveis separadas (análise 1 da saliência). Fizemos também
outra etapa, considerando a transformação de Processos e Tonicidade como
uma só variável, denominada Saliência (análise 3 da saliência),
534

conforme visto no item 6.2.2.9. Os valores probabilísticos da variável Relação


em quaisquer destas etapas não apresentam alterações relevantes, pois,
quando elas ocorrem, são da ordem de centésimos.
79 Ver texto original na nota 21.

80 Os dados da tabela 6.2.3.27 são um pouco diferentes dos dados da


tabela 6.2.3.5 (ver página 157), porque, nesta etapa, eliminamos casos do
tipo coisas assim bonitas.
81(...) there seems to be a general tendency for particular grammatical
forms to cluster together. (...) result from a more mechanical constraint on
continuing with one form unless there is a reason to change (...).
(SCHIFFRIN, 1981, p.55-6)
82Though the functional factors have a lesser effect than the others, the
ranking of factors within the functional groups is clear. Additional plural
information favors marker deletion. Whereas when the only possibility for
plural marking is inflectional, within the NP itself, a marker tends to be
retained. This is a tendency, but it is a rather weak one. (POPLACK, 1980a,
p.62-3)
83(...) that speakers (...) consistently avoided suppressing all morphological
trace of the plural (...) (POPLACK, 1980a, p.63)
84(...) almost 1000 examples of NP strings containing two to three elements,
with no morphological marker at all. Moreover, the deletion rate (...) is even
higher when it is preceded by two zeros (94) than when it is preceded by one
(82). (POPLACK, 1980a, p.63)
85 Nesta parte, invertemos os resultados de Braga 1977.

86 As probabilidades duplas se referem a falantes escolarizados e semi-


escolarizados, respectivamente.
87(...) pause cannot a priori be predicted to have any general effect on
deletion rules. Rather, its effect appears to be arbitrarily defined for different
dialects: sometimes it is treated as non-syllabic, sometimes as non-
consonantal, and sometimes as simply unmarked. (GUY, 1981a, p.145)
88(...) deletion was found to occur more in prevocalic than in preconsonantal
position. (POPLACK, 1980a, p.62)
89 Invertemos também os resultados de Poplack (1981). Além disso, não
apresentamos os de Braga (1977), por não serem eles diretamente
comparáveis aos nossos.
90 Separamos, para os adultos, os SNs de função predicativa (161/223=72)
dos SNs de função dúbia: (539/788=68), mas por termos
535

excedido o número de células na rodada, tivemos de fazer amalgama-ções e


optamos por amalgamar estes casos.

91 Esta variável foi selecionada em 7º lugar num conjunto de nove variáveis


para os falantes adultos. No caso das crianças, ela não chegou a ser
processada pelo programa que faz a seleção das variáveis.

92(...) functional factors have a small but regular effect on deletion, in a


direction confirming a functional hypothesis. (...)
However, functional factors overall affect deletion less than any other factor
group studied, except following stress. (POPLACK, 1980a, p.62)

93(...) the functional factor (...) has a regular effect on marker deletion (...)
However, this is not an overriding tendency (...) They do not affect marker
retention much more than phonological and grammatical factors do.
(POPLACK, 1981, p.61)

94(...) actually does carry all the plural information that it must be conserved.
Thus functional considerations have not resulted in strictly grammatical (...)
conditioning determining the retention of (s).
Here we have a case where structural effects and informational effects
play competing roles, and where constraints of a purely phonological
nature are equally important. (POPLACK, 1981, p.61-2)

95 O item outro neste caso tem emprego substantivado como em "acontece


cum os otro."

96 Observamos que os pronomes pessoais também encontram-se incluídos


nesta etapa da análise. Todavia, eles perfazem apenas 45 casos nos dados
dos adultos e cinco nos dados das crianças. Observamos também que,
embora as variáveis Saliência fônica, Posição, Contexto fonético/fonológico
seguinte e Função resumitiva tenham sido também consideradas nesta
etapa, elas não serão novamente apresentadas, porque todos seus
resultados apresentam a mesma hierarquia dos anteriores e a maioria deles
permanecem praticamente inalterados.

97 Relembramos que a variável Função resumitiva foi também codificada


nesta etapa do trabalho. Embora haja uma certa sobreposição entre os
dados dos fatores [+resumitivo] e [+informal], em estruturas contendo o item
coisa, a Função resumitiva, junto a todas as variáveis, inclusive as sociais, foi
selecionada, nos dados dos adultos. Todavia, a sua seleção ocorreu em
último plano, e as probabilidades associadas aos fatores [+resumitivo] e [-
resumitivo] reduziram-se um pouco. De 0,38 e 0,62 (ver Tabela 6.2.5.3),
respectivamente, passaram a 0,43 e 0,57. Durante o reprocessamento dos
dados das crianças, perdemos a simbologia associada a esta variável. Mas,
com base nos resultados das crianças para os dois fatores desta variável
(0,41 X 0,53), cremos poder projetar também a sua seleção.
536

98The reason for including such a factor group is to investigate the issue of
functionalism: is a speaker constrained in some way to avoid deletion or
omission of elements bearing a high functional load? Poplack 1979
investigates this question in some detail, and concludes that functional factors
do significantly constraint deletion of plural -S: when there is additional plural
information present in the discourse, a given plural marker is more likely to be
omitted than when there is no such additional information. Poplack
investigated two types of plural information: morphological and non-
morphological. No significant differences between the two were reported, and
the position of the additional information was also apparently unimportant.
(GUY, 1981a, p.190)

99(...) for example, the presence and position of a plural-marked verb of


which the NP under consideration was the subject, the occurrence of the NP
as the complement of a copular sentence with plural subject and/or verb, and
the occurrence of lexical or semantic information which might indicate the
plurality of a word under consideration.(GUY, 1981a, p.190-1)

100This tendency goes against the functional hypothesis, because it favors


plural marking in precisely those contexts where there is other plural
information available. (...) This is analogous to the tendency towards string-
level concord, which Poplack reports for PRS. It could result from a kind of
stylistic effect: when a speaker endeavors to mark more plurals, he or she will
do so in both the NP and the VP simultaneously. (GUY, 1981a, p.191-2)
101The difference between the last two factors (no plural information and
following plural information) is not significant. The difference between the last
two factors and the first factor is statistically significant, but it has the grave
defect or segregating out only 1 1/2 of the data and opposing it to all the rest.
However, the results are in agreement with the previously noted tendency in
this dialect to mark plurality at the first opportunity, and the omit it at
subsequent 'redundant' sites. This at least follows the functionalist line:
there is a lower rate for plural marking in a context where the marker will
bear a lighter functional load. (GUY, 1981a, p.192-3)

102 A comparação de nossos resultados com os de Guy (1981a) é indireta,


porque esta parte de nossa análise é não atomística enquanto a análise de
Guy é toda atomística.

103 (...) functional factors have a small but regular effect on deletion, in a
direction confirming a functional hypothesis. Presence of additional plural
information, whether morphological or nonmorphological, favors deletion
somewhat, whereas absence of additional information favors retention.
However, functional factors overall affect deletion less than any other
factor group studied, except following stress. (...)
The purpose of the functional groups is to ascertain the effect of functional
factors on the elimination of redundancy. Though the functional factors have a
lesser effect than the others, the ranking of factors within
537

the functional groups is clear (...) this is a tendency, but is a rather weak one.
(POPLACK, 1980a, p.62)
104Functional considerations play a regular, though not overwhelming, role in
the retention of a plural marker, (...) Functional factors show no greater
effect on deletion of (s) from the NP than other factor categories studied.
(POPLACK, 1980b, p.379 e 383)
105Although functional factors are significant to deletion, in contrast with
aspiration, of plural (s), they do not affect marker retention much more than
phonological and grammatical factors do. (...)
It should be remembered that the functional hypothesis as stated (...) is
really that surface marking patterns, which can carry information will tend to
be conserved in the grammar. The weaker functional effect found here
against (s) deletion is not of this type. It is only in sentences where the (s)
actually does carry all the plural information that it must be conserved. Thus
functional considerations have not resulted in strictly grammatical (...)
conditioning determining the retention of (s).
Here we have a case where structural effects and informational effects
play competing rules, and where constraints of a purely phonological
nature are equally important. (POPLACK, 1981, p.61-2)
106(...) the S-Deletion rule is actually inhibited by the presence of a
morpheme boundary before the final S. (GUY, 1981a, p.164-5)
107(...) it could also be considered a functional constraint favoring retention of
grammatical information. (GUY, 1981a, p.165)
108 Este estudo não foi ainda feito por nós por limitação exclusiva de tempo,
uma vez que envolverá a análise de aproximadamente 6000 SNs de dois
elementos que se encontram no nosso corpus. Ele será feito brevemente.
109 Nesta etapa, não codificamos a tonicidade dos regulares. Mas, se
codificada, ela mostrará, indubitavelmente, resultados positivos.
110(...) is definable in terms of the notion cohesion, which is itself a relative
rather than absolute concept. Structural distance refers to the degree to which
two elements are integrated in terms of some grammatico-semantic relation
within a higher-level structure. (CORNISH, 1986, p.187)
111The lowest degree of structural distance existing between two elements is
represented by the mutual dependence of word-internal morphemes, between
which it is impossible to insert any element (...) This status is marked by the
lack of formal concord (...) (CORNISH, 1986, p.187)
112(...) can only precede their head noun, their mutual ordering being strictly
constrained (...) (CORNISH, 1986, p.187)
538

113(...) of concord relations between elements. The concord obtaining


between elements manifesting this degree of structural distance is always (as
expected) formal (i.e. purely grammatical) rather than referential-semantic in
character. (CORNISH, 1986, p.187)
114The third degree of structural distance is that represented by the relations
obtaining between phrases within a clause. The grammatical relations
obtaining between subjects and predicates (...) are reflected in their greater
propensity for concord in terms of their controller's relevant referential-
semantic features. (CORNISH, 1986, p.187)
115 Ver texto original na nota 107.

11.3 - Notas do capítulo 7


116A system-external functional force, once appealed to, cannot simply be
turned off at will. Volumes of so-called functionalism are filled with ingenious
appeals to perception, cognition or other system-external functional domains,
which are used to "explain" why the language in question simply has to have
the grammatical particularity that it does - when a moment's further reflection
would show that another wellknown language, or even just the next dialect
down the road, has a grammatical structure diametrically opposed in the
relevant parameter. (DU BOIS, 1984, p.353)
117 Relembramos que a primeira versão deste artigo é mimeografada e data
de 1977.
118Concord is redundancy, and contrary to what could be expected,
redundancy results, as a rule, from least effort: people do not mind repeating
if mental effort is thereby reduced (...) (MARTINET, 1962, p.55)
119 Não temos indicações bibliográficas precisas desse texto. Usamos uma
versão mimeografada. Neste texto, Labov já cita as conclusões de Poplack
publicadas em 1980a. Como já sabemos, há uma versão de Poplack
mimeografada, de 1977, que é basicamente idêntica à publicada em 1980a.
120Such parallelism of surface seems to be a powerful factor in determining
the choice of active or passive, and passive are favored when the logical
object moves into a position parallel with its co-referents.
The over-all distribution of this constraints proves to be somewhat larger
than the given vs. new effect. When coreferential noun phrases were located
in subject position in preceding clauses, the logical object of the agenteless
clause appeared in parallel subject position 58 of the time, that is, the passive
alternant was chosen, when this was not the case, the passive choice was
realized only 29 of the time. (WEINER & LABOV, 1977, p.32)
539

121(...) our earlier decision to treat the choice of active and passive as two
alternative ways of saying "the same thing", since it is conditioned by formal,
syntactic factors far more than the influence of given vs. new. One might
argue that parallel strings are also characteristic of semantically significant
choices: there is a cognitively determined tendency to keep talking about the
same thing. (WEINER & LABOV, 1977, p.38-9)
122The distribution of information in discourse is not without influence, but it
is a relatively minor factor compared to more mechanical tendency to
preserve parallel structure: first in the succession of passive constructions,
second in the retention of the same structural position for the same referent in
successive sentences. There is undoubtedly a stylistic factor operating.
(WEINER & LABOV, 1977, p.43)
123(...) there is a tendency of verbs in the same tense to cluster together.
Both HP and P verbs are more frequent when the prior verb is in the same
tense; in non-initial complicating action clauses, 62 of the 368 HP verbs occur
after an HP verb in the prior clause, and 82 of the 847 P verbs follow a P verb
in the prior clause. Thus sequence with rapid alternation between the HP and
the P verb are not typical.(SCHIFFRIN, 1981, p.51)
124The tendency for verbs in one tense of a cluster together is given a
functional, discourse-level explanation: maintenance of one tense groups
events into one scene or episode while switching separates events from one
another. (SCHIFFRIN, 1981, p.52)
125(...) supports Wolfson's hypothesis that tense switching separate events.
However, this does not mean that maintaining one tense has the opposite
function - that of uniting acts into one event. Rather, there seems to be a
general tendency for particular grammatical forms to cluster together. Thus
Weiner & Labov 1977 find that the probability of using a passive increases if a
passive has already occurred in the preceding discourse. And Sankoff &
Laberge 1978 report for French that, when on and tu/vous occur in a
sequence of conjoined or juxtaposed sentences, their switch rate is lower
than their over-all proportions. Such sequence constraints suggest that what
influences the first occurrence of a form need not to be the same as what
influence subsequent occurrences. It is perfectly possible that tense-switching
functions in discourse to separate events, but that staying in one tense does
not have a comparable discourse function. Rather, the latter may result from
a more mechanical constraint on continuing with one form unless there is
reason to change (...) (SCHIFFRIN, 1981, p.55-6)
126(...) states that the weaker the syntagmatic relationship between the two
tokens, the greater the chance of a switch of variant when the second token is
uttered. (SANKOFF & LABERGE, 1978, p.121)
540

127(...) when a single referent is the subject of two (or more) sentences, one
of which is embedded in the other. (SANKOFF & LABERGE, 1978, p.120)
128(...) when a single referent is the subset in a sequence of two or more
independent sentences which are conjoined or simply juxtaposed. (SANKOFF
& LABERGE, 1978, p.120)
129Is sequence constraint a form of text coherence, albeit quantitative,
operating on coreferential variables in adjacent syntactic units, or does it
simply reflect stylistic homogeneity within relatively short passages of
conversation? (SANKOFF & LABERGE, 1978, p.122)
130The first option is at least partly valid (...) the switching rates for
unconstrained pairs are not clearly different from the over-all proportion of the
variants, indicating little or no effect of stylistic homogenei-ty.(SANKOFF &
LABERGE, 1978, p.126)
131(...) The fact that there is a high probability of plural inflection for nouns
that are not preceded by a quantifier is in agreement with the functionalism
hypothesis. (LEFEBVRE, 1981, p.80)
132If we look at the contribution of the type of plural information contained in
the subject NP we find the following results. In cases where the subject
pronouns do not appear in surface structure, probability of plural inflection of
verbs is very high. This fact fits the functionalism hypothesis (...); conversely
in the case of a quantified noun or conjoined subject probability of inflection
for plural of verbs is low (...).
The remaining factors, however, do not confirm the funcionalist
hypothesis as well. This involves both cases for which there is no plural
information in the subject NP (...) and cases from which there is plural
information in the subject NP (...). The functionalist hypothesis would predict
that the former category would favor inflection of verbs for plural in order to
preserve plural information at the sentence level, while the latter category
would permit less inflection on the verb since plurality is already marked on
the subject. The results show the reverse tendency. I suggest the following
explanation for these facts: there seems to be a surface concord
phenomenon, which accounts for inflection of plural of verbs when the subject
NP is inflected for plural and absence of inflection when the subject NP is not
inflected. (LEFEBVRE, 1981, p.81-2)
133(...) tend to support the idea that "where you have overt agreement, you
can drop the subject " (...). Furthermore, one can now add that the more
overt the agreement is, the more subjects can be dropped. (NARO, 1981b,
p.356)
134(...) is not 'try to preserve marking' but 'try to eliminate redundancy'.
(NARO, 1981, p.354)
541

135If the only relevant consideration were preservation of explicit marking of


categories such as plural, the subject would appear more frequently than with
agreeing verbs because such categories are not marked in the desinence of
the nonagreeing form. Furthermore, we would expect more explicit subjects
with strongly nonagreeing verbs than with their weak counterparts. However,
none of these expectations are confirmed (...) (NARO, 1981, p.354)

136It is important to bear in mind, however, that in the real world there are
many nonagreeing verbs. The fact that these too allow empty subjects, and in
the same or greater proportions than agreeing verbs, shows that the overt
agreement hypothesis, even in its relativized version, is not correct. The
general underlying principle behind the behavior of both types of construction
is reduction in amount of surface marking. For agreeing verbs, this reduces
subject/verb redundancy and for nonagreeing verbs it reduces subject/verb
conflict. Notice especially that in this latter case, marking is reduced even at
the cost of loss of all surface marking of semantic categories. (NARO, 1981,
p.356)

137(...) a new subject referent and a referent which was mentioned three or
more clauses before would favor pronominal subjects. (LIRA, 1982, p.148)

138(...) the reverse happens. If the subject is present one clause before, the
pronoun has the highest probability of being realized. (LIRA, 1982, p.149)

139The fact that the pronominal subject occurs more often when the referent
was mentioned one clause before might be explained by some kind of
parallelism or agreement on the surface. (LIRA, 1982, p.150)

140(...) This indicate that the two rules tend to vary in tandem also appeared
in our examination of the NPA rule in Chapter Five. This might be a reflection
of degree of self-monitoring; a "stylistic" effect more subtle than we are able
to discriminate with our relatively crude, topic based measure of speech style.
(GUY, 1981, p.252)

141(...) So what we have, then, is a relatively strong covariance between NPA


and SVA, which can be summarized by saying that when the former has
failed to apply, the latter is also likely to fail to apply. These data of course
encompass only those sentences with a surface subject (...). (GUY, 1981,
p.254)

142 Este trabalho foi realizado sob a nossa orientação, no ano de 1987,
quando Lage foi nossa auxiliar de pesquisa com bolsa concedida pela UFRJ.

143 It has since become accepted practice to treat successive occurrences of


a variable, even in the same utterance, as independent binomial trials. Those
who use such a model realize, of course, that
542

various types of co-occurrence relationships may hold between neighboring


tokens of a variable (...). We generally proceed under this assumption
(independence), however, not only because it simplifies the analysis, but also
because in terms of their relative infrequency in the data, co-occurrence
relationships should not seriously affect the results of statistical procedures
for estimating the effects of other linguistic and sociolinguistic constraints.
(SANKOFF & LABERGE, 1978, p.119)

144 Ver texto original na nota 118.


145The formal opposition TRANSPARENT VS. OPAQUE will thus
correspond to the pragmatic opposition UNUSUAL VS. FAMILIAR. The
motivation for reduction, and hence for opacity, is presumably economic: (...)
'principle of least effort'. (HAIMAN, 1983, p.802)
146The general underlying principle behind the behavior of both types of
construction is reduction in amount of surface marking. For agreeing verbs,
this reduces subject/verb redundancy and for nonagreeing verbs it reduces
subject/verb conflict. Notice especially that in this latter case, marking is
reduced even at the cost of loss of all surface marking of semantic categories.
(NARO, 1981, p.356)
147(...) redundancy, not merely status as a morpheme, is the relevant factor
in the deletion. (...) Thus we may tentatively formulate a universal: "Deletion
of a morpheme segment is more likely than deletion of the corresponding
non-morphemic segment if the morpheme is redundant (...) (NARO, 1980,
p.166)
148However, we have also seen that, overall, functional factors affect marker
deletion less than any other factor group studied, with the exception of
following stress, a result that is not readily interpretable. Whether this is the
case because (s) deletion in Puerto Rican Spanish has not yet advanced far
enough to call functional factors into play remains to be investigated. The
results of this study, moreover, indicate that the problems raised by these
competing constraints on (s) deletion cannot be resolved conclusively by
examining the noun phrase alone. Answers to these questions may also
reside in another area of linguistic structure, such as the verb phrase. A
functional study of variability in verbal marking should allow us to draw clearer
conclusions about deletion and disambiguation in Puerto Rican Spanish.
(POPLACK, 1980a, p.66-7)
149 Embora o índice de concordância da fala dos analfabetos e,
principalmente, de área rural seja bem baixo, é importante verificar de forma
sistemática a influência das variáveis Marcas precedentes, Posição e Classe
gramatical, bem como a da Configuração sintagmática, da forma analisada
neste trabalho.
Carvalho Nina, por exemplo, ao trabalhar com os dados de falantes
analfabetos de área rural do Pará, conclui que os determinantes da segunda
posição antepostos ao núcleo ainda apresentam marcas: "os meus irmão",
embora os da terceira posição antepostos ao núcleo se
543

apresentem totalmente sem marcas, à semelhança dos determinantes


pospostos (cf. 1980, p.109-11). Além disso, Ponte, ao analisar os dados de
falantes semi-analfabetos de Porto Alegre, faz uma série de considerações
gerais sobre a estrutura sintagmática dos SNs coletados, apresentando
exemplos totalmente marcados do tipo "os primeiros três anos", "todos os
netos" e, até, "todos os princípios muito bons", fora uma série de outros
exemplos, com apenas uma marca, do tipo "muitos home sério" e "duas
sobrinha nossa" (cf. 1979, p.100-6), o que está perfeitamente de acordo com
os resultados obtidos na análise de nossos dados.
Seria interessante que os dados destas duas pesquisadoras pudessem
ser reanalisados de forma a serem comparáveis aos nossos. Isto nos
permitiria verificar a generalidade do Princípio da Iconicidade e do Princípio
do Processamento com Paralelismo nos dados dos falantes analfabetos e
semi-analfabetos do Norte e do Sul do país.

11.4 - Notas do capítulo 8


150Any statement about change is of course an inference, since change
could hardly be observed directly (...) (LABOV, 1981, p.177)
151(...) for communities where women favor the prestige form of stable
markers, a variable that shows women in the lead may very well be a new
change in progress (...) (LABOV, 1981, p.185)
152(...) only appears when certain combinations of the four basic factors, age,
economic activity, sex and schooling are taken into consideration. (KEMP,
1981, p.4)
153(...) older women are more sensitive to standard variants than men of the
same age group. Older women appear to use more standard variants in
normal conversation, but in addition, given the relative inconsistency from one
variable to another, it is most likely that they make greater use of style
shifting. (KEMP, 1981, p.4-5)
154A good many of the changes discussed under that heading are probably
not in progress at all, but variation that may have been stable for centuries.
(LABOV, 1981, p.177)
155(...) we will often be in the position of trying to make the best guesses we
can about change in progress from synchronic data. (LABOV, 1981, p.183)
156(...) degree of penetration into the culture of the surrounding higher socio-
economic levels, as reflected in his or her habits of television viewing.
(NARO, 1981a, p.86)
157On the one hand, we see in the variable the continuation of a slow
process of rule death, related to similar changes in the NP and elsewhere.
544

This variable is, so to speak, exterior to the speaker, impinging upon him or
her without any internal motivation. The orientation variable, on the other
hand, reflects a resurgence in the use of this same rule that comes from
within the speaker, depending upon his or her own cultural orientation.
(NARO, 1981b, p.87)
158If the vicarious orientation continues to spread among younger speakers,
given the relatively small age-differential, the situation could soon reach a
point where that group might produce a higher rate for agreement than the
older speakers. Since there are no social barriers between the two orientation
subgroups, at a certain point in time the resurgence in use of the agreement
rule might even spread throughout the younger group, independently of the
orientation variable, and produce a reversal in the trend toward the
elimination of the rule. Future studies will determine if there is any validity to
this speculation. (NARO, 1981b, p.88)
159(...) syntactic change starts at a point where surface differentiation
between the old and new systems is zero (or nearly so); later it spreads
throughout the language in inverse proportion to the degree of saliency of the
surface differences between these systems in each particular environment.
(NARO, 1981b, p.63; cf. também, p.96-7)
160(...) can be partially blocked for a certain period of time. It is only in the
long run, not in its initiation or progress, that linguistic change produces
relatively uniform and 'natural' results. (NARO, 1981b, p.97)
161Já discutimos amplamente este aspecto no item 6.1.2 deste mesmo
trabalho.
162(...)although we have no firm evidence, we suppose that syntactic change
actuated by learned reaction or hypercorrection would work in the opposite
way, turning up in the most salient environments. (NARO & LEMLE , 1976,
p.237 e 1977, p.267)
163(...) given only a synchronic cross-section of a variable phenomenon
obeying a saliency constraint there is no way of determining whether change
is currently in progress or has been interrupted for some reason before
reaching full generalization, just as it is in principle impossible to state what
the direction of change is (or was). Matters are further complicated by
consideration of the locus of change - in the community as a whole, in
subcommunities, or in individual. (NARO, 1986, p.1)
164(...) there was a convergence of motives for the actuation of loss of SVA
and NPA in Brazil: 1) natural internal development of the language (Naro
1981); 2) pidginization behavior on the part of Europeans (as shown in Naro
1978, but for an earlier period and under different social conditions); 3)
imperfect learning by speakers of vastly diverse linguistic backgrounds.
(NARO, 1986, p.10)
545

165 É possível ainda se interpretar que a metodologia estatística usada não


é adequada para este tipo de situação (cf. KAY, 1978).
166 Os resultados das crianças referentes á Saliência fônica não foram
apresentados por ser impossível separá-las em termos de graus de
escolarização ou de tipo de ambiente de origem, dada à escassez dos
dados. No grupo como um todo, elas apresentam basicamente a oposição
regular x não regular.
167 Ver texto original na nota 159.

168The group norms are not just artifacts of the macrocosmic viewpoint,
representing mere averages of a collection of widely scattered individual
norms. Rather, they recapitulate the generally uniform norms of individuals.
(GUY, 1980, p.12)

11.5 - Notas do capítulo 9


169 Esta classificação está sendo feita no presente momento pela equipe do
Projeto Censo, a qual está aprimorando o trabalho que envolve todas as
variáveis sociais não convencionais.
170 Renda e Ambição foram duas outras variáveis estudadas pelo Projeto
Censo que não se mostraram relevantes para o fenômeno da concordância
nominal. Observamos ainda que os resultados relativos às variáveis não
convencionais ora apresentados diferem um pouco dos que são encontrados
no Relatório final de pesquisa deste projeto, porque os desta etapa envolvem
todos os dados e todas as variáveis lingüísticas pertinentes.
171 Infelizmente não temos referência desta matéria.
12 - REFERÊNCIAS BIBLIOGRÁFICAS

ALI, M. Said. Gramática histórica da língua portuguesa. 7. ed. Rio de


Janeiro, Acadêmica, 1971. 375p.

AMARAL, Amadeu. O dialeto caipira. São Paulo, O Livro, 1920.

BECHARA, Evanildo. Moderna gramática portuguesa. 27. ed. São Paulo,


Nacional, 1982. 374p.

BIDERMAN, Maria Tereza Camargo. Lingüística matemática e


computacional. Estudos Lingüísticos, São Paulo, Centro de
Lingüística Aplicada do Instituto de Idiomas Yásigi, 1968. v.III .1-2,
p.11-7.
BLALOCK Jr., Humbert M. Social statistics. 2. ed. Washington, MacGraw-
Hill, 1972. 583p.

BRAGA, Maria Luiza. A Concordância de número no sintagma nominal no


triângulo mineiro. Dissertação de Mestrado, PUC, Rio de Janeiro,
1977. 88p. mimeo

BRAGA, Maria Luiza. Left-dislocation and topicalization in capederdean


creole. Ph.D. Dissertation, University of Pennsylvania, 1982. 172p.
mimeo

_____. Construções de tópico de discurso. In: NARO, Anthony J. Et alii.


(coord.). Relatório final de pesquisa: Projeto subsídios do Projeto
Censo à educação. Rio de Janeiro, UFRJ, 1986. v.III. p.393- 453.
mimeo

BRAGA, Maria Luiza. & SILVA, Giselle Machline de oliveira e. Novas


considerações a respeito de um velho tópico: a taxonomia
novo/velho. Lingüística: questões e controvérsias. Uberaba,
Faculdades Integradas de Uberaba, 1984. Série Estudos-10, p.27-40.

BRAGA, Maria Luiza. & SCHERRE, Maria Marta Pereira. A concordância


de número no SN na área urbana do Rio de Janeiro. In: ENCONTRO
NACIONAL DE LINGÜÍSTICA, 1o, 1976. Anais ... Rio de Janeiro,
PUC, 1976. p.464-77.

CALLOU, Dinah Maria Isensee. Variação e distribuição da vibrante na fala


urbana culta do Rio de Janeiro. Tese de Doutorado, UFRJ, Rio de
Janeiro, 1979. 199p. mimeo

CÂMARA Jr., J. Mattoso. Estrutura da língua portuguesa. 5. ed.


Petrópolis, Vozes, 1975.

_____. Introdução às línguas indígenas brasileiras. Rio de Janeiro, Ao


Livro Técnico S/A, 1977. 230p.

_____. História e estrutura da língua portuguesa. 2. ed. Rio de Janeiro,


Padrão, 1976. 262p.
547

_____. Dicionário de lingüística. Petrópolis, Vozes, 1977. 266p.

CARVALHO NINA, Terezinha de Jesus. Concordância nominal/verbal do


analfabeto na micro-região de Bragantina. Dissertação de Mestrado,
PUC, Rio Grande do Sul, 1980. 165p. mimeo

CEDERGREN, Henrietta J. The interplay of social and linguistic factors in


Panama. Cornell University, Ph.D. Dissertation, 1973.

CEDERGREN, Henrietta J. E SANKOFF, David. Variable rules:


performance as a statistical reflexion of competence. Language,
50(2):333-55, jun. 1974.

CHAFE, Wallace L. Giveness, constrastiveness, definiteness, subjects,


topics, and point of view. In: LI, Charles (ed.). Subject & topic. New
York, Academic Press, New York, 1976. p.27-55.

CHAMBERS, J.K. & TRUDGILL, Peter. Dialectology, 1. ed. Cambridge,


Cambridge University Press, 1980. 218p.

CHOMSKY, Noam. Aspectos da teoria da sintaxe. Coimbra, Arménio


Amado, 1965. 372p.

CORNISH, Francis. Anaphoric relations in English and French: a


discourse perspective. Great Britain, Biddles Ltd, Guildford and
Kingis Lynn, 1986. 242p.

CUNHA, Celso e CINTRA, L.F. Nova gramática do português


contemporâneo. Rio de Janeiro, Nova Fronteira, 1985.

DU BOIS, John W. Competing motivations. In: HAIMAN, John. Iconicity in


syntax. Amsterdam, John Benjtiming, 1984. P.342-65.

_____. The discourse basis of ergativity. Language, LSA, 63(4):805-55,


dez. 1987

EMMERICH, Charlotte. Um traço propulsor numa língua de contato. In:


ENCONTRO NACIONAL DE LINGÜÍSTICA, 2o., Rio de Janeiro,
1977. Anais ... Rio de janeiro, PUC, 1977. p.393-9.

_____. A língua de contato no Alto Xingu - origem, forma e função. Tese


de Doutorado. UFRJ, Rio de Janeiro, 1984. 278p. mimeo

FASOLD. Ralph W. Linguistic Variation and linguistic competence. In:


SANKOFF, David. (eds.). Linguistic variation: models and methods.
New York, Academic Press, 1978. p.85-95.
548

FERNANDES, Francisco. Dicionário de verbos e regimes. Porto Alegre,


Globo, 1979.

FICHER, John L. Influências sociais na escolha de variantes. In:


FONSECA, Maria Estela V. & NEVES, Moena F. (orgs.).
Sociolingüística. Rio de Janeiro, Eldorado, 1974. p.87-98.

GIVÓN, T. Topic continuity in discourse: an introduction. In: GIVÓN, T.


(ed.). Topic continuity in discourse: a quantitative cross-language
study. Amsterdam and Philadelphia: Jonh Benjamins, 1983. p.1-45.

GORSKY, Edair Maria. Condições de entrada e continuidade do referente


em narrativas orais. Dissertação de Mestrado, UFRJ, Rio de Janeiro,
1985. 140p. mimeo

GRYNER, Helena. A variação de concordância com verbos pessoais na


cidade de Petrópolis. Dissertação de Mestrado, UFRJ, 1977. 139p.
mimeo

GRYNER, Helena. & MACEDO, Alzira Tavares de. La prononciation du s


post-vocalic: deux processus de changement linguistic en portugais.
In: SANKOFF, David & CEDERGREN, Henrietta. (eds.). Variation
Omnibus. Canadá, Linguistic Research Inc., 1981. P.135-49.

GUY, Gregory R. Use and applications of the Cedergren- Sankoff variable


rule programs. In: FASOLD, Ralph W. & SHUY, Roger W. (eds.).
Analyzing variation in language. Georgetown, Georgetown University,
1975. P.59-69.

_____. Variation in the group and the individual: the case of final stop
deletion. In: LABOV, William. (eds). Locating language in time and
space. Philadelphia, University of Pennsylvania, 1980. P.1-36.

_____. Linguistic variation in Brazilian Portuguese: aspects of the


phonology, syntax, and language history. Ph.D. Dissertation,
University of Pennsylvania, 1981a. 391p. mimeo

_____. Parallel Variability in American dialects of Spanish and


Portuguese. In: SANKOFF, David. & CEDERGREN, Henrietta.
(eds.). Variation Omnibus. Canada, Linguistic Inc., 1981b. p.85-93.

_____. Saliency and the direction of syntactic change. University of


Sydney, Cornell University, 1986. 74p. mimeo

HAIMAN, John. The iconicity of grammar. Language, LSA 56 (3):515-40,


set. 1980.

_____. Iconic and economic motivation. Language, LSA, 59(4):781-819,


dez. 1983.

HOCHBERG, Judith G. Functional compensation for /s/ deletion in Puerto


Rican Spanish. Language, LSA 62(3):609-21, set. 1986.
549

HOEL, Paul G. Estatística elementar. 2. ed. Rio de Janeiro, Fundo de


Cultura S/A, 1968. 311p.

HOPPER, Paul. Aspect and fore grounding in discourse. In: GIVÓN, . ed.
Syntax and semantics. New York, Academic Press, v.II, Discourse
and Syntax, 1979. P.213-41.

HOPPER, Paul & THOMPSON Sandra. Transitivity in grammar and


discourse. Language, LSA, 56(3):251-99, set. 1980.

JAKOBSON, Roman. Lingüística e Comunicação. São Paulo, Cultrix,


1969. 162p.

KAY, Paul. Variable rules, community grammar, and linguistic change. In:
SANKOFF, David. (ed.). Linguistic variation: models and methods.
New York. Academic Press, 1978. p.71-83.

KAY, Paul & Mac DANIEL, Chad K. On the logical of variable rules.
Working papers in linguistic. Bloomington, Indiana University Press,
1977. p.1-21.

KEMP, William. Major sociolinguistic patterns in Montreal French. In:


SANKOFF, David & CEDERGREN, Henrietta. (eds.). Variation
Omnibus. Canada, Linguistic Research, Inc., 1981. p.3-16.

KIPARSKY, Paul. Explanation in Phonology. In: PETERS, Stanley. (ed.).


Goals of linguistic theory. New Jersey: Prentice Hall, 1972. p.189-
225.

LABOV, William. On the use of the present to explain the past. In:
HEILMANN, L. (ed.) THE ELEVENTH INTERNATIONAL CONGRESS
OF LINGUISTICS. Bologna- Florence, aug. 28 sept, 1972. v.2.
P.825-851.

_____. Sociolinguistic patterns. 3. ed. Philadelphia, University of


Pennsylvania Press, 1975a. 343p.

_____. Language in the inner city. 3. ed. Philadelphia, University of


Pennsylvania Press, 1975b. 412p.

_____. The social origins of sound change in: LABOV, William. (ed.).
Locating language in time and space. Philadelphia, University of
Pennsylvania, 1980. P.251-64.

_____. What can be learned about change in progress from synchronic


descriptions? In: SANKOFF, David. & CEDERGREN, Henrietta.
(eds.). Variation Omnibus. Canada, Linguistic Research, Inc., 1981.
P.177-99.
550

_____. Resolving the neogrammarian controversy. Language, LSA,


57(2):267-308, jun. 1981.

LAGE, Aleria Cavalcante. A concordância verbal no português com as


expressões de sentido quantitativo acompanhadas de complemento.
1º. Relatório de pesquisa apresentado à sub-reitoria de ensino para
graduados e pesquisa. (SR-2). UFRJ, 1987. 34p. mimeo

LEFEBVRE, Claire. Variation in plural marking: the case of cuzco


quechua. In: SANKOFF, David. & CEDERGREN, Henrietta.(eds.).
Variation Omnibus. Canada, Linguistic Research Inc., 1981. p.125-
33.

LEMLE, Miriam. A ordem dos adjetivos no sintagma nominal em Inglês e


Português: implicações para a teoria gramatical. In: ENCONTRO
NACIONAL DE Lingüística, III, Rio de Janeiro, 1979. Anais ... Rio de
Janeiro, PUC, 1979. p.6-31.

_____. Análise sintática (Teoria geral e descrição do português). São


Paulo, ática, 1984.

LEMLE, Miriam. & NARO, Anthony Julius. Competências básicas do


português. Relatório final de pesquisa apresentado às instituições
patrocinadoras Fundação Movimento Brasileiro (MOBRAL) e
Fundação Ford, Rio, 1977. 151p.

LIRA, Solange de Azambuja. Nominal, pronominal and zero subject in


Brazilian Portuguese. Ph.D. Dissertation. University of Pennsylvania,
1982. mimeo

LOBATO, Lúcia Maria Pinheiro. Sintaxe gerativa do português: da teoria


padrão à teoria da regência e ligação. Belo Horizonte, Vigília, 1986.
558p.

MACEDO, Alzira Verthein Tavares de. O uso do futuro do subjuntivo em


português: regularização de uma forma verbal. Tese de Doutorado,
UFRJ, 1981. 201p. mimeo

MARROQUIM, Mário. A língua do nordeste - Alagoas e Pernambuco. 2.


ed. São Paulo, Nacional, 1945.

MARTINET, André. A functional view of language, 1. ed. London, Oxford


University Press, 1962. 163p.

_____. Elementos de lingüística geral. Lisboa, Sá da Costa, 1973. 223p.

MELO, Gladstone Chaves de. A língua do Brasil. Rio de Janeiro, Agir,


1946.

_____. Gramática fundamental da língua portuguesa. 3. ed. Rio de


Janeiro, Ao Livro Técnico, 1978. 258p.

MOLLICA, Maria Cecília. Estudo da cópia nas construções relativas em


português. Dissertação de Mestrado, PUC, Rio de Janeiro, 1977.
86p. mimeo
551

MONTEIRO, Clóvis do Rêgo. A linguagem dos cantadores. Tese


apresentada em concurso à Congregação do Colégio Pedro II. Rio de
Janeiro, 1933.

MONTINNI, Marina. Transcrição de gravações. Jornal do Brasil, Rio de


Janeiro, 06 mar. 1987. p.1, Caderno Cidade.

_____. Reportagem sobre as gravações. Jornal do Brasil, Rio de Janeiro,


07 mar. 1987, p.3, Caderno Cidade.

NARO, Anthony J. The SWAMINC program. Rio de Janeiro,


Departamento de Letras, PUC, 1974. mimeo

_____. Review article. Linguistic variation, Models and methods. Edited by


DAVID SANKOFF. New York: Academic Press, 1978. Language,
LSA, 56(1):158-70, mar. 1980.

_____. Morphological constraints on subject deletion: In: SANKOFF,


David. & CEDERGREN, Henrietta. (eds.). Variation Omnibus,
Canada, Linguistic Research Inc., 1981b. p.351-8.

_____. The social and structural dimensions of a syntactic change.


Language, LSA, 57(1):63-98, 1981a.

_____. Comments on saliency and the direction of syntactic change by


Gregory R. Guy. Rio de Janeiro, dez. 1986. 11p. mimeo

NARO, Anthony J. & LEMLE, Miriam. Syntactic diffusion. In: STEEVER,


Sandord B. Et alii (eds.). Papers from the parasession on diachronic
syntax. Chicago, Chicago Linguistic Society, 1976. p.221-41.

_____. Syntactic diffusion. Ciência e cultura, 29(3):259-68, 1977.

NARO, Anthony J. & VOTRE, Sebastião J. SWAVA: Sistema


SWAMINC/VARBRUL (Manual do Usuário). UFRJ, 1980. mimeo

_____. Emergência da sintaxe como um efeito discursivo. In: NARO,


Anthony J. et alii. Relatório final de pesquisa: Projeto subsídios do
Projeto Censo à educação. Rio de Janeiro, UFRJ, 1986. V.III, p.454-
81. mimeo

NARO Anthony J. et alii. Relatório final de pequis: Projeto subsídios do


Projeto Censo à educação. Rio de Janeiro, UFRJ, 1986. v.I,II e III.
512p. mimeo
552

NASCENTES, Antenor. O linguajar carioca. 2. ed. Rio de Janeiro,


Organização Simões, 1953.

NICHOLS, Johanna. Functional theories of grammar. In: ANN-REV.


ANTHROPOL. Berkeley, University of California, Slavic Department,
1984. p.9-117.

NICHOLS, Johanna. & WOODBURY, A. C. Introduction. In: (eds.).


Grammar inside and outside the clause. London, Cambridge
University Press, 1985. p.1-14.

OLIVEIRA, Marco Antônio de. Sobre os reflexos sociais da mudança em


progresso. In: VEADO, Rosa Maria Assis. (org.). Ensaios de
lingüística. cadernos de lingüística e teoria da literatura. Belo
Horizonte, UFMG, (7):71-89, dez. 1982.

_____. Variável lingüística: Conceituação, problemas de descrição


gramatical e implicações para a construção de uma teoria
gramatical. Documentação de Estudos em Lingüística Teórica e
Aplicada. São Paulo, Editora da PUC, 3(1):19-34, fev. 1987.

OLIVEIRA FERNANDEZ, Maria do Carmo Leite de. et alii. Coisas sobre a


palavra coisa. In: ENCONTRO NACIONAL DA ANPOLL, Curitiba,
1986. Anais ... Curitiba, 1986 (a sair).

OMENA, Nelize Pires de. Pronome pessoal de terceira pessoa: suas


formas variantes em função acusativa. Dissertação de Mestrado,
PUC, Rio de Janeiro, 1978. 138p. mimeo

_____. A referência variável da primeira pessoa do discurso, no plural. In:


NARO, Anthony J. et alii. Relatório final de pesquisa: Projeto
subsídios do Projeto Censo à educação. Rio de Janeiro, UFRJ, 1986.
V.II, p.286-319. mimeo

PEREIRA, Carlos Eduardo. Gramática expositiva. 8. ed. São Paulo,


Nacional, 1949.

PEREIRA, Maria Angela Botelho. Gênero e número em Português. estudo


das relações forma-sentido na gramática. Tese de Doutorado, UFRJ,
Rio de Janeiro, 1984. 189p. mimeo

PERINI, Mário A. A gramática gerativa: introdução ao estudo da sintaxe


portuguesa. Belo Horizonte, Vigília, 1976. 254p.

PIKE, Kenneth L. Phonemics: A technique for reducing languages to


writing. Michigan, Ann Arbor-The University of Michigan Press, 1976.
p.67-173.
553

PONTE, Vanessa Maria Lôbo. A concordância nominal de uma


comunidade de Porto Alegre. Dissertação de Mestrado, PUC, Rio
Grande do Sul, 1979. 215p. mimeo

PONTES, Eunice Souza Lima. Sujeito: da sintaxe ao discurso. São Paulo,


ática, 1986. 287p.

_____. O tópico no português do Brasil. São Paulo, Pontes, 1987. 169p.

POPLACK, Shana. The notion of the plural in Puerto Rico Spanish:


competing constraints on /s/ deletion. In: LABOV, William. (eds.).
Locating language in time and space. Philadelphia, University of
Pennsylvania, 1980a. P.55-67.

_____. Deletion and disambiguation in Puerto Rican Spanish. Language,


LSA, 56(2):371-385, jun. 1980b.

_____. Mortal phonemes as plural morphemes. In: SANKOFF, David. &


CEDERGREN, Henrietta. (eds.). Variation Omnibus. Canada,
Linguistic Research Inc., 1981. p.59-71.

PRINCE, Ellen F. Toward a taxonomy of Given-new information. In:


COLE, P. (ed.). Radical pragmatics. New York, Academic Press,
1981. p.223-55.

ROCHA LIMA, Carlos Henrique de. Gramática normativa da língua


portuguesa. 23. ed. Rio de Janeiro, José Olympio, 1983. 506p.

ROUSSEAU, Pascale & SANKOFF, David. Advances in variable rule


methodology. In: SANKOFF, David. (ed.). Linguistic variation: models
and methods. New York: Academic Press, 1978. p.57-68.

SANKOFF, David. Varbrul Version 2. Centre de Réchérches


Mathématiques, Université de Montréal, 1975. mimeo

_____. Varbrul 2S. Programa não publicado e não documentado. 1979.

SANKOFF, David. & CEDERGREN, Henrietta. (eds.). Variation Omnibus.


Canada, Linguistic Research Inc., 1981.

SANKOFF, David & LABERGE, Suzanne. Statistical dependence among


successive occurrences of a variable in discourse. In: SANKOFF,
David. (ed.). Linguistic variation: models and methods. New York:
Academic Press, 1978. P.119-26.

_____. The linguistic market and the statistical explanation of variability.


In: SANKOFF, David. (ed.) Linguistic variation: models and methods.
New York: Academic Press, 1978. p.239-49.

SARAIVA, Maria Elizabeth Fonseca. & BITTENCOURT, Vanda de


Oliveira. A concordância verbal em estruturas com SN complexo em
português: um caso de interferência de fatores metonímicos e
metafóricos. Belo Horizonte, UFMG, 1987. 42p. mimeo
554

SAUSSURE, Ferdinand de. Curso de lingüística geral. 5. ed. São Paulo,


Cultrix, 1973. 279p.

SCHERRE, Maria Marta Pereira. A regra de concordância de número no


sintagma nominal em português. Dissertação de Mestrado, PUC, Rio
de Janeiro, 1978. 158p. mimeo

_____. TRABALHO FINAL DO CURSO: ASPECTOS DA VARIAÇÃO


GRAMATICAL. Rio de Janeiro, Faculdade de Letras da UFRJ, 1979.
12p. mimeo

_____. Variation de la regle d'accord du nombre dans le syntagme


nominal en Portugais. In: SANKOFF, David. & CEDERGREN,
Henrietta. (ed.). Variation Omnibus. Canada, Linguistic Research,
Inc., 1981. p.125-33.

_____. A concordância de número no SN. In: NARO, Anthony J. et alii


(coord.). Relatório final de pesquisa apresentado à FINEP, UFRJ,
1984. p.130-49. mimeo

_____. A concordância nominal em português. In: NARO, Anthony J. et


alii (coord.). Relatório parcial de pesquisa apresentado ao INEP. Rio
de Janeiro, UFRJ, 1984. P.87-112. mimeo

_____. A regra de concordância de número entre os elementos dos SNs.


In: NARO, Anthony J. et alii (coord.). Relatório final de pesquisa
apresentado ao INEP. Rio de Janeiro, UFRJ, 1985. p.61-109. mimeo

_____. Análise da estratificação social: concordância de número entre os


elementos do sintagma nominal. In: NARO, Anthony J. et alii (coord.).
Relatório final de pesquisa: Projeto subsídios sociolingüísticos do
projeto Censo à Educação. Rio de Janeiro, UFRJ, 1986. v.I, p.58-75.
mimeo

_____. Análise lingüística da amostra: Visão global de um fenômeno de


variação em Português: a regra de concordância de número entre os
elementos do sintagma nominal. In: NARO, Anthony J. et alii
(coord.). Relatório final de pesquisa: Projeto subsídios
sociolingüísticos do projeto Censo à Educação. Rio de Janeiro,
UFRJ, 1986. v.II, p.144-231. mimeo

_____. Interferências de aspectos semânticos no processo formal de


concordância de número entre os elementos do SN. In: X
ENCONTRO NACIONAL DE Lingüística, Rio de Janeiro, 1986. Anais
... Rio de Janeiro, PUC, 1986.(a sair)

_____. Relação entre classe gramatical e posição na concordância


nominal em português. In: XXXIII SEMINÁRIO DE LINGÜÍSTICA DO
GEL. São Paulo, UNICAMP, 1987. (a sair)
555

SCHIFFRIN, Deborah. Tense variation in narrative. Language, LSA,


57(1):45-62, mar. 1981.

SILVA, Giselle Machline de Oliveira e. Estudo da regularidade na variação


dos possessivos no Português do Rio de Janeiro. Tese de
Doutorado, UFRJ, 1982. 444p. mimeo

SILVA Giselle Machline Oliveira e. & FERREIRA, Estela Maris Alves.


Sensibilidade lingüística dos cariocas. Comunicação a ser
apresentada na Reunião Anual da SBPC em julho de 1988. 18p.
mimeo

TARALLO, Fernando. A pesquisa sociolingüística. São Paulo, Ática, 1985.


96p.

TARALLO, Fernando. & DUARTE, Maria Eugênia Lamogia. Processos de


mudança lingüística em progresso: a saliência vs não saliência de
variantes. UNICAMP e PUC, São Paulo, /s.d/. 18p. mimeo

TROUBETZKOY, N.S. Principes de phonologie. Paris, Klincksieck, 1976.


395p.

VOTRE, Sebastião Josué. Aspectos da variação fonológica no Rio de


Janeiro. Tese de Doutorado, PUC, Rio de Janeiro, 1978. 221p.
mimeo

WEINER, E. Judith. & LABOV, William. Constraints on the agentless


passive. University of Pennsylvania, /s.d/. 62p. mimeo
556

SCHERRE, Maria Marta Pereira. Reanálise da concordância nominal em


português. Tese de Doutorado em Lingüística. Rio de Janeiro,
Faculdade de Letras, UFRJ, 1988. Em dois volumes, com 555p.
mimeo.

RESUMO

Este trabalho é uma reanálise pormenorizada


da concordância de número entre os elementos do
sintagma nominal no Português do Brasil, baseada em
amostras de fala de pessoas residentes na área urbana
do Rio de Janeiro, sob o enfoque da Sociolingüística
Quantitativa. Inicialmente, descreve-se e explica-se o
conjunto de variáveis lingüísticas, sob perspectivas
atomística e não atomística, que regem as tendências
sistemáticas da variação da concordância nominal, com
exame crítico de estudos anteriores e propostas de
resolução dos problemas levantados. Paralelamente,
discute-se a hipótese funcionalista kiparskiana e, a
seguir, propõe-se um novo princípio universal de
motivação externa - o Princípio do Processamento com
Paralelismo -, ao lado de outros princípios já
incorporados pela teoria lingüística. Além disso, analisa-
se a correlação entre variação e mudança, inferindo-se,
através de resultados de variáveis sociais e lingüísticas,
a existência de variação sociolingüística estável para
um grupo de falantes e a existência de mudança em
progresso para outro grupo. Finalmente, demonstra-se
a variação inerente, detectando-se influências
uniformes de variáveis lingüísticas e explicitam-se
influências sociais não convencionais. Este trabalho
contribui, portanto, para a descrição/explicação de
gramáticas particulares e para a teoria lingüística geral
.
557

SCHERRE, Maria Marta Pereira. Reanálise da concordância nominal em


português. Tese de Doutorado em Lingüística. Rio de Janeiro,
Faculdade de Letras, UFRJ, 1988. Em dois volumes, com 555p.
mimeo.

ABSTRACT

This thesis is a detailed reanalysis of number


agreement between the elements of the noun phrase in
Brazilian Portuguese, based on recorded samples of
speech of residents of urban Rio de Janeiro, using the
methodology of Quantitative Sociolinguistics. First, we
describe and explain the linguistic variables, viewed
from both an atomistic and a non-atomistic perspective.
These variables determine systematic tendencies of
variation in nominal agreement. Our discussion is
accompanied by a critical examination of earlier work
and proposals for solutions of problems which occur. At
the same time, we also discuss Kiparky's functionalist
hypothesis and propose a new universal principle of
external motivation - the Principle of Parallel Processing
- which interacts with other principles already accepted
by linguistic theory. Furthermore, we analyze the
correlation between variation and change, infering, from
results of social and linguistic variables, that there is
stable sociolinguistic variation for one group of speakers
and change-in-progress for another group. Finally, we
show the existence of inherent variation through the
detection of uniform influence of linguistic variables and
we discuss the influence of non-conventional social
variables. Thus this thesis contributes to the
description/explanation of particular grammars and to
general linguistic theory.
558

SCHERRE, Maria Marta Pereira. Reanálise da concordância nominal em


português. Tese de Doutorado em Lingüística. Rio de Janeiro,
Faculdade de Letras, UFRJ, 1988. Em dois volumes, com 555p.
mimeo.

RESUMÉ

Cette thèse est une réanalyse detaillée de


l'accord du nombre entre les éléments du syntagme
nominal en Portugais du Brésil, fondée sur des
échantillons de la conversation de personnes qui
resident dans le périmètre urbain de Rio de Janeiro, à la
lumière de la Sociolinguistique Quantitative. D'abord,
nous faisons la description et l'explication de l'ensemble
de variables linguistiques, dans une perspective
atomistique et non-atomistique, qui régissent les
tendences sistématiques de la variation des accords
nominaux, avec un examen critique d'études antérieures
ainsi que des propositions e rêsolutions des problèmes
soulevés. En même temps, nous discutons l'hypothèse
fonctionnaliste de Kiparsky et, en suite, nous faisons la
proposition d'un nouveau principe universel de
motivation exterieure - le Principe du Processement
Parallèle - côte à côte avec d'autres principes déja
incorporés par la théorie linguistique. En plus, nous
analysons la corrélation entre variation et changement,
en faisant l'inférence, au moyen de quelques résultats
de variables sociales et linguistiques, de l'existence de
variation sociolinguistique stable pour un groupe de
parlants et de l'existence de changements en progrès
pour un autre groupe. Finalement, nouns démontrons
une variation inérente, en faisant la détection
d'influences uniformes de variables linguistiques et nous
explicitons aussi des influences sociales non-
conventionnelles. De cette façon, ce travail contribue à
la description/explication de grammaires particulières et
à la théorie linguistique générale.

Você também pode gostar