Minicurso Sobre Goldvarb

UFPB Universidade Federal da Paraba
MINICURSO: Introduo ao GoldVarb X: uso e interpretao

PBLICO-ALVO: Alunos e Professores de Letras (20 vagas)
PROFESSORA: Josane Moreira de Oliveira (UEFS)
Data: 14 e 15 de julho de 2014
Carga horria: 8 horas/aula
PLANO DE ENSINO
1 OBJETIVOS
a) Conhecer e utilizar a ferramenta GoldVarb X;
b) Codificar, processar e analisar dados lingusticos;
c) Desenvolver habilidades para a interpretao dos resultados emitidos pelo GoldVarb X.
2 CONTEDO PROGRAMTICO
A sociolingustica quantitativa
O corpus
O GoldVarb X
o Origem
o Instalao
o Uso
Arquivos de dados
Grupos de fatores
Arquivo de especificaes
Arquivo de condies
Arquivo de clulas
Varbrul pesos relativos
o Interpretao dos resultados
o Apresentao dos resultados tabelas e grficos
3 METODOLOGIA
Exposio participada com direcionamento dos contedos para a aplicao prtica a partir do uso
do programa GoldVarb X no computador.
4 AVALIAO
Avaliao processual considerando a frequncia e a participao efetiva dos alunos nas aulas;
Exerccios constantes;
Processamento de dados das pesquisas dos alunos.
REFERNCIAS
CEDERGREN, H. J.; SANKOFF, D. Variable rules: performance as a statistical reflection of
competence. Language, 50:2. 1974, p. 333-355.
GUY, G. R. Advanced varbrul analysis. In: FERRARA, K; BROWN, B.; WALTERS, K.;
BAUGH, J. (Ed.). Linguistic change and contact. Austin: University of Texas, 1988, p. 124-136.
GUY, G. R.; ZILLES, A. M. Sociolingustica quantitativa: instrumental de anlise. So Paulo:
Parbola, 2007.
MILROY, L.; GORDON, M. Sociolinguistics: method and interpretation. Oxford: Blackwell,
2003.
MOLLICA, M. C.; BRAGA, M. L. (Org.). Introduo sociolingustica: o tratamento da variao.
So Paulo: Contexto, 2004.
PAOLILLO, J. Analyzing linguistic variation: statistical models and methods. Stanford CA: CSLI,
2002.
RAND, D. & SANKOFF, D. GoldVarb: a variable rule application for Macintosh. 1990.
ROBINSON, J.; LAWRENCE, H.; TAGLIAMONTE, S. GoldVarb 2001: a multivariate analysis
application for Windows. Users manual. 2001.
SANKOFF, D. Linguistic variation: models and methods. New York: Academic Press, 1978.
SANKOFF, D.; LABOV, W. On the uses of variable rules. Language in Society, 8 (2). 1979, p.
189-222. SANKOFF, D. Variable rules. In: AMMON, U.; DITTMAR, N.; MATTHEIR, K. J.
(Ed.). Sociolinguistics: an international handbook of the science of language and society.
Berlin/New York: De Gruyter, 1988, p. 984-998.
SANKOFF, D.; TAGLIAMONTE, S.; SMITH, E. GoldVarb X a multivariate analysis
application. 2005. Toronto: Department of Linguistics; Ottawa: Department of Mathematics.
Disponvel em: http://individual.utoronto.ca/tagliamonte/ Goldvarb/GV_index.htm#ref. Acesso em:
20 out. 2011.
SCHERRE, M. M. P.; CARDOSO, C. R. Guia rpido do GoldVarb X. Disponvel em:
http://geasunb.blogspot.com.br/. Acesso em: 6 fev. 2014.
TAGLIAMONTE, S. A. Analyzing sociolinguistic variation. Cambridge: Cambridge University
Press, 2006.
UFPB Curso GoldVarb X
Profa. Josane Oliveira
A sociolingustica quantitativa
Muito antiga a constatao de que a lngua se diversifica em seu uso. A viso da lngua como um
sistema heterogneo e instvel prioriza uma anlise lingustica voltada para o estudo de modos alternativos
de dizer a mesma coisa. A sociolingustica postula que a condio normal de uma comunidade de fala a
heterogeneidade e que essa heterogeneidade estruturada.
A diversificao lingustica est documentada tanto diatpica como socialmente. As lnguas
humanas esto em constante variao. Algumas variaes se propagam gradativamente por perodos mais
ou menos longos em diversos eixos sociais e podem levar a mudanas. Como praticamente impossvel a
demarcao exata e ntida de fronteiras geogrficas e sociais, prefervel falar em tendncias a empregos
de certas formas lingusticas motivadas por condicionamentos vrios.
Tendo sido largamente demonstrado e discutido o carter social da lngua, j se dispe de um
campo da cincia lingustica especificamente voltado para a covariao entre fenmenos lingusticos e
sociais, a sociolingustica, equivalente, para outros, a uma dialectologia urbana ou vertical. Por ser
impossvel desvincular a lngua de sua funo scio-comunicativa, a sociolingustica entendida como um
espao de investigao interdisciplinar que estuda e correlaciona aspectos dos sistemas lingusticos e dos
sistemas sociais, focalizando empregos concretos da lngua.
Labov (1972) questiona a justificativa para a dicotomia lingustica versus sociolingustica, uma vez
que de todos conhecido sobretudo depois de Saussure o fato de que a lngua essencialmente um
sistema de comunicao social, mas admite o uso desse termo sociolingustica, para que se diferenciem
estudos baseados em dados intuitivos (lingusticos) daqueles baseados em dados reais obtidos atravs de
gravaes de interaes orais ou de recolha de textos escritos (sociolingusticos).
Entretanto a razo maior para que se distingam esses dois tipos de estudo da lngua parece residir
nos objetivos, pois, enquanto a chamada lingustica interna, sobretudo o estruturalismo e o gerativismo,
busca estudar e descrever um sistema homogneo e abstrato de lngua, a sociolingustica ou lingustica
externa , focalizando a lngua no contexto em que se concretiza, analisa a heterogeneidade do sistema.
Alm de ocupar-se da diversidade da lngua nas situaes ou contextos em que ocorre, diversidade esta
atestada seja na variao, seja na mudana lingustica, a sociolingustica procede tambm ao estudo dos
juzos e das atitudes do falante sobre o comportamento verbal no s dele prprio mas tambm da sua
comunidade de fala.
A sociolingustica apresenta uma relao estreita com a rea da lingustica histrica, uma vez que,
estudando a variao da lngua dentro da estrutura social da comunidade em que ocorre, identifica e prev
processos de mudana em curso, que, obviamente, so decorrentes dessas variaes.
Ora, sendo a lngua um meio de interao entre o indivduo e a sociedade em que ele atua, est
claro que h foras sociais que agem sobre essa interao. E esse relacionamento casual entre lngua e
sociedade que constitui o objeto de anlise da sociolingustica.
Labov (1972) insiste na relao entre lngua e sociedade e na possibilidade, virtual e real, de
investigar e descrever a sistematicidade da variao existente e prpria das lnguas. O modelo de anlise
lingustica proposto pelo autor tambm rotulado de sociolingustica quantitativa, pois, como, em se
tratando de variao, no se pode reduzir os fatos a uma questo de tudo ou nada, opera com nmeros e
tratamento estatstico dos dados coletados.
O problema central que se coloca para a teoria da variao a avaliao do quantum com que cada
categoria postulada contribui para a realizao de uma ou outra das variantes lingusticas em concorrncia.
Na verdade, na fala concreta, a operao de uma regra varivel o resultado da atuao simultnea de
vrios fatores, ou seja, as categorias no so isoladas, pelo contrrio, elas se apresentam conjugadas.
atravs de modelos quantitativos que se podem estabelecer correlaes entre fatos lingusticos e
socioculturais, o que proporciona uma melhor viso da variao da lngua, que descrita em termos de
regras variveis, s quais se podem atribuir valores probabilsticos (ou pesos relativos) que predizem a
ocorrncia das variantes independentemente do corpus observado1.
1
Os resultados finais da anlise propiciariam a formulao de regras gramaticais variveis. Trata-se, portanto, de um sistema
lingustico de probabilidades (composto de formas em relao de concorrncia). Dessa forma, seria incorporado gramtica o
Os fatores que desencadeiam a mudana lingustica so numerosos e diversificados; podem ser
explcitos e perceptveis, ou, ao contrrio, invisveis e inacessveis percepo do falante. Podem ainda ser
externos ou internos ao sistema da lngua (MARCHELLO-NIZIA et alii, 2003).
A sociolingustica, como disciplina independente e com uma metodologia prpria, desenvolveu-se
principalmente a partir dos anos 60, nos Estados Unidos e no Canad. Seu objetivo descrever a relao
entre os fatos lingusticos e os fatos sociais, portanto exteriores lngua, tais como idade, sexo/gnero,
nvel de escolarizao, classe social, etnia, profisso, contexto estilstico ou situacional etc.
A varivel idade revela-se de fundamental importncia no estudo dos fenmenos variveis, uma
vez que essa varivel que vai indicar se determinado fenmeno de variao lingustica est estvel ou
est em progresso num estudo em tempo aparente. Tambm se sabe que, nos eixos sociais, por exemplo,
em geral, os falantes mais jovens so mais inovadores e os falantes mais velhos costumam preservar
formas mais antigas.
A varivel sexo/gnero tambm focalizada pela sociolingustica, pois, do ponto de vista social,
homens e mulheres tm papis diferentes e esto, portanto, expostos a situaes diversas. Assim, esse fator
pode influenciar a escolha de uma ou outra forma lingustica. Estudos comprovam que, nos processos de
variao estvel, so os homens que utilizam as variantes inovadoras, porm, nos casos de mudana, so as
mulheres que esto frente do processo.
A varivel escolaridade mostra-se pertinente, por exemplo, no momento em que se observa a
existncia de formas lingusticas de prestgio ou estigmatizadas. H fenmenos que so alvo do ensino
escolar e outros que no o so. Como as gramticas escolares e os manuais de ensino e estudo da lngua
julgam as formas estigmatizadas rotulando-as de erros ou vcios de linguagem, o grau de instruo do
falante pode condicion-lo ao uso de determinada(s) forma(s) lingustica(s). Tambm essa varivel se
revela importante quando do estudo da lngua escrita.
A classe ou o grupo social ou o nvel socioeconmico a que o falante pertence se reflete
tambm na sua linguagem. Quanto mais estratificada socialmente uma comunidade, maior o ndice de
variao das formas lingusticas. Os estudos sociolingusticos de Labov mostram que muitas inovaes
lingusticas surgem nas camadas mais populares e sobem pela escala social. A mudana comea a se
efetivar nas classes intermedirias, pois, quando uma variante concorrente, normalmente no prestigiada,
atinge as classes mais altas, muito provavelmente a mudana se implementa. Outros estudos, porm,
mostram resultados diversos que refletem, provavelmente, diferentes formas de organizao social.
A etnia tambm uma varivel considerada pelos sociolinguistas. sobretudo em estudos da
variao na lngua inglesa da Amrica que esse fator tem se tornado mais conhecido para a explicao de
fenmenos variveis. No caso do portugus do Brasil, entretanto, essa varivel no tem sido muito
considerada.
Para a sociolingustica, pode haver uma correlao entre o tipo de atividade profissional
desenvolvida por uma pessoa ao longo de sua vida e a necessidade do uso de formas lingusticas de
prestgio. Assim, tem-se considerado tambm a varivel profisso para compreender fenmenos
variveis, uma vez que h profisses que se servem mais da lngua do que outras. Entre falantes que atuam
em profisses do primeiro tipo (por exemplo, professores, advogados, jornalistas...), podem ocorrer mais
variantes de prestgio, j que tm acesso mais direto e mais constante ao cdigo lingustico, o que pode no
acontecer com falantes que exercem profisses do segundo tipo.
A varivel estilo de fala diz respeito forma como as pessoas se comunicam sobre determinado
assunto em determinado lugar, observadas as relaes sociais particulares entre elas. Os falantes possuem
um repertrio lingustico que varia a depender do local, do interlocutor, do assunto, do ambiente. Em
situaes descontradas, mais informais, entre pessoas com as quais se tem mais intimidade, comum que
se usem formas lingusticas vernculas, ao passo que em ambientes de maior formalidade, entre pessoas
que no se conhecem ou de posies hierrquicas diferentes, em situaes de conscincia da prpria
linguagem, os falantes so capazes de adaptar sua maneira de falar e usar com maior frequncia variantes
de prestgio. Ou seja, a fala formal se aproxima mais da norma standard e a fala informal dela se afasta,
deixando transparecer o coloquial, espontneo. Diferenas de contexto formal e informal levam os falantes
a empregar, respectivamente, estilos tambm formais ou informais. atravs do estilo informal, que deixa
transparecer mais o vernculo, que muitas mudanas se implementam.
conceito de regra varivel ao lado das regras categricas da lingustica estrutural e gerativo-transformacional , cuja aplicao
apresentaria uma frequncia condicionada a fatores internos e/ou externos lngua.
No estudo da mudana lingustica, Weinreich, Labov & Herzog (1968) formulam cinco questes
tericas centrais: os condicionamentos, a transio, o encaixamento, a avaliao e a sua implementao.
Esses cinco problemas so explicados resumidamente a seguir:
a) o problema dos condicionamentos (the constraint problem) alguns fatores determinam
mudanas possveis numa dada direo. Assim, cada restrio pressupe uma explicao que
diz respeito causa da mudana. Pode-se, ento, saber quais so as mudanas possveis e se so
de ordem universal;
b) o problema da transio (the transition problem) essa questo objetiva responder como uma
lngua muda, ou seja, como ela passa de um estgio para outro. Isso implica tambm a
transmisso de regras de uma gerao a outra e, portanto, a localizao social do falante na
comunidade de fala. Numa escala social, h grupos mais inovadores e menos inovadores.
Localizar que grupo lidera a mudana tambm, portanto, uma questo crucial. H que se
levantar hipteses para o funcionamento de cada nvel lingustico num estudo sincrnico e
diacrnico, na tentativa de entender os sistemas intermedirios, que dizem muito mais sobre as
mudanas do que os estgios inicial e final;
c) o problema do encaixamento (the embedding problem) deve-se observar como uma mudana
se encaixa no sistema lingustico e na matriz social da comunidade. H que se investigar como
uma mudana pode desencadear outra, num efeito domin, dentro do sistema lingustico;
d) o problema da avaliao (the evaluation problem) a avaliao social diz respeito forma
como os falantes julgam a mudana e qual o efeito desse julgamento sobre a mudana. Isso
implica o nvel de ateno do falante em relao fala;
e) o problema da implementao (the actuation problem) a propagao da mudana se d em
determinados ambientes estruturais e se difunde progressivamente a partir de ambientes mais
favorveis. H que se investigar que fatores propiciam que uma determinada mudana ocorra
em uma lngua em uma determinada poca e no em outra. Essa parece ser a questo mais
difcil a ser respondida pela teoria. Para a sua resoluo deve ser considerada a combinao dos
resultados para todos os problemas anteriores.
Conjugando, pois, estudos sincrnicos e diacrnicos (de longa e de curta durao) tem-se mais
embasamento para uma descrio fiel e segura de uma dada lngua. Todavia, devido ao fato de no ser
possvel resolver determinados problemas histricos, j que os dados so fragmentados, pode-se utilizar a
observao emprica do presente para explicar o passado e do passado para explicar o presente. Essa
observao pode ser produtiva na medida em que est baseada no princpio do uniformitarismo (LABOV,
1994). Ele uma condio necessria reconstruo histrica assim como o uso do presente necessrio
para explicar o passado, j que as foras e restries que regem as mudanas numa lngua no presente so
as mesmas que impulsionaram mudanas j concludas.
Finalmente, no h distino entre origem e propagao da mudana (LABOV, 1975), pois uma
lngua s muda quando uma forma foi transmitida de um falante para outro e foi aceita como uma
conveno social.
Enfim, os objetivos desse tipo de anlise so descrever e analisar a variao numa lngua,
depreendendo a sistematizao que lhe inerente e comparando os resultados das anlises com vistas
projeo de possveis rumos que as variantes tomaro.
Assim, a concepo e o alcance do modelo sociolingustico so, ao mesmo tempo, sincrnicos e
diacrnicos, uma vez que toda mudana implica uma variao. Nesse modelo, a estrutura de uma lngua
somente ser totalmente entendida medida que se compreendam efetivamente os processos histricos de
sua configurao.
Teoricamente, uma amostra sincrnica de dados, isto , dados de um tempo real na histria de uma
lngua, permite estudar a dinmica da mudana em curso de implementao, dado que um estado de lngua
a face sincrnica da mudana lingustica. Entretanto, procedendo a um recorte transversal da amostra
sincrnica em funo da faixa etria dos informantes, acrescenta-se uma dimenso diacrnica anlise.
Assim, tem-se o que se chama de tempo aparente.
O tempo aparente serve como um procedimento atravs do qual se pode projetar o tempo real
futuro, ou seja, estudando-se a transio e a implementao de variveis uma anlise acurada de uma
comunidade sociolingustica com seu componente de variao e de mudana , pode-se dimensionar
historicamente uma varivel, no s em relao ao passado mas tambm em relao a um possvel
comportamento no futuro.
Analisando a correlao entre as variantes e os fatores internos e considerando o fator idade, pode-
se observar a estratificao das mesmas. Se, por exemplo, a variante inovadora for mais frequente entre
falantes mais jovens, decrescendo em relao idade dos outros informantes, tem-se indcios de uma
mudana em progresso.
Uma vez aventada a hiptese de mudana com base em dados do tempo aparente, pode-se proceder
tambm a uma anlise histrica da varivel no tempo real, isto , deve-se recorrer a dados de outra(s)
sincronia(s) para que, atravs de comparaes, se possa melhor entender o valor e a direo da varivel na
comunidade (LABOV, 1994).
Em tempo real, o estudo da mudana possibilita analisar aspectos que no podem ser detectados em
tempo aparente e permite distinguir mudanas que se produzem gradualmente em toda a comunidade das
que caracterizam a trajetria de comportamento lingustico individual (PAIVA & DUARTE, 2003).
Os estudos no tempo real de longa durao que requerem um interstcio de sculos apresentam
dificuldades quanto coleta de dados, sobretudo de pocas pretritas, pois no h registros orais e os
escritos no so to sistemticos. a que se exige do pesquisador uma maior ateno para que consiga
fazer um bom uso dos chamados maus dados (LABOV, 1994; PAIVA & DUARTE, 2003).
J os estudos no tempo real de curta durao geralmente com um interstcio de duas ou trs
dcadas fornecem evidncias mais seguras sobre o estatuto dos padres de variao em um dado
momento da lngua e podem se apresentar de duas maneiras, estudo de tendncia (trend study) ou estudo
de painel (panel study) (LABOV, 1994). O primeiro compara em sincronias diferentes uma mesma
comunidade de fala, ou seja, gravam-se informantes diferentes de uma mesma comunidade em momentos
diferentes, com o intuito de depreender a direcionalidade do sistema na comunidade e a relao entre as
mudanas lingusticas (sua propagao, estabilizao ou recuo) e a configurao social de um grupo.
Assim, focaliza-se a continuidade/descontinuidade na prpria lngua, que pode se refletir no
comportamento do indivduo. O segundo estuda o comportamento lingustico dos mesmos informantes em
momentos sincrnicos diferentes, com o intuito de distinguir mudana geracional de mudana na
comunidade. Nesse tipo de estudo, est em jogo a continuidade/descontinuidade no comportamento
lingustico do indivduo sem reflexos no sistema (LABOV, 1994).
Assim, correlacionando fatores lingusticos e extralingusticos, sincrnicos e diacrnicos, tenta-se
desvendar o mistrio da variao e da mudana.
Como bem colocam Paiva & Duarte (2003), conjugando esses tipos diferentes de estudo, obtm-se
subsdios para a questo da implementao e do encaixamento da mudana. Ao comparar duas sincronias,
surgem indcios para a identificao de como uma dada mudana progride na lngua, qual a sua trajetria
estrutural e social e quais as relaes de causa e efeito entre diferentes processos de mudana. Ou seja, esse
confronto permite descobrir como as mudanas esto associadas entre si, j que no so frutos do acaso.
Teoricamente, quando uma mudana se implementa, ela no s consequncia mas tambm possibilita o
aparecimento de outra, isto , faz parte de uma matriz de mudanas mais gerais. Enfim, pressupe-se que
as mudanas nas lnguas naturais no so isoladas ou independentes.
A metodologia da teoria da variao constitui uma ferramenta que pode ser usada para o estudo de
qualquer fenmeno varivel nos diversos nveis e manifestaes lingusticas. mais um instrumento que
se apresenta ao linguista para o entendimento das lnguas humanas.
(Extrado de: OLIVEIRA, Josane Moreira de. O futuro da lngua portuguesa ontem e hoje: variao e
mudana. Rio de Janeiro: UFRJ, Faculdade de Letras, 2006. Tese de Doutorado em Lngua Portuguesa. p.
44-51)
O corpus
Uma anlise sociolingustica uma anlise quantitativa de dados. Por isso, a escolha do corpus
muito importante no trabalho. Claro que preciso primeiramente dedicar-se a um determinando fenmeno
lingustico varivel e proceder leitura de material bibliogrfico sobre o tema!
Em se tratando de lngua falada, escolhe-se uma comunidade de fala. Buscam-se, a seguir,
informantes que dela sejam representativos. Um dos critrios ser nascido no local, filho de pais do local e
que no tenha se afastado por muito tempo do local. Da preciso equilibrar as clulas quanto ao
sexo/gnero, quanto faixa etria, quanto escolarizao etc. Segue um exemplo de estratificao dos
informantes de uma comunidade:
Homens Mulheres
Nome Faixa etria Escolaridade Nome Faixa etria Escolaridade
Pedro 1 S Maria 1 S
Joo 1 S Ana 1 S
Mrio 1 N Paula 1 N
Andr 1 N Andria 1 N
Antnio 2 S Jlia 2 S
Jlio 2 S Carla 2 S
Joaquim 2 N Joana 2 N
Mateus 2 N Alice 2 N
Felipe 3 S Cludia 3 S
Carlos 3 S Vera 3 S
Manuel 3 N Marta 3 N
Ricardo 3 N Adriana 3 N
Assim teramos 24 informantes, sendo 12 homens e 12 mulheres, 12 escolarizados e 12 analfabetos,

8 da faixa 1 (25 a 35 anos), 8 da faixa 2 (36 a 55 anos) e 8 da faixa 3 (56 anos ou mais).
Da faramos as gravaes e levantaramos os dados do fenmeno sob anlise controlando essas
informaes.
Em se tratando de lngua escrita, tambm os dados devem ser controlados. Por exemplo,
trabalhando com jornais, teramos de controlar qual o jornal, qual o tipo de texto, qual a cidade, qual a data
etc. para controlar essas informaes na coleta dos dados.
muito importante colocar essas informaes de forma abreviada, mas decodificvel, aps o dado.
Montado o corpus, passa-se ao levantamento e codificao dos dados para a anlise quantitativa.
Trabalha-se com cdigos (de preferncia mnemnicos) que alimentaro o Programa GoldVarb. Veremos
como fazer isso mais adiante!
Exerccio 1
Instalando o GoldVarb X
1. Crie uma nova pasta com o nome GoldVarb X na sua rea de Trabalho (Desktop) usando o boto
direito do mouse.
2. Baixe o Programa da Internet (GOLDVARB30B3), digitando-o no Google. Os links so:
http://individual.utoronto.ca/tagliamonte/Goldvarb/GV_index.htm ou
http://individual.utoronto.ca/tagliamonte/goldvarb.htm. O manual da verso anterior (GoldVarb
2001) pode ser encontrado em:
http://www.york.ac.uk/depts/lang/webstuff/goldvarb/manual/manualOct2001.html (no h manual
para a verso X).
3. Voc j tem todos os arquivos executveis do programa!
Utilizando o GoldVarb X
1. D um duplo click na Pasta GoldVarb X e um duplo click na primeira pasta GoldVarb30b3.

Depois, d um duplo click no aplicativo GoldVarb.
2. V ao menu e clique em File. Ento crie um arquivo de dados (New New Tokens) ou abra um
arquivo j existente (Open).
3. A voc pode comear a digitar os seus dados. Primeiro coloque a cadeia de codificao precedida
de ( . Aps a cadeia de codificao, d um espao e coloque o seu dado. No feche os parnteses.
Cada dado (com a respectiva cadeia) deve vir em uma linha diferente. Deixe uma linha em branco
entre os dados.
(I2d3i2PpbA/AddPaU//S7EJnA Tal comisso VAI FAZER uma espcie de radiografia

do INPS para apontar ao Sr. Jlio Barata os males que afetam o mastodntico
instituto. [T2 J 70 SSA]
(F1c3i2FpnE/XndPaU//S7EJnC ste, se a comisso nomeada pelo Ministro fr de

bons clnicos, SER o diagnstico. [T2 J 70 SSA]
bom destacar o dado examinado dentro do contexto. A varivel dependente deve ser sempre a
primeira na cadeia de codificao. Ao final do exemplo, coloque a fonte (localizao) do dado. Nos
exemplos acima, T2 texto 2, J jornal, 70 anos 70 e SSA Salvador. Ao terminar, d um nome
ao arquivo (File, Save As). A extenso desse arquivo .tkn (de token, que significa dado). Da
prxima vez, para abrir o seu arquivo de dados, clique em File, Open e selecione o arquivo a ser
aberto. Ao digitar os dados, no use parnteses (se for o caso, substitua-os por colchetes). Tambm
no use barras (se for o caso, substitua-as por trao).
Voc pode digitar os dados no Word e us-los depois no GoldVarb X. Voc pode copiar e colar
todo o arquivo ou salv-lo no Word como Texto sem formatao. Neste caso, ele ter a extenso
.txt. Ento, na hora de abri-lo no GoldVarb X, preciso selecionar (ao lado da linha do nome do
arquivo) All Files em vez de Token Files. Lembre-se de salvar o arquivo como .tkn, para facilitar o
uso posteriormente. Use File Save As e d um nome. Ele ser .tkn.
4. Como codificar os dados

a) comece pela varivel dependente
b) evite repetir muito os mesmos smbolos
c) evite num mesmo grupo maisculas e minsculas
d) tente colocar um cdigo que lembre o fator especificado (cdigo mnemnico)
e) nunca use caracteres do tipo inserir smbolos
Exemplo de codificao:
Grupos de fatores Variantes Cdigos

G1: Varivel dependente Futuro simples (farei) F
Futuro perifrstico (vou fazer) I
Presente (fao) P
G2: Conjugao verbal 1 conjugao 1
2 conjugao 2
3 conjugao 3
G3: Paradigma verbal Regular r
Irregular i
G4: Tipo de sujeito Agente (eu lavarei os pratos) A
Experienciador (eu verei a luz) E
Paciente (o livro ser lido) P
No se aplica (haver paz) /
G5: Tipo de futuro Prximo p
Distante d
Indefinido i
G6: Sexo/gnero do informante Feminino M
Masculino H
G7: Faixa etria 25 a 35 anos 1
45 a 55 anos 2
65 anos em diante 3
G8: Escolaridade Nvel superior s
Nvel mdio m
Nvel fundamental f
Agora, prepare os seus dados. Crie os seus grupos de fatores e codifique os dados num papel
parte. Cada grupo de fatores corresponde a uma coluna no programa (o GoldVarb X aceita at 120
colunas). Mantenha sempre em mos os seus grupos de fatores num papel separado.
bom ler o texto:
SCHERRE, M. M. P.; NARO, A. J. Anlise quantitativa e tpicos de interpretao do Varbrul. In:
MOLLICA, M. C.; BRAGA, M. L. (Org.). Introduo sociolingustica: o tratamento da variao. So
Paulo: Contexto, 2004, p. 147-177.
Os arquivos do GoldVarb X:
Os arquivos lidos pelo GoldVarb X tm extenses .tkn, .res, .cnd, .cel.
.tkn: arquivos de dados
.cnd: arquivos de condies
.cel: arquivos de clulas
.res: arquivos de resultados (especificaes, percentagens, pesos relativos, tabulaes cruzadas...)
Todos os resultados gerados pelo programa durante uma sesso ficam em um arquivo .res nas janelas
abaixo ou ao lado da janela do arquivo de dados. Se quiser mant-los, precisar salv-los em Save As.
Exerccio 2
Arquivo de dados pronto (.tkn)
Agora que o arquivo de dados (tokens) est pronto, voc precisa criar o arquivo de especificaes,
ou seja, precisa informar ao programa todos os seus grupos e todos os fatores de cada grupo.
Observao: para inserir algum comentrio sobre os dados, voc pode usar o ponto e vrgula (;) no
incio da linha. Exemplo:
(P2r1 Eu LAVO os pratos depois.

; neste exemplo, considera-se que o presente tem valor de futuro, j que indica uma ao que ocorrer aps
o ato de fala.
(F1i3 Ele VIR mais cedo hoje.
Exemplo de arquivo de dados no GoldVarb X:
Criando o arquivo de especificaes e checando erros de codificao
Para criar o seu arquivo de especificaes, na tela principal, clique em Tokens e, a seguir, em
Generate Factor Specifications. Clique em OK. Aparecer uma telinha com o nmero total de dados.
Clique em Ok. A seguir, aparecer uma tela com os grupos, os valores e o Default. Cada grupo tem um
Default, um fator que deve ser um dos fatores daquele grupo. Pode ser qualquer fator, apenas uma
referncia para o programa saber qual o fator mais esperado por voc. Confira se os grupos tm pelo
menos 2 fatores e se os valores esto corretos. Se houver erros de codificao, preciso corrigi-los. Voc
pode ver todo o arquivo de especificaes tambm clicando em Tokens Show Factor Specifications.
Verifique se em cada grupo h pelo menos 2 fatores. Se houver algum grupo com apenas 1 fator,
acrescente mais um fator qualquer. Depois, clique em Modify Group.
Agora v tela dos dados e clique em Tokens No recode (no recodificar). Aparecer a tela com
o arquivo de condies, em que constam todos os grupos de fatores. Voc far a primeira rodada com
todos os grupos e todos os fatores para um resultado inicial.
Na tela do arquivo de condies, clique em Cell Load cells to memory. O programa perguntar se
quer gerar o arquivo de clulas a partir do arquivo de dados e do arquivo de condies em tela. Clique em
Yes. Aparecer ento uma telinha com o total de dados e de linhas checados. Clique em Ok. Aparecer
outra tela com Choose application value(s). O programa pede a regra de aplicao. Ele apresenta a ordem
das variantes (varivel dependente) na ordem em que aparecem no arquivo de dados.
Voc pode mudar essa ordem, a depender do que esteja estudando. Por exemplo, estudando o
futuro verbal, temos 4 variantes (futuro simples F, futuro perifrstico com ir no presente I, futuro
perifrstico com ir no futuro R e presente do indicativo P). Pela ordem em que aparecem nos dados, o
programa me mostra: PIFR. Mas prefiro a ordem FIRP. Ento posso alterar. Clique em OK e aparecer o
primeiro arquivo de resultados, com os percentuais. Salve-o como Save As e faa uma primeira anlise.
Aparecem tambm um telinha com o total de clulas (clique em OK) e uma tela com o arquivo .cel (que
no nos interessa). Eis uma imagem do arquivo de clulas com os percentuais:
Imprima o seu arquivo de clulas para fazer uma primeira anlise. Possivelmente, haver alguns
KnockOuts. O KnockOut acontece sempre que h regra categrica (0% ou 100% dos dados) em algum
fator. Eles tero de ser retirados da rodada, mas fornecem uma informao lingustica importantssima.
No deixe de informar, na sua anlise, os casos categricos! Pode acontecer tambm o Singleton Group,
grupo que contm apenas um fator. Este tambm deve ser retirado da rodada.
Vejamos um exemplo desses casos em um arquivo de clulas:
CELL CREATION 07/02/2014 19:00:41

Name of token file: A Tarde1.tkn
Name of condition file: Untitled.cnd
(
(1 (P (COL 1 P))
(I (COL 1 I))
(F (COL 1 F))
(I (COL 1 R)))
(2)
(3)
(4)
(5)
(8)
(12)
(14)
(15)
(16)
(17)
)
Number of cells: 410
Application value(s): FIP
Total no. of factors: 39
Group F I P Total %
----------------------------------------------
1 (2) F I P
2 N 126 55 81 262 42.5
% 48.1 21.0 30.9
4 N 22 19 45 86 13.9
% 25.6 22.1 52.3
3 N 37 46 22 105 17.0
% 35.2 43.8 21.0
1 N 137 8 19 164 26.6

% 83.5 4.9 11.6
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
2 (3) F I P
3 N 190 91 125 406 65.8
% 46.8 22.4 30.8
6 N 120 17 37 174 28.2

% 69.0 9.8 21.3
4 N 11 18 3 32 5.2
% 34.4 56.2 9.4
1 N 1 2 2 5 0.8
% 20.0 40.0 40.0
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
3 (4) F I P
1 N 79 86 87 252 40.8
% 31.3 34.1 34.5
2 N 224 25 64 313 50.7

% 71.6 8.0 20.4
3 N 19 17 16 52 8.4
% 36.5 32.7 30.8
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
4 (5) F I P
r N 97 100 116 313 50.7
% 31.0 31.9 37.1
i N 225 28 51 304 49.3

% 74.0 9.2 16.8
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
5 (8) F I P
A N 65 91 94 250 42.0
% 26.0 36.4 37.6
E N 157 34 69 260 43.7

% 60.4 13.1 26.5
P N 82 1 2 85 14.3
% 96.5 1.2 2.4
Total N 304 126 165 595

% 51.1 21.2 27.7
----------------------------------------------
6 (12) F I P
P N 78 97 107 282 45.7
% 27.7 34.4 37.9
E N 35 17 18 70 11.3
% 50.0 24.3 25.7
F N 208 14 42 264 42.8

% 78.8 5.3 15.9
C N 1 0 0 1 0.2
% 100.0 0.0 0.0 * KnockOut *
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
7 (14) F I P
P N 123 42 103 268 43.4
% 45.9 15.7 38.4
X N 143 74 23 240 38.9

% 59.6 30.8 9.6
I N 44 9 32 85 13.8
% 51.8 10.6 37.6
A N 11 3 8 22 3.6
% 50.0 13.6 36.4
D N 1 0 1 2 0.3
% 50.0 0.0 50.0 * KnockOut *
Total N 322 128 167 617
% 52.2 20.7 27.1
----------------------------------------------
8 (15) F I P
o N 50 31 34 115 18.6
% 43.5 27.0 29.6
i N 84 17 31 132 21.4
% 63.6 12.9 23.5
u N 153 66 85 304 49.3

% 50.3 21.7 28.0
d N 35 14 17 66 10.7
% 53.0 21.2 25.8
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
9 (16) F I P
c N 322 128 167 617 100.0
% 52.2 20.7 27.1 * Singleton Group *
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
10 (17) F I P
T N 10 9 22 41 6.6
% 24.4 22.0 53.7
M N 231 96 63 390 63.2

% 59.2 24.6 16.2
N N 34 16 76 126 20.4
% 27.0 12.7 60.3
E N 9 0 0 9 1.5
% 100.0 0.0 0.0 * KnockOut *
A N 20 1 0 21 3.4
% 95.2 4.8 0.0 * KnockOut *
H N 12 0 3 15 2.4
% 80.0 0.0 20.0 * KnockOut *
Q N 0 1 2 3 0.5
% 0.0 33.3 66.7 * KnockOut *
R N 4 5 1 10 1.6
% 40.0 50.0 10.0
C N 2 0 0 2 0.3
% 100.0 0.0 0.0 * KnockOut *
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
TOTAL N 322 128 167 617
% 52.2 20.7 27.1
Name of new cell file: .cel
Como dito antes, para a rodada final, o arquivo de clulas precisa estar sem nenhum problema.
Precisamos resolver os casos de No Factors, de Singleton Group e de Knockouts.
Exerccio 3
Como interpretar os resultados do arquivo de clulas
Como j se disse, o 1 arquivo de clulas, no caso de ter havido algum problema (KnockOut,
Singleton Group ou No Factors), deve ser guardado, pois o problema deve ser comentado na anlise dos
dados. Todavia esse arquivo ter de ser refeito at que no haja mais problemas. S ento ele poder ser
submetido ao clculo dos pesos relativos.
O arquivo de clulas j permite uma anlise dos dados, pois ele informa a quantidade de
ocorrncias e os percentuais para cada variante em relao a cada fator considerado nos grupos de fatores.
Por exemplo, observe os resultados do grupo abaixo, extrado do arquivo de clulas anterior:
----------------------------------------------
4 (5) F I P
r N 97 100 116 313 50.7
% 31.0 31.9 37.1
i N 225 28 51 304 49.3

% 74.0 9.2 16.8
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
Este Grupo (Paradigma verbal) possui 2 fatores (r = verbo regular / i = verbo irregular).
Transformando esses resultados em tabela, temos:
Tabela 1: Variao na expresso do futuro na escrita e paradigma verbal

Paradigma Futuro simples Futuro perifrstico Presente Total
verbal
No de Percentual No de Percentual No de Percentual
dados dados dados
Verbo regular 97 31% 100 32% 116 37% 313
Verbo irregular 225 74% 28 9% 51 17% 304
Total 322 128 167 617
Assim, podemos ver que o futuro simples foi mais utilizado (52%) do que o futuro perifrstico
(21%) e do que o presente (27%) em toda a amostra, que contm 617 dados. Comparando os dois
paradigmas verbais, vemos que nos verbos irregulares prevaleceu o futuro simples, enquanto que os verbos
regulares foram mais usados com o futuro perifrstico e com o presente.
Este s um exemplo. A estruturao e a leitura da tabela podem variar, a depender do que se
queira chamar ateno.
Mas, voltemos aos problemas! Para retirar os casos de Singleton Group, No Factors e KnockOut,
devemos recodificar os dados. Nos casos de Singleton Group e de No Factors, os grupos devem ser,
simplesmente, retirados na recodificao. No primeiro caso, trata-se de um grupo em que s um fator
ocorreu; no segundo, trata-se de um grupo em que nenhum dos fatores ocorreu.
Exemplo de Singleton Group:
----------------------------------------------
9 (16) F I P
c N 322 128 167 617 100.0
% 52.2 20.7 27.1 * Singleton Group *
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
Este grupo, Tipo de jornal, possui 2 fatores: culto (c) e popular (p). Como os dados dessa amostra
foram todos do jornal considerado culto (ainda no tinham sido codificados os dados do jornal popular), os
617 dados (total da amostra) apareceram codificados com o fator c (100%) dos dados. Observe que no total
o programa continua dizendo (como na tabela anterior) que h futuro simples em 52% dos dados, futuro
perifrstico em 21% dos dados e presente em 27% dos dados. Simplesmente no h como considerar esse
grupo, pois no h clculo algum a fazer. Eis o que o programa informa com a expresso Singleton
Group. Quando da recodificao, devemos excluir o grupo 16 (atual 9).
Exemplo de No factors:
---------------------------------
17 (18)
* No Factors *
---------------------------------
Suponha que este grupo seja Tipo de sujeito, com 3 fatores: sujeito animado (A), sujeito
inanimado (I) e no se aplica (/). Os casos de no se aplica devem ser codificados com uma barra (/).
Neste grupo, seriam casos de no se aplica os dados em que h sujeito oracional (DEVER ser
considerado que o homem um ser mortal) ou em que h orao sem sujeito (VAI HAVER muitos
problemas). Com o no se aplica (/), dizemos ao programa que nesses casos no h como dizer se o
sujeito animado ou no animado, ou seja, nesses casos, essa classificao NO SE APLICA. E o
programa retira da rodada (dos clculos) esses dados. Ele nem os enxerga.
Agora suponha que nessa amostra s ocorreram exemplos de no se aplica, ou seja, em todos os
dados houve sujeito oracional ou orao sem sujeito. Assim, a mensagem No Factors informa que no
houve nenhum fator, ou seja, no houve A (sujeito animado) nem I (sujeito inanimado). Dessa forma, o
programa no tem como informar nada. Com essa mensagem, ele nos diz: o que voc quer que eu faa
nesse grupo se no h nada codificado (nem A nem I)? Quando da recodificao, o grupo 18 (atual 17)
deve ser excludo.
Como recodificar os dados retirando grupos
Para recodificar os dados retirando grupos (depois veremos como retirar apenas fatores e como
agrupar fatores), os passos so os seguintes:
1. Na tela dos dados (Tokens) e clique em Recode setup
2. Aparece uma tela Generate conditions for recoding:
3. Clique no Grupo 1 (o grupo da varivel dependente) e ele vai ficar azul. Ento clique ao lado
em Recode
4. Na tela ao lado aparecem os fatores, repita os que quer manter e modifique os que quer
recodificar (no exemplo, digite P I F I). Assim, estamos recodificando R como I (ou seja, os
casos de irei fazer estaro juntos com os casos de vou fazer, como futuro perifrstico)
5. A seguir, clique no Grupo 2 da tela esquerda e clique em Copy (esse grupo ser mantido sem
alteraes)
6. Repita a mesma operao com todos os grupos, exceto com os grupos a serem excludos (no
caso do exemplo, ignore os grupos 16 Singleton Group e 18 No factors, pulando-os)
7. A seguir, clique em Ok e aparecer um novo arquivo de condies
8. Aparecer uma nova tela, com o arquivo de condies;
9. Clique em Cells Load cells to memory
10. Aparecer uma tela dizendo que h clulas na memria e o programa pergunta se voc quer
descart-las (clique em Yes)
11. Aparece outra tela perguntando se voc quer criar um novo arquivo de clulas a partir dos
dados e das condies em tela (clique em Yes)
12. Aparecer uma tela pedindo a regra de aplicao (digite FIP e clique em Ok)
13. O programa ento apresenta o novo arquivo de clulas sem os grupos excludos
14. Veja o seu novo arquivo de clulas sem os grupos excludos (eles no constaro nem do arquivo
de condies nem dos resultados)
Ateno: o programa gera o novo arquivo embaixo do anterior (a no ser que o tenhamos salvado).
Assim, preciso cuidado pra olhar o ltimo arquivo!
Vejamos o arquivo de clulas que estamos tomando como exemplo. Eis o arquivo aps a
recodificao:
CELL CREATION 07/02/2014 19:52:36

(
(1 (P (COL 1 P))
(I (COL 1 I))
(F (COL 1 F))
(I (COL 1 R)))
(2)
(3)
(4)
(5)
(8)
(12)
(14)
(17)
)

Application value(s): FIP
Group F I P Total %
----------------------------------------------
1 (2) F I P
2 N 126 55 81 262 42.5
% 48.1 21.0 30.9
4 N 22 19 45 86 13.9
% 25.6 22.1 52.3
3 N 37 46 22 105 17.0
% 35.2 43.8 21.0
1 N 137 8 19 164 26.6

% 83.5 4.9 11.6
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
2 (3) F I P
3 N 190 91 125 406 65.8
% 46.8 22.4 30.8
6 N 120 17 37 174 28.2

% 69.0 9.8 21.3
4 N 11 18 3 32 5.2
% 34.4 56.2 9.4
1 N 1 2 2 5 0.8
% 20.0 40.0 40.0
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
3 (4) F I P
1 N 79 86 87 252 40.8
% 31.3 34.1 34.5
2 N 224 25 64 313 50.7

% 71.6 8.0 20.4
3 N 19 17 16 52 8.4
% 36.5 32.7 30.8
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
4 (5) F I P
r N 97 100 116 313 50.7
% 31.0 31.9 37.1
i N 225 28 51 304 49.3

% 74.0 9.2 16.8
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
5 (8) F I P
A N 65 91 94 250 42.0
% 26.0 36.4 37.6
E N 157 34 69 260 43.7

% 60.4 13.1 26.5
P N 82 1 2 85 14.3
% 96.5 1.2 2.4
Total N 304 126 165 595

% 51.1 21.2 27.7
----------------------------------------------
6 (12) F I P
P N 78 97 107 282 45.7
% 27.7 34.4 37.9
E N 35 17 18 70 11.3
% 50.0 24.3 25.7
F N 208 14 42 264 42.8

% 78.8 5.3 15.9
C N 1 0 0 1 0.2
% 100.0 0.0 0.0 * KnockOut *
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
7 (14) F I P
P N 123 42 103 268 43.4
% 45.9 15.7 38.4
X N 143 74 23 240 38.9

% 59.6 30.8 9.6
I N 44 9 32 85 13.8
% 51.8 10.6 37.6
A N 11 3 8 22 3.6
% 50.0 13.6 36.4
D N 1 0 1 2 0.3
% 50.0 0.0 50.0 * KnockOut *
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
8 (17) F I P
T N 10 9 22 41 6.6
% 24.4 22.0 53.7
M N 231 96 63 390 63.2

% 59.2 24.6 16.2
N N 34 16 76 126 20.4
% 27.0 12.7 60.3
E N 9 0 0 9 1.5
% 100.0 0.0 0.0 * KnockOut *
A N 20 1 0 21 3.4
% 95.2 4.8 0.0 * KnockOut *
H N 12 0 3 15 2.4
% 80.0 0.0 20.0 * KnockOut *
Q N 0 1 2 3 0.5
% 0.0 33.3 66.7 * KnockOut *
R N 4 5 1 10 1.6
% 40.0 50.0 10.0
C N 2 0 0 2 0.3
% 100.0 0.0 0.0 * KnockOut *
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
TOTAL N 322 128 167 617
% 52.2 20.7 27.1
No h mais Singleton Group nem No Factors. Restam s os KnocKouts. Vejamos como resolv-
los.
Exerccio 4
Como recodificar os dados retirando fatores ou juntando fatores de um mesmo grupo
Tomando como exemplo o arquivo de clulas anterior, observe o Grupo 6 (antigo 12):
----------------------------------------------
6 (12) F I P
P N 78 97 107 282 45.7
% 27.7 34.4 37.9
E N 35 17 18 70 11.3
% 50.0 24.3 25.7
F N 208 14 42 264 42.8

% 78.8 5.3 15.9
C N 1 0 0 1 0.2
% 100.0 0.0 0.0 * KnockOut *
Total N 322 128 167 617

% 52.2 20.7 27.1
----------------------------------------------
O fator C (verbo cognitivo) apresenta KnockOut. Ou seja, no nico caso em que houve esse tipo de
verbo, ocorreu futuro simples (100%). Devemos informar isso na anlise e retirar esse dado desse grupo.
Assim, veremos a variao apenas entre verbos de processo (P), verbos de evento (E) e verbos de estado
fsico (F).
Para fazer isso, siga os seguintes passos (alguns dos quais vimos anteriormente quando da retirada
de grupos inteiros):
1. Na tela dos dados, v em Tokens e clique em Recode setup
2. Aparece uma telinha perguntando se quer salvar ou no o arquivo de condies anterior (clique
em Dont save)
3. Aparece uma tela para recodificao (Generate conditions for recoding...)
4. Clique no Grupo 1 (o grupo da varivel dependente) e ele vai ficar azul. Ento clique ao lado
em Recode e digite P I F I (ele vai manter esse grupo substituindo R por I)
5. Clique no Grupo 2 e a seguir em Copy
6. Repita a mesma operao com todos os grupos que voc quer manter
7. J vimos que os grupos a serem excludos devem ser pulados
8. No caso do grupo 12, do qual queremos excluir o fator C, clique em Recode
9. Na tela ao lado, digite P E F / (assim manteremos P E F e exclumos o dado de C, que tinha
knockout)
10. No caso de excluir mais de um fator no mesmo grupo, continue colocando a barra (/) para os
fatores a serem excludos;
11. Faamos o mesmo com o Grupo 14, para excluir o D (digite na tela ao lado P X I A /)
12. Devemos excluir tambm o Grupo 17 (Gnero textual), que apresentou muitos knockouts
13. Clique em Ok e ter o novo arquivo de clulas (imprima-o e analise-o) sem problemas
14. Agora os seus dados j esto prontos para a rodada final do Varbrul (pesos relativos)
Acontece que temos 3 variantes e o programa s faz rodadas binrias para gerar os pesos relativos.
Nossa opo aqui deixar de lado o presente do indicativo e rodar o futuro simples e o futuro perifrstico.
Essa deciso feita com base em anlises lingusticas. Como o futuro perifrstico a forma inovadora,
ser a regra de aplicao, de acordo com o seguinte raciocnio: queremos ver quais os contextos de entrada
da forma inovadora na escrita.
Veremos como fazer isso mais tarde!
Exerccio 5
H outra opo para a retirada dos casos de KnockOut. Em vez de retirar fatores, podemos
reagrupar os fatores dentro de um mesmo grupo. Por exemplo, podemos juntar P1 (= eu) e P4 (= ns)
como 1 pessoa, P2 (= tu) e P5 (= vs) como 2 pessoa e P3 (= ele) e P6 (= eles) como 3 pessoa. Neste
caso, ignoraremos o nmero (singular ou plural).
Podemos tambm reagrupar fatores de grupos diferentes. Por exemplo, em vez de ter 2 grupos um
com a conjugao verbal (1, 2 e 3) e outro com o paradigma verbal (verbo regular e verbo irregular) ,
podemos transform-los em um s grupo: 1 conj. reg., 1 conj. irreg., 2 conj. reg., 2 conj. irreg., 3 conj.
reg. e 3 conj. irreg. Assim, em vez de 2 grupos com 3 fatores cada, temos um grupo s com 6 fatores.
Optar pela retirada dos fatores ou pelo reagrupamento depende de uma anlise lingustica. A, como
cada caso um caso, vale a intuio lingustica e o conhecimento do fenmeno e da lngua sob anlise.
Vimos como excluir fatores. A seguir, veremos como reagrupar fatores.
Como recodificar os dados reagrupando fatores de grupos diferentes
Comandos AND e OR
Os comandos AND e OR no esto disponveis na verso do GoldVarb X, mas podemos us-los na
verso do GoldVarb 2001.
AND
Por exemplo, considerando os grupos de fatores exemplificados abaixo:
Grupos de fatores Variantes Cdigos

G1: Varivel dependente Futuro simples (farei) F
Futuro perifrstico (vou fazer) I
Presente (fao) P
G2: Conjugao verbal 1 conjugao 1
2 conjugao 2
3 conjugao 3
G3: Paradigma verbal Regular r
Irregular i
G4: Tipo de sujeito Agente (eu lavarei os pratos) A
Experienciador (eu verei a luz) E
Paciente (o livro ser lido) P
No se aplica (haver paz) /
G5: Sexo/gnero do informante Feminino M
Masculino H
Podemos juntar os fatores dos grupos 2 e 3 da seguinte forma:
Verbos regulares de 1 conjugao (1 + r)

Verbos irregulares de 1 conjugao (1 + i)
Para fazer isso (no GoldVarb 2001), v ao Action Recode Setup da janela de Tokens. Clique no
Grupo 2 e clique em AND. O programa ento pede o outro grupo. Selecione o Grupo 3. Observe que na
tabela do lado direito (com as novas condies) aparece o AND com uma linha em branco e os dois grupos
selecionados a seguir. Na tabela do lado esquerdo (original), clique em 1 (Grupo2) e em r (Grupo 3).
Depois clique em 1 (Grupo 2) e em i (Grupo 3). Clique em 2 (Grupo 2) e em r (Grupo 3). Depois combine
2 com i. Faa o mesmo com o 3 (com r e depois com i). Assim, voc fez todas as combinaes propostas
acima, juntando os dois grupos. Observe na tabela ao lado direito as novas combinaes. Na linha em
branco do AND, preencha cada combinao com um novo cdigo. Por exemplo: 1 + r = 1; 2 + r = 2; 3 + r
= 3; 1 + i = U; 2 + i = D; 3 + i = T. Clique ento em Finish current operation. O programa pede ento uma
condio para que essa operao acabe. Digite qualquer smbolo (por exemplo, a letra X). Prossiga com a
recodificao, copiando ou excluindo os demais grupos, como visto em aulas anteriores. Aparecer o novo
arquivo de condies com os grupos unidos pelo AND.
Da s rodar o novo arquivo de clulas: View Results Load Cells to Memory. Voc ver o
novo arquivo de condies e o arquivo de clulas. No caso da exemplificao aqui apresentada, houve dois
knockouts com a nova codificao. Os fatores U (verbos irregulares de 1 conjugao) e T (verbos
irregulares de 3 conjugao) apresentaram 100% de futuro simples. Teramos de retirar esses knockouts,
obviamente. Mas, por enquanto, observe apenas a juno dos grupos 2 e 3. Veja que o GoldVarb chamou
esse novo grupo de New (novo):
CELL CREATION
=============
Name of token file: C:\Documents and Settings\Josane\Desktop\Goldvarb\JOT90.tkn
(
(1)
(2)
(3)
(4 (6 (COL 4 6))
(3 (COL 4 3))
(/ (COL 4 4)))
(0 (T (AND (COL 5 i) (COL 6 3) )) Grupo novo com o AND
(D (AND (COL 5 i) (COL 6 2) ))
(U (AND (COL 5 i) (COL 6 1) ))
(3 (AND (COL 5 r) (COL 6 3) ))
(2 (AND (COL 5 r) (COL 6 2) ))
(1 (AND (COL 5 r) (COL 6 1) ))
(1 (ELSEWHERE)))
(10)
(16 (a (COL 16 a))
(n (COL 16 n))
(/ (COL 16 i)))
(17 (U (COL 17 U))
(O (COL 17 O))
(I (COL 17 I))
(F (COL 17 F))
(/ (COL 17 P)))
(20)
)
Number of cells: 68
Application value(s): IF
Group I F Total %
---------------------------------
1 (2)
4 N 3 8 11 15
% 27 72
2 N 7 20 27 39
% 25 74
3 N 5 13 18 26
% 27 72
1 N 2 11 13 18
% 15 84
Total N 17 52 69
% 24 75
---------------------------------
2 (3)
b N 1 1 2 2
% 50 50
d N 10 24 34 49
% 29 70
c N 2 12 14 20
% 14 85
t N 3 11 14 20
% 21 78
i N 1 4 5 7
% 20 80
Total N 17 52 69
% 24 75
---------------------------------
3 (4)
6 N 4 14 18 27
% 22 77
3 N 13 35 48 72
% 27 72
Total N 17 49 66
% 25 74
---------------------------------
4 (new) Grupo novo com o AND
3 N 1 4 5 7
% 20 80
1 N 10 27 37 53
% 27 72
D N 4 14 18 26
% 22 77
2 N 2 3 5 7
% 40 60
U N 0 3 3 4
% 0 100 * KnockOut *
T N 0 1 1 1
% 0 100 * KnockOut *
Total N 17 52 69
% 24 75
---------------------------------
5 (10)
P N 1 14 15 22
% 6 93
A N 9 20 29 43
% 31 68
E N 5 17 22 33
% 22 77
Total N 15 51 66
% 22 77
---------------------------------
6 (16)
a N 15 49 64 94
% 23 76
n N 1 3 4 5
% 25 75
Total N 16 52 68
% 23 76
---------------------------------
7 (17)
U N 9 28 37 54
% 24 75
O N 5 8 13 19
% 38 61
I N 1 4 5 7
% 20 80
F N 2 11 13 19
% 15 84
Total N 17 51 68
% 25 75
---------------------------------
8 (20)
S N 11 27 38 55
% 28 71
R N 6 25 31 44
% 19 80
Total N 17 52 69
% 24 75
---------------------------------
Total N 17 52 69
% 24 75
Name of new cell file: Untitled.cel
O mesmo pode ser feito, por exemplo, para cruzar as variveis sexo/gnero e faixa etria, ou para
cruzar as variveis sexo/gnero e escolaridade.
OR
Para usar o comando OR, o procedimento o mesmo para o comando AND. A diferena apenas
semntica: AND significa E e OR significa OU. S uma reflexo lingustica indicar os casos em que
devemos usar um ou outro.
Exerccio 6
Como obter os pesos relativos
Para a rodada binria Futuro perifrstico X Futuro simples, precisamos excluir os dados de
Presente. Assim, vamos recodificar os dados, colocando / no fator P do primeiro grupo. preciso lembrar
que as alteraes anteriores precisam ser mantidas. A nova regra de aplicao I F. Assim, o nosso novo
arquivo clulas :
CELL CREATION 07/02/2014 20:21:46

(
(1 (/ (COL 1 P))
(I (COL 1 I))
(F (COL 1 F))
(I (COL 1 R)))
(2)
(3)
(4)
(5)
(8)
(12 (P (COL 12 P))
(E (COL 12 E))
(F (COL 12 F))
(/ (COL 12 C)))
(14 (P (COL 14 P))
(X (COL 14 X))
(I (COL 14 I))
(A (COL 14 A))
(/ (COL 14 D)))
)

Application value(s): IF
Group I F Total %
--------------------------------------
1 (2) I F
2 N 55 126 181 40.2
% 30.4 69.6
1 N 8 137 145 32.2

% 5.5 94.5
4 N 19 22 41 9.1
% 46.3 53.7
3 N 46 37 83 18.4
% 55.4 44.6
Total N 128 322 450

% 28.4 71.6
--------------------------------------
2 (3) I F
3 N 91 190 281 62.4
% 32.4 67.6
4 N 18 11 29 6.4
% 62.1 37.9
6 N 17 120 137 30.4
% 12.4 87.6
1 N 2 1 3 0.7
% 66.7 33.3
Total N 128 322 450

% 28.4 71.6
--------------------------------------
3 (4) I F
3 N 17 19 36 8.0
% 47.2 52.8
2 N 25 224 249 55.3

% 10.0 90.0
1 N 86 79 165 36.7
% 52.1 47.9
Total N 128 322 450

% 28.4 71.6
--------------------------------------
4 (5) I F
i N 28 225 253 56.2
% 11.1 88.9
r N 100 97 197 43.8

% 50.8 49.2
Total N 128 322 450

% 28.4 71.6
--------------------------------------
5 (8) I F
E N 34 157 191 44.4
% 17.8 82.2
A N 91 65 156 36.3
% 58.3 41.7
P N 1 82 83 19.3
% 1.2 98.8
Total N 126 304 430

% 29.3 70.7
--------------------------------------
6 (12) I F
E N 17 35 52 11.6
% 32.7 67.3
P N 97 78 175 39.0
% 55.4 44.6
F N 14 208 222 49.4

% 6.3 93.7
Total N 128 321 449

% 28.5 71.5
--------------------------------------
7 (14) I F
X N 74 143 217 48.3
% 34.1 65.9
I N 9 44 53 11.8
% 17.0 83.0
P N 42 123 165 36.7

% 25.5 74.5
A N 3 11 14 3.1
% 21.4 78.6
Total N 128 321 449

% 28.5 71.5
--------------------------------------
TOTAL N 128 322 450
% 28.4 71.6
Com este arquivo pronto, podemos proceder rodada para gerar os pesos relativos. Para tanto,
nesse novo arquivo de percentagens (.res), clique em Cells Binomial, Up and Down. Aparecer nosso
novo arquivo .res, com os pesos relativos (logo abaixo do arquivo de percentagens)!
BINOMIAL VARBRUL 07/02/2014 20:29:33

Name of cell file: .cel
Averaging by weighting factors.

Threshold, step-up/down: 0.050001
Stepping up...
---------- Level # 0 ----------
Run # 1, 1 cells:
Convergence at Iteration 2
Input 0.284
Log likelihood = -268.696
---------- Level # 1 ----------
Run # 2, 4 cells:
Input 0.228
Group # 1 -- 2: 0.597, 1: 0.166, 4: 0.745, 3: 0.808
Log likelihood = -227.458 Significance = 0.000
Run # 3, 4 cells:
Input 0.265
Group # 2 -- 3: 0.570, 4: 0.819, 6: 0.282, 1: 0.847
Run # 4, 3 cells:
Input 0.233
Group # 3 -- 3: 0.746, 2: 0.269, 1: 0.782
Run # 5, 2 cells:
Input 0.239
Group # 4 -- i: 0.284, r: 0.766
Run # 6, 4 cells:
Input 0.197
Group # 5 -- E: 0.470, A: 0.851, P: 0.048
Run # 7, 4 cells:
Input 0.209
Group # 6 -- E: 0.648, P: 0.825, F: 0.204
Run # 8, 5 cells:
Input 0.281
Group # 7 -- X: 0.570, I: 0.344, P: 0.467, A: 0.412
Add Group # 6 with factors EPF
---------- Level # 2 ----------
Run # 9, 13 cells:
Input 0.195
Group # 1 -- 2: 0.586, 1: 0.299, 4: 0.566, 3: 0.645
Group # 6 -- E: 0.626, P: 0.779, F: 0.247
Run # 10, 13 cells:

Input 0.198
Group # 2 -- 3: 0.549, 4: 0.786, 6: 0.326, 1: 0.887
Group # 6 -- E: 0.618, P: 0.818, F: 0.215
Run # 11, 10 cells:

Input 0.198
Group # 3 -- 3: 0.559, 2: 0.367, 1: 0.684
Group # 6 -- E: 0.652, P: 0.764, F: 0.255
Run # 12, 7 cells:

Input 0.203
Group # 4 -- i: 0.392, r: 0.637
Group # 6 -- E: 0.617, P: 0.773, F: 0.254
Run # 13, 12 cells:

Input 0.177
Group # 5 -- E: 0.547, A: 0.713, P: 0.105
Group # 6 -- E: 0.639, P: 0.729, F: 0.286
Run # 14, 14 cells:

Input 0.208
Group # 6 -- E: 0.640, P: 0.822, F: 0.207
Group # 7 -- X: 0.535, I: 0.411, P: 0.485, A: 0.484
Add Group # 3 with factors 321
---------- Level # 3 ----------
Run # 15, 31 cells:

Input 0.187
Group # 1 -- 2: 0.564, 1: 0.359, 4: 0.475, 3: 0.622
Group # 3 -- 3: 0.545, 2: 0.379, 1: 0.670
Group # 6 -- E: 0.640, P: 0.740, F: 0.277
Run # 16, 28 cells:

Input 0.184
Group # 2 -- 3: 0.547, 4: 0.796, 6: 0.328, 1: 0.892
Group # 3 -- 3: 0.580, 2: 0.361, 1: 0.689
Group # 6 -- E: 0.628, P: 0.756, F: 0.266
Run # 17, 18 cells:

Input 0.198
Group # 3 -- 3: 0.571, 2: 0.390, 1: 0.649
Group # 4 -- i: 0.445, r: 0.570
Group # 6 -- E: 0.634, P: 0.744, F: 0.275
Run # 18, 24 cells:

Input 0.168
Group # 3 -- 3: 0.518, 2: 0.377, 1: 0.678
Group # 5 -- E: 0.520, A: 0.722, P: 0.121
Group # 6 -- E: 0.655, P: 0.652, F: 0.344
Run # 19, 28 cells:

Input 0.197
Group # 3 -- 3: 0.569, 2: 0.366, 1: 0.684
Group # 6 -- E: 0.644, P: 0.759, F: 0.260
Group # 7 -- X: 0.535, I: 0.432, P: 0.482, A: 0.432
Add Group # 2 with factors 3461
---------- Level # 4 ----------
Run # 20, 66 cells:

Input 0.173
Group # 1 -- 2: 0.565, 1: 0.354, 4: 0.470, 3: 0.631
Group # 2 -- 3: 0.545, 4: 0.804, 6: 0.327, 1: 0.904
Group # 3 -- 3: 0.557, 2: 0.375, 1: 0.673
Group # 6 -- E: 0.623, P: 0.730, F: 0.289
Run # 21, 43 cells:

Input 0.184
Group # 2 -- 3: 0.545, 4: 0.797, 6: 0.329, 1: 0.915
Group # 3 -- 3: 0.592, 2: 0.387, 1: 0.649
Group # 4 -- i: 0.439, r: 0.578
Group # 6 -- E: 0.612, P: 0.734, F: 0.287
Run # 22, 50 cells:

Input 0.158
Group # 2 -- 3: 0.545, 4: 0.773, 6: 0.338, 1: 0.878
Group # 3 -- 3: 0.544, 2: 0.370, 1: 0.683
Group # 5 -- E: 0.525, A: 0.696, P: 0.143
Group # 6 -- E: 0.633, P: 0.660, F: 0.343
Run # 23, 60 cells:

Input 0.184
Group # 2 -- 3: 0.547, 4: 0.792, 6: 0.328, 1: 0.896
Group # 3 -- 3: 0.587, 2: 0.361, 1: 0.687
Group # 6 -- E: 0.623, P: 0.753, F: 0.269
Group # 7 -- X: 0.521, I: 0.427, P: 0.495, A: 0.518
Add Group # 5 with factors EAP
---------- Level # 5 ----------
Run # 24, 95 cells:

Input 0.154
Group # 1 -- 2: 0.541, 1: 0.408, 4: 0.443, 3: 0.599
Group # 2 -- 3: 0.545, 4: 0.782, 6: 0.334, 1: 0.889
Group # 3 -- 3: 0.530, 2: 0.375, 1: 0.679
Group # 5 -- E: 0.519, A: 0.675, P: 0.174
Group # 6 -- E: 0.633, P: 0.653, F: 0.349
Run # 25, 66 cells:

Input 0.158
Group # 2 -- 3: 0.543, 4: 0.775, 6: 0.341, 1: 0.902
Group # 3 -- 3: 0.556, 2: 0.393, 1: 0.647
Group # 4 -- i: 0.443, r: 0.573
Group # 5 -- E: 0.523, A: 0.696, P: 0.146
Group # 6 -- E: 0.618, P: 0.636, F: 0.365
Run # 26, 95 cells:

Input 0.157
Group # 2 -- 3: 0.545, 4: 0.765, 6: 0.339, 1: 0.881
Group # 3 -- 3: 0.551, 2: 0.370, 1: 0.681
Group # 5 -- E: 0.521, A: 0.702, P: 0.141
Group # 6 -- E: 0.627, P: 0.652, F: 0.351
Group # 7 -- X: 0.531, I: 0.415, P: 0.486, A: 0.520
No remaining groups significant
Groups selected while stepping up: 6 3 2 5

Best stepping up run: #22
---------------------------------------------
Stepping down...
---------- Level # 7 ----------
Run # 27, 167 cells:

Input 0.155
Group # 1 -- 2: 0.538, 1: 0.440, 4: 0.418, 3: 0.563
Group # 2 -- 3: 0.546, 4: 0.774, 6: 0.335, 1: 0.903
Group # 3 -- 3: 0.546, 2: 0.388, 1: 0.656
Group # 4 -- i: 0.456, r: 0.556
Group # 5 -- E: 0.513, A: 0.689, P: 0.165
Group # 6 -- E: 0.618, P: 0.631, F: 0.369
Group # 7 -- X: 0.522, I: 0.437, P: 0.486, A: 0.560
Log likelihood = -178.400
---------- Level # 6 ----------

Input 0.157
Group # 2 -- 3: 0.543, 4: 0.767, 6: 0.341, 1: 0.902
Group # 3 -- 3: 0.562, 2: 0.392, 1: 0.647
Group # 4 -- i: 0.446, r: 0.569
Group # 5 -- E: 0.520, A: 0.701, P: 0.143
Group # 6 -- E: 0.614, P: 0.630, F: 0.371
Group # 7 -- X: 0.528, I: 0.426, P: 0.486, A: 0.509

Input 0.163
Group # 1 -- 2: 0.531, 1: 0.456, 4: 0.425, 3: 0.547
Group # 3 -- 3: 0.528, 2: 0.390, 1: 0.657
Group # 4 -- i: 0.459, r: 0.553
Group # 5 -- E: 0.509, A: 0.723, P: 0.132
Group # 6 -- E: 0.636, P: 0.619, F: 0.374
Group # 7 -- X: 0.540, I: 0.428, P: 0.474, A: 0.467

Input 0.161
Group # 1 -- 2: 0.549, 1: 0.427, 4: 0.454, 3: 0.544
Group # 2 -- 3: 0.546, 4: 0.771, 6: 0.334, 1: 0.914
Group # 4 -- i: 0.400, r: 0.627
Group # 5 -- E: 0.523, A: 0.684, P: 0.160
Group # 6 -- E: 0.594, P: 0.663, F: 0.349
Group # 7 -- X: 0.524, I: 0.444, P: 0.482, A: 0.563

Input 0.154
Group # 1 -- 2: 0.541, 1: 0.409, 4: 0.446, 3: 0.598
Group # 2 -- 3: 0.546, 4: 0.776, 6: 0.334, 1: 0.891
Group # 3 -- 3: 0.534, 2: 0.375, 1: 0.677
Group # 5 -- E: 0.517, A: 0.681, P: 0.171
Group # 6 -- E: 0.624, P: 0.646, F: 0.356
Group # 7 -- X: 0.524, I: 0.428, P: 0.486, A: 0.571

Input 0.175
Group # 1 -- 2: 0.564, 1: 0.374, 4: 0.451, 3: 0.607
Group # 2 -- 3: 0.546, 4: 0.802, 6: 0.326, 1: 0.914
Group # 3 -- 3: 0.570, 2: 0.386, 1: 0.655
Group # 4 -- i: 0.468, r: 0.541
Group # 6 -- E: 0.609, P: 0.723, F: 0.297
Group # 7 -- X: 0.512, I: 0.450, P: 0.494, A: 0.571

Input 0.163
Group # 1 -- 2: 0.532, 1: 0.441, 4: 0.422, 3: 0.572
Group # 2 -- 3: 0.546, 4: 0.768, 6: 0.334, 1: 0.922
Group # 3 -- 3: 0.580, 2: 0.378, 1: 0.664
Group # 4 -- i: 0.432, r: 0.587
Group # 5 -- E: 0.486, A: 0.756, P: 0.120
Group # 7 -- X: 0.532, I: 0.411, P: 0.481, A: 0.568

Input 0.156
Group # 1 -- 2: 0.538, 1: 0.443, 4: 0.412, 3: 0.561
Group # 2 -- 3: 0.545, 4: 0.780, 6: 0.335, 1: 0.902
Group # 3 -- 3: 0.544, 2: 0.388, 1: 0.656
Group # 4 -- i: 0.452, r: 0.561
Group # 5 -- E: 0.515, A: 0.685, P: 0.168
Group # 6 -- E: 0.625, P: 0.635, F: 0.364
Cut Group # 7 with factors XIPA
---------- Level # 5 ----------
Run # 35, 66 cells:

Input 0.158
Group # 2 -- 3: 0.543, 4: 0.775, 6: 0.341, 1: 0.902
Group # 3 -- 3: 0.556, 2: 0.393, 1: 0.647
Group # 4 -- i: 0.443, r: 0.573
Group # 5 -- E: 0.523, A: 0.696, P: 0.146
Group # 6 -- E: 0.618, P: 0.636, F: 0.365
Run # 36, 66 cells:

Input 0.165
Group # 1 -- 2: 0.531, 1: 0.462, 4: 0.409, 3: 0.545
Group # 3 -- 3: 0.520, 2: 0.392, 1: 0.655
Group # 4 -- i: 0.453, r: 0.560
Group # 5 -- E: 0.511, A: 0.717, P: 0.136
Group # 6 -- E: 0.645, P: 0.628, F: 0.365
Run # 37, 74 cells:

Input 0.162
Group # 1 -- 2: 0.550, 1: 0.428, 4: 0.449, 3: 0.543
Group # 2 -- 3: 0.545, 4: 0.777, 6: 0.336, 1: 0.916
Group # 4 -- i: 0.397, r: 0.631
Group # 5 -- E: 0.525, A: 0.680, P: 0.162
Group # 6 -- E: 0.599, P: 0.666, F: 0.345
Run # 38, 95 cells:

Input 0.154
Group # 1 -- 2: 0.541, 1: 0.408, 4: 0.443, 3: 0.599
Group # 2 -- 3: 0.545, 4: 0.782, 6: 0.334, 1: 0.889
Group # 3 -- 3: 0.530, 2: 0.375, 1: 0.679
Group # 5 -- E: 0.519, A: 0.675, P: 0.174
Group # 6 -- E: 0.633, P: 0.653, F: 0.349
Run # 39, 79 cells:

Input 0.175
Group # 1 -- 2: 0.564, 1: 0.376, 4: 0.448, 3: 0.605
Group # 2 -- 3: 0.545, 4: 0.803, 6: 0.327, 1: 0.912
Group # 3 -- 3: 0.568, 2: 0.386, 1: 0.655
Group # 4 -- i: 0.465, r: 0.545
Group # 6 -- E: 0.615, P: 0.723, F: 0.296
Run # 40, 81 cells:

Input 0.165
Group # 1 -- 2: 0.530, 1: 0.448, 4: 0.412, 3: 0.569
Group # 2 -- 3: 0.545, 4: 0.779, 6: 0.334, 1: 0.920
Group # 3 -- 3: 0.576, 2: 0.379, 1: 0.663
Group # 4 -- i: 0.424, r: 0.597
Group # 5 -- E: 0.489, A: 0.754, P: 0.119
Cut Group # 1 with factors 2143
---------- Level # 4 ----------
Run # 41, 36 cells:

Input 0.167
Group # 3 -- 3: 0.530, 2: 0.397, 1: 0.647
Group # 4 -- i: 0.449, r: 0.566
Group # 5 -- E: 0.519, A: 0.723, P: 0.122
Group # 6 -- E: 0.640, P: 0.629, F: 0.366
Run # 42, 42 cells:

Input 0.164
Group # 2 -- 3: 0.543, 4: 0.770, 6: 0.340, 1: 0.915
Group # 4 -- i: 0.390, r: 0.639
Group # 5 -- E: 0.532, A: 0.694, P: 0.137
Group # 6 -- E: 0.595, P: 0.666, F: 0.346
Run # 43, 50 cells:

Input 0.158
Group # 2 -- 3: 0.545, 4: 0.773, 6: 0.338, 1: 0.878
Group # 3 -- 3: 0.544, 2: 0.370, 1: 0.683
Group # 5 -- E: 0.525, A: 0.696, P: 0.143
Group # 6 -- E: 0.633, P: 0.660, F: 0.343
Run # 44, 43 cells:

Input 0.184
Group # 2 -- 3: 0.545, 4: 0.797, 6: 0.329, 1: 0.915
Group # 3 -- 3: 0.592, 2: 0.387, 1: 0.649
Group # 4 -- i: 0.439, r: 0.578
Group # 6 -- E: 0.612, P: 0.734, F: 0.287
Run # 45, 43 cells:

Input 0.168
Group # 2 -- 3: 0.542, 4: 0.776, 6: 0.341, 1: 0.920
Group # 3 -- 3: 0.593, 2: 0.384, 1: 0.653
Group # 4 -- i: 0.413, r: 0.611
Group # 5 -- E: 0.494, A: 0.763, P: 0.106
Cut Group # 4 with factors ir
---------- Level # 3 ----------
Run # 46, 24 cells:

Input 0.168
Group # 3 -- 3: 0.518, 2: 0.377, 1: 0.678
Group # 5 -- E: 0.520, A: 0.722, P: 0.121
Group # 6 -- E: 0.655, P: 0.652, F: 0.344
Run # 47, 27 cells:

Input 0.170
Group # 2 -- 3: 0.548, 4: 0.761, 6: 0.336, 1: 0.865
Group # 5 -- E: 0.554, A: 0.687, P: 0.122
Group # 6 -- E: 0.610, P: 0.737, F: 0.285
Run # 48, 28 cells:

Input 0.184
Group # 2 -- 3: 0.547, 4: 0.796, 6: 0.328, 1: 0.892
Group # 3 -- 3: 0.580, 2: 0.361, 1: 0.689
Group # 6 -- E: 0.628, P: 0.756, F: 0.266
Run # 49, 28 cells:

Input 0.170
Group # 2 -- 3: 0.547, 4: 0.774, 6: 0.333, 1: 0.892
Group # 3 -- 3: 0.582, 2: 0.344, 1: 0.712
Group # 5 -- E: 0.484, A: 0.785, P: 0.093
All remaining groups significant
Groups eliminated while stepping down: 7 1 4

Best stepping down run: #43
Vejamos agora como interpretar esses resultados:

O programa comea com o Stepping up. No nvel 0, ele apresenta o input inicial (0.284), que
corresponde ao percentual total da regra de aplicao (28,4% para a variante I futuro perifrstico). O
input representa o nvel geral de uso de determinado valor da varivel dependente (GUY; ZILLES, 2007,
p. 238).
Em seguida, o programa apresenta vrios nveis de anlise. No nvel 1, ele roda cada grupo
isoladamente. No nvel 2, roda os grupos dois a dois; no nvel 3, cruza os grupos trs a trs e assim por
diante. Nesta rodada, o programa identificou os pesos no nvel 5 da rodada, aps constatar que no h mais
grupos significativos. Assim, ele selecionou como estatisticamente significativos, nesta ordem, os grupos
6, 3, 2 e 5. E indica que os melhores resultados esto na tabela 22.
No remaining groups significant
Groups selected while stepping up: 6 3 2 5

---------------------------------------------
Eis os melhores resultados:
Run # 22, 50 cells:

Input 0.158
Group # 2 -- 3: 0.545, 4: 0.773, 6: 0.338, 1: 0.878
Group # 3 -- 3: 0.544, 2: 0.370, 1: 0.683
Group # 5 -- E: 0.525, A: 0.696, P: 0.143
Group # 6 -- E: 0.633, P: 0.660, F: 0.343
Embora os grupos apaream em ordem crescente aqui, a anlise deve considerar a ordem de
seleo. Assim, so importantes para a aplicao da regra de futuro perifrstico: 1 o tipo de verbo (grupo
6), 2 a conjugao verbal (grupo 3), 3 a pessoa verbal (grupo 2) e o tipo de sujeito (grupo 5).
Observemos que o input final foi de 0.158, ou seja, o programa corrigiu algum desequilbrio na
amostra. O log likelihood foi de -181.010 e o nvel de significncia foi 0.008. O log likelihood, logaritmo
de verossimilhana, mede a aproximao entre o modelo e os dados observados. Seu valor varia em funo
da quantidade de dados e o nmero de aplicaes do modelo em cada clula (para mais detalhes, cf. GUY;
ZILLES, 2007). Quanto maior o log likelihood, maior a robustez dos dados. O nvel de significncia o
nvel de confiabilidade dos resultados. Para as cincias humanas, o nvel mximo aceitvel de 0.050. No
nosso caso, os resultados so confiveis!
Aps a seleo do Stepping up, o programa comea o Stepping down. Aqui, ele comea com todos
os grupos e vai retirando cada um, depois retira dois, depois retira trs e assim por diante. como se fosse
a prova dos nove dos clculos. Ao final, apresenta os grupos eliminados, aps constatar no existirem mais
grupos relevantes:
All remaining groups significant
Groups eliminated while stepping down: 7 1 4

Best stepping down run: #43
Neste caso, ele eliminou os grupos 7, 1 e 4, exatamente os que no foram selecionados no Stepping
up. E volta a dizer que os melhores resultados esto nas tabelas 22 e 43, cujos pesos relativos so os
mesmos para todos os fatores:
Run # 22, 50 cells:

Input 0.158
Group # 2 -- 3: 0.545, 4: 0.773, 6: 0.338, 1: 0.878
Group # 3 -- 3: 0.544, 2: 0.370, 1: 0.683
Group # 5 -- E: 0.525, A: 0.696, P: 0.143
Group # 6 -- E: 0.633, P: 0.660, F: 0.343
Run # 43, 50 cells:

Input 0.158
Group # 2 -- 3: 0.545, 4: 0.773, 6: 0.338, 1: 0.878
Group # 3 -- 3: 0.544, 2: 0.370, 1: 0.683
Group # 5 -- E: 0.525, A: 0.696, P: 0.143
Group # 6 -- E: 0.633, P: 0.660, F: 0.343
Observao importante: acontece s vezes de um grupo ser selecionado e depois ser descartado. Isso indica
que o programa no tem certeza da sua importncia. Vale a pena olhar o comportamento desse grupo em
cada rodada (run) em que ele aparece e verificar se h grandes mudanas nos pesos dos seus fatores.
Detectada essa mudana repentina de pesos, observe o grupo de fatores que foi adicionado na rodada, pois,
possivelmente, ocorre interao (para mais informaes, cf. GUY; ZILLES, 2007).
De posse dos resultados, agora s montar as tabelas com os resultados de cada grupo (nmero de
ocorrncias/total, percentual e peso relativo) e explic-los linguisticamente, sempre luz de uma teoria
lingustica e da intuio do pesquisador, comeando sempre pela hiptese aventada. Os nmeros sozinhos
nada dizem, preciso que expliquemos por que tal(is) varivel(is) e/ou tal(is) fator(es) favorece(m) ou
desfavorece(m) a aplicao da regra! No esquea de colocar exemplos na anlise! Lembre-se tambm de
apresentar os casos categricos (knockouts). Normalmente, usamos apenas duas casas decimais (com
aproximao matemtica) e eliminamos o zero inicial. Ex: Grupo 5, fator A (sujeito agente), o peso
0.696; dizemos ento que .70. Recomenda-se tambm o uso de grficos ilustrativos, sobretudo para
variveis sociais.
Para ver uma anlise sociolingustica pronta, vejamos o artigo a seguir, em que, alm dos resultados
vistos aqui (para o jornal A Tarde), h os resultados para mais duas rodadas, uma do jornal Correio da
Bahia e outra do jornal Tribuna da Bahia. O trabalho foi apresentado no XV Congresso da ALFAL, em
agosto de 2008, em Montevideo.
Agora, bom trabalho nas suas pesquisas!
XV Congreso Internacional de la Asociacin de Lingustica y Filologa de Amrica Latina ALFAL (Montevideo, 18 a 21 de
agosto de 2008)
Qual o futuro da Bahia?

Josane Moreira de Oliveira2
(Universidade Estadual de Feira de Santana / Brasil)
Introduo
A expresso do futuro verbal na histria do portugus um fenmeno varivel tanto na fala quanto
na escrita. Para exprimir o tempo posterior ao momento da fala, podem-se usar as seguintes variantes: a) o
futuro simples (eu farei isso amanh); b) o futuro perifrstico com haver de no presente + infinitivo (eu hei
de fazer isso amanh); c) o futuro perifrstico com haver de no futuro + infinitivo (eu haverei de fazer isso
amanh); d) o futuro perifrstico com ir no presente + infinitivo (eu vou fazer isso amanh); e) o futuro
perifrstico com ir no futuro + infinitivo (eu irei fazer isso amanh); f) o presente (eu fao isso amanh).
As perfrases com haver de + infinitivo perduram at o sculo XIX, quando comeam a ceder espao para
as perfrases com ir + infinitivo. O presente do indicativo parece ter um contexto bastante prprio e tem se
mantido, ao longo do tempo, mais ou menos estvel (OLIVEIRA, 2006). J o processo de mudana futuro
simples > futuro perifrstico com ir + infinitivo est bastante avanado (e mesmo j quase concludo) na
modalidade falada e comea a invadir a modalidade escrita. Essa variao no exclusiva do portugus;
atestada em muitas outras lnguas. O uso do verbo ir como auxiliar de futuro combinado com o infinitivo e
a gramaticalizao dessa forma perifrstica so documentados tambm em ingls (I am going to sleep), em
francs (Je vais dormir) e em espanhol (Yo voy a dormir), por exemplo. Todavia, mesmo sendo esse
fenmeno bastante conhecido e no discriminado pelos falantes, as gramticas tradicionais e os manuais
escolares de lngua portuguesa ainda registram apenas o futuro simples. Com base em dados
contemporneos de jornais baianos (A Tarde, Tribuna da Bahia e Correio da Bahia) direcionados a
pblicos distintos, investiga-se a implementao da forma perifrstica na escrita considerada culta ou
padro, tomando como quadro terico-metodolgico a sociolingustica quantitativa laboviana e a hiptese
da gramaticalizao nos moldes propostos por Hopper & Traugott (2003).
1. Quadro terico
A sociolingustica variacionista pressupe que a variao inerente a toda e qualquer lngua e no

aleatria ou fortuita. Ao contrrio, condicionada por fatores lingusticos e sociais. Ou seja, tanto a
2
Participaram desta pesquisa as estudantes Isabella Almeida de Souza e Viviane Moreira de Oliveira, a quem agradeo pela
valiosa colaborao, respectivamente, na coleta e na digitao dos dados.
variao como a mudana lingusticas tm ligaes estreitas com fenmenos extralingusticos que as
condicionam.
O funcionalismo lingustico analisa a lngua enquanto fenmeno comunicativo e discursivo. Sendo
a noo de tempo uma categoria lingustica e suas relaes com o tempo cronolgico uma funo da
comunicao e do discurso, uma abordagem funcionalista pode embasar teoricamente a anlise da
expresso de futuro no portugus, que pode ser realizada atravs de formas simples ou de formas
analticas/perifrsticas.
O tempo futuro expressa a expectativa de alguma ao (processo ou evento) a ser verificada mais
tarde, aps o ato de fala. Ele tem um valor temporal que no permite expressar uma modalidade factual,
pois s aceita asseres segundo a avaliao feita pelo falante da (im)possibilidade de ocorrncia de um
estado de coisas. Assim, h um valor modal aliado ao fator temporal no futuro que compromete a
determinao do valor de verdade da proposio enunciada. Segundo Cmara Jr. (1957, p. 223), a
categoria de futuro no ocorre pela necessidade da expresso temporal; concretizam-no certas
necessidades modais, de sorte que o futuro comea como modo muito mais do que como tempo.
O ciclo de alternncia entre formas simples e formas perifrsticas de futuro uma constante na
histria das lnguas romnicas. J no prprio latim, o futuro desinencial adveio de formas modais analticas
(cantare habeo > cantar hei > cantarei). Para Cmara Jr., a nova forma de futuro criada ainda no latim
desempenha trs funes na lngua: a) marca o modo; b) marca tempo com matiz modal; e c) marca tempo.
O autor fala em gramaticalizao do futuro modal em futuro temporal.
Neste trabalho, admite-se a hiptese de que o processo que aconteceu no latim (forma analtica >
forma sinttica) est sendo invertido no portugus atual (forma sinttica > forma analtica) a partir da
gramaticalizao do verbo ir, que passa, j em estgios anteriores da lngua, de forma plena a marca
morfossinttica de futuro.
A perfrase a forma verbal inovadora, que convive com a forma simples (conservadora). Trata-se,
pois, de um fenmeno varivel no portugus em que a variante perifrstica, concorrente da forma sinttica
para codificar a funo que situa a ao ou o processo direita do ponto da fala, muito pouco
discriminada. E a entrada do verbo ir como auxiliar na perfrase para expressar o futuro vem encontrando
resposta positiva entre os falantes.
Os verbos de movimento, em geral, so polissmicos e superpem, dentre outras, as noes de
espao e de tempo. O verbo ir um dos verbos mais polissmicos e, pois, um dos mais gramaticalizveis.
Na construo perifrstica com o infinitivo, ele tende a se transformar em auxiliar (HEINE, 1993; BYBEE
et alii, 1994; HEINE & KUTEVA, 2002), quer dizer, num instrumento gramatical para a expresso do
tempo futuro. Essa tendncia, bem conhecida no ingls, no francs e no espanhol, pode ser constatada
tambm em portugus, em que, na fala, o processo de substituio da forma de futuro simples pela forma
perifrstica ir + infinitivo est quase concludo (OLIVEIRA, 2006).
2. Amostra e metodologia
Por meio da anlise controlada de dados coletados em jornais contemporneos baianos, com base
na sociolingustica laboviana, verifica-se a implementao da perfrase com ir + infinitivo, identificando-se
os contextos lingusticos do seu espraiamento. Nesta pesquisa, observa-se o papel de alguns grupos de
fatores (medido em termos de percentuais e de pesos relativos a partir da ferramenta GoldVarb): a) a
extenso fonolgica do verbo; b) a conjugao verbal; c) o paradigma verbal; d) a pessoa verbal; e) o tipo
de sujeito; f) a animacidade do sujeito; g) o papel temtico do sujeito; h) o tipo de verbo; i) a transitividade
verbal; j) a presena/ausncia de clticos; k) a natureza semntica do verbo; l) a indicao de tempo futuro
fora do verbo; m) a projeo de futuridade; n) o paralelismo sinttico-discursivo; o) o tipo de peridico; e
p) o gnero textual.
Foram examinados: a) dois exemplares do jornal A Tarde, de 07/06/07 e de 03/08/07, considerado
um peridico direcionado a um pblico mais elitizado; b) dois exemplares do jornal Correio da Bahia, de
28/11/07 e de 20/12/07, considerado um peridico direcionado classe mdia; e c) dois exemplares do
jornal Tribuna da Bahia, de 23/08/07 e de 08 e 09/12/07, considerado um peridico mais popular.
Foram coletados, inicialmente, 2575 dados de quatro variantes: futuro simples, futuro perifrstico
com ir + infinitivo, futuro perifrstico com haver de + infinitivo e presente. Como s houve 4 dados com
haver de + infinitivo, todos num mesmo exemplar de peridico, essas ocorrncias foram retiradas da
amostra final. Quanto perfrase com ir + infinitivo, houve 27 ocorrncias com o verbo ir no futuro, que,
pela sua baixa frequncia, foram computadas juntamente com as formas de ir no presente + infinitivo.
Assim, os resultados encontrados esto apresentados na Tabela 1:
Tabela 1: Distribuio das variantes na lngua escrita por peridico

Variantes Peridico Total
A Tarde Correio da Tribuna da
Bahia Bahia
Futuro simples 473 624 339 1436
49% 66% 52% 56%
Ir + infinitivo 197 145 146 488
20% 16% 22% 19%
Presente 306 173 168 647
31% 18% 26% 25%
Total 976 942 653 2571
Para esta comunicao, em particular, foram excludas as formas de presente com valor de futuro,
embora tenham apresentado percentuais maiores que a forma perifrstica, por duas razes: a) com base em
resultados de trabalhos anteriores (OLIVEIRA, 2006), essa variante possui contextos bem especficos,
mantm ndices de uso mais ou menos estveis na histria da lngua e est margem da concorrncia
futuro simples X futuro perifrstico; e b) objetiva-se verificar, aqui, a implementao da forma perifrstica
em substituio forma de futuro na lngua escrita, j que na lngua falada esse processo j se encontra em
fase de compleio (OLIVEIRA, 2006).
Assim, considerando apenas os dados das variantes em concorrncia (1924 dados), a distribuio
a seguinte:
Tabela 2: Redistribuio das variantes na lngua escrita por peridico

Variantes Peridico
Bahia Bahia
Futuro simples 473 624 339
71% 81% 70%
Ir + infinitivo 197 145 146
29% 19% 30%
Total 670 769 485
Numa anlise inicial, olhando os dados globalmente, embora predomine o futuro simples na escrita
jornalstica, pode-se verificar que a concorrncia entre as duas variantes documentada nos trs
peridicos, e em ndices bastante prximos (variando de 19% a 30% o percentual de uso da forma
perifrstica), conforme ilustra o Grfico 1, a seguir:
Grfico 1: Variantes por peridico (percentuais)
100
90
80
70
60
50
Futuro simples
40
30 Futuro perifrstico
20
10
0
Bahia Bahia
3. Anlise dos dados
Primeiramente, os dados foram submetidos a uma rodada que considerou os diferentes peridicos
como uma varivel independente com o objetivo de verificar o papel desse grupo de fatores, que no foi
selecionado pelo GoldVarb. A regra de aplicao foi o uso da forma perifrstica, variante inovadora em
fase de implementao na modalidade escrita da lngua. Dos 1924 dados, 488 (25%) foram de perfrase.
De todos os grupos controlados, nove foram selecionados, nesta ordem: 1. natureza semntica do verbo; 2.
gnero textual; 3. pessoa verbal; 4. paradigma verbal; 5. paralelismo sinttico-discursivo; 6. tipo de verbo;
7. indicao de tempo futuro fora do verbo; 8. papel temtico do sujeito; e 9. tipo de sujeito.
O fato de a varivel tipo de peridico no ter sido selecionada significa que no h diferena
estatstica significativa entre o uso da perfrase e o tipo de jornal, ou seja, ela est presente nos trs
peridicos, independentemente de ser o jornal mais ou menos elitizado. E essa informao, embora
contrarie a hiptese inicial (a de que haveria mais perfrase no peridico mais popular e menos perfrase no
peridico mais elitizado), muito importante para medir o grau de implementao dessa forma na escrita
jornalstica baiana.
Embora estatisticamente no seja relevante o tipo de jornal, linguisticamente importante verificar
as diferenas dos resultados dos trs peridicos para conhecer os contextos iniciais de espraiamento da
variante analisada. Assim, foram feitas rodadas separadas, por peridico, e o resultado est ilustrado na
Tabela 3, a seguir:
Tabela 3: Dados de perfrase por peridico

A Tarde Correio da Bahia Tribuna da Bahia
Ocorrncias/Total 197/670 145/769 146/485
Percentual 29% 19% 30%
Input inicial .29 .19 .30
Significncia 0,037 0,027 0,021
Grupos 1. Natureza 1. Natureza 1. Natureza
selecionados semntica do verbo semntica do verbo semntica do verbo
2. Paradigma verbal 2. Gnero textual 2. Paradigma verbal
3. Pessoa verbal 3. Paralelismo 3. Pessoa verbal
4. Gnero textual sinttico-discursivo 4. Projeo de
5. Papel temtico do 4. Pessoa verbal futuridade
sujeito 5. Paradigma verbal 5. Tipo de sujeito
6. Tipo de verbo 6. Transitividade 6. Indicao de tempo
7. Animacidade do verbal futuro fora do verbo
sujeito 7. Tipo de sujeito
8. Extenso
fonolgica do verbo
De acordo com os resultados do GoldVarb, no peridico mais elitizado, a perfrase se implementa

na escrita com verbos que expressam ao ou processo, verbos regulares, com sujeito de 1 pessoa, em
textos do tipo colunas, quadrinhos, resumos e manchetes, com sujeito [+ agente], com o verbo ser e com
sujeito [+ animado]. No peridico considerado intermedirio, o contexto de entrada da forma inovadora
com verbos que tambm indicam ao ou processo, em textos do tipo matria e resumo, em ocorrncias
isoladas, tambm com sujeito de 1 pessoa, tambm com verbos regulares, com verbos intransitivos, com
sujeitos oracionais ou desinenciais e com verbos extensos fonologicamente (3 slabas ou mais). Quanto ao
jornal mais popular, a forma perifrstica mais usada com verbos cognitivos, tambm com verbos
regulares, tambm com sujeito de 1 pessoa, para expressar um futuro imediato (com ao a ser realizada
nas prximas 24 horas), tambm com sujeitos oracionais e na presena de uma orao adverbial.
Nos trs jornais analisados, trs grupos foram selecionados em comum: a natureza semntica do
verbo, o paradigma verbal e a pessoa verbal. Os resultados para essas variveis esto apresentados e
comentados a seguir.
3.1. Natureza semntica do verbo
Esse grupo de fatores controla o tipo semntico dos verbos, distribuindo-os em verbos que indicam
processo, ao ou movimento, verbos que denotam evento, verbos de estado e verbos cognitivos ou que
expressam um estado psicolgico. Seguem exemplos de cada um desses tipos de verbo:
Processo
(1) Foi to bom e to aplaudido o show do cantor Billy Paul em Salvador, que, a pedido, ele est
retornando para o Othon, onde VAI SE APRESENTAR durante jantar na noite de tera-feira,
fazendo uma homenagem toda especial aos namorados. [AT 1, c.2, p.2, col.]
Evento
(2) (...) os climatologistas dizem o que VAI ACONTECER se o aumento global continuar no ritmo
atual. [CB 1, c.4, p.10, not.]
Estado
(3) Mesmo suspenso, Alysson ainda VAI FICAR de molho por um ms, depois de sofrer diante do
Coritiba uma luxao no cotovelo. [AT 2, ec, p.5, not.]
Cognio
(4) Ao invs de met-los na cadeia, arruma-se uma frmula deles se sarem numa boa custa do
torcedor otrio que VAI PENSAR, certamente, que o Bahia, o Vitria, a Catuense e tantos outros
times baianos sero beneficiados. [TB1, c.1, p.2, mat.]
A hiptese levantada para esse grupo era a de que o futuro perifrstico se implementasse pelos
verbos que denotam processo, j que o verbo ir, sendo um verbo de movimento, exprime uma ao que
envolve dois momentos, o de partida e o de chegada. A literatura sobre a gramaticalizao do verbo ir
mostra que o fenmeno ocorre principalmente com esse tipo de verbos, j que implicam alterao entre
dois momentos temporais. Esperava-se tambm que os verbos de estado inibissem o uso do futuro
perifrstico, favorecendo, portanto, o emprego do futuro simples, como atestado por outros trabalhos,
como, por exemplo, o de Malvar (2003).
Em dois tipos de jornal (A Tarde e Correio da Bahia), os resultados encontrados revelam que, de
fato, o maior percentual e o maior peso relativo de uso do futuro perifrstico ocorrem com verbos que
indicam processo, seguidos dos verbos que denotam evento, como se v na Tabela 4, a seguir:
Tabela 4: Uso da perfrase e natureza semntica do verbo por peridico
Fator A Tarde Correio da Bahia Tribuna da Bahia
Oc./Total PR Oc./Total PR Oc./Total PR
% % %
Evento 24/87 .51 29/152 .63 21/56 .64
27% 19% 37%
Processo 146/257 .56 99/219 .74 96/191 .66
56% 45% 50%
Estado 27/324 .45 15/396 .31 24/232 .32
8% 3% 10%
Cognio 0/2 - 2/2 - 5/6 .91
0% 100% 83%
Oc. = ocorrncias PR = Peso relativo
J no peridico Tribuna da Bahia, contrariando a hiptese aventada, o maior percentual e o maior

peso relativo ocorrem para os verbos cognitivos, seguidos dos verbos que expressam um processo e dos
que denotam evento. Mas os dados com verbos cognitivos so muito poucos para que explicaes mais
conclusivas sejam dadas. Houve dois dados apenas no jornal A Tarde (ambos com futuro simples) e no
jornal Correio da Bahia (ambos com futuro perifrstico). No jornal Tribuna da Bahia, houve seis dados,
cinco dos quais com a perfrase.
Assim, deixando de lado os verbos cognitivos, por ora, o que se pode dizer que, na escrita
jornalstica baiana, a mudana se implementa pelos verbos que indicam processo, seguidos dos verbos que
denotam evento, sendo os verbos de estado os que mantm o futuro simples, o que condiz com a literatura
sobre o processo de gramaticalizao do verbo ir.
3.2. Paradigma verbal
Esta varivel distribui os dados em dois grupos: os que contm um verbo que segue o paradigma
geral (verbos regulares) e os que apresentam um verbo de padro especial (verbos irregulares),
considerando, pois, o critrio morfolgico. Por exemplo, so verbos regulares cantar, beber e partir e
so irregulares os verbos estar, trazer e pedir. Supondo que h uma mudana em curso no sentido de
o futuro perifrstico substituir o futuro simples, aventou-se a hiptese de que esse processo avanaria
primeiro nas formas regulares e depois nas irregulares. Essa hiptese se confirma nos dados dos trs tipos
de peridico, tanto em termos percentuais como em pesos relativos, conforme evidenciado na Tabela 5:
Tabela 5: Uso da perfrase e paradigma verbal por peridico
% % %
Regular 158/303 .69 113/333 .61 117/231 .68
52% 33% 50%
Irregular 39/367 .34 32/436 .42 29/254 .33
10% 7% 11%
So os verbos regulares os que favorecem a aplicao da regra de perfrase, ficando o futuro
simples mais restrito aos verbos irregulares, ou seja, os que tm um padro morfolgico especial. Esses
verbos, segundo Bybee (2003), por terem uma frequncia alta de uso na lngua, resistem a mudanas e,
sendo estocados na memria do falante como nicos (especiais), mantm o futuro simples, pois no
seguem padres gerais.
3.3. Pessoa verbal
Como mencionado frequentemente na literatura sobre a expresso do futuro verbal em portugus,

as formas de presente e de perfrase com ir + infinitivo exprimem um maior grau de certeza da realizao
do estado de coisas no futuro. Essa maior possibilidade ou maior probabilidade de acontecimento de algo
est intimamente ligada ao envolvimento ou comprometimento do falante em relao ao enunciado que
profere. Assim, assumiu-se como hiptese que os sujeitos de primeira pessoa favoreceriam o uso da forma
inovadora, expressando um maior investimento para a concretizao da ao futura.
Observem-se os exemplos a seguir:
(5) O leitor me desculpe, mas no VOU FAZER o histrico porque precisaria de pesquisar mais a
fundo. [TB 1, c.1, p.2, mat.]
(6) J estamos a par da reintegrao desde segunda-feira, VAMOS VER quais as propostas do
governo do Estado e da Suzano na reunio de amanh... [AT 2, c.1, p.12, mat.]
Os resultados encontrados nesta pesquisa esto apresentados na Tabela 6:
Tabela 6: Uso da perfrase e pessoa verbal por peridico

% % %
P1 3/4 .90 12/15 .85 9/14 .88
75% 80% 64%
P3 138/426 .54 97/529 .48 102/322 .51
32% 18% 31%
P4 21/33 .73 14/19 .87 13/22 .89
63% 73% 59%
P6 35/206 .37 22/206 .47 22/127 .34
16% 10% 17%
Como se pode ver na Tabela 6, a primeira pessoa (P1 = eu; P4 = ns) apresenta maior peso relativo
e maior percentual no uso da perfrase. Esse fato revela um maior comprometimento do sujeito com a
realizao do processo verbal a se concretizar no futuro.
Note-se que os dados de primeira pessoa so muito poucos em relao aos de terceira pessoa, mais
tpicos nesse tipo de escrita. Em geral, os dados de 1 pessoa aparecem em citaes de fala para ilustrar os
textos jornalsticos. De qualquer forma, percebe-se que o jornalista no corrige a fala dos entrevistados,
pelo menos no que tange ao fenmeno aqui estudado, o que corrobora o fato de que a perfrase est para a
fala assim como o futuro simples est para a escrita (pelo menos a escrita formal).
Em pesquisa anterior (OLIVEIRA, 2006), foram analisados dados de fala de informantes
considerados cultos, isto , todos com nvel superior completo e os resultados apontam a preferncia de uso
da forma perifrstica em detrimento da forma simples. Comparando os resultados gerais de fala e escrita
(ambas as modalidades em sua forma considerada culta ou padro), observa-se uma inverso parcial no uso
das variantes concorrentes. Veja-se a Tabela 7, a seguir, com o acrscimo dos dados de jornais de 2007:
Tabela 7: Comparao de dados de fala e de escrita

Variantes Fala* Escrita
EF DID DID Jornais** Jornais** Jornais
(anos 70) (anos 70) (anos 90) (anos 70) (anos 90) (2007)
Futuro 82 25 5 71 51 1436
simples 19% 13% 4% 91% 73% 75%
Futuro 358 164 137 7 19 488
perifrstico 81% 87% 96% 9% 27% 25%
Total 440 189 142 78 70 1924
3
* Dados do Projeto NURC
** S textos de editoriais
EF = elocuo formal
DID = dilogo entre informante e documentador
Analisando a Tabela 7, percebe-se que os dados confirmam a inverso parcial das duas variantes
em relao s modalidades da lngua: o futuro perifrstico mais usado na fala e o futuro simples mais
usado na escrita. Comparando os dados dos anos 70 com os dados dos anos 90, observa-se um aumento no
uso da perfrase na fala e um decrscimo no uso do futuro simples na escrita. Ou seja, o uso da perfrase
quase categrico na fala e comea a se implementar na escrita.
Concluses
A partir do controle de vrios grupos de fatores lingusticos e extralingusticos, com o intuito de

verificar os contextos de condicionamento do uso das variantes futuro simples e futuro perifrstico,
constatou-se que o futuro simples ainda prevalece na lngua escrita jornalstica. Todavia a forma
perifrstica vem se implementando na modalidade escrita e o seu contexto de entrada o que envolve
verbos que exprimem processo/ao/movimento, verbos regulares e sujeitos de 1 pessoa (sobretudo
quando h dados de fala reproduzidos nos jornais). Considerando trs tipos de jornais voltados para
pblicos diferentes, percebeu-se que o peridico mais popular (Tribuna da Bahia) o que mais usa a forma
inovadora (30%), mas o peridico considerado intermedirio (Correio da Bahia, visto na sociedade
3
Projeto de Estudo da Norma Urbana Culta das Principais Cidades Brasileiras, desenvolvido em Salvador, Recife, Rio de
Janeiro, So Paulo e Porto Alegre.
soteropolitana como conservador) o que mais usa a forma de futuro simples (81%). Estatisticamente,
porm, no h diferena significativa entre o uso das formas concorrentes e os tipos de jornal analisados.
Este trabalho apresenta resultados parciais de pesquisa desenvolvida a partir de 2007 com textos
jornalsticos, mas, comparando-os com resultados de pesquisa anterior (OLIVEIRA, 2006), mantm-se a
hiptese da inverso parcial entre fala e escrita quanto ao uso das variantes inovadora e conservadora.
Resta saber se, com a ampliao do corpus, os resultados se mantm prximos. Pretende-se tambm
verificar a implementao do futuro perifrstico em outros tipos de escrita, como, por exemplo, em
redaes escolares.
Referncias
BYBEE, J. Mechanisms of change in grammaticization: the role of frequency. In: JOSEPH, B. D.;
JANDA, R. D. (Ed.) The handbook of historical linguistics. Oxford: Blackwell, 2003, p. 602-623.
BYBEE, J. et alii. The evolution of grammar: tense, aspect, and modality in the languages of the world.
Chicago: Chicago University Press, 1994.
CMARA JR., J. M. Uma forma verbal portuguesa estudo estilstico e gramatical. Tese apresentada no
concurso para a cadeira de Lngua Portuguesa da Faculdade de Filosofia. Rio de Janeiro: Jornal do
Comrcio/Rodrigues & Cia., 1957.
FLEISCHMAN, S. The future in thought and language diachronic evidence from Romance. Cambridge:
Cambridge University Press, 1982.
HEINE, B. Auxiliaries: cognitive forces and grammaticalization. New York: Oxford University Press,
1993.
HEINE, B.; KUTEVA, T. World lexicon of grammaticalization. Cambridge: Cambridge University Press,
2002.
HOPPER, P. J. & TRAUGOTT, E. Grammaticalization. Cambridge: Cambridge University Press, 2003
[1993].
MALVAR, E. O presente do futuro no portugus oral do Brasil. Ottawa: University of Ottawa, 2003 (Tese
de Doutorado).
MARCHELLO-NIZIA, C. Grammaticalisation et changement linguistique. Bruxelas: De Boeck, 2006.
OLIVEIRA, J. M. O futuro da lngua portuguesa ontem e hoje: variao e mudana. Rio de Janeiro:
UFRJ, 2006 (Tese de Doutorado).
Mais grficos
Para finalizar o nosso curso, vejamos mais alguns exemplos de tabelas e grficos diferentes.
Trabalho: Abralin em Cena Esprito Santo (Vitria, 26-29/05/09)

Ttulo: A expresso do futuro verbal no portugus escrito de Angola
Tabela 1: Distribuio das variantes

Variantes Ocorrncias
Futuro simples 246
65%
Ir + infinitivo 90
24%
Presente 41
11%
Total 377
Grfico 1: Variantes (percentuais)
100%
90%
80%
70%
60%
50% Futuro simples
40%
30% Futuro perifrstico
20%
10%
0%
Angola
Tabela 4: Uso da perfrase e extenso fonolgica do verbo

Fator Ocorrncias Percentual Peso Relativo
1 slaba 9 / 102 8% .36
2 slabas 30 / 145 20% .45
3 slabas 33 / 58 56% .67
4 ou + slabas 18 / 31 58% .82
Grfico 2: Uso da perfrase e extenso fonolgica do verbo (pesos relativos)
1001
.90
.
80
70
.
60
.
.50
.
40 Perfrase
.30
.
20
.10
0
1 slaba 2 slabas 3 slabas 4 ou + slabas
Trabalho: XIII Colquio da Lusofonia (V Encontro Aoriano) Florianpolis (5-9 abril 2010)
Ttulo: O futuro da lngua portuguesa em trs cantos do mundo: Angola, Brasil e Portugal
Tabela 2: Novos resultados

Angola Brasil Portugal
Futuro simples 246 445 496
73% 71% 65%
Ir + infinitive 90 186 271
27% 29% 35%
Total de dados 336 631 767
Grfico 1: Uso do futuro verbal nos trs pases
100%
90%
80% 73% 71%
70% 65%
60%
50% Futuro simples
40% 35% Futuro perifrstico
30% 27% 29%
20%
10%
0%
Angola Brasil Portugal
Trabalho: Tese de Doutorado
Ttulo: O futuro da lngua portuguesa ontem e hoje: variao e mudana.
Tabela 1: Distribuio das variantes na lngua escrita por sculos

Variantes Sculos
XIII XIV XV XVI XVII XVIII XIX XX4
Futuro simples 18 433 65 681 358 105 91 122
54,5% 91,9% 81,3% 87,4% 74,4% 83,3% 85,8% 75,3%
Haver de + infinitivo 15 31 12 90 108 13 6 3
45,5% 6,6% 15% 11,6% 22,5% 10,3% 5,8% 1,9%
Ir + infinitivo - 6 1 3 4 5 8 26
1,3% 1,2% 0,4% 0,8% 4% 7,5% 16%
Presente - 1 2 5 11 3 1 11
0,2% 2,5% 0,6% 2,3% 2,4% 0,9% 6,8%
Total 33 471 80 779 481 126 106 162
Grfico 1: Distribuio das variantes na lngua escrita por sculos (percentuais)
100%
90%
80%
70%
60%
Futuro simples
50%
Haver de + infinitivo
40%
Ir + infinitivo
30%
20% Presente
10%
0%
XIII XIV XV XVI XVII XVIII XIX XX
Tabela 2: Distribuio geral das variantes na dcada de 70

Variantes Tipo de texto Total
Oral Escrito
EFs DIDs Jornais
Futuro simples 82 (17%) 25 (11%) 71 (88%) 178
Perfrase haver presente + infinitivo - - 2 (2%) 2
Perfrase haver futuro + infinitivo - - 1 (1%) 1
Perfrase ir presente + infinitivo 355 (72%) 164 (73%) 5 (6%) 524
Perfrase ir futuro + infinitivo 3 (1%) - 2 (2%) 5
Presente 51 (19%) 37 (16%) 1 (1%) 89
Total 491 226 82 799
4
Para o sculo XX, esto sendo considerados apenas os dados de lngua escrita, para uma coerncia na comparao com os
outros sculos, que no dispem de dados de lngua falada. Os dados orais do sculo XX so analisados na seo seguinte.
Grfico 3: Variantes por tipo de texto na dcada de 90 (percentuais)
100%
80%
FS
60%
FP
40%
PR
20%
0%
DID Jornais
Grfico 5: Faixa etria em EFs e DIDs anos 70 (pesos relativos)
.100
.80
.60 EF
.40 DID
.20
.0
Faixa 1 Faixa 2 Faixa 3
Grfico 6: Procedncia geogrfica em EFs e DIDs anos 70 (percentuais)
100%
80%
60% Salvador
40% Rio de Janeiro
20%
0%
EF DID
Grfico 9: Procedncia geogrfica em DIDs anos 70 e 90 (percentuais)
100%
80%
60% Salvador
40% Rio de Janeiro
20%
0%
Anos 70 Anos 90
Quadro 9: Dados demogrficos de Salvador e do Rio de Janeiro

Variveis Salvador Rio de Janeiro
Censo 70 Censo 91 Censo 70 Censo 91
Populao residente 1.007.195 2.075.272 4.251.918 5.480.772
Populao imigrada 297.584 646.821 1.800.822 1.517.232
Populao alfabetizada 650.679 1.467.593 3.283.600 4.255.625
IDH Municipal 0,580 0,793 0,702 0,808
IDH Educao 0,639 0,758 0,707 0,800
IDH Renda 0,698 0,952 0,940 0,965
Tabela 48: Distribuio do presente ao longo do tempo na escrita

Sculos Sc. Sc. Sc. Sc. Sc. Sc. Sc. Sc.
XIII XIV XV XVI XVII XVIII XIX XX
Oc. - 1 2 5 11 3 1 11
% - 0,2% 2,5% 0,6% 2,3% 2,4% 0,9% 6,8%
Tabela 61: Sntese dos resultados do sculo XX (percentuais)

Amostra Futuro simples Futuro perifrstico Presente
Fala 70: EFs 17% 73% 10%
Salvador 20% 65% 15%
Rio de Janeiro 14% 78% 8%
Fala 70: DIDs 11% 73% 16%
Fala 90: DIDs 3% 82% 15%
Salvador - 89% 11%
Escrita 70: jornais 90% 9% 1%
Salvador 97% 3% -
Escrita 90: jornais 65% 23% 12%
Agora, mos obra e bom trabalho! Espero ter ajudado! Contato: josanemoreira@hotmail.com.

Minicurso Sobre Goldvarb

Enviado por

Dados do documento

Descrição original:

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Minicurso Sobre Goldvarb

Enviado por

Direitos autorais:

Formatos disponíveis

UFPB Universidade Federal da Paraba

MINICURSO: Introduo ao GoldVarb X: uso e interpretao

Assim teramos 24 informantes, sendo 12 homens e 12 mulheres, 12 escolarizados e 12 analfabetos,

1. D um duplo click na Pasta GoldVarb X e um duplo click na primeira pasta GoldVarb30b3.

(I2d3i2PpbA/AddPaU//S7EJnA Tal comisso VAI FAZER uma espcie de radiografia

(F1c3i2FpnE/XndPaU//S7EJnC ste, se a comisso nomeada pelo Ministro fr de

4. Como codificar os dados

Grupos de fatores Variantes Cdigos

Os arquivos lidos pelo GoldVarb X tm extenses .tkn, .res, .cnd, .cel.

.tkn: arquivos de dados

.cnd: arquivos de condies

.cel: arquivos de clulas

.res: arquivos de resultados (especificaes, percentagens, pesos relativos, tabulaes cruzadas...)

Arquivo de dados pronto (.tkn)

(P2r1 Eu LAVO os pratos depois.

(F1i3 Ele VIR mais cedo hoje.

Exemplo de arquivo de dados no GoldVarb X:

Criando o arquivo de especificaes e checando erros de codificao

CELL CREATION 07/02/2014 19:00:41

1 N 137 8 19 164 26.6

Total N 322 128 167 617

6 N 120 17 37 174 28.2

Total N 322 128 167 617

2 N 224 25 64 313 50.7

Total N 322 128 167 617

i N 225 28 51 304 49.3

Total N 322 128 167 617

E N 157 34 69 260 43.7

Total N 304 126 165 595

F N 208 14 42 264 42.8

Total N 322 128 167 617

X N 143 74 23 240 38.9

u N 153 66 85 304 49.3

Total N 322 128 167 617

Total N 322 128 167 617

M N 231 96 63 390 63.2

Total N 322 128 167 617

Name of new cell file: .cel

Como interpretar os resultados do arquivo de clulas

i N 225 28 51 304 49.3

Total N 322 128 167 617

Tabela 1: Variao na expresso do futuro na escrita e paradigma verbal

Total N 322 128 167 617

Como recodificar os dados retirando grupos

CELL CREATION 07/02/2014 19:52:36

Number of cells: 301

1 N 137 8 19 164 26.6

Total N 322 128 167 617

6 N 120 17 37 174 28.2

Total N 322 128 167 617

2 N 224 25 64 313 50.7

Total N 322 128 167 617

i N 225 28 51 304 49.3

Total N 322 128 167 617

E N 157 34 69 260 43.7

Total N 304 126 165 595

F N 208 14 42 264 42.8

Total N 322 128 167 617

X N 143 74 23 240 38.9

Total N 322 128 167 617

M N 231 96 63 390 63.2

Total N 322 128 167 617

Name of new cell file: .cel