Escolar Documentos
Profissional Documentos
Cultura Documentos
PLANO DE ENSINO
1 OBJETIVOS
a) Conhecer e utilizar a ferramenta GoldVarb X;
b) Codificar, processar e analisar dados lingusticos;
c) Desenvolver habilidades para a interpretao dos resultados emitidos pelo GoldVarb X.
2 CONTEDO PROGRAMTICO
A sociolingustica quantitativa
O corpus
O GoldVarb X
o Origem
o Instalao
o Uso
Arquivos de dados
Grupos de fatores
Arquivo de especificaes
Arquivo de condies
Arquivo de clulas
Varbrul pesos relativos
o Interpretao dos resultados
o Apresentao dos resultados tabelas e grficos
3 METODOLOGIA
Exposio participada com direcionamento dos contedos para a aplicao prtica a partir do uso
do programa GoldVarb X no computador.
4 AVALIAO
Avaliao processual considerando a frequncia e a participao efetiva dos alunos nas aulas;
Exerccios constantes;
Processamento de dados das pesquisas dos alunos.
REFERNCIAS
CEDERGREN, H. J.; SANKOFF, D. Variable rules: performance as a statistical reflection of
competence. Language, 50:2. 1974, p. 333-355.
GUY, G. R. Advanced varbrul analysis. In: FERRARA, K; BROWN, B.; WALTERS, K.;
BAUGH, J. (Ed.). Linguistic change and contact. Austin: University of Texas, 1988, p. 124-136.
GUY, G. R.; ZILLES, A. M. Sociolingustica quantitativa: instrumental de anlise. So Paulo:
Parbola, 2007.
MILROY, L.; GORDON, M. Sociolinguistics: method and interpretation. Oxford: Blackwell,
2003.
MOLLICA, M. C.; BRAGA, M. L. (Org.). Introduo sociolingustica: o tratamento da variao.
So Paulo: Contexto, 2004.
PAOLILLO, J. Analyzing linguistic variation: statistical models and methods. Stanford CA: CSLI,
2002.
RAND, D. & SANKOFF, D. GoldVarb: a variable rule application for Macintosh. 1990.
ROBINSON, J.; LAWRENCE, H.; TAGLIAMONTE, S. GoldVarb 2001: a multivariate analysis
application for Windows. Users manual. 2001.
SANKOFF, D. Linguistic variation: models and methods. New York: Academic Press, 1978.
SANKOFF, D.; LABOV, W. On the uses of variable rules. Language in Society, 8 (2). 1979, p.
189-222. SANKOFF, D. Variable rules. In: AMMON, U.; DITTMAR, N.; MATTHEIR, K. J.
(Ed.). Sociolinguistics: an international handbook of the science of language and society.
Berlin/New York: De Gruyter, 1988, p. 984-998.
SANKOFF, D.; TAGLIAMONTE, S.; SMITH, E. GoldVarb X a multivariate analysis
application. 2005. Toronto: Department of Linguistics; Ottawa: Department of Mathematics.
Disponvel em: http://individual.utoronto.ca/tagliamonte/ Goldvarb/GV_index.htm#ref. Acesso em:
20 out. 2011.
SCHERRE, M. M. P.; CARDOSO, C. R. Guia rpido do GoldVarb X. Disponvel em:
http://geasunb.blogspot.com.br/. Acesso em: 6 fev. 2014.
TAGLIAMONTE, S. A. Analyzing sociolinguistic variation. Cambridge: Cambridge University
Press, 2006.
UFPB Curso GoldVarb X
Profa. Josane Oliveira
A sociolingustica quantitativa
Muito antiga a constatao de que a lngua se diversifica em seu uso. A viso da lngua como um
sistema heterogneo e instvel prioriza uma anlise lingustica voltada para o estudo de modos alternativos
de dizer a mesma coisa. A sociolingustica postula que a condio normal de uma comunidade de fala a
heterogeneidade e que essa heterogeneidade estruturada.
A diversificao lingustica est documentada tanto diatpica como socialmente. As lnguas
humanas esto em constante variao. Algumas variaes se propagam gradativamente por perodos mais
ou menos longos em diversos eixos sociais e podem levar a mudanas. Como praticamente impossvel a
demarcao exata e ntida de fronteiras geogrficas e sociais, prefervel falar em tendncias a empregos
de certas formas lingusticas motivadas por condicionamentos vrios.
Tendo sido largamente demonstrado e discutido o carter social da lngua, j se dispe de um
campo da cincia lingustica especificamente voltado para a covariao entre fenmenos lingusticos e
sociais, a sociolingustica, equivalente, para outros, a uma dialectologia urbana ou vertical. Por ser
impossvel desvincular a lngua de sua funo scio-comunicativa, a sociolingustica entendida como um
espao de investigao interdisciplinar que estuda e correlaciona aspectos dos sistemas lingusticos e dos
sistemas sociais, focalizando empregos concretos da lngua.
Labov (1972) questiona a justificativa para a dicotomia lingustica versus sociolingustica, uma vez
que de todos conhecido sobretudo depois de Saussure o fato de que a lngua essencialmente um
sistema de comunicao social, mas admite o uso desse termo sociolingustica, para que se diferenciem
estudos baseados em dados intuitivos (lingusticos) daqueles baseados em dados reais obtidos atravs de
gravaes de interaes orais ou de recolha de textos escritos (sociolingusticos).
Entretanto a razo maior para que se distingam esses dois tipos de estudo da lngua parece residir
nos objetivos, pois, enquanto a chamada lingustica interna, sobretudo o estruturalismo e o gerativismo,
busca estudar e descrever um sistema homogneo e abstrato de lngua, a sociolingustica ou lingustica
externa , focalizando a lngua no contexto em que se concretiza, analisa a heterogeneidade do sistema.
Alm de ocupar-se da diversidade da lngua nas situaes ou contextos em que ocorre, diversidade esta
atestada seja na variao, seja na mudana lingustica, a sociolingustica procede tambm ao estudo dos
juzos e das atitudes do falante sobre o comportamento verbal no s dele prprio mas tambm da sua
comunidade de fala.
A sociolingustica apresenta uma relao estreita com a rea da lingustica histrica, uma vez que,
estudando a variao da lngua dentro da estrutura social da comunidade em que ocorre, identifica e prev
processos de mudana em curso, que, obviamente, so decorrentes dessas variaes.
Ora, sendo a lngua um meio de interao entre o indivduo e a sociedade em que ele atua, est
claro que h foras sociais que agem sobre essa interao. E esse relacionamento casual entre lngua e
sociedade que constitui o objeto de anlise da sociolingustica.
Labov (1972) insiste na relao entre lngua e sociedade e na possibilidade, virtual e real, de
investigar e descrever a sistematicidade da variao existente e prpria das lnguas. O modelo de anlise
lingustica proposto pelo autor tambm rotulado de sociolingustica quantitativa, pois, como, em se
tratando de variao, no se pode reduzir os fatos a uma questo de tudo ou nada, opera com nmeros e
tratamento estatstico dos dados coletados.
O problema central que se coloca para a teoria da variao a avaliao do quantum com que cada
categoria postulada contribui para a realizao de uma ou outra das variantes lingusticas em concorrncia.
Na verdade, na fala concreta, a operao de uma regra varivel o resultado da atuao simultnea de
vrios fatores, ou seja, as categorias no so isoladas, pelo contrrio, elas se apresentam conjugadas.
atravs de modelos quantitativos que se podem estabelecer correlaes entre fatos lingusticos e
socioculturais, o que proporciona uma melhor viso da variao da lngua, que descrita em termos de
regras variveis, s quais se podem atribuir valores probabilsticos (ou pesos relativos) que predizem a
ocorrncia das variantes independentemente do corpus observado1.
1
Os resultados finais da anlise propiciariam a formulao de regras gramaticais variveis. Trata-se, portanto, de um sistema
lingustico de probabilidades (composto de formas em relao de concorrncia). Dessa forma, seria incorporado gramtica o
Os fatores que desencadeiam a mudana lingustica so numerosos e diversificados; podem ser
explcitos e perceptveis, ou, ao contrrio, invisveis e inacessveis percepo do falante. Podem ainda ser
externos ou internos ao sistema da lngua (MARCHELLO-NIZIA et alii, 2003).
A sociolingustica, como disciplina independente e com uma metodologia prpria, desenvolveu-se
principalmente a partir dos anos 60, nos Estados Unidos e no Canad. Seu objetivo descrever a relao
entre os fatos lingusticos e os fatos sociais, portanto exteriores lngua, tais como idade, sexo/gnero,
nvel de escolarizao, classe social, etnia, profisso, contexto estilstico ou situacional etc.
A varivel idade revela-se de fundamental importncia no estudo dos fenmenos variveis, uma
vez que essa varivel que vai indicar se determinado fenmeno de variao lingustica est estvel ou
est em progresso num estudo em tempo aparente. Tambm se sabe que, nos eixos sociais, por exemplo,
em geral, os falantes mais jovens so mais inovadores e os falantes mais velhos costumam preservar
formas mais antigas.
A varivel sexo/gnero tambm focalizada pela sociolingustica, pois, do ponto de vista social,
homens e mulheres tm papis diferentes e esto, portanto, expostos a situaes diversas. Assim, esse fator
pode influenciar a escolha de uma ou outra forma lingustica. Estudos comprovam que, nos processos de
variao estvel, so os homens que utilizam as variantes inovadoras, porm, nos casos de mudana, so as
mulheres que esto frente do processo.
A varivel escolaridade mostra-se pertinente, por exemplo, no momento em que se observa a
existncia de formas lingusticas de prestgio ou estigmatizadas. H fenmenos que so alvo do ensino
escolar e outros que no o so. Como as gramticas escolares e os manuais de ensino e estudo da lngua
julgam as formas estigmatizadas rotulando-as de erros ou vcios de linguagem, o grau de instruo do
falante pode condicion-lo ao uso de determinada(s) forma(s) lingustica(s). Tambm essa varivel se
revela importante quando do estudo da lngua escrita.
A classe ou o grupo social ou o nvel socioeconmico a que o falante pertence se reflete
tambm na sua linguagem. Quanto mais estratificada socialmente uma comunidade, maior o ndice de
variao das formas lingusticas. Os estudos sociolingusticos de Labov mostram que muitas inovaes
lingusticas surgem nas camadas mais populares e sobem pela escala social. A mudana comea a se
efetivar nas classes intermedirias, pois, quando uma variante concorrente, normalmente no prestigiada,
atinge as classes mais altas, muito provavelmente a mudana se implementa. Outros estudos, porm,
mostram resultados diversos que refletem, provavelmente, diferentes formas de organizao social.
A etnia tambm uma varivel considerada pelos sociolinguistas. sobretudo em estudos da
variao na lngua inglesa da Amrica que esse fator tem se tornado mais conhecido para a explicao de
fenmenos variveis. No caso do portugus do Brasil, entretanto, essa varivel no tem sido muito
considerada.
Para a sociolingustica, pode haver uma correlao entre o tipo de atividade profissional
desenvolvida por uma pessoa ao longo de sua vida e a necessidade do uso de formas lingusticas de
prestgio. Assim, tem-se considerado tambm a varivel profisso para compreender fenmenos
variveis, uma vez que h profisses que se servem mais da lngua do que outras. Entre falantes que atuam
em profisses do primeiro tipo (por exemplo, professores, advogados, jornalistas...), podem ocorrer mais
variantes de prestgio, j que tm acesso mais direto e mais constante ao cdigo lingustico, o que pode no
acontecer com falantes que exercem profisses do segundo tipo.
A varivel estilo de fala diz respeito forma como as pessoas se comunicam sobre determinado
assunto em determinado lugar, observadas as relaes sociais particulares entre elas. Os falantes possuem
um repertrio lingustico que varia a depender do local, do interlocutor, do assunto, do ambiente. Em
situaes descontradas, mais informais, entre pessoas com as quais se tem mais intimidade, comum que
se usem formas lingusticas vernculas, ao passo que em ambientes de maior formalidade, entre pessoas
que no se conhecem ou de posies hierrquicas diferentes, em situaes de conscincia da prpria
linguagem, os falantes so capazes de adaptar sua maneira de falar e usar com maior frequncia variantes
de prestgio. Ou seja, a fala formal se aproxima mais da norma standard e a fala informal dela se afasta,
deixando transparecer o coloquial, espontneo. Diferenas de contexto formal e informal levam os falantes
a empregar, respectivamente, estilos tambm formais ou informais. atravs do estilo informal, que deixa
transparecer mais o vernculo, que muitas mudanas se implementam.
conceito de regra varivel ao lado das regras categricas da lingustica estrutural e gerativo-transformacional , cuja aplicao
apresentaria uma frequncia condicionada a fatores internos e/ou externos lngua.
No estudo da mudana lingustica, Weinreich, Labov & Herzog (1968) formulam cinco questes
tericas centrais: os condicionamentos, a transio, o encaixamento, a avaliao e a sua implementao.
Esses cinco problemas so explicados resumidamente a seguir:
a) o problema dos condicionamentos (the constraint problem) alguns fatores determinam
mudanas possveis numa dada direo. Assim, cada restrio pressupe uma explicao que
diz respeito causa da mudana. Pode-se, ento, saber quais so as mudanas possveis e se so
de ordem universal;
b) o problema da transio (the transition problem) essa questo objetiva responder como uma
lngua muda, ou seja, como ela passa de um estgio para outro. Isso implica tambm a
transmisso de regras de uma gerao a outra e, portanto, a localizao social do falante na
comunidade de fala. Numa escala social, h grupos mais inovadores e menos inovadores.
Localizar que grupo lidera a mudana tambm, portanto, uma questo crucial. H que se
levantar hipteses para o funcionamento de cada nvel lingustico num estudo sincrnico e
diacrnico, na tentativa de entender os sistemas intermedirios, que dizem muito mais sobre as
mudanas do que os estgios inicial e final;
c) o problema do encaixamento (the embedding problem) deve-se observar como uma mudana
se encaixa no sistema lingustico e na matriz social da comunidade. H que se investigar como
uma mudana pode desencadear outra, num efeito domin, dentro do sistema lingustico;
d) o problema da avaliao (the evaluation problem) a avaliao social diz respeito forma
como os falantes julgam a mudana e qual o efeito desse julgamento sobre a mudana. Isso
implica o nvel de ateno do falante em relao fala;
e) o problema da implementao (the actuation problem) a propagao da mudana se d em
determinados ambientes estruturais e se difunde progressivamente a partir de ambientes mais
favorveis. H que se investigar que fatores propiciam que uma determinada mudana ocorra
em uma lngua em uma determinada poca e no em outra. Essa parece ser a questo mais
difcil a ser respondida pela teoria. Para a sua resoluo deve ser considerada a combinao dos
resultados para todos os problemas anteriores.
Conjugando, pois, estudos sincrnicos e diacrnicos (de longa e de curta durao) tem-se mais
embasamento para uma descrio fiel e segura de uma dada lngua. Todavia, devido ao fato de no ser
possvel resolver determinados problemas histricos, j que os dados so fragmentados, pode-se utilizar a
observao emprica do presente para explicar o passado e do passado para explicar o presente. Essa
observao pode ser produtiva na medida em que est baseada no princpio do uniformitarismo (LABOV,
1994). Ele uma condio necessria reconstruo histrica assim como o uso do presente necessrio
para explicar o passado, j que as foras e restries que regem as mudanas numa lngua no presente so
as mesmas que impulsionaram mudanas j concludas.
Finalmente, no h distino entre origem e propagao da mudana (LABOV, 1975), pois uma
lngua s muda quando uma forma foi transmitida de um falante para outro e foi aceita como uma
conveno social.
Enfim, os objetivos desse tipo de anlise so descrever e analisar a variao numa lngua,
depreendendo a sistematizao que lhe inerente e comparando os resultados das anlises com vistas
projeo de possveis rumos que as variantes tomaro.
Assim, a concepo e o alcance do modelo sociolingustico so, ao mesmo tempo, sincrnicos e
diacrnicos, uma vez que toda mudana implica uma variao. Nesse modelo, a estrutura de uma lngua
somente ser totalmente entendida medida que se compreendam efetivamente os processos histricos de
sua configurao.
Teoricamente, uma amostra sincrnica de dados, isto , dados de um tempo real na histria de uma
lngua, permite estudar a dinmica da mudana em curso de implementao, dado que um estado de lngua
a face sincrnica da mudana lingustica. Entretanto, procedendo a um recorte transversal da amostra
sincrnica em funo da faixa etria dos informantes, acrescenta-se uma dimenso diacrnica anlise.
Assim, tem-se o que se chama de tempo aparente.
O tempo aparente serve como um procedimento atravs do qual se pode projetar o tempo real
futuro, ou seja, estudando-se a transio e a implementao de variveis uma anlise acurada de uma
comunidade sociolingustica com seu componente de variao e de mudana , pode-se dimensionar
historicamente uma varivel, no s em relao ao passado mas tambm em relao a um possvel
comportamento no futuro.
Analisando a correlao entre as variantes e os fatores internos e considerando o fator idade, pode-
se observar a estratificao das mesmas. Se, por exemplo, a variante inovadora for mais frequente entre
falantes mais jovens, decrescendo em relao idade dos outros informantes, tem-se indcios de uma
mudana em progresso.
Uma vez aventada a hiptese de mudana com base em dados do tempo aparente, pode-se proceder
tambm a uma anlise histrica da varivel no tempo real, isto , deve-se recorrer a dados de outra(s)
sincronia(s) para que, atravs de comparaes, se possa melhor entender o valor e a direo da varivel na
comunidade (LABOV, 1994).
Em tempo real, o estudo da mudana possibilita analisar aspectos que no podem ser detectados em
tempo aparente e permite distinguir mudanas que se produzem gradualmente em toda a comunidade das
que caracterizam a trajetria de comportamento lingustico individual (PAIVA & DUARTE, 2003).
Os estudos no tempo real de longa durao que requerem um interstcio de sculos apresentam
dificuldades quanto coleta de dados, sobretudo de pocas pretritas, pois no h registros orais e os
escritos no so to sistemticos. a que se exige do pesquisador uma maior ateno para que consiga
fazer um bom uso dos chamados maus dados (LABOV, 1994; PAIVA & DUARTE, 2003).
J os estudos no tempo real de curta durao geralmente com um interstcio de duas ou trs
dcadas fornecem evidncias mais seguras sobre o estatuto dos padres de variao em um dado
momento da lngua e podem se apresentar de duas maneiras, estudo de tendncia (trend study) ou estudo
de painel (panel study) (LABOV, 1994). O primeiro compara em sincronias diferentes uma mesma
comunidade de fala, ou seja, gravam-se informantes diferentes de uma mesma comunidade em momentos
diferentes, com o intuito de depreender a direcionalidade do sistema na comunidade e a relao entre as
mudanas lingusticas (sua propagao, estabilizao ou recuo) e a configurao social de um grupo.
Assim, focaliza-se a continuidade/descontinuidade na prpria lngua, que pode se refletir no
comportamento do indivduo. O segundo estuda o comportamento lingustico dos mesmos informantes em
momentos sincrnicos diferentes, com o intuito de distinguir mudana geracional de mudana na
comunidade. Nesse tipo de estudo, est em jogo a continuidade/descontinuidade no comportamento
lingustico do indivduo sem reflexos no sistema (LABOV, 1994).
Assim, correlacionando fatores lingusticos e extralingusticos, sincrnicos e diacrnicos, tenta-se
desvendar o mistrio da variao e da mudana.
Como bem colocam Paiva & Duarte (2003), conjugando esses tipos diferentes de estudo, obtm-se
subsdios para a questo da implementao e do encaixamento da mudana. Ao comparar duas sincronias,
surgem indcios para a identificao de como uma dada mudana progride na lngua, qual a sua trajetria
estrutural e social e quais as relaes de causa e efeito entre diferentes processos de mudana. Ou seja, esse
confronto permite descobrir como as mudanas esto associadas entre si, j que no so frutos do acaso.
Teoricamente, quando uma mudana se implementa, ela no s consequncia mas tambm possibilita o
aparecimento de outra, isto , faz parte de uma matriz de mudanas mais gerais. Enfim, pressupe-se que
as mudanas nas lnguas naturais no so isoladas ou independentes.
A metodologia da teoria da variao constitui uma ferramenta que pode ser usada para o estudo de
qualquer fenmeno varivel nos diversos nveis e manifestaes lingusticas. mais um instrumento que
se apresenta ao linguista para o entendimento das lnguas humanas.
(Extrado de: OLIVEIRA, Josane Moreira de. O futuro da lngua portuguesa ontem e hoje: variao e
mudana. Rio de Janeiro: UFRJ, Faculdade de Letras, 2006. Tese de Doutorado em Lngua Portuguesa. p.
44-51)
UFPB Curso GoldVarb X
Profa. Josane Oliveira
O corpus
Uma anlise sociolingustica uma anlise quantitativa de dados. Por isso, a escolha do corpus
muito importante no trabalho. Claro que preciso primeiramente dedicar-se a um determinando fenmeno
lingustico varivel e proceder leitura de material bibliogrfico sobre o tema!
Em se tratando de lngua falada, escolhe-se uma comunidade de fala. Buscam-se, a seguir,
informantes que dela sejam representativos. Um dos critrios ser nascido no local, filho de pais do local e
que no tenha se afastado por muito tempo do local. Da preciso equilibrar as clulas quanto ao
sexo/gnero, quanto faixa etria, quanto escolarizao etc. Segue um exemplo de estratificao dos
informantes de uma comunidade:
Homens Mulheres
Nome Faixa etria Escolaridade Nome Faixa etria Escolaridade
Pedro 1 S Maria 1 S
Joo 1 S Ana 1 S
Mrio 1 N Paula 1 N
Andr 1 N Andria 1 N
Antnio 2 S Jlia 2 S
Jlio 2 S Carla 2 S
Joaquim 2 N Joana 2 N
Mateus 2 N Alice 2 N
Felipe 3 S Cludia 3 S
Carlos 3 S Vera 3 S
Manuel 3 N Marta 3 N
Ricardo 3 N Adriana 3 N
Exerccio 1
Instalando o GoldVarb X
1. Crie uma nova pasta com o nome GoldVarb X na sua rea de Trabalho (Desktop) usando o boto
direito do mouse.
2. Baixe o Programa da Internet (GOLDVARB30B3), digitando-o no Google. Os links so:
http://individual.utoronto.ca/tagliamonte/Goldvarb/GV_index.htm ou
http://individual.utoronto.ca/tagliamonte/goldvarb.htm. O manual da verso anterior (GoldVarb
2001) pode ser encontrado em:
http://www.york.ac.uk/depts/lang/webstuff/goldvarb/manual/manualOct2001.html (no h manual
para a verso X).
3. Voc j tem todos os arquivos executveis do programa!
Utilizando o GoldVarb X
bom destacar o dado examinado dentro do contexto. A varivel dependente deve ser sempre a
primeira na cadeia de codificao. Ao final do exemplo, coloque a fonte (localizao) do dado. Nos
exemplos acima, T2 texto 2, J jornal, 70 anos 70 e SSA Salvador. Ao terminar, d um nome
ao arquivo (File, Save As). A extenso desse arquivo .tkn (de token, que significa dado). Da
prxima vez, para abrir o seu arquivo de dados, clique em File, Open e selecione o arquivo a ser
aberto. Ao digitar os dados, no use parnteses (se for o caso, substitua-os por colchetes). Tambm
no use barras (se for o caso, substitua-as por trao).
Voc pode digitar os dados no Word e us-los depois no GoldVarb X. Voc pode copiar e colar
todo o arquivo ou salv-lo no Word como Texto sem formatao. Neste caso, ele ter a extenso
.txt. Ento, na hora de abri-lo no GoldVarb X, preciso selecionar (ao lado da linha do nome do
arquivo) All Files em vez de Token Files. Lembre-se de salvar o arquivo como .tkn, para facilitar o
uso posteriormente. Use File Save As e d um nome. Ele ser .tkn.
Agora, prepare os seus dados. Crie os seus grupos de fatores e codifique os dados num papel
parte. Cada grupo de fatores corresponde a uma coluna no programa (o GoldVarb X aceita at 120
colunas). Mantenha sempre em mos os seus grupos de fatores num papel separado.
bom ler o texto:
SCHERRE, M. M. P.; NARO, A. J. Anlise quantitativa e tpicos de interpretao do Varbrul. In:
MOLLICA, M. C.; BRAGA, M. L. (Org.). Introduo sociolingustica: o tratamento da variao. So
Paulo: Contexto, 2004, p. 147-177.
Os arquivos do GoldVarb X:
Todos os resultados gerados pelo programa durante uma sesso ficam em um arquivo .res nas janelas
abaixo ou ao lado da janela do arquivo de dados. Se quiser mant-los, precisar salv-los em Save As.
UFPB Curso GoldVarb X
Profa. Josane Oliveira
Exerccio 2
Agora que o arquivo de dados (tokens) est pronto, voc precisa criar o arquivo de especificaes,
ou seja, precisa informar ao programa todos os seus grupos e todos os fatores de cada grupo.
Observao: para inserir algum comentrio sobre os dados, voc pode usar o ponto e vrgula (;) no
incio da linha. Exemplo:
Para criar o seu arquivo de especificaes, na tela principal, clique em Tokens e, a seguir, em
Generate Factor Specifications. Clique em OK. Aparecer uma telinha com o nmero total de dados.
Clique em Ok. A seguir, aparecer uma tela com os grupos, os valores e o Default. Cada grupo tem um
Default, um fator que deve ser um dos fatores daquele grupo. Pode ser qualquer fator, apenas uma
referncia para o programa saber qual o fator mais esperado por voc. Confira se os grupos tm pelo
menos 2 fatores e se os valores esto corretos. Se houver erros de codificao, preciso corrigi-los. Voc
pode ver todo o arquivo de especificaes tambm clicando em Tokens Show Factor Specifications.
Verifique se em cada grupo h pelo menos 2 fatores. Se houver algum grupo com apenas 1 fator,
acrescente mais um fator qualquer. Depois, clique em Modify Group.
Agora v tela dos dados e clique em Tokens No recode (no recodificar). Aparecer a tela com
o arquivo de condies, em que constam todos os grupos de fatores. Voc far a primeira rodada com
todos os grupos e todos os fatores para um resultado inicial.
Na tela do arquivo de condies, clique em Cell Load cells to memory. O programa perguntar se
quer gerar o arquivo de clulas a partir do arquivo de dados e do arquivo de condies em tela. Clique em
Yes. Aparecer ento uma telinha com o total de dados e de linhas checados. Clique em Ok. Aparecer
outra tela com Choose application value(s). O programa pede a regra de aplicao. Ele apresenta a ordem
das variantes (varivel dependente) na ordem em que aparecem no arquivo de dados.
Voc pode mudar essa ordem, a depender do que esteja estudando. Por exemplo, estudando o
futuro verbal, temos 4 variantes (futuro simples F, futuro perifrstico com ir no presente I, futuro
perifrstico com ir no futuro R e presente do indicativo P). Pela ordem em que aparecem nos dados, o
programa me mostra: PIFR. Mas prefiro a ordem FIRP. Ento posso alterar. Clique em OK e aparecer o
primeiro arquivo de resultados, com os percentuais. Salve-o como Save As e faa uma primeira anlise.
Aparecem tambm um telinha com o total de clulas (clique em OK) e uma tela com o arquivo .cel (que
no nos interessa). Eis uma imagem do arquivo de clulas com os percentuais:
Imprima o seu arquivo de clulas para fazer uma primeira anlise. Possivelmente, haver alguns
KnockOuts. O KnockOut acontece sempre que h regra categrica (0% ou 100% dos dados) em algum
fator. Eles tero de ser retirados da rodada, mas fornecem uma informao lingustica importantssima.
No deixe de informar, na sua anlise, os casos categricos! Pode acontecer tambm o Singleton Group,
grupo que contm apenas um fator. Este tambm deve ser retirado da rodada.
Vejamos um exemplo desses casos em um arquivo de clulas:
Group F I P Total %
----------------------------------------------
1 (2) F I P
2 N 126 55 81 262 42.5
% 48.1 21.0 30.9
4 N 22 19 45 86 13.9
% 25.6 22.1 52.3
3 N 37 46 22 105 17.0
% 35.2 43.8 21.0
4 N 11 18 3 32 5.2
% 34.4 56.2 9.4
1 N 1 2 2 5 0.8
% 20.0 40.0 40.0
3 N 19 17 16 52 8.4
% 36.5 32.7 30.8
P N 82 1 2 85 14.3
% 96.5 1.2 2.4
E N 35 17 18 70 11.3
% 50.0 24.3 25.7
C N 1 0 0 1 0.2
% 100.0 0.0 0.0 * KnockOut *
I N 44 9 32 85 13.8
% 51.8 10.6 37.6
A N 11 3 8 22 3.6
% 50.0 13.6 36.4
D N 1 0 1 2 0.3
% 50.0 0.0 50.0 * KnockOut *
Total N 322 128 167 617
% 52.2 20.7 27.1
----------------------------------------------
8 (15) F I P
o N 50 31 34 115 18.6
% 43.5 27.0 29.6
i N 84 17 31 132 21.4
% 63.6 12.9 23.5
d N 35 14 17 66 10.7
% 53.0 21.2 25.8
N N 34 16 76 126 20.4
% 27.0 12.7 60.3
E N 9 0 0 9 1.5
% 100.0 0.0 0.0 * KnockOut *
A N 20 1 0 21 3.4
% 95.2 4.8 0.0 * KnockOut *
H N 12 0 3 15 2.4
% 80.0 0.0 20.0 * KnockOut *
Q N 0 1 2 3 0.5
% 0.0 33.3 66.7 * KnockOut *
R N 4 5 1 10 1.6
% 40.0 50.0 10.0
C N 2 0 0 2 0.3
% 100.0 0.0 0.0 * KnockOut *
Como dito antes, para a rodada final, o arquivo de clulas precisa estar sem nenhum problema.
Precisamos resolver os casos de No Factors, de Singleton Group e de Knockouts.
UFPB Curso GoldVarb X
Profa. Josane Oliveira
Exerccio 3
Como j se disse, o 1 arquivo de clulas, no caso de ter havido algum problema (KnockOut,
Singleton Group ou No Factors), deve ser guardado, pois o problema deve ser comentado na anlise dos
dados. Todavia esse arquivo ter de ser refeito at que no haja mais problemas. S ento ele poder ser
submetido ao clculo dos pesos relativos.
O arquivo de clulas j permite uma anlise dos dados, pois ele informa a quantidade de
ocorrncias e os percentuais para cada variante em relao a cada fator considerado nos grupos de fatores.
Por exemplo, observe os resultados do grupo abaixo, extrado do arquivo de clulas anterior:
----------------------------------------------
4 (5) F I P
r N 97 100 116 313 50.7
% 31.0 31.9 37.1
Este Grupo (Paradigma verbal) possui 2 fatores (r = verbo regular / i = verbo irregular).
Transformando esses resultados em tabela, temos:
Assim, podemos ver que o futuro simples foi mais utilizado (52%) do que o futuro perifrstico
(21%) e do que o presente (27%) em toda a amostra, que contm 617 dados. Comparando os dois
paradigmas verbais, vemos que nos verbos irregulares prevaleceu o futuro simples, enquanto que os verbos
regulares foram mais usados com o futuro perifrstico e com o presente.
Este s um exemplo. A estruturao e a leitura da tabela podem variar, a depender do que se
queira chamar ateno.
Mas, voltemos aos problemas! Para retirar os casos de Singleton Group, No Factors e KnockOut,
devemos recodificar os dados. Nos casos de Singleton Group e de No Factors, os grupos devem ser,
simplesmente, retirados na recodificao. No primeiro caso, trata-se de um grupo em que s um fator
ocorreu; no segundo, trata-se de um grupo em que nenhum dos fatores ocorreu.
Exemplo de Singleton Group:
----------------------------------------------
9 (16) F I P
c N 322 128 167 617 100.0
% 52.2 20.7 27.1 * Singleton Group *
---------------------------------
17 (18)
* No Factors *
---------------------------------
Suponha que este grupo seja Tipo de sujeito, com 3 fatores: sujeito animado (A), sujeito
inanimado (I) e no se aplica (/). Os casos de no se aplica devem ser codificados com uma barra (/).
Neste grupo, seriam casos de no se aplica os dados em que h sujeito oracional (DEVER ser
considerado que o homem um ser mortal) ou em que h orao sem sujeito (VAI HAVER muitos
problemas). Com o no se aplica (/), dizemos ao programa que nesses casos no h como dizer se o
sujeito animado ou no animado, ou seja, nesses casos, essa classificao NO SE APLICA. E o
programa retira da rodada (dos clculos) esses dados. Ele nem os enxerga.
Agora suponha que nessa amostra s ocorreram exemplos de no se aplica, ou seja, em todos os
dados houve sujeito oracional ou orao sem sujeito. Assim, a mensagem No Factors informa que no
houve nenhum fator, ou seja, no houve A (sujeito animado) nem I (sujeito inanimado). Dessa forma, o
programa no tem como informar nada. Com essa mensagem, ele nos diz: o que voc quer que eu faa
nesse grupo se no h nada codificado (nem A nem I)? Quando da recodificao, o grupo 18 (atual 17)
deve ser excludo.
Para recodificar os dados retirando grupos (depois veremos como retirar apenas fatores e como
agrupar fatores), os passos so os seguintes:
1. Na tela dos dados (Tokens) e clique em Recode setup
2. Aparece uma tela Generate conditions for recoding:
3. Clique no Grupo 1 (o grupo da varivel dependente) e ele vai ficar azul. Ento clique ao lado
em Recode
4. Na tela ao lado aparecem os fatores, repita os que quer manter e modifique os que quer
recodificar (no exemplo, digite P I F I). Assim, estamos recodificando R como I (ou seja, os
casos de irei fazer estaro juntos com os casos de vou fazer, como futuro perifrstico)
5. A seguir, clique no Grupo 2 da tela esquerda e clique em Copy (esse grupo ser mantido sem
alteraes)
6. Repita a mesma operao com todos os grupos, exceto com os grupos a serem excludos (no
caso do exemplo, ignore os grupos 16 Singleton Group e 18 No factors, pulando-os)
7. A seguir, clique em Ok e aparecer um novo arquivo de condies
8. Aparecer uma nova tela, com o arquivo de condies;
9. Clique em Cells Load cells to memory
10. Aparecer uma tela dizendo que h clulas na memria e o programa pergunta se voc quer
descart-las (clique em Yes)
11. Aparece outra tela perguntando se voc quer criar um novo arquivo de clulas a partir dos
dados e das condies em tela (clique em Yes)
12. Aparecer uma tela pedindo a regra de aplicao (digite FIP e clique em Ok)
13. O programa ento apresenta o novo arquivo de clulas sem os grupos excludos
14. Veja o seu novo arquivo de clulas sem os grupos excludos (eles no constaro nem do arquivo
de condies nem dos resultados)
Ateno: o programa gera o novo arquivo embaixo do anterior (a no ser que o tenhamos salvado).
Assim, preciso cuidado pra olhar o ltimo arquivo!
Vejamos o arquivo de clulas que estamos tomando como exemplo. Eis o arquivo aps a
recodificao:
Group F I P Total %
----------------------------------------------
1 (2) F I P
2 N 126 55 81 262 42.5
% 48.1 21.0 30.9
4 N 22 19 45 86 13.9
% 25.6 22.1 52.3
3 N 37 46 22 105 17.0
% 35.2 43.8 21.0
1 N 1 2 2 5 0.8
% 20.0 40.0 40.0
3 N 19 17 16 52 8.4
% 36.5 32.7 30.8
P N 82 1 2 85 14.3
% 96.5 1.2 2.4
E N 35 17 18 70 11.3
% 50.0 24.3 25.7
C N 1 0 0 1 0.2
% 100.0 0.0 0.0 * KnockOut *
A N 11 3 8 22 3.6
% 50.0 13.6 36.4
D N 1 0 1 2 0.3
% 50.0 0.0 50.0 * KnockOut *
N N 34 16 76 126 20.4
% 27.0 12.7 60.3
E N 9 0 0 9 1.5
% 100.0 0.0 0.0 * KnockOut *
A N 20 1 0 21 3.4
% 95.2 4.8 0.0 * KnockOut *
H N 12 0 3 15 2.4
% 80.0 0.0 20.0 * KnockOut *
Q N 0 1 2 3 0.5
% 0.0 33.3 66.7 * KnockOut *
R N 4 5 1 10 1.6
% 40.0 50.0 10.0
C N 2 0 0 2 0.3
% 100.0 0.0 0.0 * KnockOut *
No h mais Singleton Group nem No Factors. Restam s os KnocKouts. Vejamos como resolv-
los.
UFPB Curso GoldVarb X
Profa. Josane Oliveira
Exerccio 4
Tomando como exemplo o arquivo de clulas anterior, observe o Grupo 6 (antigo 12):
----------------------------------------------
6 (12) F I P
P N 78 97 107 282 45.7
% 27.7 34.4 37.9
E N 35 17 18 70 11.3
% 50.0 24.3 25.7
C N 1 0 0 1 0.2
% 100.0 0.0 0.0 * KnockOut *
O fator C (verbo cognitivo) apresenta KnockOut. Ou seja, no nico caso em que houve esse tipo de
verbo, ocorreu futuro simples (100%). Devemos informar isso na anlise e retirar esse dado desse grupo.
Assim, veremos a variao apenas entre verbos de processo (P), verbos de evento (E) e verbos de estado
fsico (F).
Para fazer isso, siga os seguintes passos (alguns dos quais vimos anteriormente quando da retirada
de grupos inteiros):
1. Na tela dos dados, v em Tokens e clique em Recode setup
2. Aparece uma telinha perguntando se quer salvar ou no o arquivo de condies anterior (clique
em Dont save)
3. Aparece uma tela para recodificao (Generate conditions for recoding...)
4. Clique no Grupo 1 (o grupo da varivel dependente) e ele vai ficar azul. Ento clique ao lado
em Recode e digite P I F I (ele vai manter esse grupo substituindo R por I)
5. Clique no Grupo 2 e a seguir em Copy
6. Repita a mesma operao com todos os grupos que voc quer manter
7. J vimos que os grupos a serem excludos devem ser pulados
8. No caso do grupo 12, do qual queremos excluir o fator C, clique em Recode
9. Na tela ao lado, digite P E F / (assim manteremos P E F e exclumos o dado de C, que tinha
knockout)
10. No caso de excluir mais de um fator no mesmo grupo, continue colocando a barra (/) para os
fatores a serem excludos;
11. Faamos o mesmo com o Grupo 14, para excluir o D (digite na tela ao lado P X I A /)
12. Devemos excluir tambm o Grupo 17 (Gnero textual), que apresentou muitos knockouts
13. Clique em Ok e ter o novo arquivo de clulas (imprima-o e analise-o) sem problemas
14. Agora os seus dados j esto prontos para a rodada final do Varbrul (pesos relativos)
Acontece que temos 3 variantes e o programa s faz rodadas binrias para gerar os pesos relativos.
Nossa opo aqui deixar de lado o presente do indicativo e rodar o futuro simples e o futuro perifrstico.
Essa deciso feita com base em anlises lingusticas. Como o futuro perifrstico a forma inovadora,
ser a regra de aplicao, de acordo com o seguinte raciocnio: queremos ver quais os contextos de entrada
da forma inovadora na escrita.
Veremos como fazer isso mais tarde!
UFPB Curso GoldVarb X
Profa. Josane Oliveira
Exerccio 5
H outra opo para a retirada dos casos de KnockOut. Em vez de retirar fatores, podemos
reagrupar os fatores dentro de um mesmo grupo. Por exemplo, podemos juntar P1 (= eu) e P4 (= ns)
como 1 pessoa, P2 (= tu) e P5 (= vs) como 2 pessoa e P3 (= ele) e P6 (= eles) como 3 pessoa. Neste
caso, ignoraremos o nmero (singular ou plural).
Podemos tambm reagrupar fatores de grupos diferentes. Por exemplo, em vez de ter 2 grupos um
com a conjugao verbal (1, 2 e 3) e outro com o paradigma verbal (verbo regular e verbo irregular) ,
podemos transform-los em um s grupo: 1 conj. reg., 1 conj. irreg., 2 conj. reg., 2 conj. irreg., 3 conj.
reg. e 3 conj. irreg. Assim, em vez de 2 grupos com 3 fatores cada, temos um grupo s com 6 fatores.
Optar pela retirada dos fatores ou pelo reagrupamento depende de uma anlise lingustica. A, como
cada caso um caso, vale a intuio lingustica e o conhecimento do fenmeno e da lngua sob anlise.
Vimos como excluir fatores. A seguir, veremos como reagrupar fatores.
Comandos AND e OR
Os comandos AND e OR no esto disponveis na verso do GoldVarb X, mas podemos us-los na
verso do GoldVarb 2001.
AND
Para fazer isso (no GoldVarb 2001), v ao Action Recode Setup da janela de Tokens. Clique no
Grupo 2 e clique em AND. O programa ento pede o outro grupo. Selecione o Grupo 3. Observe que na
tabela do lado direito (com as novas condies) aparece o AND com uma linha em branco e os dois grupos
selecionados a seguir. Na tabela do lado esquerdo (original), clique em 1 (Grupo2) e em r (Grupo 3).
Depois clique em 1 (Grupo 2) e em i (Grupo 3). Clique em 2 (Grupo 2) e em r (Grupo 3). Depois combine
2 com i. Faa o mesmo com o 3 (com r e depois com i). Assim, voc fez todas as combinaes propostas
acima, juntando os dois grupos. Observe na tabela ao lado direito as novas combinaes. Na linha em
branco do AND, preencha cada combinao com um novo cdigo. Por exemplo: 1 + r = 1; 2 + r = 2; 3 + r
= 3; 1 + i = U; 2 + i = D; 3 + i = T. Clique ento em Finish current operation. O programa pede ento uma
condio para que essa operao acabe. Digite qualquer smbolo (por exemplo, a letra X). Prossiga com a
recodificao, copiando ou excluindo os demais grupos, como visto em aulas anteriores. Aparecer o novo
arquivo de condies com os grupos unidos pelo AND.
Da s rodar o novo arquivo de clulas: View Results Load Cells to Memory. Voc ver o
novo arquivo de condies e o arquivo de clulas. No caso da exemplificao aqui apresentada, houve dois
knockouts com a nova codificao. Os fatores U (verbos irregulares de 1 conjugao) e T (verbos
irregulares de 3 conjugao) apresentaram 100% de futuro simples. Teramos de retirar esses knockouts,
obviamente. Mas, por enquanto, observe apenas a juno dos grupos 2 e 3. Veja que o GoldVarb chamou
esse novo grupo de New (novo):
CELL CREATION
=============
Name of token file: C:\Documents and Settings\Josane\Desktop\Goldvarb\JOT90.tkn
Name of condition file: Untitled.cnd
(
(1)
(2)
(3)
(4 (6 (COL 4 6))
(3 (COL 4 3))
(/ (COL 4 4)))
(0 (T (AND (COL 5 i) (COL 6 3) )) Grupo novo com o AND
(D (AND (COL 5 i) (COL 6 2) ))
(U (AND (COL 5 i) (COL 6 1) ))
(3 (AND (COL 5 r) (COL 6 3) ))
(2 (AND (COL 5 r) (COL 6 2) ))
(1 (AND (COL 5 r) (COL 6 1) ))
(1 (ELSEWHERE)))
(10)
(16 (a (COL 16 a))
(n (COL 16 n))
(/ (COL 16 i)))
(17 (U (COL 17 U))
(O (COL 17 O))
(I (COL 17 I))
(F (COL 17 F))
(/ (COL 17 P)))
(20)
)
Number of cells: 68
Application value(s): IF
Total no. of factors: 28
Group I F Total %
---------------------------------
1 (2)
4 N 3 8 11 15
% 27 72
2 N 7 20 27 39
% 25 74
3 N 5 13 18 26
% 27 72
1 N 2 11 13 18
% 15 84
Total N 17 52 69
% 24 75
---------------------------------
2 (3)
b N 1 1 2 2
% 50 50
d N 10 24 34 49
% 29 70
c N 2 12 14 20
% 14 85
t N 3 11 14 20
% 21 78
i N 1 4 5 7
% 20 80
Total N 17 52 69
% 24 75
---------------------------------
3 (4)
6 N 4 14 18 27
% 22 77
3 N 13 35 48 72
% 27 72
Total N 17 49 66
% 25 74
---------------------------------
4 (new) Grupo novo com o AND
3 N 1 4 5 7
% 20 80
1 N 10 27 37 53
% 27 72
D N 4 14 18 26
% 22 77
2 N 2 3 5 7
% 40 60
U N 0 3 3 4
% 0 100 * KnockOut *
T N 0 1 1 1
% 0 100 * KnockOut *
Total N 17 52 69
% 24 75
---------------------------------
5 (10)
P N 1 14 15 22
% 6 93
A N 9 20 29 43
% 31 68
E N 5 17 22 33
% 22 77
Total N 15 51 66
% 22 77
---------------------------------
6 (16)
a N 15 49 64 94
% 23 76
n N 1 3 4 5
% 25 75
Total N 16 52 68
% 23 76
---------------------------------
7 (17)
U N 9 28 37 54
% 24 75
O N 5 8 13 19
% 38 61
I N 1 4 5 7
% 20 80
F N 2 11 13 19
% 15 84
Total N 17 51 68
% 25 75
---------------------------------
8 (20)
S N 11 27 38 55
% 28 71
R N 6 25 31 44
% 19 80
Total N 17 52 69
% 24 75
---------------------------------
Total N 17 52 69
% 24 75
O mesmo pode ser feito, por exemplo, para cruzar as variveis sexo/gnero e faixa etria, ou para
cruzar as variveis sexo/gnero e escolaridade.
OR
Para usar o comando OR, o procedimento o mesmo para o comando AND. A diferena apenas
semntica: AND significa E e OR significa OU. S uma reflexo lingustica indicar os casos em que
devemos usar um ou outro.
UFPB Curso GoldVarb X
Profa. Josane Oliveira
Exerccio 6
Para a rodada binria Futuro perifrstico X Futuro simples, precisamos excluir os dados de
Presente. Assim, vamos recodificar os dados, colocando / no fator P do primeiro grupo. preciso lembrar
que as alteraes anteriores precisam ser mantidas. A nova regra de aplicao I F. Assim, o nosso novo
arquivo clulas :
Group I F Total %
--------------------------------------
1 (2) I F
2 N 55 126 181 40.2
% 30.4 69.6
4 N 19 22 41 9.1
% 46.3 53.7
3 N 46 37 83 18.4
% 55.4 44.6
4 N 18 11 29 6.4
% 62.1 37.9
6 N 17 120 137 30.4
% 12.4 87.6
1 N 2 1 3 0.7
% 66.7 33.3
1 N 86 79 165 36.7
% 52.1 47.9
A N 91 65 156 36.3
% 58.3 41.7
P N 1 82 83 19.3
% 1.2 98.8
P N 97 78 175 39.0
% 55.4 44.6
I N 9 44 53 11.8
% 17.0 83.0
A N 3 11 14 3.1
% 21.4 78.6
Com este arquivo pronto, podemos proceder rodada para gerar os pesos relativos. Para tanto,
nesse novo arquivo de percentagens (.res), clique em Cells Binomial, Up and Down. Aparecer nosso
novo arquivo .res, com os pesos relativos (logo abaixo do arquivo de percentagens)!
Stepping up...
Run # 1, 1 cells:
Convergence at Iteration 2
Input 0.284
Log likelihood = -268.696
Run # 2, 4 cells:
Convergence at Iteration 6
Input 0.228
Group # 1 -- 2: 0.597, 1: 0.166, 4: 0.745, 3: 0.808
Log likelihood = -227.458 Significance = 0.000
Run # 3, 4 cells:
Convergence at Iteration 5
Input 0.265
Group # 2 -- 3: 0.570, 4: 0.819, 6: 0.282, 1: 0.847
Log likelihood = -249.486 Significance = 0.000
Run # 4, 3 cells:
Convergence at Iteration 5
Input 0.233
Group # 3 -- 3: 0.746, 2: 0.269, 1: 0.782
Log likelihood = -220.284 Significance = 0.000
Run # 5, 2 cells:
Convergence at Iteration 5
Input 0.239
Group # 4 -- i: 0.284, r: 0.766
Log likelihood = -224.550 Significance = 0.000
Run # 6, 4 cells:
Convergence at Iteration 7
Input 0.197
Group # 5 -- E: 0.470, A: 0.851, P: 0.048
Log likelihood = -209.363 Significance = 0.000
Run # 7, 4 cells:
Convergence at Iteration 5
Input 0.209
Group # 6 -- E: 0.648, P: 0.825, F: 0.204
Log likelihood = -205.705 Significance = 0.000
Run # 8, 5 cells:
Convergence at Iteration 5
Input 0.281
Group # 7 -- X: 0.570, I: 0.344, P: 0.467, A: 0.412
Log likelihood = -264.605 Significance = 0.045
Run # 9, 13 cells:
Convergence at Iteration 8
Input 0.195
Group # 1 -- 2: 0.586, 1: 0.299, 4: 0.566, 3: 0.645
Group # 6 -- E: 0.626, P: 0.779, F: 0.247
Log likelihood = -200.445 Significance = 0.015
Stepping down...
Embora os grupos apaream em ordem crescente aqui, a anlise deve considerar a ordem de
seleo. Assim, so importantes para a aplicao da regra de futuro perifrstico: 1 o tipo de verbo (grupo
6), 2 a conjugao verbal (grupo 3), 3 a pessoa verbal (grupo 2) e o tipo de sujeito (grupo 5).
Observemos que o input final foi de 0.158, ou seja, o programa corrigiu algum desequilbrio na
amostra. O log likelihood foi de -181.010 e o nvel de significncia foi 0.008. O log likelihood, logaritmo
de verossimilhana, mede a aproximao entre o modelo e os dados observados. Seu valor varia em funo
da quantidade de dados e o nmero de aplicaes do modelo em cada clula (para mais detalhes, cf. GUY;
ZILLES, 2007). Quanto maior o log likelihood, maior a robustez dos dados. O nvel de significncia o
nvel de confiabilidade dos resultados. Para as cincias humanas, o nvel mximo aceitvel de 0.050. No
nosso caso, os resultados so confiveis!
Aps a seleo do Stepping up, o programa comea o Stepping down. Aqui, ele comea com todos
os grupos e vai retirando cada um, depois retira dois, depois retira trs e assim por diante. como se fosse
a prova dos nove dos clculos. Ao final, apresenta os grupos eliminados, aps constatar no existirem mais
grupos relevantes:
Neste caso, ele eliminou os grupos 7, 1 e 4, exatamente os que no foram selecionados no Stepping
up. E volta a dizer que os melhores resultados esto nas tabelas 22 e 43, cujos pesos relativos so os
mesmos para todos os fatores:
Observao importante: acontece s vezes de um grupo ser selecionado e depois ser descartado. Isso indica
que o programa no tem certeza da sua importncia. Vale a pena olhar o comportamento desse grupo em
cada rodada (run) em que ele aparece e verificar se h grandes mudanas nos pesos dos seus fatores.
Detectada essa mudana repentina de pesos, observe o grupo de fatores que foi adicionado na rodada, pois,
possivelmente, ocorre interao (para mais informaes, cf. GUY; ZILLES, 2007).
De posse dos resultados, agora s montar as tabelas com os resultados de cada grupo (nmero de
ocorrncias/total, percentual e peso relativo) e explic-los linguisticamente, sempre luz de uma teoria
lingustica e da intuio do pesquisador, comeando sempre pela hiptese aventada. Os nmeros sozinhos
nada dizem, preciso que expliquemos por que tal(is) varivel(is) e/ou tal(is) fator(es) favorece(m) ou
desfavorece(m) a aplicao da regra! No esquea de colocar exemplos na anlise! Lembre-se tambm de
apresentar os casos categricos (knockouts). Normalmente, usamos apenas duas casas decimais (com
aproximao matemtica) e eliminamos o zero inicial. Ex: Grupo 5, fator A (sujeito agente), o peso
0.696; dizemos ento que .70. Recomenda-se tambm o uso de grficos ilustrativos, sobretudo para
variveis sociais.
Para ver uma anlise sociolingustica pronta, vejamos o artigo a seguir, em que, alm dos resultados
vistos aqui (para o jornal A Tarde), h os resultados para mais duas rodadas, uma do jornal Correio da
Bahia e outra do jornal Tribuna da Bahia. O trabalho foi apresentado no XV Congresso da ALFAL, em
agosto de 2008, em Montevideo.
Agora, bom trabalho nas suas pesquisas!
XV Congreso Internacional de la Asociacin de Lingustica y Filologa de Amrica Latina ALFAL (Montevideo, 18 a 21 de
agosto de 2008)
Introduo
A expresso do futuro verbal na histria do portugus um fenmeno varivel tanto na fala quanto
na escrita. Para exprimir o tempo posterior ao momento da fala, podem-se usar as seguintes variantes: a) o
futuro simples (eu farei isso amanh); b) o futuro perifrstico com haver de no presente + infinitivo (eu hei
de fazer isso amanh); c) o futuro perifrstico com haver de no futuro + infinitivo (eu haverei de fazer isso
amanh); d) o futuro perifrstico com ir no presente + infinitivo (eu vou fazer isso amanh); e) o futuro
perifrstico com ir no futuro + infinitivo (eu irei fazer isso amanh); f) o presente (eu fao isso amanh).
As perfrases com haver de + infinitivo perduram at o sculo XIX, quando comeam a ceder espao para
as perfrases com ir + infinitivo. O presente do indicativo parece ter um contexto bastante prprio e tem se
mantido, ao longo do tempo, mais ou menos estvel (OLIVEIRA, 2006). J o processo de mudana futuro
simples > futuro perifrstico com ir + infinitivo est bastante avanado (e mesmo j quase concludo) na
modalidade falada e comea a invadir a modalidade escrita. Essa variao no exclusiva do portugus;
atestada em muitas outras lnguas. O uso do verbo ir como auxiliar de futuro combinado com o infinitivo e
a gramaticalizao dessa forma perifrstica so documentados tambm em ingls (I am going to sleep), em
francs (Je vais dormir) e em espanhol (Yo voy a dormir), por exemplo. Todavia, mesmo sendo esse
fenmeno bastante conhecido e no discriminado pelos falantes, as gramticas tradicionais e os manuais
escolares de lngua portuguesa ainda registram apenas o futuro simples. Com base em dados
contemporneos de jornais baianos (A Tarde, Tribuna da Bahia e Correio da Bahia) direcionados a
pblicos distintos, investiga-se a implementao da forma perifrstica na escrita considerada culta ou
padro, tomando como quadro terico-metodolgico a sociolingustica quantitativa laboviana e a hiptese
da gramaticalizao nos moldes propostos por Hopper & Traugott (2003).
1. Quadro terico
2
Participaram desta pesquisa as estudantes Isabella Almeida de Souza e Viviane Moreira de Oliveira, a quem agradeo pela
valiosa colaborao, respectivamente, na coleta e na digitao dos dados.
variao como a mudana lingusticas tm ligaes estreitas com fenmenos extralingusticos que as
condicionam.
O funcionalismo lingustico analisa a lngua enquanto fenmeno comunicativo e discursivo. Sendo
a noo de tempo uma categoria lingustica e suas relaes com o tempo cronolgico uma funo da
comunicao e do discurso, uma abordagem funcionalista pode embasar teoricamente a anlise da
expresso de futuro no portugus, que pode ser realizada atravs de formas simples ou de formas
analticas/perifrsticas.
O tempo futuro expressa a expectativa de alguma ao (processo ou evento) a ser verificada mais
tarde, aps o ato de fala. Ele tem um valor temporal que no permite expressar uma modalidade factual,
pois s aceita asseres segundo a avaliao feita pelo falante da (im)possibilidade de ocorrncia de um
estado de coisas. Assim, h um valor modal aliado ao fator temporal no futuro que compromete a
determinao do valor de verdade da proposio enunciada. Segundo Cmara Jr. (1957, p. 223), a
categoria de futuro no ocorre pela necessidade da expresso temporal; concretizam-no certas
necessidades modais, de sorte que o futuro comea como modo muito mais do que como tempo.
O ciclo de alternncia entre formas simples e formas perifrsticas de futuro uma constante na
histria das lnguas romnicas. J no prprio latim, o futuro desinencial adveio de formas modais analticas
(cantare habeo > cantar hei > cantarei). Para Cmara Jr., a nova forma de futuro criada ainda no latim
desempenha trs funes na lngua: a) marca o modo; b) marca tempo com matiz modal; e c) marca tempo.
O autor fala em gramaticalizao do futuro modal em futuro temporal.
Neste trabalho, admite-se a hiptese de que o processo que aconteceu no latim (forma analtica >
forma sinttica) est sendo invertido no portugus atual (forma sinttica > forma analtica) a partir da
gramaticalizao do verbo ir, que passa, j em estgios anteriores da lngua, de forma plena a marca
morfossinttica de futuro.
A perfrase a forma verbal inovadora, que convive com a forma simples (conservadora). Trata-se,
pois, de um fenmeno varivel no portugus em que a variante perifrstica, concorrente da forma sinttica
para codificar a funo que situa a ao ou o processo direita do ponto da fala, muito pouco
discriminada. E a entrada do verbo ir como auxiliar na perfrase para expressar o futuro vem encontrando
resposta positiva entre os falantes.
Os verbos de movimento, em geral, so polissmicos e superpem, dentre outras, as noes de
espao e de tempo. O verbo ir um dos verbos mais polissmicos e, pois, um dos mais gramaticalizveis.
Na construo perifrstica com o infinitivo, ele tende a se transformar em auxiliar (HEINE, 1993; BYBEE
et alii, 1994; HEINE & KUTEVA, 2002), quer dizer, num instrumento gramatical para a expresso do
tempo futuro. Essa tendncia, bem conhecida no ingls, no francs e no espanhol, pode ser constatada
tambm em portugus, em que, na fala, o processo de substituio da forma de futuro simples pela forma
perifrstica ir + infinitivo est quase concludo (OLIVEIRA, 2006).
2. Amostra e metodologia
Por meio da anlise controlada de dados coletados em jornais contemporneos baianos, com base
na sociolingustica laboviana, verifica-se a implementao da perfrase com ir + infinitivo, identificando-se
os contextos lingusticos do seu espraiamento. Nesta pesquisa, observa-se o papel de alguns grupos de
fatores (medido em termos de percentuais e de pesos relativos a partir da ferramenta GoldVarb): a) a
extenso fonolgica do verbo; b) a conjugao verbal; c) o paradigma verbal; d) a pessoa verbal; e) o tipo
de sujeito; f) a animacidade do sujeito; g) o papel temtico do sujeito; h) o tipo de verbo; i) a transitividade
verbal; j) a presena/ausncia de clticos; k) a natureza semntica do verbo; l) a indicao de tempo futuro
fora do verbo; m) a projeo de futuridade; n) o paralelismo sinttico-discursivo; o) o tipo de peridico; e
p) o gnero textual.
Foram examinados: a) dois exemplares do jornal A Tarde, de 07/06/07 e de 03/08/07, considerado
um peridico direcionado a um pblico mais elitizado; b) dois exemplares do jornal Correio da Bahia, de
28/11/07 e de 20/12/07, considerado um peridico direcionado classe mdia; e c) dois exemplares do
jornal Tribuna da Bahia, de 23/08/07 e de 08 e 09/12/07, considerado um peridico mais popular.
Foram coletados, inicialmente, 2575 dados de quatro variantes: futuro simples, futuro perifrstico
com ir + infinitivo, futuro perifrstico com haver de + infinitivo e presente. Como s houve 4 dados com
haver de + infinitivo, todos num mesmo exemplar de peridico, essas ocorrncias foram retiradas da
amostra final. Quanto perfrase com ir + infinitivo, houve 27 ocorrncias com o verbo ir no futuro, que,
pela sua baixa frequncia, foram computadas juntamente com as formas de ir no presente + infinitivo.
Assim, os resultados encontrados esto apresentados na Tabela 1:
Para esta comunicao, em particular, foram excludas as formas de presente com valor de futuro,
embora tenham apresentado percentuais maiores que a forma perifrstica, por duas razes: a) com base em
resultados de trabalhos anteriores (OLIVEIRA, 2006), essa variante possui contextos bem especficos,
mantm ndices de uso mais ou menos estveis na histria da lngua e est margem da concorrncia
futuro simples X futuro perifrstico; e b) objetiva-se verificar, aqui, a implementao da forma perifrstica
em substituio forma de futuro na lngua escrita, j que na lngua falada esse processo j se encontra em
fase de compleio (OLIVEIRA, 2006).
Assim, considerando apenas os dados das variantes em concorrncia (1924 dados), a distribuio
a seguinte:
Numa anlise inicial, olhando os dados globalmente, embora predomine o futuro simples na escrita
jornalstica, pode-se verificar que a concorrncia entre as duas variantes documentada nos trs
peridicos, e em ndices bastante prximos (variando de 19% a 30% o percentual de uso da forma
perifrstica), conforme ilustra o Grfico 1, a seguir:
100
90
80
70
60
50
Futuro simples
40
30 Futuro perifrstico
20
10
0
A Tarde Correio da Tribuna da
Bahia Bahia
Primeiramente, os dados foram submetidos a uma rodada que considerou os diferentes peridicos
como uma varivel independente com o objetivo de verificar o papel desse grupo de fatores, que no foi
selecionado pelo GoldVarb. A regra de aplicao foi o uso da forma perifrstica, variante inovadora em
fase de implementao na modalidade escrita da lngua. Dos 1924 dados, 488 (25%) foram de perfrase.
De todos os grupos controlados, nove foram selecionados, nesta ordem: 1. natureza semntica do verbo; 2.
gnero textual; 3. pessoa verbal; 4. paradigma verbal; 5. paralelismo sinttico-discursivo; 6. tipo de verbo;
7. indicao de tempo futuro fora do verbo; 8. papel temtico do sujeito; e 9. tipo de sujeito.
O fato de a varivel tipo de peridico no ter sido selecionada significa que no h diferena
estatstica significativa entre o uso da perfrase e o tipo de jornal, ou seja, ela est presente nos trs
peridicos, independentemente de ser o jornal mais ou menos elitizado. E essa informao, embora
contrarie a hiptese inicial (a de que haveria mais perfrase no peridico mais popular e menos perfrase no
peridico mais elitizado), muito importante para medir o grau de implementao dessa forma na escrita
jornalstica baiana.
Embora estatisticamente no seja relevante o tipo de jornal, linguisticamente importante verificar
as diferenas dos resultados dos trs peridicos para conhecer os contextos iniciais de espraiamento da
variante analisada. Assim, foram feitas rodadas separadas, por peridico, e o resultado est ilustrado na
Tabela 3, a seguir:
Esse grupo de fatores controla o tipo semntico dos verbos, distribuindo-os em verbos que indicam
processo, ao ou movimento, verbos que denotam evento, verbos de estado e verbos cognitivos ou que
expressam um estado psicolgico. Seguem exemplos de cada um desses tipos de verbo:
Processo
(1) Foi to bom e to aplaudido o show do cantor Billy Paul em Salvador, que, a pedido, ele est
retornando para o Othon, onde VAI SE APRESENTAR durante jantar na noite de tera-feira,
fazendo uma homenagem toda especial aos namorados. [AT 1, c.2, p.2, col.]
Evento
(2) (...) os climatologistas dizem o que VAI ACONTECER se o aumento global continuar no ritmo
atual. [CB 1, c.4, p.10, not.]
Estado
(3) Mesmo suspenso, Alysson ainda VAI FICAR de molho por um ms, depois de sofrer diante do
Coritiba uma luxao no cotovelo. [AT 2, ec, p.5, not.]
Cognio
(4) Ao invs de met-los na cadeia, arruma-se uma frmula deles se sarem numa boa custa do
torcedor otrio que VAI PENSAR, certamente, que o Bahia, o Vitria, a Catuense e tantos outros
times baianos sero beneficiados. [TB1, c.1, p.2, mat.]
A hiptese levantada para esse grupo era a de que o futuro perifrstico se implementasse pelos
verbos que denotam processo, j que o verbo ir, sendo um verbo de movimento, exprime uma ao que
envolve dois momentos, o de partida e o de chegada. A literatura sobre a gramaticalizao do verbo ir
mostra que o fenmeno ocorre principalmente com esse tipo de verbos, j que implicam alterao entre
dois momentos temporais. Esperava-se tambm que os verbos de estado inibissem o uso do futuro
perifrstico, favorecendo, portanto, o emprego do futuro simples, como atestado por outros trabalhos,
como, por exemplo, o de Malvar (2003).
Em dois tipos de jornal (A Tarde e Correio da Bahia), os resultados encontrados revelam que, de
fato, o maior percentual e o maior peso relativo de uso do futuro perifrstico ocorrem com verbos que
indicam processo, seguidos dos verbos que denotam evento, como se v na Tabela 4, a seguir:
Tabela 4: Uso da perfrase e natureza semntica do verbo por peridico
Fator A Tarde Correio da Bahia Tribuna da Bahia
Oc./Total PR Oc./Total PR Oc./Total PR
% % %
Evento 24/87 .51 29/152 .63 21/56 .64
27% 19% 37%
Processo 146/257 .56 99/219 .74 96/191 .66
56% 45% 50%
Estado 27/324 .45 15/396 .31 24/232 .32
8% 3% 10%
Cognio 0/2 - 2/2 - 5/6 .91
0% 100% 83%
Oc. = ocorrncias PR = Peso relativo
Esta varivel distribui os dados em dois grupos: os que contm um verbo que segue o paradigma
geral (verbos regulares) e os que apresentam um verbo de padro especial (verbos irregulares),
considerando, pois, o critrio morfolgico. Por exemplo, so verbos regulares cantar, beber e partir e
so irregulares os verbos estar, trazer e pedir. Supondo que h uma mudana em curso no sentido de
o futuro perifrstico substituir o futuro simples, aventou-se a hiptese de que esse processo avanaria
primeiro nas formas regulares e depois nas irregulares. Essa hiptese se confirma nos dados dos trs tipos
de peridico, tanto em termos percentuais como em pesos relativos, conforme evidenciado na Tabela 5:
Tabela 5: Uso da perfrase e paradigma verbal por peridico
Fator A Tarde Correio da Bahia Tribuna da Bahia
Oc./Total PR Oc./Total PR Oc./Total PR
% % %
Regular 158/303 .69 113/333 .61 117/231 .68
52% 33% 50%
Irregular 39/367 .34 32/436 .42 29/254 .33
10% 7% 11%
Oc. = ocorrncias PR = Peso relativo
So os verbos regulares os que favorecem a aplicao da regra de perfrase, ficando o futuro
simples mais restrito aos verbos irregulares, ou seja, os que tm um padro morfolgico especial. Esses
verbos, segundo Bybee (2003), por terem uma frequncia alta de uso na lngua, resistem a mudanas e,
sendo estocados na memria do falante como nicos (especiais), mantm o futuro simples, pois no
seguem padres gerais.
Como se pode ver na Tabela 6, a primeira pessoa (P1 = eu; P4 = ns) apresenta maior peso relativo
e maior percentual no uso da perfrase. Esse fato revela um maior comprometimento do sujeito com a
realizao do processo verbal a se concretizar no futuro.
Note-se que os dados de primeira pessoa so muito poucos em relao aos de terceira pessoa, mais
tpicos nesse tipo de escrita. Em geral, os dados de 1 pessoa aparecem em citaes de fala para ilustrar os
textos jornalsticos. De qualquer forma, percebe-se que o jornalista no corrige a fala dos entrevistados,
pelo menos no que tange ao fenmeno aqui estudado, o que corrobora o fato de que a perfrase est para a
fala assim como o futuro simples est para a escrita (pelo menos a escrita formal).
Em pesquisa anterior (OLIVEIRA, 2006), foram analisados dados de fala de informantes
considerados cultos, isto , todos com nvel superior completo e os resultados apontam a preferncia de uso
da forma perifrstica em detrimento da forma simples. Comparando os resultados gerais de fala e escrita
(ambas as modalidades em sua forma considerada culta ou padro), observa-se uma inverso parcial no uso
das variantes concorrentes. Veja-se a Tabela 7, a seguir, com o acrscimo dos dados de jornais de 2007:
Analisando a Tabela 7, percebe-se que os dados confirmam a inverso parcial das duas variantes
em relao s modalidades da lngua: o futuro perifrstico mais usado na fala e o futuro simples mais
usado na escrita. Comparando os dados dos anos 70 com os dados dos anos 90, observa-se um aumento no
uso da perfrase na fala e um decrscimo no uso do futuro simples na escrita. Ou seja, o uso da perfrase
quase categrico na fala e comea a se implementar na escrita.
Concluses
3
Projeto de Estudo da Norma Urbana Culta das Principais Cidades Brasileiras, desenvolvido em Salvador, Recife, Rio de
Janeiro, So Paulo e Porto Alegre.
soteropolitana como conservador) o que mais usa a forma de futuro simples (81%). Estatisticamente,
porm, no h diferena significativa entre o uso das formas concorrentes e os tipos de jornal analisados.
Este trabalho apresenta resultados parciais de pesquisa desenvolvida a partir de 2007 com textos
jornalsticos, mas, comparando-os com resultados de pesquisa anterior (OLIVEIRA, 2006), mantm-se a
hiptese da inverso parcial entre fala e escrita quanto ao uso das variantes inovadora e conservadora.
Resta saber se, com a ampliao do corpus, os resultados se mantm prximos. Pretende-se tambm
verificar a implementao do futuro perifrstico em outros tipos de escrita, como, por exemplo, em
redaes escolares.
Referncias
BYBEE, J. Mechanisms of change in grammaticization: the role of frequency. In: JOSEPH, B. D.;
JANDA, R. D. (Ed.) The handbook of historical linguistics. Oxford: Blackwell, 2003, p. 602-623.
BYBEE, J. et alii. The evolution of grammar: tense, aspect, and modality in the languages of the world.
Chicago: Chicago University Press, 1994.
CMARA JR., J. M. Uma forma verbal portuguesa estudo estilstico e gramatical. Tese apresentada no
concurso para a cadeira de Lngua Portuguesa da Faculdade de Filosofia. Rio de Janeiro: Jornal do
Comrcio/Rodrigues & Cia., 1957.
FLEISCHMAN, S. The future in thought and language diachronic evidence from Romance. Cambridge:
Cambridge University Press, 1982.
HEINE, B. Auxiliaries: cognitive forces and grammaticalization. New York: Oxford University Press,
1993.
HEINE, B.; KUTEVA, T. World lexicon of grammaticalization. Cambridge: Cambridge University Press,
2002.
HOPPER, P. J. & TRAUGOTT, E. Grammaticalization. Cambridge: Cambridge University Press, 2003
[1993].
MALVAR, E. O presente do futuro no portugus oral do Brasil. Ottawa: University of Ottawa, 2003 (Tese
de Doutorado).
MARCHELLO-NIZIA, C. Grammaticalisation et changement linguistique. Bruxelas: De Boeck, 2006.
OLIVEIRA, J. M. O futuro da lngua portuguesa ontem e hoje: variao e mudana. Rio de Janeiro:
UFRJ, 2006 (Tese de Doutorado).
UFPB Curso GoldVarb X
Profa. Josane Oliveira
Mais grficos
Para finalizar o nosso curso, vejamos mais alguns exemplos de tabelas e grficos diferentes.
100%
90%
80%
70%
60%
50% Futuro simples
40%
30% Futuro perifrstico
20%
10%
0%
Angola
1001
.90
.
80
70
.
60
.
.50
.
40 Perfrase
.30
.
20
.10
0
1 slaba 2 slabas 3 slabas 4 ou + slabas
Trabalho: XIII Colquio da Lusofonia (V Encontro Aoriano) Florianpolis (5-9 abril 2010)
Ttulo: O futuro da lngua portuguesa em trs cantos do mundo: Angola, Brasil e Portugal
100%
90%
80% 73% 71%
70% 65%
60%
50% Futuro simples
40% 35% Futuro perifrstico
30% 27% 29%
20%
10%
0%
Angola Brasil Portugal
Trabalho: Tese de Doutorado
Ttulo: O futuro da lngua portuguesa ontem e hoje: variao e mudana.
100%
90%
80%
70%
60%
Futuro simples
50%
Haver de + infinitivo
40%
Ir + infinitivo
30%
20% Presente
10%
0%
XIII XIV XV XVI XVII XVIII XIX XX
4
Para o sculo XX, esto sendo considerados apenas os dados de lngua escrita, para uma coerncia na comparao com os
outros sculos, que no dispem de dados de lngua falada. Os dados orais do sculo XX so analisados na seo seguinte.
Grfico 3: Variantes por tipo de texto na dcada de 90 (percentuais)
100%
80%
FS
60%
FP
40%
PR
20%
0%
DID Jornais
.100
.80
.60 EF
.40 DID
.20
.0
Faixa 1 Faixa 2 Faixa 3
100%
80%
60% Salvador
40% Rio de Janeiro
20%
0%
EF DID
Grfico 9: Procedncia geogrfica em DIDs anos 70 e 90 (percentuais)
100%
80%
60% Salvador
40% Rio de Janeiro
20%
0%
Anos 70 Anos 90
Agora, mos obra e bom trabalho! Espero ter ajudado! Contato: josanemoreira@hotmail.com.