Você está na página 1de 20

O TRABALHO DE CAMPO

SOCIOLINGUÍSTICO

Aldir Santos de Paula1

Introdução

Não raro, justificado muitas vezes pela extensão territorial


do Brasil, é comum ouvirmos algumas pessoas falarem sobre a
variedade linguística de outra pessoa, como ‘fala arrastada’,
‘fala apressada’, ou que a pessoa tem sotaque, baiano, carioca,
paulista, pernambucano, etc. ou ainda que determinada
variedade é mais bonita do que outra ou outros comentários
mais. Embora tais avaliações possam ser consideradas
subjetivas, impressionísticas ou até sem fundamento, o que
importa é que, de certa forma, este é apenas um dos reflexos e
talvez o mais evidente da variação linguística presente em todas
as línguas humanas.
Este trabalho tem por objetivo sistematizar, ainda que de
forma inicial, os passos metodológicos a serem seguidos para
que a variação linguística possa ser sistematizada. Sem querer
ser exaustivo, apresentaremos as etapas a serem seguidas,
buscando colaborar na reflexão sobre a coleta de dados, a
1
Doutor em Linguística pela UNICAMP e professor da graduação e pós-
graduação da Faculdade de Letras da UFAL.
transcrição e a codificação dos mesmos, bem como a
interpretação dos resultados alcançados. Desta forma, estaremos
explicitando os procedimentos básicos para que uma pesquisa
sociolinguística possa chegar a um bom termo.
Este trabalho estará dividido em duas partes. Na primeira,
serão apresentadas a delimitação do campo da Sociolinguística e
alguns conceitos fundamentais para a área. Na segunda parte,
discutiremos as etapas mais importantes para o trabalho de
campo sociolinguístico, apontando estratégias para quantificar a
variação linguística.

1. Sociolinguística: a delimitação do campo

A Sociolinguística é uma ciência interdisciplinar que se


ocupa das relações entre língua e sociedade, por meio de uma
investigação empírica e foi definida como campo de estudo,
principalmente, a partir dos trabalhos de William Labov em
meados da década de 1960. Embora investigando aspectos
mutuamente interligados entre estrutura linguística e sociedade,
a sociolinguística enfoca, prioritariamente, os usos linguísticos
concretos, especialmente os de caráter heterogêneo.
As pesquisas iniciais no campo da variação envolveram
fenômenos fonéticos ou fonológicos, a exemplo da realização
velar ou dental da consoante final do sufixo do gerúndio -ing em
Inglês em palavras do tipo de working ‘trabalhando’. (Cf.
Labov, 1966, 2008 [1972]). Nas pesquisas seguintes, este foco
foi sendo ampliado e, atualmente, é possível estabelecer
fenômenos variáveis relacionados ao vocabulário, à morfologia,
à sintaxe e aos planos discursivo e pragmático da língua. Esta
amplitude de fenômenos ilustra a variabilidade linguística e
destaca a variação como um princípio geral e universal, que
pode ser descrito e analisado cientificamente e considerado
fundamental para a Teoria da Variação ou Sociolinguística
Quantitativa.
Desta forma, o pressuposto básico do estudo variacionista
é que o aparente caos ou desorganização observada numa
análise superficial do fenônemo linguístico é regulado, tal como
a homogeneidade do sistema, por regras e que as mesmas não
são aleatórias. Por isso, as regras ou o conjunto delas que
possibilitam o uso de determinadas construções mais ou menos
estáveis no sistema linguístico que ‘obrigam’ o falante a
empregá-las em lugar de outra(s) fazem parte do sistema
homogêneo da língua. Ao mesmo tempo e agindo
simultaneamente no sistema, existem condições que favorecem
o uso variável, coexistindo regras em competição que
possibilitam a ocorrência de uma ou outra variante. Mesmo
nesta situação, o uso é regulado por regras que atuam no sentido
de favorecer ou não determinadas formas em seus múltiplos
contextos. Determinar a relação entre os usos linguísticos de
uma determinada comunidade e os fatores sociais que os
desencadeiam é uma das tarefas da pesquisa sociolinguística,
sendo fundamental identificar e quantificar os fatores que são
internos ao sistema ou externos ao mesmo.

2. Quantificar a variação

Como foi dito anteriormente, duas forças coexistem nos


sistemas linguísticos: uma no sentido de manter a
homogeneidade e outra que possibilita a heterogeneidade e a
variação ocupa um lugar central. A variação está presente
quando o falante se depara com a possibilidade de expressar o
mesmo referente através de formas alternativas, definidas como
variantes, que, por sua vez, refletem um fenômeno linguístico
variável. A variável se realiza através de duas variantes, ou seja,
duas alternativas possíveis e semanticamente equivalentes.
Para Mollica (2003, p. 11), uma variável é “concebida
como dependente no sentido que o emprego das variantes não é
aleatório, mas influenciado por grupos de fatores (ou variáveis
independentes) de natureza social ou estrutural’.
Tomando por base o Português falado no Brasil,
apresentamos os exemplos de variação nos níveis fonético e
morfológico, exemplos A e B, respectivamente:

A. variante 1 
ariante 2 

B. nós fomos. - variante 1
nós foi. - variante 2 

Entre os fatores de ordem estrutural ou interna ao sistema


linguístico e que podem atuar no fenômeno variável se destacam
os relacionados aos diversos subsistemas de uma língua, tais
como o léxico, a fonologia, a morfologia, a sintaxe, a semântica
e o discurso. Além destes, que se situam no plano linguístico,
podem atuar fatores que operam simultaneamente, são externos
ao mesmo e estão diretamente relacionados ao falante e/ou ao
contexto comunicativo. Estes fatores extralinguísticos são
subcategorizados em individuais, sociais e contextuais. Os
fatores individuais estão diretamente relacionados ao falante,
tais como sexo, idade, etnia. Os fatores sociais dizem respeito,
por exemplo, ao nível de renda, escolaridade, profissão e classe
social do falante e os fatores contextuais referem-se ao grau de
formalidade e a tensão discursiva envolvidas no evento
comunicativo.
Os fatores acima de forma direta ou indireta dizem
respeito ao falante e, embora seja ele quem produz a variação, o
mesmo encontra-se inserido em uma comunidade que é formada
por outros indivíduos que compartilham traços linguísticos
semelhantes, além de normas, valores e atitudes sobre os usos
linguísticos, de forma a reconhecer os que fazem parte da
comunidade, por possuírem traços compartilhados e os que, por
possuírem variantes e valores distintos, pertencem à outra
comunidade. O conceito de comunidade linguística é
fundamental para os estudos sociolinguísticos, pois é no contato
com outros falantes que o indivíduo encontra os limites para a
sua variação individual ao ser reconhecido ou não como
pertencente àquela comunidade de fala. Uma comunidade de
fala pode ser distinta de outra quando as diferenças entre elas
são categóricas, de forma que uma comunidade possui um traço
ou traços que a outra não tem.2

2.1. As etapas da análise

Antes de discutirmos questões relacionadas à pesquisa


sociolinguística, tais como o que coletar, que tipo de gravação

2
Cf. PATRICK, P. L. The Spech Community. In: CHAMBERS, J. K.;
TRUGDILL, P.; SCHILLING-ESTES, N. (eds). The Handbook of Language
Variation and Change. Oxford: Blackwell Publishing, 2002.
ou transcrição utilizar e outros aspectos relacionados à coleta de
dados, é relevante observar o que fala Labov (2008, p. 83):

nosso objetivo é observar o modo como as


pessoas usam a língua quando não estão sendo
observadas. Todos os nossos métodos envolvem
uma aproximação a este objetivo: quando
fazemos uma abordagem a partir de duas
direções diferentes e obtemos o mesmo
resultado, podemos ter certeza de conseguimos
vencer o paradoxo do observador3 no sentido
de que a estrutura existe independentemente do
analista.

Para superar tal paradoxo, o próprio Labov (2008, p. 244)


propõe que o pesquisador se utilize de procedimentos que
desviem a atenção do falante para o quê está sendo dito, de
forma que o falante ‘esqueça’ que está sendo entrevistado e seja
possível registrar o vernáculo. Além desta estratégia, é
fundamental que a palavra ‘língua’ seja evitada e que o falante
possa relatar experiências vividas, tendo em vista que

A narrativa de experiência pessoal é a mina de


ouro que o pesquisador - sociolingüista procura.
Ao narrar suas experiências pessoais mais
envolventes, ao colocá-las no gênero narrativa, o
informante desvencilha-se praticamente de
qualquer preocupação com a forma.
(TARALLO, 1985, p. 23).

Com algumas destas questões em mente, o pesquisador


deverá planejar sua pesquisa, procurando incorporar essas

3
Grifo nosso.
considerações sobre o mesmo. Além disso, ao serem escolhidos
o assunto, as hipóteses norteadoras do trabalho e a comunidade
de fala, é essencial que o pesquisador reúna o maior número
possível de dados sobre a mesma, enfocando aspectos
relacionados à história da comunidade, à economia, às
lideranças, às instituições religiosas ou outros dados relevantes,
como uma forma de conhecimento prévio sobre o local e as
pessoas que participarão da pesquisa.
Ainda nesta fase, é fundamental que o pesquisador leia e
se familiarize com questões relacionadas ao assunto a ser
pesquisado, especialmente em teses e dissertações que trataram
do assunto direta ou indiretamente e reflita sobre as soluções
metodológicas apresentadas pelos respectivos autores dos
trabalhos (Cf. VITÓRIO, 2008; SÓSTENES, 2008; SOUZA
NETO, 2008). A leitura de outros trabalhos pode iluminar
algumas questões teóricas fundamentais para a área da
sociolinguística e que podem repercutir nos rumos do trabalho
de campo. Destacamos os trabalhos de Weinrich, Labov &
Herzog (2006), Labov (1972, 2008), Milroy (1980), Trudgill
(2000), Campoy & Almeida (2005). Outros autores, certamente,
podem ser incluídos nesta lista de acordo com o assunto do
projeto de pesquisa.
As tarefas apresentadas devem ser consideradas
preliminares e suplementares à elaboração do projeto de
pesquisa, sendo seguidas por outras que exigem um ajustamento
preciso e terão consequências para o bom desenvolvimento do
mesmo. Algumas perguntas, tais como: quem e quantos serão os
colaboradores da pesquisa, quais as variáveis linguísticas e não
linguísticas deverão ser consideradas relevantes, quais as
hipóteses norteadoras do trabalho e qual o procedimento a ser
seguido na coleta dos dados, deverão de alguma forma absorver
o pesquisador nesta fase que antecede a consecução da pesquisa.
Ainda assim, mesmo com um bom projeto de pesquisa, que
guiará a coleta de dados, por vezes, novas questões de natureza
conceitual ou metodológica podem ocorrer durante qualquer
etapa da pesquisa, às vezes, de forma cíclica, fazendo o
pesquisador refletir sobre o seu percurso de pesquisa e de
aspectos anteriormente insuspeitos nesta tarefa sempre
complexa de mapear a relação entre língua e sociedade.
A coleta de dados envolve questões relacionadas aos
colaboradores da pesquisa, buscando garantir a
representatividade e a confiabilidade dos dados levantados. Para
Guy (2007, p. 22),

uma da melhores maneiras de garantir a


representatividade é usar uma amostra aleatória,
construída de maneira a dar, a cada informante
ou dado potencial existente na população total
igual probabilidade de serem incluídos na
amostra.
Embora a questão da representatividade esteja diretamente
ligada ao número de variáveis independentes escolhidas, em
termos estatísticos cinco falantes por célula é considerado um
número adequado, levando em consideração que bons critérios
foram eleitos na seleção das variáveis envolvidas. Um número
maior de falantes por célula é sempre bem-vindo, tendo em vista
que, em pesquisas sociolinguísticas, quanto maior for a
quantidade de dados levantados melhor.
Tendo definido o perfil esperado dos colaboradores da
pesquisa e o número dos mesmos é necessário definir como se
dará o contato, por: interações livres, entrevistas ou testes e
quantos encontros serão precisos para a coleta dos dados. A
gravação de dois ou mais interlocutores interagindo, podendo o
pesquisador participar, mas com severa parcimônia, é o processo
esperado em interações livres. As entrevistas consistem na
gravação da conversa entre o pesquisador e o falante e deve
girar em torno de um assunto previamente planejado pelo
pesquisador, sendo indispensável que a conversa seja informal
ou casual para que o colaborador da pesquisa não se sinta
intimidado ou observado, de forma que o vernáculo seja
registrado. As entrevistas facilitam no momento da gravação e
transcrição dos dados e é o procedimento preferido para
pesquisas relacionadas à fonologia, morfologia e sintaxe. Ainda
sobre as entrevistas, para o bom andamento das mesmas, é
necessário que o pesquisador elenque previamente uma
quantidade suficiente de temas, para que, caso o assunto
escolhido não favoreça a fluidez da conversa, o tema possa ser
rapidamente alternado e com isso a entrevista tenha
continuidade. Os testes permitem ao pesquisador o levantamento
dos dados desejados e em muitas situações podem ser
considerados complementares aos demais tipos de contato.
Cada um desses tipos deve ser utilizado de acordo com a
pesquisa a ser desenvolvida, pois cada um envolve vantagens e
desvantagens que devem ser contornadas pelo pesquisador. As
interações livres, por exemplo, são adequadas para as pesquisas
que envolvem estudos sobre os pronomes de tratamento,
entretanto este tipo de contato pode resultar em desvantagem por
conta das superposições das falas gravadas, o que pode dificultar
no momento da transcrição dos dados, tendo em vista que em
interações livres é habitual que duas ou mais pessoas falem
simultaneamente. Além disso, ainda dependendo do tipo de
pesquisa, é possível que o pesquisador precise recorrer à
gravação em vídeo para que outros aspectos relacionados à
interação possam ser registrados. A busca pela melhor relação
custo-benefício deve nortear o pesquisador para que as
dificuldades possam ser minoradas e a coleta dos dados aconteça
como planejada.
Definido o tipo de contato, ainda resta delimitar o número
de entrevistas ou o tempo de gravação necessário para que o
fenômeno estudado seja amplamente registrado. Cabe ao
pesquisador decidir sobre estas questões, atentando que a
resposta está diretamente relacionada ao fenômeno estudado e
que o tempo deve ser distribuído uniformemente entre todos os
colaboradores. Caso seja definido, por exemplo, que o tempo de
gravação será de uma hora, o mesmo deve ser aplicado a todos.
Um recurso muito utilizado para uma primeira
aproximação com o colaborador da pesquisa é traçar o perfil
social do mesmo. Esta ficha social pode ter dados referentes à
idade, grau de instrução, local de nascimento, religião, sendo
ainda possível perguntar se o falante morou em outro lugar e por
qual período ou outras informações que o pesquisador julgar
relevante. Serão precisos alguns cuidados por parte do
pesquisador, especialmente no tocante à inserção
socioeconômica do falante. Este quesito envolve aspectos
delicados, o que pode ocasionar omissão ou inflação do quadro
real por parte do falante. De certa forma, esta primeira
abordagem, além das informações sobre o falante, favorece a
familiaridade do falante com o gravador e é possível mapear
possíveis interesses do falante que podem ser usados no
momento da entrevista propriamente dita.
O equipamento de gravação é outro item relacionado à
coleta de dados. Neste caso, recomendamos, dado as rápidas
mudanças tecnológicas experimentadas atualmente, que o
pesquisador escolha um equipamento que possa ser facilmente
operado durante a gravação e transcrição dos dados e que o
mesmo possa se comunicar com um computador, como uma
forma de resguardar os dados contra possíveis perdas. Adquirir
um bom equipamento significa que o mesmo possa gravar os
dados com alta qualidade, seja fácil de operar, tenha peso
adequado e tenha a possibilidade de trocar as mídias de suporte
de gravação, caso seja necessário.
Com os dados coletados, a próxima etapa será dedicada à
transcrição dos dados. O objetivo da transcrição é transpor o
discurso falado para um registro gráfico de forma mais fiel
possível. Esta etapa consome um tempo considerável por parte
do pesquisador, sendo necessário que o sistema de transcrição
usado seja o mais consistente possível, para que, apesar dos
possíveis aspectos subjetivos implícitos no processo, a
convenção utilizada para os respectivos fenômenos seja
uniforme do princípio ao fim. A maioria dos projetos de estudos
de língua falada utiliza a transcrição grafemática ou ortográfica
com alguns recursos especiais de notação para captura de
fenômenos específicos. A título de exemplificação, sugerimos
consultar Da Hora e Pedrosa (2001). Entretanto, motivado pela
natureza do projeto, quando relacionado, por exemplo, à
fonética/fonologia, pode-se utilizar a transcrição fonética. Neste
caso, é recomendada a utilização do alfabeto fonético
internacional. Entretanto, uma transcrição fonética de grande
quantidade de dados pode resultar em uma tarefa penosa para o
pesquisador e com poucos resultados práticos. Assim, para
contornar este problema, sempre tendo por base os objetivos da
pesquisa previamente definidos, que a transcrição fonética fique
circunscrita aos dados objeto da pesquisa e que o pesquisador
não perca de vista o contexto da ocorrência do fenômeno, que
pode interferir ou não na realização do mesmo.
O pesquisador deve ter em mente que, embora a
transcrição seja o resultado do que é percebido e, portanto,
também é consequência do cruzamento das opções teóricas do
pesquisador, da interpretação atribuída aos dados e dos objetivos
da pesquisa, não existe uma transcrição irretocável, por isso é
conveniente que a transcrição realizada possa ser ‘avaliada’ por
outra(s) pessoa(s) e, quando necessário, submetida a revisões.
A etapa de codificação dos dados precede a análise
propriamente dita e funciona como requisito para a organização
dos dados coletados, tendo em vista os objetivos da pesquisa e
as variáveis escolhidas para a delimitação do fenômeno em
estudo, que podem estar relacionados a fatores linguísticos ou
extralinguísticos como sexo, idade, escolaridade, nível
socioeconômico, entre outros. As variáveis deverão ser
codificadas por letras ou números, de forma a diferenciá-las
entre si. Para ilustrar a codificação dos fatores, estamos
considerando um número de cinco colaboradores por célula ou
estrato com as mesmas características sociais, e três variáveis
extralinguísticas: Sexo (H(omem) / M(ulher)), Escolaridade (F
(Ensino fundamental) / S (Ensino universitário)) e origem do
falante (R(ural) / U(rbano)), que ficarão assim sumarizados:

Cinco homens com ensino fundamental da área rural


Cinco homens com ensino fundamental da área urbana
Cinco homens com ensino universitário da área rural
Cinco homens com ensino universitário da área urbana
Cinco mulheres com ensino fundamental da área rural
Cinco mulheres com ensino fundamental da área urbana
Cinco mulheres com ensino universitário da área rural
Cinco mulheres com ensino universitário da área urbana.

Todos estes fatores serão mais bem visualizados com a


codificação apresentada:

1HFR 1HFU 1HSR 1HSU


2HFR 2HFU 2HSR 2HSU
3HFR 3HFU 3HSR 3HSU
4HFR 4HFU 4HSR 4HSU
5HFR 5HFU 5HSR 5HSU

1MFR 1MFU 1MSR 1MSU


2MFR 2MFU 2MSR 2MSU
3MFR 3MFU 3MSR 3MSU
4MFR 4MFU 4MSR 4MSU
5MFR 5MFU 5MSR 5MSU

O tratamento estatístico nas pesquisas sociolinguísticas


serve para verificar com que frequência cada fator pode
interferir nas escolhas feitas pelos falantes, porque é considerado
o resultado dos cálculos do uso das variantes e o peso relativo de
cada um. Para tanto, existem programas computacionais, entre
os quais o Varbrul (Goldvarb), que é “um conjunto de
programas computacionais de análise multivariada,
especificamente estruturada para acomodar dados de variação
sociolingüística” (GUY e ZILLES, 2007, p. 105), que fornece
suporte estatístico e gera frequências absolutas e relativas de
ocorrência de cada grupo de fatores. Este programa é uma
ferramenta fundamental para análise sociolinguística e dado a
complexidade do assunto e ao espaço disponível neste artigo,
sugerimos a leitura de Guy & Zilles (2007) e Santos & Vitório
(neste volume)4 para um maior aprofundamento sobre ele, bem
como de Cedergren & Sankoff (1974) Sankoff & Labov (1979)
sobre regras variáveis.
O Varbrul seleciona o(s) grupo(s) de fator(es) mais
significativo(s) para realização da variação linguística, que
deverão ficar com um peso relativo acima de 0.51, o que
demonstraria a efetividade na aplicação da regra variável.
Valores abaixo de 0.51 podem ser interpretados como
desfavorecedores a sua aplicação. Deste modo, são identificados
os fatores linguísticos e sociais que favorecem ou não o uso de
uma ou outra variante, que está diretamente relacionada à
variável dependente em análise. Com os dados estatísticos
apresentados pelo programa é possível iniciar a interpretação
dos dados e a análise linguística propriamente dita, indicando se
os resultados estatísticos obtidos apontam para a confirmação ou
não das hipóteses iniciais norteadoras do trabalho, pois como diz
Naro (2003, p. 25): “o progresso da ciência lingüística não está
nos números em si, mas no que a análise dos números pode
trazer para nosso entendimento das línguas humanas”.

Conclusão

4
Uma rodada no GOLDVARB X.
Este artigo objetivou sistematizar, ainda que de forma
inicial, os passos metodológicos da Sociolinguística
Variacionista. Desta forma, sem querer ser exaustivo,
apresentamos as etapas a serem seguidas na coleta, transcrição e
codificação de dados e na consequente interpretação dos
mesmos. É conveniente lembrar que, embora tenham sido
utilizados procedimentos metodológicos adequados, cada
pesquisa impõe determinados limites, obrigando o pesquisador a
contorná-los como uma forma de obter dados pertinentes,
confiáveis e representativos do universo pesquisado. A
discussão sobre a metodologia de pesquisa sociolinguística não
se encerra aqui e muitos outros pontos não debatidos podem se
revelar pertinentes, cabendo ao pesquisador usar de bom senso
em sua delimitação e utilização.

Referências

CAMPOY, J. M. H. & ALMEIDA, M. Metodología de la


investigación sociolingüística. Málaga: Editorial Comares,
2005.

CEDERGREN, H. & SANKOFF, D. Variable rules:


performance as a statistical reflection of Competence. Language
(50): 233 - 255, 1974.
CHAMBERS, J. K., TRUDGILL, P. & SCHILLING-ESTES, N.
(eds). The Handbook of Language Variation and Change.
Oxford: Blackwell Publishing, 2002.

DA HORA, D. & PEDROSA, J.L.R. (orgs). Projeto variação


lingüística no estado da Paraíba (VALPB). João Pessoa: Idéia,
2001.

GUY, G.R. & ZILLES, A. Sociolinguística quantitativa:


instrumental de análise. São Paulo: Parábola, 2007.

LABOV, W. The social stratification of English in New York


City. Wasghington: Center for Applied Linguistics, 1966.

LABOV, W. Some principles of linguistics methodology.


Language in Society (1): 97-120, 1972.

LABOV, W. Padrões sociolingüísticos. São Paulo: Parábola.


2008 [1972].

MILROY, L. Language and social networks. Oxford: Basil


Blackwell, 1980.
MOLLICA, M.C. & BRAGA, M.L. (orgs) Introdução à
sociolingüística: o tratamento da variação. São Paulo:
Contexto, 2003.

NARO, A.J. Modelos quantitativos e tratamento estatístico. In:


MOLLICA, M.C. & BRAGA, M.L. (orgs) Introdução à
sociolingüística: o tratamento da variação. São Paulo:
Contexto, 2003.

SANKOFF, D. & LABOV, W. On the uses of variable rules.


Language in Society (9): 189 - 222, 1979.

SÓSTENES, G. Análise das variantes segmentais na fala de


telejornalistas de quatro cidades brasileiras, em emissão
espontânea e profissional. Dissertação de Mestrado. Maceió:
PPGLL - UFAL, 2008.

SOUZA NETO, A. F. Realizações dos fonemas  e  em


Aracaju – Sergipe. Dissertação de Mestrado. Maceió: PPGLL -
UFAL, 2008.

TARALLO, F. A pesquisa sociolingüística. São Paulo: Ática,


1985.

TRUDGILL, P. Sociolinguistics: an introduction to language


and society. London: Penguin Books, 2000.

VITÓRIO, E.G.S.L.A. Ter/Haver existenciais na escrita de


alunos dos ensinos fundamental e médio da cidade de
Maceió/AL. Dissertação de Mestrado. Maceió: PPGLL - UFAL,
2008.

WEINRICH, U; LABOV, W. & HERZOG, M. I.. Fundamentos


empíricos para uma teoria da mudança lingüística. São Paulo:
Parábola. 2006 [1968].

Você também pode gostar