Você está na página 1de 15

A ortografia de palavras em textos de alunos do Ensino

Fundamental II: as hipo e hipersegmentações

(The spelling of words in texts of elmentary school students: the hypo and
hypersegmentation)

Abstract: This paper analyzes unconventional segmentation of word in text produced by students of the
last years of Elementary School. We hypothesized that these data allow us to observe the characteristics
of written and spoken utterances. Through analysis of data on prosodic constituents, we argue that
students deal with conflicting hypotheses on the organization of unstressed syllables into prosodic
constituents: prosodic word and clitic group. Our analysis shows evidence that unconventional spellings
have their main motivation in the difficulty of students to assign the status word to grammatical items
which constitute prosodic clitics.
Keywords: prosody; spelling conventions; orality; literacy.

Resumo: Este artigo analisas as segmentações não-convencionais de palavras produzidas por alunos dos
quatro últimos anos do Ensino Fundamental. Partimos da hipótese de que esse tipo de dado de escrita nos
permite observar características tanto dos enunciados escritos quanto dos enunciados falados. Por meio da
análise dos dados em constituintes prosódicos, argumentamos que os escreventes operam com hipóteses
conflitantes a respeito da organização das sílabas átonas em constituintes prosódicos: palavra prosódica e
grupo clítico. Nossa análise demonstra evidencias de que as grafias não-convencionais têm sua principal
motivação na dificuldade dos escreventes em atribuir status de palavra a itens gramaticais que se
constituem como clíticos prosódicos.
Palavras-chave: prosódia; convenções ortográficas; oralidade; letramento.

Introdução
Pesquisadores da área de linguística, principalmente aqueles voltados à
aquisição da escrita infantil, vêm cada vez mais se interessando por questões referentes
às segmentações não-convencionais de palavras em produções escritas do Ensino
Fundamental I1 (doravante, EF I). Esse interesse parece resultar de uma frequência com
que esse tipo de dado pode ser encontrado nas produções textuais de crianças e,
também, de uma busca por critérios que, além de explicar o funcionamento das
segmentações não-convencionais, possam contribuir para a elaboração de hipóteses
acerca de como se dá o processo de aquisição da escrita e, também, para a explicitação
de como se dão as relações entre fala e escrita. Diante deste quadro, objetivamos
analisar a escrita de sete sujeitos ao longo do Ensino Fundamental II (doravante, EF II),
uma vez que esse tipo de dado não tem sido objeto de investigação dos estudiosos da
linguagem, particularmente, dos que investigam a aquisição da escrita. Ainda mais, de
acordo com o que prevê o Parâmetro Curricular Nacional de Língua Portuguesa, os
alunos deveriam terminar o EF I sendo capazes de “escrever textos com domínio da
separação em palavras” (PCN, 1997, p. 80, destaque nosso), ou seja, deveriam iniciar o

1
São exemplos de pesquisas que focalizam as segmentações não-convencionais de palavras produzidas
por alunos do EF I, entre outros, Abaurre (1991), Silva (1991), Abaurre e Silva (1993), Chacon (2004,
2005), Cunha (2004, 2010), Capristano (2007a, b).
EF II não mais “flutuando” em relação ao que consiste ser a fronteira gráfica de palavra.
No entanto, vale observar que há, como já demonstrado por Paranhos e Tenani (2011),
baseadas em dados de quinta série, e Tenani (2011a, b), grande recorrência de dados de
segmentação não-convencional de palavras em textos de escreventes do EF II.
Frente a essas constatações, neste texto, por meio da análise de um conjunto de
dados selecionados do córpus do Banco de Dados de Escrita do EF II (a ser detalhado
na próxima seção), formulamos a seguinte questão: as segmentações não-convencionais
de palavras, produzidas por escreventes do EF II, podem fornecer características
prosódicas do Português Brasileiro (doravante, PB)? A premissa deste trabalho é que os
dados de segmentação não-convencional de palavra permitem observar tanto
características dos enunciados escritos, quanto dos enunciados falados (base teórica
assumida, também, por autores, como, Chacon (2005), Capristano (2003, 2007a,b) e
Tenani (2011a, b)). Nossa hipótese é: as segmentações não-convencionais de palavra,
produzidas por escreventes do EF II, fornecem evidências de constituintes prosódicos
no PB (principalmente, a palavra fonológica e o grupo clítico). E no processo de
aquisição da escrita os escreventes, com base nesses constituintes, elaboram suas
hipóteses acerca dos limites gráficos de uma palavra na escrita, especialmente, dos
monossílabos átonos em relação à palavra de conteúdo que lhes são adjacentes.
Apresentados nossos pontos de partida, nosso objetivo principal é identificar em uma
amostra de dados longitudinais, quais características prosódicas podem ser observadas
em nas séries analisadas, na tentativa de responder à questão específica: em que medida
as segmentações não-convencionais de palavra podem ser consideradas como resultados
de características prosódicas dos enunciados falados, principalmente, dos constituintes
prosódicos palavra fonológica e grupo clítico?
A resposta a essa pergunta será dada por meio de uma análise prosódica que
toma como base as descrições dos constituintes prosódicos no PB, feitas a partir do
arcabouço teórico da Fonologia Prosódica de Nespor e Vogel (1986), particularmente
das noções sobre os domínios palavra fonológica e grupo clítico.

Aspectos metodológicos e segmentações não-convencional de palavras


De acordo com a literatura a respeito, a segmentação não-convencional de
palavra pode ser definida pela ausência/ presença do espaço em branco em local não
previsto pelas convenções ortográficas. Em função da ausência não-onvencional do
espaço em braço, essas segmentações podem ser classificadas em hipossegmentação,
como em: “meamava” e “denovo”; e, em função da presença não-convencional dessas
marcas gráficas, as segmentações não-convencionais de palavras são classificadas como
hipersegmentação, como em: “em quando”, “na quela”. Uma questão metodológica
importante, em textos manuscritos, relacionada a essa classificação de palavras é, para
Tenani (2011b), identificar quando há ou não o espaço de fronteira de palavras
empregado fora das convenções ortográficas. Seguindo a proposta da pesquisadora no
estabelecimento de critérios de identificação de dados, apresentamos as Figuras 1, 2, e
3, como exemplos de diferentes tipos de grafias podem gerar dúvidas na identificação
de dados de segmentação não-convencional de palavra.
Na Figura 1, na grafia de “minha” observa-se um espaçamento entre “mi” e
“nha” que poderia ser considerada como um possível dado. Entretanto, ao compararmos
as grafias de <i> ao longo do texto, constatamos que o escrevente as produz de tal modo
que, por vezes, há algum espaçamento que foge ao esperado para o traçado dessa letra.
Por isso, em casos como esses, para definir se essa é ou não uma ocorrência de
segmentação não-convencional de palavra, foi tomado como critério a comparação dos
traçados da letra. No caso exemplificado de <i>, observou-se, ao longo do texto a
distribuição do espaço em branco entre as demais palavras do texto. Feita essa
comparação, pode-se definir que essa não é uma ocorrência de segmentação não-
convencional de palavra.

Figura 1: Fonte Z09_6A_05_01


Observamos, na Figura 2, um espaçamento proporcionalmente maior entre “es”
e “tamos”. Essa grafia poderia ser analisada como uma segmentação não-convencional,
devido à flutuação na forma de grafar as letras em uma mesma palavra que se
caracteriza pela ausência das ligaduras entre as letras dentro de uma palavra (TENANI,
2011b). No entanto, ao compararmos a distribuição do espaço em branco entre outras
palavras, como, por exemplo, “souber” (linha 1), “internet” (linha 2), “crescer” (linha
3), chegamos a conclusão de não ser a grafia de “estamos” um dado de segmentação
não-convencional de palavra.

Figura 2: Fonte: Z08_5C_39F_04


Por fim, cabe explicitar o tratamento dado à translineação, caracterizada pela
segmentação de uma palavra em duas partes por motivo de passagem de uma linha para
outra, ilustrada na Figura 3. Segundo as convenções para manuscritos, o hífen deve ser
colocado após a primeira divisão da palavra. Da mesma forma que Tenani (2011b),
identificamos ausência de hífen, como ocorre na Figura 3, na grafia de “computador”, e
essa grafia não foi considerada como uma segmentação não-convencional de palavras,
por ter sido interpretada como uma questão de translineação.
Figura 3: Fonte Z08_5B_31F_04
Com a descrição realizada, objetivamos exemplificar o tipo de dificuldade
encontrado na categorização do espaço em branco entre palavras e, simultaneamente,
demonstrar o tipo de olhar necessário para a correta identificação dos dados de
segmentação não-convencional de palavra.
Dados os critérios para a identificação de ocorrências de segmentação não-
convencional de palavra, passemos a tratar da tipologia dessas ocorrências, baseados na
proposta de Tenani (2011b). No entanto, antes de adentrarmos a essa problemática vale
lembrar a existência de outro tipo de dado nomeado como mescla (CHACON, 2006) ou
híbrido (CUNHA, 2004,). Em nossos dados, apenas uma ocorrência foi identificada, a
saber: “a olado” (“ao lado”), produzida por um aluno de sétima série. Esse dado se
caracteriza por apresentar como uma hipo e uma hipersegmentação, ou seja: há
hipossegmentação entre as fronteiras das palavras “ao” e “lado”, seguida de
hipersegementação em “ao”. Esse resultado nos leva a concluir que a baixa frequência
desse tipo de dado parece ser um traço característico dos textos do EF II, quando
comparados aos textos produzidos no EF I, como já observado anteriormente por
Tenani (2011b).
Os três tipos de segmentação não-convencional ora descritos, a saber, hipo,
hipersegmentação e híbridos, têm em comum o critério básico do uso não-convencional
do espaço em branco em fronteira de palavra escrita. No entanto, na análise dos dados,
encontramos ocorrências que envolvem, além do critério básico que define uma
segmentação não-convencional, características linguísticas e ortográficas, o que
segundo Tenani (2011b, p.99) “nos levam a problematizar a pertinência (ou não) em
considerá-las como tipo distinto dos demais já estabelecidos na literatura”.
No córpus utilizado, neste trabalho, constituído por textos do EF II, há dados que
envolvem homonímias e a colocação não convencional do hífen, por isso adotamos a
proposta de Tenani (2011a, b) de classificar os dados não somente com base no critério
básico do uso não-convencional do branco, mas também com base no aspecto
ortográfico (uso não convencional do hífen) e morfossemântico (homonímia, ou não
homonímia). A partir dessa problemática propomos analisar quantitativa e
qualitativamente as ocorrências considerando esses (sub) tipos de dados de segmentação
não-convencional.

As segmentações não-convencionais de palavra em textos do EF II


Os dados de segmentação não-convencional analisados, neste trabalho, são
extraídos de textos pertencentes ao Banco de Dados de Produções Escritas do EF,
desenvolvido no âmbito do Projeto de Extensão Universitária, “Desenvolvimento de
Oficinas de Leitura, Interpretação e Produção Textual”, credenciado pela Pró-Reitoria
de Extensão (PROEx) da Unesp. O banco de dados é constituído por textos escritos de
alunos de quinta a oitava série (atual sexto ao nono ano) do EF da escola estadual
“Zulmira da Silva Salles”, situada na zona sul da cidade de São José do Rio Preto (SP).
Desse banco selecionamos 163 textos produzidos por 7 (sete) sujeitos2 ao longo dos
quatro últimos anos do EF II.
Analisando os 163 textos selecionados, identificamos um total de 238
ocorrências de segmentação não-convencionais de palavras. Na Tabela 1, são
apresentadas informações sobre: o total de textos coletados em cada ano, o total de hipo
e hipersegmentações identificadas por meio do branco, bem como a porcentagem dessas
ocorrências em relação ao total de dados identificados.

Tabela 1: Distribuição de textos e segmentações não-convencionais3


Textos coletados HIPO HIPER Total de segmentações
Séries
Nº % Nº % Nº % Nº %
5as. 40 24,5 39 16,4 35 14,7 74 31,1
6as. 42 25,8 30 12,6 29 12,2 59 24,8
7as. 36 22,1 31 13 25 10,5 56 23,5
8as. 45 27,6 15 6,3 34 14,3 49 20,6
TOTAIS 163 100 114 48,3 124 51,7 238 100
Onde: hipo: hipossegmentação; hiper: hipersegmentação.

Por meio da Tabela acima, é possível constatar dois que merecem destaque. O
primeiro é que o total de ocorrências de segmentações não-convencionais diminui
gradativamente com o passar dos anos, passando de 74 ocorrências (31,1%), na 5ª série,
para 49 ocorrências (20,6%), na 8ª série. Por hipótese, poderíamos dizer que essa queda
no número de ocorrências de segmentações não-convencionais tem correlação com o
tempo de escolarização e/ ou com o contato dos escrevente com as práticas de
letramento. O segundo resultado a comentar é que, de modo geral, há o predomínio de
hipossegmentações em relação à hipersegmentações, em todas as séries, tendência já
observada em trabalhos como, por exemplo, de Ferreiro e Pontecorvo (1996),
Capristano (2003) e Cunha (2004) em dados de crianças em fase inicial de aquisição da
escrita, e em trabalhos como de Tenani (2011b) em dados de EF II. Essa tendência, em
nossos dados, só irá se inverter na 8ª série, em que o total de hipersegmentações
(14,3%) se sobressairá sobre o total de hipossegmentações (6,3%). Esse resultado pode
ser um indício de que, com o passar do tempo de escolarização, os alunos estariam
registrando porções menores do enunciado – resultando em hipersegmentações do
enunciado – razão pela qual os alunos ancorariam sua escrita em (algumas)
características dos enunciados falados.
Continuando a exposição das características quantitativas dos dados de
segmentação não-convencional do EF II, apresentamos, no Quadro 1, todas as
ocorrências consideradas em nossa análise. Em seguida, apresentamos, na Tabela 2, os
números (juntamente com as porcentagens) de dados cujas grafias envolvem palavras

2
Os sujeitos selecionados fazem do córpus da pesquisa de mestrado intitulada: “As segmentações não-
convencionais de palavra em textos de alunos dos quatro últimos anos do Ensino Fundamental: um estudo
longitudinal”, desenvolvida pela mestranda Fabiana Cristina Paranhos, do Programa de Pós-Graduação da
UNESP/SJRP. Esses sujeitos foram selecionados, pois foram eles que atenderam os critérios de seleção
estabelecidos na pesquisa supracitada, a saber, alunos que apresentar 65% ou 100% de suas produções
textuais com algum tipo de segmentação não-convencional, e iniciaram e terminaram o EF II, na escola
em questão.
3
A ocorrência “a olado” é classificada de acordo com a literatura como dado híbridos, ou mescla, por isso
foi contabilizada duas vezes, ou seja, como sendo uma hipo e uma hipersegmentação.
homônimas, no caso, hipossegmentações como “agente” (quando a convenção prevê “a
gente”), e hipersegmentações como “por que” (quando a convenção prevê “porque”).

Quadro 1: Ocorrências de segmentações não-convencionais em textos do EF II


Séries HIPO HIPER HOMO HÍFEN
5as. vamofazer, uque, eo, meamava, so zinho, com sigo, de se, da li, por que, pegala,
befeito, porsima, meresta, ea, a panho, que ria, a caba, com agente, aparese-
enfrente, dela (de lá), emais, pra, com versa, a i, a gora, es de mais, se
comtudo, tevejo, poraqui, jatem, quito, na que le, estra senão
eos, oque, ensima, eai, ea, parage terrestres, anti penúltimo, ém
(para vê), encima, ensima, apé, dela, Barcou, em bora , disney
encima, pralá, poraquê, denovo, lândia, disney landia
vaitala
6as. anoite, derrepente, derepente, uque, em quamdo, ne um, tam bem, por que,
meroubar, daora; anoite, tabom, da quele, a quela, a caso, na agente, de
porixo, porelas, eramuito quela, com migo, mini cidade, mais
a gora, a sistir, começa mo
7as. quinem, imforma(em forma), com tigo, su por, com migo, a de mais, vira-se
mechamava, jogala (joga lá), dela olado, de pois, a onde, a por que,
(de lá), mechamou, jano, Eundia, migos, a o, come cheia agente,
mechamaram, a olado, oque, pasair (comecei) afim
(para sair), denovo, medar, meda
8as. eo, denovo, enfrente, diversi quando com ver sando, com verço, de mais,
(de vez em quando), oque, poriço, com versando, com ver samos, por que,
quinem, pramim em baixo, simples mente, a agente
sim, na quele, de baixo, contra
bando

Tabela 2: Ocorrências de segmentação não-convencional de formas homônimas


Hipossegmentação Hipersegmentação
Série Total
agente senão afim por que de mais
N % N % N % N % N % N %
5ª 1 1,1 1 1,1 - 3 3,2 3 3,2 8 8,5
6ª 15 15,9 - - 15 15,9 2 2,1 32 34,0
7ª 12 12,8 - 2 2,1 12 12,8 2 2,1 28 29,8
8ª 6 6,4 - - 18 19,2 2 2,1 26 27,7
Total 34 36,2 1 1,1 2 2,1 48 51,1 9 9,5 94 100

Da Tabela 2, dois resultados nos interessa destacar. O primeiro diz respeito ao


fato de haver, nesse subconjunto de dados, mais hipersegmentações (60,6%) do que
hipossegmentações (39,4%). Essa tendência se apresenta em todas as séries analisadas –
exceto na 7ª série que apresenta o mesmo número de hipo e hipersegmentações – e é
inversa à tendência identificada quando consideradas todas as demais palavras
segmentadas não convencionalmente, ou seja, a tendência geral é a de haver mais
hipossegmentação do que hipersegmentação (como demonstrado na Tabela 2). Esse
resultado, como verificado na Tabela 2, encontra-se fortemente ligado ao alto número
de ocorrências da forma hipersegmentada “por que”. Vale salientar que Tenani (2011a),
ao analisar dados de segmentação não-convencional de escreventes do EF II
transversalmente, também chegou aos mesmos resultados. Portanto, tanto em uma
amostra transversal, quanto em uma amostra longitudinal de dados de segmentação não-
convencional de palavras envolvendo homonímia apresentam uma mesma tendência.
Do ponto de vista fonológico, podemos dizer que tanto as hipo, quanto as
hipersegmentações envolvendo palavras homônimas resultam em representações
gráficas de sequências em que há um clítico prosódico, que corresponde a palavras
funcionais ou itens gramaticais, como nos dados coletados, o artigo “a” (em “agente”), a
conjunção “se” (em “senão”), a preposição “a” (em “afim”), a preposição “por” (por
que), e a preposição “de” (em “de mais”).
Como já colocado por Tenani (2011a, p. 8), as grafias não-convencionais de
palavras homônimas apontam para a relevância em se analisar esse tipo de grafia de
palavras ao menos como um

subtipo de hiper e hipossegmentações, cujas características morfossintáticas e


morfossemânticas carecem de uma análise detalhada que leve em conta
conjuntamente o nível de articulação entre as orações/sentenças de um texto,
com relações de dependência ou de encaixamento, e as diferentes nuanças de
causa: justificativa, motivo, explicação.

No entanto, neste texto, como nosso objetivo é apresentar uma análise que
demonstre as características prosódicas dos dados em análise, nos limitamos a sinalizar
a importância de realizar essa investigação mais aprofundada que faremos em outro
momento.
Outro conjunto de dados que merece destaque em nossa análise são as grafias
que envolvem usos não-convencionais de hífen. Esse tipo de dado se particulariza frente
aos dados que se caracterizam apenas pelo uso não-convencional do branco, como em
“denovo” e “na quela”, uma vez que se caracterizam pela combinação de usos não-
convencionais do espaço em branco e do hífen, resultando, como apresentado no
Quadro 2 (a partir de Tenani 2011b), em hipossegmentações – pela ausência do branco
e do hífen, e em hipersegmentações – pela presença do branco e do hífen. Pode-se notar,
ainda, em nosso córpus, ocorrências de outros dois tipos de dados, que apesar de
envolverem o uso não-convencional do hífen não foram considerados por nós como
sendo ocorrências de segmentação não-convencional de palavras, como o fez Tenani
(2011b), são eles: “montanha russa”, e, “pra-la” e “por-isso”, uma vez que no primeiro
tipo de dado se encontra envolvida a ausência do hífen entre palavras compostas, o que
leva a uma grafia não-convencional de palavra composta, e no segundo tipo de dado há
usos não convencionais do hífen, gerando uma representação de suposta relação
morfossintática entre palavras.

Quadro 2: Segmentação não-convencional de palavra e uso de hífen


CARACTERÍSTICA DADO OBSERVAÇÕES
Ausência do branco e ausência pegala (5ª) Caso de hipossegmentação
de hífen
Presença de branco e ausência montanha russa (5ª) Não é segmentação não-
de hífen convencional
Presença de hífen dentro da aparese-se (5ª), vira-se (7ª) Caso de hipersegmentação
palavra
Presença do hífen nos demais pra-la (5ª), por-isso (7ª) Não é segmentação não-
contextos convencional

As características listadas para os dados que envolvem os usos não


convencionais de hífen nos fazem retomar a definição do que seja hífen, por um lado, e
do que seja segmentação não-convencional de palavra, por outro lado. De acordo com a
literatura, a segmentação não-convencional de palavra pode ser definida como usos do
espaço em branco que sinalizam fronteiras de palavras escritas que não atendem às
convenções ortográficas. Segundo Tenani (2011a), esse tipo de definição privilegiaria

apenas o aspecto funcional que o ‘branco’ tem de delimitar fronteiras de palavra e


não abarca o fato de haver usos não-convencionais do hífen o qual, em seu aspecto
gráfico, é definido por um traço e, em seu aspecto funcional, por uma natureza
‘dupla’, pois sinaliza certos tipos de relações entre palavras de modo que as delimita
e as une. (p. 9, grifos da autora)

Ainda, segundo a autora, a natureza dupla do hífen está na sua própria definição
registrada em dicionários, como podemos observar nos exemplos a seguir:

“Sinal diacrítico (-) usado para ligar os elementos de palavras compostas (couve-
flor; ex-presidente), para unir pronomes átonos a verbos (ofereceram-me; vê-lo-ei) e
para, no fim da linha, separar uma palavra em duas partes (ca-/sa; compa-/nheiro).”
(Dicionário Aurélio)4
“Sinal gráfico que une: elementos de um composto, um verbo a pronomes oblíquos
enclíticos e mesoclíticos; e indica partição de sílabas de um vocábulo; traço de
união” (Dicionário Michaelis on line)5
“Sinal em forma de um pequeno traço horizontal (-), us. para unir os elementos de
palavras compostas, separar sílabas em final de linha e marcar ligações enclíticas e
mesoclíticas (p.ex., em guarda-chuva, aboli-/ção, telefonaram-lhe, fá-lo-ei); risca de
união, traço de união, tirete” (Dicionário Houaiss)6

Diante desse quadro, defendemos, junto com Tenani (2011a, b), ser relevante
analisar os usos combinados de branco e de hífen separadamente, pois esse tipo de dado
pode nos mostrar, de modo privilegiado, evidências sobre a mobilização de informações
letradas a respeito dos limites de palavras na língua, ao passo que, hipoteticamente, as
grafias não-convencionais de palavras observadas em textos do EF II trazem pistas da
noção de palavra que os escreventes estão lidando quando imersos em práticas
orais/faladas e letradas/escritas.
Dos dados que foram classificados de acordo com o aspecto gráfico (branco e
hífen), verificamos que das 238 segmentações não-convencionais de palavras
encontradas no córpus, apenas três, envolvem usos não-convencionais de hífen, sendo 1
(uma) ocorrência de hífen envolvendo hipossegmentação de palavras, como (na 5ª
série); e 2 (duas) ocorrências de hífen envolvendo hipersegmentação de palavras:
“aparece-se” (5ª série) e “vira-se” (7ª série).
Dentre os dados que envolvem hipo e hipersegmentação, podemos identificar
dois tipos de dados envolvendo uso não-convencional de hífen como podemos
visualizar no Quadro 3.

4
Novo Dicionário Eletrônico Aurélio, versão 5.11a.
5
Disponível em: http://michaelis.uol.com.br/moderno/portugues/index.php?lingua=portugues-
portugues&palavra=hífen.
6
Dicionário eletrônico Houaiss da língua portuguesa, versão 3.0.
Quadro 3: Tipos de uso não-convencional de hífen
Tipo Classificação Exemplos
v-cl> v O hífen não é colocado em sequências de verbo-clítico (v- “pegá-la” > “pegala”
(Hipo) cl)
v > v-cl O hífen é colocado em formas verbais (v) como se fossem “aparecesse” > “aparese-se”,
(Hiper) sequências de verbo-clítico (v-cl). “virasse” > “vira-se”

Conforme observado, os dados que envolvem hipersegmentação ocorrem tanto


na 5ª, quanto na 7ª série. Em ambas as séries, os escreventes analisam formas verbais
como se fossem constituídas de sequências de verbo-clítico, ocasionando uma
hipersegmentação. Já no caso de hipossegmentação que envolvem o sinal gráfico hífen,
observamos que esse tipo de dado ocorreu somente na 5ª série, e abrange o uso não-
convencional de hífen em sequência de verbo-clítico (v-cl), analisada como sendo uma
palavra (v-cl>v).
A separação dos dados por aspecto gráfico permite visualizar, de modo mais
evidente, a motivação de natureza letrada na ocorrência da segmentação não-
convencional de palavra, uma vez que tanto na hipersegmentação (“vira-se” – v>v-cl),
quanto na hipossegmentação (“pegala” – v-cl>v), está sendo mobilizada a mesma
estrutura verbo-clítico (v-cl), ou seja, estrutura enclítica que é típica da escrita, que o
aluno provavelmente produz na busca de alçar uma escrita institucionalizada
(CORRÊA, 2004).
Além dessa característica gramatical, também realizamos a análise prosódica das
ocorrências de uso combinado de branco e de hífen. Primeiramente, apresentamos, por
meio do Quadro 4, as premissas e as hipóteses em relação a hipo e hipersegmentação
envolvendo hífen, retomadas de Tenani (2011b). Devemos considerar que a premissa
principal se encontra ancorada em Corrêa (2004), segundo a qual enunciados escritos
são constituídos de modo heterogêneo, pela combinação entre as práticas sociais
orais/faladas e letradas/escritas. Como, também, nossa hipótese geral é que as grafias de
fronteiras de palavras (por branco ou por hífen) podem ser vistas como evidências do
modo como o escrevente projeta características dos enunciados falados (no que diz
respeito à dimensão sonora da linguagem) nos enunciados escritos.

Quadro 4: Premissas e Hipóteses quanto as hipo e hipersegmentações envolvendo hífen


Tipo de dado Premissa Hipótese
Hipersegmentação A presença não-convencional de O registro gráfico é uma
hífen/branco dentro da palavra foi representação motivada pela
motivada pela interpretação do percepção de uma palavra como se
escrevente de dois constituintes fosse ou um grupo clítico. Ex:
prosódicos. “aparese-se> aparecesse” (v> v-cl)
Hipossegmentação A ausência não-convencional de O registro gráfico é uma
hífen/branco em relação as convenções representação motivada pela
ortográficas foi motivada pela percepção de um grupo clítico como
interpretação do escrevente de um se fosse uma palavra. Ex: “pegala >
constituinte prosódico. pegá-la” (v-cl > v)

Apresentadas as premissas e as hipóteses da pesquisa, passamos à análise das


estruturas prosódica envolvidas nas quatro ocorrências de branco/hífen consideradas em
nossa análise, seguindo a análise de Tenani (2011b) para dados transversais. No Quadro
5, verificamos que formas verbais como “aparecesse”, que correspondem a uma palavra
prosódica (ω), têm a sua grafia não-convencional (“aparese-se”) corresponde a um
grupo clítico (Gcl), formado pela suposta forma verbal “aparese” (ω) seguida do clítico
“se”(cl). Já as grafias convencionais “pegá-la”, correspondente a um grupo clítico (Gcl),
em que o verbo é o hospedeiro de elemento clítico “la”, tem sua grafia não-
convencional (“pegala”), representada como uma suposta palavra prosódica.

Quadro 5: Tipos de usos não-convencionais de hífen e estruturas prosódicas


Tipo de dado Estrutura prosódica Ocorrências
Hipersegmentação v>v-cl ω>(ω+cl) Gcl “aparecesse” > “aparese-se” (5ª)
“virasse” > “vira-se” (7ª)
Hipossegmentação v-cl>v (ω+cl) Gcl > ω “pegá-la” > “pegala” (5ª)

Podemos concluir a respeito da análise das segmentações não-convencionais que


se caracterizam pela combinação de usos não-convencionais do espaço em branco e de
hífen que há evidências de o escrevente lida com hipóteses (conflitantes) sobre a
representação gráfica da palavra escrita baseando sua grafia na percepção da
organização prosódica dos enunciados em grupos clíticos e palavras prosódicas. Mais
especificamente, os dados dão pistas de haver flutuação entre os domínios de palavra
prosódica e grupo clítico e vice-versa – como em (aparecesse) ω > (aparese-se) Gcl e
(pegá-la) Gcl > (pegala) ω.
Em suma, por meio desta descrição e análise de dados, apresentamos elementos
empíricos que sustentam a tese de que as segmentações não-convencionais de palavra
dão pistas de como se dá o trânsito do escrevente por práticas orais/faladas e
letradas/escritas.
Passemos agora a analisar prosodicamente as hipo e hipersegmentações que
seguem uma tendência geral dos dados.

Análise prosódica das segmentações não-convencionais de palavras


Após apresentarmos as análises de ocorrências de segmentação não-
convencional que se particularizam por envolverem o uso não-convencional de hífen e
de homonímias, passemos a analisar prosodicamente as segmentações não-
convencionais de palavras que apresentaram as estruturas prosódicas mais recorrentes
nos textos que investigamos.7
Iniciamos a análise prosódica focalizando as hipossegmentações identificadas
nos textos analisados, por meio da Tabela 3, em que se encontra a distribuição das
ocorrências das estruturas prosódicas identificadas em relação às séries em que os
alunos encontravam-se matriculados.

Tabela 3: Tipos de estrutura prosódica para as hipossegmentações


Hipossegmentação
Séries
ω+cl cl+ω cl+cl ω+ω cl+cl+ω Total
5ª 0 23 7 5 0 35
6ª 0 12 2 1 0 15
7ª 2 12 1 1 1 17
8ª 0 6 3 0 0 9
Total 2 (2,7%) 53(69,7%) 13(17,1%) 7(9,2%) 1(1,3%) 76(100%)

7
Nessa parte da análise foram consideradas somente as hipo e hipersegmentações que envolvem o uso
não-convencional do espaço em branco, que totalizam 141 ocorrências, uma vez que decidimos
apresentar uma análise separada das ocorrências envolvendo as 94 ocorrências de homonímias, e as 3
ocorrências de uso não-convencional de hífen.
Na tabela 3, observamos que as cinco estruturas prosódicas identificadas nas
hipossegmentações envolvem clíticos e/ou palavras fonológicas. A maior parte (69,7%)
das hipossegmentações envolve a estrutura de clítico seguido de palavra fonológica,
sendo essa a estrutura predominante em todas as séries. Como, exemplos, dessa
estrutura têm-se “meamava” e “denovo”, em que o clítico se torna, na interpretação do
sujeito escrevente, uma sílaba pretônica da palavra. Prosodicamente, “me amava” e “de
novo” constituem grupos clíticos. Vale ressaltar que Tenani e Paranhos (2011) e Tenani
(2011b) já demonstraram em seus estudos ser esse tipo de estrutura prosódica a mais
envolvida nas hipossegmentações produzidos por escreventes do EF II. Portanto, essa
tendência se mantém para o conjunto de dados longitudinais analisados.
O segundo tipo de estrutura mais recorrente (com 17,1% do total dos dados) são
as hipossegmentações que se caracterizam por grafias do que, na fala, são junturas de
dois elementos clíticos e, nesse caso, os elementos envolvidos na juntura não formam,
em princípio, um grupo clítico, por não haver hospedeiro. Do total de 13 ocorrências
envolvendo esse tipo de estrutura, sete envolvem a sequência “oque/uque”. A respeito
dessa sequência, podemos afirmar baseados em Tenani (2011b), que a grafia não-
convencional da sequência “o que” foi ocasionado pelo fato da partícula “que” – que
não apresenta acento lexical, receber acento prosódico e passar a ser na interpretação do
aluno uma sequência de clítico seguido de palavra fonológica. Já o restante dos dados
envolvem a junção entre “e” (conjunção) e “o(s)/a”(artigos), palavras funcionais,
correspondentes a clíticos prosódicos.
Da Tabela 3, restam 13,2% dos dados que podem ser analisados como
envolvendo três diferentes tipos de estruturas prosódicas. Desses dados 2,7% envolvem
sequências de palavra fonológica seguida de clítico. O primeiro dado envolvendo esse
tipo de estrutura é a sequência “jano”, em que temos o monossílabo tônico “já” seguido
do clítico “no”, que se torna uma sílaba postônica da palavra. O segundo dado é
“jogala” (“jogar lá”), trata-se de duas palavras fonológicas, no entanto, na interpretação
do aluno o monossílabo tônico “lá” foi analisado como um clítico, resultando em uma
hipossegmentação do tipo ω+cl. Possivelmente, o escrevente analisou o monossílabo
tônico como sendo um pronome enclítico ao verbo, a exemplo das estruturas enclíticas
analisadas como sendo uma única palavra fonológica, como demonstrado na seção 3.3,
com os dados de segmentação não-convencional envolvendo hífen.
Dos demais dados, apenas um é do tipo cl+cl+ω, a saber, “eundia” (“e um dia”),
o qual se caracteriza pela grafia de um grupo clítico como sendo uma única palavra
fonológica.
E finalmente, 9,2 % das ocorrências são, em princípio, sequências de duas
palavras fonológicas, a saber: na 5ª série – “befeito” (bem feito), “vamofazer”, “jatem”,
“parage” (para vê), “vaitala” (vai estar lá); na 6ª série “tabom”, e na 7ª série “eramuito”.
No entanto, “tabom” e “eramuito”, poderiam ser interpretados como uma sequência de
clítico e palavra fonológica, uma vez que “ta” (forma reduzida de “estar”), e “era”
(verbo “ser”) parecem “estar perdendo, no PB, o acento primário e se transformando em
um clítico (monossílabo não acentuado) que os escreventes, em alguns momentos,
tendem a unir a elementos mais fortes (fonológica, semântica e/ou sintaticamente)”
(CAPRISTANO, 2007, p.106). Ainda mais, as hipossegmentações “vaitala” (“vai estar
lá”), “jatem” (“já tem”) e “parage” (“para ver”) poderiam ser analisados como sendo
dois φs hipossegmentados, como demonstrado abaixo para as duas últimas ocorrências
e, no caso de “vaitalá”, a locução verbal “vai tá” forma uma única palavra fonológica
seguida de outra constituída do advérbio “lá”.
1.1. “[E ai primo] [Marco] [voce] [jatem] φ [o MSN]”

1.2. “[Ai nois foi][ na janela][ parage] φ [o pais]”


Por fim, ao analisarmos a hipossegmentação “befeito” diríamos que se trata de
uma frase fonológica ([bem]ω [feito]ω)φ. No entanto, essa segmentação não nos parece
um φ hipossegmentado, pois no texto em questão a sequência “bem feito” está tendo um
funcionamento lexical e não pós-lexical, ou seja, essa sequência não estaria funcionando
como uma estrutura sintática formada por advérbio mais verbo, como em: “O bolo foi
bem feito por Maria”, mas sim como uma expressão interjetiva, como em: “Bem feito
para você por não seguir meus conselhos”, proferida quando alguém vê o outro tomar
uma lição de moral. No texto em análise, o escrevente, poderíamos dizer, tomou como
base o aspecto morfossemântico além do prosódico do enunciado ao hipossegmentar
“befeito”, isto é, ao tomar a decisão de não colocar o espaço em branco em local
previsto pela ortografia, o escrevente, possivelmente atribuiu um status de palavra a
essa expressão interjetiva, o que estaria representando o valor semântico dessa
expressão e a distinguindo da sequência sintática formada por advérbio mais verbo.
Podemos concluir a análise das hipossegmentações, afirmando que são
simultaneamente motivadas por informações de natureza prosódica, de natureza
morfossemântica, além de informações de natureza letrada, nas tentativas de registro,
principalmente, de sílabas átonas.
Feita a descrição das características prosódicas das hipossegmentações,
apresentamos, na Tabela 4, a distribuição das ocorrências das estruturas prosódicas
envolvidas nas hipersegmentações.

Tabela 4: Tipos de estrutura prosódica para as hipersegmentações


Hipersegmentação
Séries
ω+cl cl+ω cl+cl ω+ω outros Total
5ª 0 18 0 6 5 29
6ª 1 10 0 1 0 12
7ª 0 8 0 1 1 10
8ª 0 6 0 4 4 14
Total 1(1,5%) 42(64,6%) 0 12(18,5%) 10(15,4%) 65(100%)

Na tabela 4, verificamos que, dentre as quatro possibilidades de estruturas


prosódicas das palavras hipersegmentadas, duas envolvem sílabas átonas das palavras
grafadas como se fossem clíticos, como, por exemplo, “em quando” (cl+ω) e “comeca
mos” (ω+cl). Observamos que a minoria dos dados (1,5%) é resultado de uma tentativa
de representação da estrutura verbo-clítico, podendo ser a ocorrência “comeca mos”
tomada como um indício da tentativa de o escrevente alçar as grafias convencionais de
uma estrutura típica de enunciados escritos formada de verbo-clítico, demonstrando,
desta maneira, que informações letradas também são mobilizadas nas
hipersegmentações. Já a maioria das ocorrências (64,6%) é resultante de representações
gráficas do que seria uma sequência de clítico seguido de palavra fonológica, como, por
exemplo, “em quando” (enquanto) e “na quela” – ainda que, diversas vezes, a palavra
fonológica resultante não corresponda a nenhuma palavra possível na língua, mas que,
nos termos de Cunha (2004), se trataria de uma pseudo-palavra. Destacamos ainda que
o tipo de estrutura ora descrito é o mais recorrente independentemente da série em
análise, mesmo havendo um decréscimo na frequência com o passar dos anos.
Antes de adentramos nos demais tipos de estruturas prosódicas envolvidas nas
hipersegmentações, vale estabelecermos uma relação entre as características prosódicas
predominantes entre as hipersegmentações (ω>cl+ω) e as hipossegmentações (cl+ω>ω).
Nas hipersegmentações, uma palavra é grafada como sendo uma sequência de clítico e
(pseudo) palavra, enquanto, nas hipossegmentações uma sequência de clítico e palavra é
grafada como sendo uma palavra. Essas grafias não-convencionais demonstram, como
observado por Tenani (2011a, p. 14), uma

flutuação sobre decisões acerca das fronteiras de palavra na escrita, pois estão
em jogo tentativas de ‘fraseamento’ de sílabas átonas que são (na
hipossegmentação) ou poderiam ser (na hipersegmentação) um clítico
prosódico (que correspondem a palavras funcionais monossilábicas).

Da Tabela 4, restam 18,5 % de dados que podem ser analisados como tendo sido
motivada pela suposição de se tratar de duas palavras fonológicas. São exemplos desse
tipo de dado: “so zinho”, “anti penultimo ”, “simples mente”, “disney landia”; cada
parte que resulta da hipersegmentação de palavra se caracteriza por ser, do ponto de
vista fonológico, uma palavra fonológica por ter acento. Além de registro de
proeminências dos enunciados falados, vale ressaltar que essas hipersegmentações
também têm suas motivações ancoradas em critérios semânticos, como observado por
Abaurre (1991) ao analisar dados de escrita infantil. Ainda mais, podemos dizer que
além de serem motivadas por informações prosódicas e informações morfossemânticas,
esse tipo de estrutura (ω+ω) envolvida nessas ocorrências de hipersegmentações
demonstram as decisões dos escreventes sobre a colocação de espaço em branco na
escrita produzida com base na tentativa de alçar uma escrita institucionalizada
(CORRÊA, 2004), pois ao colocar um espaço em branco entre cada unidade linguística,
o escrevente deixa pista de que está elaborando hipóteses sobre o status de palavra
autônoma (ABAURRE e SILVA, 1993).
Por fim, o último conjunto de dados é formado por dez ocorrências (que
correspondem a 15,4%) que têm em comum a segmentação de palavras em sílabas,8
e/ou sílabas seguidas de um pé. No Quadro 6, apresentamos informação da série em que
ocorreu cada dado e possíveis estruturas prosódicas correspondentes.

Quadro 6: Ocorrências de hipersegmentações envolvendo sílabas e pés


Classificação Dados Série
σ+σ “que ria”(2x) 5ª
“su por” 7ª
σ+Σ “es quito” (escrito) 5ª
“com verço” 8ª
“com versando” 8ª
σ+σ+σ “na que le" 5ª
Σ+σ+σ “adicio o na” 5ª
σ+σ+Σ “com ver sando” 8ª
“com ver samos” 8ª

8
A sílaba (σ) constitui a menor unidade prosódica. Assim como os demais constituintes, ela possui um
cabeça (nó com valor forte), que em Português Brasileiro é sempre uma vogal, e, possivelmente, seus
dominados (nós com valor fraco), que em Português Brasileiro podem ser consoantes ou glides. No
modelo prosódico proposto por Nespor e Vogel (1986), as sílabas são agrupadas pés.
Como podemos observar, exceto para o dado “es quito”, todas as demais
ocorrências apresentam ao menos uma das sílabas hipersegmentadas correspondente a
um possível monossílabo átono, que prosodicamente equivale a um clítico, que pode
corresponder a palavras funcionais ou itens gramaticais, como, por exemplo, nos dados
coletados, a conjunção “com” (em “com versando”), a preposição “em” + artigo “a” =
(na) (em “adisio o na”), o pronome “que” (em “que ria”), e a preposição “por” (em “su
por”).
Concluímos a análise das hipo e hipersegmentações, tendo demonstrado que
essas grafias constituem evidências de que os escreventes, ao tomarem decisões sobre
onde alocar o espaço em branco que indica fronteira de palavra na escrita, mobilizam
tanto informações prosódicas (como, sílaba, pé métrico, palavra fonológica) quanto
letradas (como, a grafia de palavras funcionais). Vale ressaltar, que as mesmas
características já foram observadas em dados transversais de escrita de alunos de EF II
por Tenani (2011b), como, também, em dados de escrita infantil por autores como
Capristano (2007a).

Considerações finais
Neste trabalho, argumentamos que segmentações não-convencionais de
palavras podem ser motivadas por possíveis estruturas prosódicas da língua como pé
métrico, palavra fonológica e grupo clítico. Mais especificamente, nas
hipossegmentações, observamos evidências que o clítico prosódico se torna, na
interpretação do escrevente, uma sílaba pretônica, como em “meamava” e “denovo”, e,
nas hipersegmentações, há evidências de que o escrevente analisa a sílaba pretônica da
palavra como sendo o clítico, como em “na quela”. Ainda mais, a análise nos permitiu
identificar uma dificuldade de os escreventes identificarem categorias gramaticais,
principalmente, preposições, pronomes e conjunções, itens gramaticais em que estão em
jogo os clíticos prosódicos. Esses resultados identificados em dados longitudinais são
semelhantes aos resultados de Tenani (2011a, b) feitos a partir de dados transversais.
Em relação à aquisição da escrita, constatou-se que os dados de
hipossegmentação predominam sobre os de hipersegmentação, característica comum
aos dados de escrita infantil. Observou-se também que os constituintes prosódicos
considerados relevantes para caracterizar as hipo e hipersegmentações encontradas nas
produções escritas de alunos do EF II, neste estudo longitudinal, é semelhante aos
resultados obtidos por Tenani (2011a, b) para dados transversais. Entretanto, esses
diferem daqueles encontrados nas produções de alunos do EF I, ou seja, enquanto que
no EF I podem ser encontrados dados que correspondem a todos os domínios
prosódicos (U, I, φ, C, ω, Σ) e mesclas entre os domínios, como observado por Chacon
(2005) e Capristano (2007a); no EF II, há o predomínio de segmentações não-
convencionais relacionadas, predominantemente, às fronteiras dos domínios de Σ, ω, C,
não havendo dados envolvendo constituintes altos da hierarquia prosódica (, como U, I).
Para além de serem identificadas semelhanças e diferenças, em relação a
constituintes prosódicos envolvidos nas segmentações não-convencionais de palavras
em diferentes ciclos do EF, buscamos demonstrar indícios de como se dá a relação entre
os enunciados orais/falados e letrados/escritos. Neste texto, buscamos demonstrar a
existência do trânsito do escrevente por práticas orais/faladas e letradas/escritas que
indicam um modo de constituição da escrita heterogêneo (CORRÊA, 2004).

REFERÊNCIAS
ABAURRE, M. B. M. A relevância dos critérios prosódicos e semânticos na elaboração
de hipóteses sobre segmentação na escrita inicial. Boletim da Abralin, Campinas, v. 11,
p. 203-17, 1991.
______; SILVA, A. O desenvolvimento de critérios de segmentação na escrita. Temas
em psicologia. São Paulo, v. 1, 1993
CAPRISTANO, C. C. Aspectos de segmentação na escrita infantil. São José do Rio
Preto. 166f. Dissertação (Mestrado em Estudos Linguísticos). Instituto de Biociências,
Letras e Ciências Exatas, UNESP, 2003.
______.Mudanças na trajetória da criança em direção à palavra escrita. 2007a, 263f.
Tese (Doutorado em Linguística Aplicada) – Instituto de Estudos da Linguagem,
Universidade Estadual de Campinas, Campinas, 2007a.
______. Aspectos de segmentação na escrita infantil. São Paulo: Martins Fontes, 2007b.
CHACON, L. ______. Hipersegmentações na escrita infantil: entrelaçamentos de
práticas de oralidade e letramento. Estudos linguísticos. Campinas, 2005, v. 34, p.77-86.
______. Prosódia e letramento em hipersegmentações: reflexões sobre a aquisição da
noção de palavra. In: CORRÊA, Manoel Luiz Gonçalves. (Org.) Ensino de língua:
representação e letramento. Campinas: Mercado de Letras, 2006, p.155-167
CORRÊA, M. L. G. O modo heterogêneo de constituição da escrita. São Paulo: Martins
Fontes, 2004.
CUNHA, A. P. N. A hipo e a hipersegmentação nos dados de aquisição da escrita: um
estudo sobre a influência da prosódia. 2004. Dissertação (Mestrado em Educação) –
Universidade Federal de Pelotas, Pelotas, RS.
FERREIRO, E.; PONTECORVO, C. Os limites entre as palavras. A segmentação em
palavras gráficas. In: FERREIRO, Emilia; PONTECORVO, C.; MOREIRA, N.
HIDALGO, I. G. Chapeuzinho Vermelho aprende a escrever. São Paulo: Ática, 1996. p.
38-66.
NESPOR, M.; VOGEL, I. Prosodic phonology. Dordrechet: Foris Publications, 1986.
PARANHOS, F. C.; TENANI, L. E. Análise prosódica de segmentação não-
convencional de palavras em textos do sexto ano do Ensino Fundamental. Revista
Filologia e Linguística Portuguesa – FLP. Edição n. 13, 2011
TENANI, L. ______. Aspectos segmentais e prosódicos da escrita de crianças e
adolescentes: evidências de relações entre enunciados falados e escritos. Relatório
científico final de projeto de pesquisa apresentado à FAPESP, 2011a, 44p.
______. A segmentação não-convencional de palavras em textos do ciclo II do Ensino
Fundamental. Revista da ABRALIN, v. 10, n.2, jul./dez, 2011b, p. 91-119.

Você também pode gostar