Você está na página 1de 104

CONSELHO EDITORIAL:

Alexandre Cadilhe [UFJF]


Ana Cristina Ostermann [Unisinos/CNPq]
Ana Elisa Ribeiro [CEFET-MG]
Carlos Alberto Faraco [UFPR]
Cleber Ataíde [UFRPE]
Clécio Bunzen [UFPE]
Francisco Eduardo Vieira [UFPB]
Irandé Antunes [UFPE]
José Ribamar Lopes Batista Júnior [LPT-CTF/UFPI]
Luiz Gonzaga Godoi Trigo [EACH-USP]
Márcia Mendonça [IEL-UNICAMP]
Marcos Marcionilo [editor]
Vera Menezes [UFMG]
Diagramação: Telma Custódio

CIP-BRASIL. CATALOGAÇÃO NA FONTE


SINDICATO NACIONAL DOS EDITORES DE LIVROS, RJ

T253
Tecnologias e ciências da linguagem [recurso eletrônico] : vertentes
e novas aplicações - volume 2 / organização Luciana Cidrim, Waslon
Lopes, Francisco Madeiro. - 1. ed. - São Paulo : Pá de Palavra, 2020..
recurso digital

Formato: epub
Requisitos do sistema: adobe digital editions
Modo de acesso: world wide web
Inclui bibliografia e índice
ISBN 978-65-88519-02-8 (recurso eletrônico)

1. Tecnologia educacional. 2. Tecnologia da informação. 3.


Comunicação e tecnologia. 4. Linguagem e educação. 5. Aprendizagem.
6. Livros eletrônicos. I. Cidrim, Luciana. II. Lopes, Waslon. III. Madeiro,
Francisco.

20-66983 CDD: 371.33


CDU: 37.016:316.774

Camila Donis Hartmann - Bibliotecária - CRB-7/6472

Direitos reservados:
PÁ DE PALAVRA
Rua Dr. Mário Vicente, 394 - Ipiranga
04270-000 São Paulo, SP
pabx: [11] 5061-9262
home page: www.padepalavra.com.br
e-mail: producao@padepalavra.com.br

Todos os direitos reservados. Nenhuma parte desta obra pode ser repro-
duzida ou transmitida por qualquer forma e/ou quaisquer meios (eletrônico
ou mecânico, incluindo fotocópia e gravação) ou arquivada em qualquer
sistema ou banco de dados sem permissão por escrito da editora.

ISBN: 978-65-88519-02-8
© da edição: Pá de Palavra, São Paulo, novembro de 2020.
SUMÁRIO

APRESENTAÇÃO............................................................................................................................................7
Roberta Caiado

CAPÍTULO 1
UM ALGORITMO PARA EXTRAÇÃO AUTOMÁTICA DE PARÂMETROS
MÉTRICOS E ACÚSTICOS DO RITMO DA FALA EM L1 E L2..............................................11
Leônidas José da Silva Jr. e Plínio A. Barbosa

CAPÍTULO 2
UM APLICATIVO PARA ESTIMULAR A MEMORIZAÇÃO DE PALAVRAS PARA
ESCOLARES DISLÉXICOS POR MEIO DE UM TECLADO DIGITAL................................ 27
Felipe S. Batista dos Santos, Teófilo Ribeiro, Luciana Cidrim e Francisco Madeiro

CAPÍTULO 3
LETRAMENTO DIGITAL E FORMAÇÃO INICIAL DE PROFESSORES
DE LÍNGUAS EM UMA UNIVERSIDADE COMUNITÁRIA DO RECIFE.......................... 35
Antonio Henrique Coutelo de Moraes

CAPÍTULO 4
MINERAÇÃO DE DADOS TEXTUAIS NÃO ESTRUTURADOS UTILIZANDO
ENSEMBLE DINÂMICO........................................................................................................................... 47
Raquel Bezerra Calado e Alexandre Magno Andrade Maciel

CAPÍTULO 5
RECONHECIMENTO AUTOMÁTICO DE ATIVIDADES HUMANAS.............................. 63
Hemir da Cunha Santiago

CAPÍTULO 6
AUTOMATIZAÇÃO DE CHECAGEM DE FATOS: A EXPERIÊNCIA DE
DESENVOLVIMENTO DO APLICATIVO VERIFIC.AI............................................................... 75
Alice Cristiny Ferreira de Souza, Matheus Barreto Lins Marinho, Dario Brito Rocha Junior,
Anthony José da Cunha Carneiro Lins e Carmelo José Albanez Bastos Filho

CAPÍTULO 7
MINERAÇÃO TEXTUAL PARA RECONHECIMENTO DE EMOÇÕES........................... 87
Ingryd Pereira e George DC Cavalcanti

SOBRE OS AUTORES................................................................................................................................ 99

5
APRESENTAÇÃO

E
sta coletânea, intitulada Tecnologias e Ciências da Linguagem: Verten-
tes e Novas Aplicações – Volume 2, organizada pelos pesquisadores
Luciana Cidrim, Francisco Madeiro e Waslon Lopes, reúne relevan-
tes pesquisas que relacionam o estudo da Linguagem às Tecnologias.
As Tecnologias Digitais da Informação e Comunicação, desde o seu
surgimento, e, de maneira especial, na Era Pandêmica (2020), experimen-
tam um crescente avanço e a sua utilização modifica, cria e recria formas
de convivência social, textos, leituras, ensino, aprendizagens e maneiras do
ser humano interagir no espaço real e cibernético, apropriando-se da mí-
dia digital em favor do fortalecimento dos estudos relacionados à Língua/
Linguagem. A mídia digital permite, atualmente, através da multissemiose,
a articulação de palavras, sons, imagens e movimentos, sincronicamente,
em um meio caracterizado por noções de multilinearidade: links, redes,
flexibilidade, variedade, diversidade e interatividade.
Os conhecidos App (aplicativos), dentre outros dispositivos digitais,
já fazem parte do cotidiano de estudiosos da Linguagem, favorecendo as
relações de interatividade, mobilidade, troca, diálogo, leitura e escrita hi-
pertextual, que se estabelecem entre os indivíduos interligados pelas tec-
nologias, em especial, a telemática digital, objetivando o letramento digital
dos atores comunicacionais envolvidos.
Assim, a relevância deste segundo volume de Tecnologias e Ciências da
Linguagem: Vertentes e Novas Aplicações coaduna-se ao que Lévy (1999, p.
17) denominou de A Era da Informática: “o conjunto de técnicas, de práti-
cas, de atitudes, de modos de pensamento e de valores que se desenvolvem
juntamente com o crescimento do ciberespaço”.
Nesta coletânea, a criação de teias e redes de relações cooperativas está
em sintonia com o que nos é cobrado pela cultura digital – a Cibercultura:
novos espaços de relacionamento interpessoal experienciados ininterrupta e
coletivamente; novos desafios éticos, educacionais, linguísticos e novas ques-
tões sociais, as quais pesquisadores devem procurar entender e explicar.

7
Neste jogo comunicacional, representado pelo Word Cloud, cada capítulo
representa um conjunto de dados construído pelos interlocutores/pesquisadores,
numa dinâmica de partilha, negociação e permanente (re)construção coletiva.
Neste sentido, o primeiro capítulo, intitulado Um Algoritmo para Extração
Automática de Parâmetros Métricos e Acústicos do Ritmo da Fala em L1 E L2
(Leônidas José da Silva Jr.; Plínio A. Barbosa) apresenta um algoritmo (desen-
volvido em PSL) para extração automática de parâmetros métricos e acústicos
(melódicos) do ritmo da fala. A aplicação deste algoritmo envolveu uma pes-
quisa do ritmo do inglês como língua materna (L1) – produzido por falantes
nativos (FN) oriundos dos Estados Unidos – e como língua estrangeira (L2)
produzido por falantes não-nativos do inglês (FNN) e nativos do português
brasileiro. Enfocando o ritmo da fala em L1 e L2 e os parâmetros que têm
sido utilizados para sua captura ao longo das últimas décadas, os autores de-
monstram como se deu o desenvolvimento do script, bem como, o protocolo
de segmentação e etiquetagem dos intervalos para extração dos parâmetros,
inferindo como os falantes se comportam ao falarem o inglês como L1 e L2.
O segundo capítulo, Um Aplicativo para Estimular a Memorização de Pala-
vras para Escolares Disléxicos por meio de um Teclado Digital (Felipe S. Batista dos
Santos; Teófilo Ribeiro; Luciana Cidrim; Francisco Madeiro) tem por objetivo
apresentar um aplicativo que utiliza um teclado digital com diferentes layouts
para estimular a memória visual de palavras frequentemente escritas de modo
incorreto por escolares com dislexia. Este App pode ser incorporado no âmbito
educacional, em paralelo às práticas mais tradicionais de ensino, tais como,
memorização de regras ortográficas, produções de textos e ditados. O App
conta, ainda, com a possibilidade de o educador ou o escolar adicionar novas
palavras e criar novos grupos de palavras, possibilitando um ensino mais lú-
dico e atrativo, colaborando para um processo de ensino-aprendizagem eficaz.

8 TECNOLOGIAS E CIÊNCIAS DA LINGUAGEM: vertentes e novas aplicações – VOLUME 2


No capítulo três, Letramento Digital e Formação Inicial de Professores
de Línguas em uma Universidade Comunitária do Recife (Antonio Henrique
Coutelo de Moraes), o objetivo do autor foi investigar em que medida as
TICs estiveram presentes na formação inicial de professores de línguas em
uma universidade comunitária, na cidade do Recife, relacionando o uso
das tecnologias aos ambientes acadêmicos. A pesquisa foi realizada nos
cursos de Letras, com estudantes do oitavo período. Importante ressaltar
que os resultados deste estudo, juntamente a outros estudos relacionados
ao ensino inclusivo de línguas, permitiu a reformulação do currículo dos
cursos de Letras da Instituição de Ensino Superior estudada. Além da in-
serção, no currículo, de disciplinas relacionadas à temática tecnologias na
educação, em diálogo com as diversas disciplinas de maneira transversal.
O quarto capítulo da coletânea, que intitula-se Mineração de Dados Tex-
tuais não Estruturados utilizando Ensemble Dinâmico (Raquel Bezerra Calado;
Alexandre Magno Andrade Maciel), apresenta e discute o uso de Dynamic
Ensemble Selection – DES – como técnica viável e eficiente na mineração de
dados textuais não estruturados. Esta técnica seleciona os classificadores no
momento do treinamento, de acordo com cada nova amostra apresentada. A
ideia principal do DES é baseada na suposição de que os classificadores dife-
rentes terão um melhor desempenho em regiões do espaço de entrada para
resolução de um determinado problema de maneira ideal.
Reconhecimento Automático de Atividades Humanas é o título do quinto
capítulo (Hemir da Cunha Santiago), o qual discute o papel do movimento
do corpo na comunicação e a sua importância para a identificação da ati-
vidade humana. O autor do capítulo aborda, também, a metodologia dos
sistemas de reconhecimento automático de atividades humanas e as diver-
sas áreas em que esses sistemas podem ser utilizados. Realizar esse tipo de
reconhecimento de forma automatizada faz surgir a possibilidade de tornar
mais natural a interação entre o homem e a máquina, visto que a linguagem
não verbal transmite uma mensagem completa. A comunicação não verbal
ocorre por meio de gestos, sinais, códigos sonoros, expressões faciais ou cor-
porais, imagens ou outros códigos representativos. Essa comunicação pode
ser utilizada de forma isolada, a exemplo dos sinais de trânsito, da mímica
ou da linguagem de Libras, linguagem de sinais para deficientes auditivos.
O sexto capítulo, Automatização de Checagem de Fatos: A Experiência
de Desenvolvimento do Aplicativo Verific.Ai (Alice Cristiny Ferreira de Souza;
Matheus Barreto Lins Marinho; Dario Brito Rocha Junior; Anthony José da
Cunha Carneiro Lins; Carmelo José Albanez Bastos Filho), descreve o desen-
volvimento de uma ferramenta, para automatização de checagem de fatos,

APRESENTAÇÃO 9
denominada Verific.ai, utilizada no combate à desinformação. A partir do
Verific.ai, os autores atestaram a viabilidade de automatizar o processo, bem
como o interesse do público por esse tipo de ferramenta, que entrega deter-
minada autonomia e independência aos usuários de redes sociais digitais e
da internet, para fazer o filtro do que estão consumindo. Os pesquisadores
mostraram que o caminho a perseguir é longo na produção de uma ferra-
menta automatizada, o que de certa maneira compete de forma desleal com
o avanço da tecnologia e a velocidade de processamento, a formatação, a
ressignificação, a produção e o consumo de conteúdo no espaço digital.
Por fim, no sétimo capítulo que tem por título Mineração Textual para
Reconhecimento de Emoções (Ingryd Pereira; George DC Cavalcanti), os au-
tores defendem que o reconhecimento de emoções em texto é uma tarefa
complexa. Essa tarefa enfrenta desafios significativos, como: a dificuldade
de estruturação de informação textual, a padronização e limpeza de dados
textuais, reduzindo a quantidade de dados e deixando apenas os dados im-
portantes para o domínio da aplicação, a dificuldade do reconhecimento im-
posta pela complexidade das emoções, o fato de a emoção não ser um fator
estático em um texto, e a dificuldade de encontrar o modelo que melhor rea-
liza a representação das emoções. No entanto, acreditam eles que os bene-
fícios que o reconhecimento de emoções pode trazer a uma aplicação torna
a área atrativa para pesquisadores, em amplo crescimento, principalmente,
com a popularidade das redes sociais e a geração de conteúdo por usuários.
Para finalizar, permitam-me, leitores, compartilhar a crença que me
faz ser pesquisadora das Tecnologias e Ciências da Linguagem, acredito que
parece existir, ainda, um equívoco conceitual, quando tratamos das Tec-
nologias Digitais da Informação e Comunicação (TDIC). Muitos discursos
proferidos reconhecem as novas TDIC, apenas, como recurso de aprendiza-
gem. Eu acredito nas novas TDIC, também, como meio de aprendizagem. As
tecnologias digitais, a depender do uso que nós, professores/pesquisadores,
delas fazemos, podem conquistar o status de ambiente de aprendizagem, tec-
nologia mediadora, capaz de trazer Novas Aplicações e diferentes Vertentes
aos estudos relacionados às Tecnologias e Ciências da Linguagem.
Desejo uma ótima e inspiradora leitura a vocês!

Roberta Caiado
Professora Pesquisadora
Programa de Pós-graduação em Ciências da Linguagem
Universidade Católica de Pernambuco

10 TECNOLOGIAS E CIÊNCIAS DA LINGUAGEM: vertentes e novas aplicações – VOLUME 2


CAPÍTULO 1 UM ALGORITMO PARA
EXTRAÇÃO AUTOMÁTICA DE
PARÂMETROS MÉTRICOS E ACÚSTICOS
DO RITMO DA FALA EM L1 E L2
Leônidas José da Silva Jr.1
Plínio A. Barbosa2

1. MOTIVAÇÃO

S
egundo Brinckmann (2014, p. 361), quando pesquisadores de
modo geral foram perguntados o porquê de usar o programa de
análise fonético-acústica Praat (Boersma & Weenink, 2019) em
análises de seus corpora de fala, a maioria apontou a facilidade
de acesso à ferramenta de desenvolvimento de scripts do programa para
automatizar tarefas.
Um corpus de fala geralmente consiste em um conjunto de arquivos
de som e cada um deles associado a um arquivo de anotação e informações
de metadados. Construir um corpus de fala e explorá-lo para responder
questões de pesquisa de caráter fonético-fonológico é um processo que de-
manda uma significativa quantidade de tempo. Muitas das etapas neces-
sárias no processo de construção do corpus e na fase de análise podem ser
facilitadas com o uso de programas (scripts, plug-ins) que rodam a partir
do Praat. De acordo com Boersma (2014, p. 342), os pontos fortes do Praat
estão na análise acústica e anotação dos sons individuais e/ou na análise
de vários arquivos de um dado corpus com a possibilidade de gerar como
arquivo de saída, tabelas prontas para análise estatística; ações que podem
ser realizadas via script.

1
Universidade Estadual da Paraíba – UEPB
2
Universidade Estadual de Campinas – UNICAMP

11
Várias aplicações mostram como os scripts para Praat podem ser em-
pregados tais como: transcrição ortográfica, detecção e anotação de frontei-
ras fonética e prosódica, extração de parâmetros de natureza algébrico-geo-
métrica (Cálculo) e probabilística (Estatística), plotagem de gráficos, dentre
outras. Vale ressaltar, que a Praat Scripting Language (PSL) é uma lingua-
gem de alto nível e que os principais conceitos e elementos básicos de sua
programação são descritos e ilustrados por comandos internos intuitivos e
passíveis de recuperação manual via botões dinâmicos do Menu na tela de
objetos do Praat seguindo a opção: Praat >> New Praat script >> (e no
untitled script) Edit >> Paste history.
Assim, o leitor pode se perguntar: Afinal, qual são as finalidades de se
desenvolver um script para Praat? Elencamos algumas destas:
• Para economizar tempo: as tarefas executadas manualmente podem
levar semanas (ou até meses). Uma vez automatizadas (embora sai-
bamos que se leva algum tempo para escrever o script), tais tarefas
levam minutos (ou segundos);
• Para corrigir um erro facilmente: depois de ter um script, refazer
uma operação semelhante é muito mais fácil;
• Para ser consistente: os procedimentos manuais perdem consistên-
cia após uma série repetitiva, por outro lado, os computadores são
precisos em termos de consistência. Algumas operações podem
ser difíceis de realizar manualmente. Por exemplo, se desejarmos
obter a F0 no ponto médio ou em um quantil exato de um inter-
valo, obter “um ponto médio” ou “um quantil exato” requer uma
série maior de operações manuais com os comandos do Praat que
exigem muita atenção.
Desta forma, apresentamos no presente capítulo um algoritmo (de-
senvolvido em PSL) para extração automática de parâmetros métricos e
acústicos (melódicos) do ritmo da fala. A aplicação deste algoritmo se deu
em pesquisa do ritmo do inglês como língua materna (L1) – produzido por
falantes nativos (FN) oriundos dos Estados Unidos – e como língua estran-
geira (L2) produzido por falantes não-nativos do inglês (FNN) e nativos do
português brasileiro.
Este capítulo está dividido nas seguintes seções: Motivação; Revisão
Teórica, em que falamos de modo breve acerca do ritmo da fala em L1 e
L2 e que parâmetros têm sido utilizados para sua captura ao longo das
últimas décadas; Metodologia, em que mostraremos como se deu o desen-
volvimento do script bem como, o protocolo de segmentação e etiqueta-

12 Leônidas José da Silva Jr. e Plínio A. Barbosa


gem dos intervalos para extração dos parâmetros; Resultados: nesta seção,
produzimos gráficos com o comportamento de alguns dos parâmetros ex-
traídos, bem como os interpretamos de modo a inferir como os falantes
se comportam ao falarem o inglês como L1 e L2; Conclusões: aqui refor-
çamos a utilização do algoritmo de extração automática de parâmetros do
ritmo da fala, assim como suas possíveis áreas de aplicação e propósitos.
Por fim, a bibliografia utilizada.

2. REVISÃO TEÓRICA
A literatura fonético-fonológica e prosódica conceitua que o ritmo em
Linguística se refere a um movimento marcado por sucessões de batidas
fortes e fracas em um ato de fala. Barbosa e Bailly, (1994) afirmam que o
ritmo é a sensação causada pela sucessão de diferentes graus de proemi-
nência silábica alternadas com sílabas não-proeminentes ao longo do enun-
ciado. Pike (1945) propõe dois tipos rítmicos para classificar as línguas
do mundo: stress-timed rhythm ou ritmo acentual (alternância entre sílabas
acentuadas e não-acentuadas), por exemplo, o inglês – e syllable-timed rhy-
thm ou ritmo silábico – representado uma sucessão de sílabas igualmente
espaçadas por exemplo, o francês.
Com relação aos estudos de ritmo de L2, a literatura fonética estabe-
leceu diferentes parâmetros matemáticos para sua caracterização ao longo
das últimas décadas. Deterding (1994, 2001), Nooteboom (1997), Ramus,
Nespor & Mehler (1999), Galves et al. (2002), Barbosa (2006, 2012), He
(2012), dentre outros, propuseram as chamadas “métricas” e em alguns ca-
sos, alguns desses autores (cf. Galves et al., 2002; He, 2012) utilizaram mé-
tricas como: Média, Desvio padrão, Índices de variabilidade e Derivada,
de duração de intervalos vocálicos e consonantais, para uso em parâme-
tros melódicos e intensivos. Cada estudo evoluía da seguinte forma: eram
utilizados, no máximo, dois parâmetros que funcionavam como variáveis
dependentes e independentes na análise estatística dos resultados.
Apenas na pesquisa de Loukina et al. (2009), foi possível contabilizar
sete métricas com base em uma segmentação automática da fala permi-
tindo aplicar critérios idênticos a todas as línguas envolvidas e calcular
medidas de ritmo em um corpus grande. A limitação da pesquisa se dá
pelo fato de extrair apenas valores de vogais e consoantes não levando em
conta sílabas (fonéticas) nem tampouco parâmetros melódicos com base na
frequência fundamental (F0 ou F0). No entanto, apontaram que as métricas

UM ALGORITMO PARA EXTRAÇÃO AUTOMÁTICA DE PARÂMETROS MÉTRICOS E ACÚSTICOS DO RITMO DA FALA EM L1 E L2 13


de percentual, variabilidade consonantais e duração (z-score) vocálica (%C,
r/n-PVI-C, YARD-V) têm maior poder discriminante entre os supostos ti-
pos rítmicos.
Todavia, a F0 exerce um efeito significativo do ponto de vista da pro-
dução e percepção dos falantes sendo, portanto, uma variável a ser levada
em conta nos estudos do ritmo de L2, ensino de pronúncia, reconhecimen-
to de sotaque estrangeiro, dentre outros. Observe o leitor o movimento
oposto da curva de F0 durante a produção da palavra “paw” na Figura 1
entre um FN (em vermelho) e um FNN (em verde):

Figura 1: Lado esquerdo: traçado de F0 da sentença “paw on the mouse” produzida por um
falante estadunidense (porção superior – curva em vermelho) e por um brasileiro (porção
inferior – curva em verde). Lado direito: cotejamento dos traçados de F0 e da marcação do
deslocamento do acento frasal (via tone of break índices – ToBI) indicando relação oposta
entre o falante de inglês/L1 (HL – curva vermelha) e inglês/L2 (LH – curva verde).
Fonte: Os autores.

3. METODOLOGIA

3.1. Desenvolvimento de script para Praat para extração automática de medidas


métricas e acústicas do ritmo da fala

Como mencionado anteriormente, o cálculo de parâmetros acústicos e


métricas prosódico-acústicas nos corpora de fala é uma tarefa demorada se
for realizada manualmente, especialmente no caso de cálculo de grandes
corpora (big data ou similar); e em muitos casos, pode haver uma discor-
dância entre o modelo matemático adotado para a mensuração das unida-

14 Leônidas José da Silva Jr. e Plínio A. Barbosa


des segmentais e prosódicas. Além disso, um número a se considerar de
linguistas não tem por costume em suas pesquisas cotidianas, escrever
equações e/ou fórmulas que envolvam cálculo matemático e estatístico, por
exemplo, mas ao mesmo tempo, podem interpretá-las via comportamento
dos correlatos acústicos em foco.
O cálculo automático é uma solução alternativa promissora para esse
problema, pois permite reduzir significativamente o tempo dedicado por
especialistas humanos a essa tarefa. Neste artigo, descrevemos o Metrics
& Acoustics Extractor (MAE), uma ferramenta (script) para Praat escrita em
PSL para a extração e cálculo automáticos de parâmetros métricos, acústi-
cos/melódicos e intensivos que vão desde unidades segmentais – isomórfi-
cas ao fonema – a unidades prosódicas – sentenças sintáticas e enunciados
longos. Ao final, o script gera um arquivo de texto em forma de planilha
pronto para realização de análises estatísticas em corpora de fala.
Construído a partir de algoritmos relativos à analise acústico-experi-
mental, o MAE é um programa (script) para Praat que roda a partir de um
par de arquivos; um de áudio em extensão – WAV e um de texto para ano-
tação fonético-prosódica – TextGrid (segmentado manualmente via Praat)
extraindo de todos arquivos existentes em uma pasta (na raiz e subpastas
do computador, pen-drives, ou nuvens), parâmetros métricos globais e locais
(relacionados a intervalos de vogais, consoantes e sílabas) como percentual,
coeficiente de variação, índices de variabilidade brutos e normalizados, dura-
ção (normalizada em z-score) de vogais, consoantes e sílabas fonéticas; além
de parâmetros acústicos ou melódicos (relacionados a sentenças e trechos
enunciativos (chunks) mais longos) como medidas de centralidade, dispersão
e derivadas de F0 bem como, parâmetros intensivos como um correlato
acústico do esforço vocal e pausas entre sentenças e chunks.
A ferramenta usa cálculo de natureza diversificada do ponto de vista
matemático e foi originalmente projetada para descrever o ritmo da fala no
inglês como L1 e L2. Mas uma pesquisa em desenvolvimento tem avaliado
a possibilidade de aplicação ao PB para verificação de diferenças dialetais
inter-regionais. Além disso, o MAE pode ser aplicado para fins forenses
quando na identificação do grau de sotaque estrangeiro via prosódia de L2
(Silva Jr. & Barbosa, em desenvolvimento).
Para o desenvolvimento da ferramenta, realizamos, inicialmente,
um levantamento bibliográfico e estudo teórico acerca dos parâmetros
métrico-duracionais desenvolvidos nas últimas três décadas de pesquisa
sobre sua utilização na captura do ritmo da fala de variedades distintas

UM ALGORITMO PARA EXTRAÇÃO AUTOMÁTICA DE PARÂMETROS MÉTRICOS E ACÚSTICOS DO RITMO DA FALA EM L1 E L2 15


do inglês bem como no ritmo da fala em L2 desde o primeiro trabalho
de Deterding (1994), tais como: a natureza distinta de diversos índices
de variabilidades brutos e normalizados, percentuais, medidas estatísti-
cas descritivas (média, mediana e desvio padrão), medidas brutas e nor-
malizadas de duração, coeficientes de variação. Esses parâmetros foram
determinados para serem aplicados em intervalos de vogais, consoantes
e sílabas fonológicas. Em seguida, iniciamos sua programação que le-
vou nove meses de desenvolvimento para estar disponível em sua versão
alfa. Posteriormente, para levar em conta a possibilidade de uma medida
direta a partir dos parâmetros prosódico-acústicos clássicos, incluímos
descritores derivados desses parâmetros.
O arquivo de áudio deve passar por segmentação manual via objeto
TextGrid a ser realizada por foneticista experiente. Uma vez cumprido o
protocolo de segmentação, é possível rodar o programa que, como resulta-
do, devolve um arquivo de texto contendo a “quase-totalidade”3 dos parâme-
tros métrico-duracionais desde o trabalho de Deterding (op. cit.) além de
uma série de parâmetros prosódico-acústicos (melódicos e intensivos) que
são extraídos a partir da F0 (cf. tabela 1 para verificação de todos os parâ-
metros passíveis de extração). Esta matriz de medidas oferece ao pesquisa-
dor a possibilidade de uma análise combinatória complexa de parâmetros
em modelos estatísticos multivariados e assim, criando novas possibilida-
des de análise do ritmo de L2.
Deste feito, vejamos a seguir como se deu o protocolo de segmentação de
nossos dados a partir do Praat para a execução automática da tarefa do script:

3.2. Segmentação, etiquetagem e captura automática de parâmetros métricos e


acústicos

A segmentação dos intervalos de onde foram extraídos os parâmetros


métricos e acústicos e o processo de etiquetagem dos dados foram feitos
manualmente. Os dados foram extraídos e alocados em quatro camadas no
Praat, como mostra a Figura 2:

3
O algoritmo apenas não incluiu as seguintes métricas: Syllable Ratio (Gut, 2003) por seu
intervalo de extração levar em conta apenas pares de sílabas com vogais longas e reduzi-
das. Esta definição na literatura é muito controversa, sobretudo em pares silábicos; Control-
-Compensation Index – CCI (Bernietto e Bertini, 2007) que leva em conta a controversa
classificação das línguas quanto ao tipo rítmico; controle (silábico), compensação (acentual).
Além disso, a métrica não dá conta da aplicação em sílabas e propõe que não há variabilidade
de consoantes.

16 Leônidas José da Silva Jr. e Plínio A. Barbosa


Figura 2: forma de onda, espectrograma de banda larga e 04 camadas com suas respectivas
etiquetas: 1) unidades VV; 2) unidades de vogais e consoantes isomórficas ao fonema; 3) sentenças
a partir do enunciado completo e 4) trechos (chunks) a partir do enunciado completo produzido
por um falante norte-americano do trecho: “(...) and opened his big jaws to swallow him.”.
Fonte: Os autores.

Detalharemos a seguir o que significa e a função de cada uma dessas


camadas. A contagem das camadas é crescente (1, 2, 3..., n) e realizada de
cima para baixo:
• Camada 01 (VV Tier): O áudio foi segmentado em sílabas fonéticas
(VV), ou seja, unidades que compreendem do intervalo em que
se inicia o onset de uma vogal e vai até o onset da próxima vogal
(onsetV- onsetV) para que o programa extraia medidas locais e globais
desses intervalos;
• Camada 02 (VC Tier): O áudio foi segmentado em unidades isoladas
de vogais (V) e consoantes (C) para a extração de medidas relativas
a esses intervalos;
• Camada 03 (Sentence Tier): O áudio foi segmentado em sentenças
(S) para que o programa extraia medidas locais e globais desses
intervalos;
• Camada 04 (Chunk Tier): O áudio foi segmentado em trechos (chunks)
(CH) para que o programa extraia medidas locais e globais desses
intervalos.
Para segmentação da camada 03, seguimos um protocolo de ordem
sintática (sentença sintática) e para a camada 04 de ordem sintático-prosó-
dica em que o chunk em foco (CH) deve conter a última pausa (#) da sequên-
cia do grupo (breath group) antes do início próximo chunk (CH1#, CH2#...
CHn# por exemplo) (cf. Caroll, 1994 para detalhamento do protocolo).

UM ALGORITMO PARA EXTRAÇÃO AUTOMÁTICA DE PARÂMETROS MÉTRICOS E ACÚSTICOS DO RITMO DA FALA EM L1 E L2 17


A partir dos dados segmentados e etiquetados como mostra a Figura
1, é possível compreender os parâmetros de entrada do MAE. Vejamos na
Figura 3 o formulário dos referidos parâmetros:

Figura 3: Formulário com os parâmetros de entrada do MAE. De cima para baixo: diretório
dos arquivos; nome da extensão escolhida pelo usuário; idioma a ser capturado; camadas
(tiers) onde a extração dos parâmetros métricos e acústicos irá ocorrer (sílabas fonéticas
(Vonset-Vonset,), fones (em desenvolvimento), vogais (V) e consoantes (C), sentenças sintáticas
(S) e chunks sintático-prosódicos (CH); limiar de F0 (mínimo e máximo); taxa de suavização
de F0; passo para extrair derivada de F0 (em segundos) e o limiar de ênfase espectral.
Fonte: Os autores.

Das informações contidas no formulário e descritas na legenda da


figura 3, detalhamos aqui o limiar de F0, o qual deve ser configurado le-

18 Leônidas José da Silva Jr. e Plínio A. Barbosa


vando em conta vozes masculinas (75-300Hz) e/ou femininas (120-500Hz)
a depender do interesse do pesquisador (em ambos os casos, desde que
sem afetos de nível de ativação alto, i.e. quando há emoções como alegria
e/ou surpresa, por exemplo); o limiar de F0 suavizado, para evitar a captura
de picos locais de baixa amplitude e/ou e movimentos micromelódicos que
alterem o contorno linguisticamente relevante da F0; o passo da F0 é ne-
cessário para o cálculo de parâmetros relacionados à 1ª derivada discreta
(Δ1F0) e o limiar de ênfase espectral, que está relacionado ao esforço vocal
do falante.
Depois de descritos e detalhados cada argumento do formulário do
MAE, vejamos na próxima seção, os parâmetros extraídos pelo script.

3.3. Parâmetros gerados pelo MAE

Como dito anteriormente, o MAE devolve um arquivo (.txt) à pasta


em que está instalado contendo as medidas métricas e prosódicas extraídas
da fala para a análise do ritmo. As medidas já vêm delimitadas por tabu-
lação (in-tab) que podem ser facilmente exportadas a programas de análise
de dados e testes estatísticos tais como: MS Excel, Minitab, R, SPSS, Stata,
além dos softwares de teste estatísticos online como: SSS Calculator, Stati-
graphics Stratus, SOCR, SciStatCalc dentre outros. Os parâmetros métricos
e melódicos capturados pelo MAE são apresentados na Tabela 1.

MÉTRICAS ACÚSTICAS

Parâmetro métrico Segmentos de Parâmetro acústico Segmentos


aplicação de aplicação

Percentual (%) V, C Mediana de F0 (F0median) S, CH

Desvio-padrão (Δ) V, C, (V ou C), VV Pico de F0 (F0peak) S, CH

Coef. de variação
V, C, (V ou C), VV Mínima de F0 (F0min) S, CH
(varco)

Índice de variabilidade
V, C, (V ou C), VV Desvio-padrão de F0 (ΔF0) S, CH
bruta (r-PVI)

Índice de variabilidade
V, C, (V ou C), VV Assimetria de F0 (F0sk) S, CH
normalizado (n-PVI)

Média da 1ª derivada discreta de


Razão rítmica (RR) V, C, (V ou C), VV S, CH
F0 (mΔ1– F0)

Índice de variabilidade Desvio-padrão da 1ª derivada


V, C, (Vou C), VV S, CH
simples (VI) discreta de F0 (Δ1– F0)

UM ALGORITMO PARA EXTRAÇÃO AUTOMÁTICA DE PARÂMETROS MÉTRICOS E ACÚSTICOS DO RITMO DA FALA EM L1 E L2 19


Assimetria da 1ª derivada
S, CH
discreta de F0 (skΔ1– F0)

Taxa de F0 (F0rate) S, CH

Duração normalizada Ênfase espectral S, CH


V, C, (V ou C), VV
(z-score) (YARD) Taxa de elocução (Speech rate) S, CH

Média de picos de duração


S, CH
normalizada silábica (mdur– Sil)

Média da duração de pausas (m#) #

Tabela 1: Parâmetros métricos e prosódico-acústicos extraídos pelo MAE.


Fonte: Os autores

Tendo visto os parâmetros gerados e extraídos pelo MAE, o leitor pode


visualizar nas porções 4.1 a 4.4 (P4.1-P4.4) da figura 4 e da figura 5, na pró-
xima seção, o efeito prosódico na produção do ritmo da fala em inglês/L1 e
L2 para alguns dos parâmetros da tabela 1.

4. RESULTADOS

Figura 4: Eixo ‘Y’: Porção superior esquerda (P4.1): % de intervalos de consoantes; porção
superior direita (P4.2): duração (z-score); porção inferior esquerda (P4.3): desvio-padrão das
sílabas fonéticas; porção inferior direita (P4.4): coeficiente de variação das sílabas fonéticas.
Eixo ‘X’: Produção dos trechos sintático-prosódicos pelos FN (AmE) e FNN (BP) de inglês.
Fonte: Os autores.

20 Leônidas José da Silva Jr. e Plínio A. Barbosa


Com o objetivo de entender como as medidas extraídas pelo MAE
incidem no ritmo da fala em L1 e L2, vejamos nesta seção o efeito causado
por cada um dos enunciados (chunks) do inglês/L1 (em vermelho) e L2 (em
azul) sobre cada um dos parâmetros métrico-rítmicos da Figura 4.
• %C – (P4.1): esta métrica revela que os FN de inglês produzem in-
tervalos consonânticos mais longos do que os FNN. Tal fato se dá
em função de uma gama de fatores como: onsets e codas silábicas
complexas além de VOTs de consoantes plosivas serem significati-
vamente mais longos para os FN;
• YARD-VV – (P4.2): é uma medida que normaliza a duração via
z-score. Perceba o leitor que o valor dessa métrica é menor nos FN.
Este parâmetro co-varia com o Δ-VV, uma vez que, quanto maior o
Δ, menor o YARD;
• Δ-VV – (P4.3): o desvio-padrão das durações das sílabas fonéticas se
apresenta maior entre os FN. Por ser uma língua que tende a uma
característica [+ acentual] no eixo dinâmico do ritmo da fala, as
sílabas variam mais em duração. Os grupos interacentuais possuem
duração menor do que na produção dos FNN e tanto as sílabas de
borda (do acento frasal) como as correspondentes a proeminências
são mais longas na produção dos FN.
• varco-VV – (P4.4): este é o coeficiente de variação das durações de
sílabas fonéticas. Seu efeito na produção dos enunciados se apresen-
ta maior entre os FN. O aumento do varco neste grupo demonstra
uma tendência semelhante ao YARD visto que a média duracional
das sílabas dos FN é menor do que a dos FNN assim como já apon-
tado por Dellwo (2006, pp. 231-233).
Uma vez verificado o efeito das variáveis dependentes (numéricas)
explicadas por uma variável independente categórica (chunks das L1 e L2)
de cada grupo de falantes (brasileiros e estadunidenses) na Figura 4, veja-
mos agora, o efeito de variáveis dependentes (numéricas) explicadas por
variáveis independentes (igualmente numéricas) na Figura 5 combinando
parâmetros acústicos e métricos:
• (log)varco-VV ~ (log)Speech Rate: Neste exemplo, o gráfico nos
mostra que – entre os FN – quanto maior a taxa de elocução, menor
o coef. de variação das sílabas; e – entre os FNN – a relação é inversa
havendo uma interação entre os grupos pelo cruzamento das linhas
de regressão. Tal fato nos faz inferir que: com o aumento da taxa
de elocução, os FNN de inglês aumentam o desvio padrão das VV,

UM ALGORITMO PARA EXTRAÇÃO AUTOMÁTICA DE PARÂMETROS MÉTRICOS E ACÚSTICOS DO RITMO DA FALA EM L1 E L2 21


pois, passam a variar mais a duração silábica. Em contrapartida, os
FN a diminuem fazendo com que, consequentemente, o varco dimi-
nua. As médias silábicas tendem a diminuir para os dois grupos por
uma explicação racional: Segundo Dellwo e Wagner (2003, p. 472-
473), na fala em taxa rápida os intervalos vocálicos e consonantais
podem ser mais curtos do que na fala em taxa lenta e deste modo,
é possível se obter um efeito direto na extensão para o qual as du-
rações podem variar em um nível absoluto; em outras palavras,
intervalos mais curtos causam menor variação absoluta, intervalos
mais longos causam maior variação absoluta.

Figura 5: Efeito do logaritmo do coeficiente de variação da sílaba fonética (eixo Y)


explicada pela Língua (eixo X) co-variando com taxa de elocução (eixo X).
Fonte: Os autores.

5. CONCLUSÕES
Neste capítulo, apresentamos a versão 1.0 (alfa) do Metrics and Acousti-
cs Extractor; script utilizado para extração automática de parâmetros mate-
máticos, a saber, métricos e melódicos, do ritmo da fala em inglês como L1
e L2. Com tais parâmetros, é possível inferir estatisticamente, por exem-
plo, quais as maiores dificuldades que um(a) aprendiz brasileiro(a) de inglês
como L2 possui ao falar a língua; ou mesmo, quais aspectos da oralidade os
professores podem potencializar em suas aulas para fazer com que este/a

22 Leônidas José da Silva Jr. e Plínio A. Barbosa


discente tenha um desempenho melhor e amenize a transferência prosó-
dica da L1 para L2. Além disso, os resultados aqui apresentados propõem
um enfoque no ensino de pronúncia levando em conta ritmo e entoação nas
práticas orais e não apenas segmentos vocálicos e/ou consonantais. Ainda,
este script pode ser aplicado a estudos em L1 (variação dialetal, acomoda-
ção e atitude linguística) e a diversas outras línguas estrangeiras.
Vale aqui ressaltar que tanto parâmetros métrico-duracionais como
prosódico-acústicos com base na F0 mostraram-se relevantes e significati-
vos no que tange à distinção entre o ritmo de L1 e L2. Desta forma, ratifi-
camos aqui a importância de incluir estes últimos nas pesquisas com mo-
delagem do ritmo de fala de L2 visto que, em sua grande maioria, os expe-
rimentadores utilizam-se apenas das métricas duracionais; e os parâmetros
melódicos revelam diferenças entre as línguas tanto quanto as métricas e,
por vezes, informam via modelo robustos, uma predição melhor sobre dife-
renças rítmicas entre L1 e L2 com base na variabilidade (estatística) da F0.
Tendo em vista a robustez de seus algoritmos e a possibilidade de se
mensurar parâmetros prosódico-acústicos e intensivos, outras áreas possí-
veis de aplicação deste script são as áreas clínicas, quando da verificação e
avaliação de parâmetros vocais que colaborem com diagnósticos como o de
afasia ou até mesmo, espectro de autismo, pois a ênfase espectral (o esforço
vocal) na demarcação de acento prosódico é afetada de modo significativo;
e as áreas forenses, quando da verificação e avaliação de parâmetros vo-
cais que colaborem com investigações para reconhecimento de criminosos
via parâmetros métricos e/ou melódicos da fala em um contexto específico
como crimes de latrocínio e de estupro, por exemplo, através do reconheci-
mento por sotaque estrangeiro.

6. PERSPECTIVAS FUTURAS
Em um trabalho futuro (em desenvolvimento) para a melhoria do
MAE, implementaremos a anotação automática em uma camada de fones
no intuito de aproximar uma relação fonética a segmentos isomórficos aos
fonemas (cf. “Phone Tier” na Figura 3) em que utilizaremos algoritmos ba-
seados no programa (script) ProsodyDescriptor version 2.0 (Barbosa, 2014).
Ademais, realizaremos técnicas que se correlacionam a percepção do
ouvinte como: a) a suavização das durações em z-score (YARDs) a partir
de um filtro de média móvel ponderada de cinco pontos no intuito de fil-
trar fontes adicionais de variação não relacionadas à duração percebida

UM ALGORITMO PARA EXTRAÇÃO AUTOMÁTICA DE PARÂMETROS MÉTRICOS E ACÚSTICOS DO RITMO DA FALA EM L1 E L2 23


e ressaltando uma duração de segmentos que reflita o efeito do acento
frasal e, b) cálculo dos picos do máximo das YARDs e suavizado através
da detecção das posições de transição de derivada positiva para negativa.
Para as etapas ‘a’ e ‘b’, faremos uso de um algoritmo baseado no programa
(script) SGdetector (Barbosa, 2004). Além disso, pretendemos inserir novos
parâmetros acústicos tais como: Δ2F0, HNR, intensidade relativa, dentre
outros; além de parâmetros respiratórios para interação em uma combina-
tória de matriz complexa de parâmetros.
Por fim, pretendemos aplicar o modelo dinâmico do ritmo da fala
em L2 com base na interação entre os parâmetros de controle e de ordem
no acoplamento dos osciladores silábico e acentual (cf. Barbosa, 2006, pp.
29-194) e deste modo, desenvolver outro programa que possa auxiliar na
detecção dinâmica de algum tipo rítmico para a L2 em estudo.

AGRADECIMENTOS
Agradecemos a concessão de bolsa ao Conselho Nacional de Desenvol-
vimento Científico e Tecnológico (CNPq) – (150143/2018-4) para o primeiro
autor e (302657/2015-0) para o segundo autor.

REFERÊNCIAS
BARBOSA, P. ProsodyDescriptor version 2.0. Script for Praat. 2014.
BARBOSA, P. SGdetector. Script for Praat. 2004.
BARBOSA, P. Conhecendo melhor a prosódia: aspectos teóricos e metodológicos daquilo que mol-
da nossa enunciação. Revista de. Estudos Linguísticos, vol. 20, p. 11-27, 2012.
BARBOSA, P. Incursões em torno do ritmo da fala. Campinas: FAPESP/Pontes Editores, 2006.
BARBOSA, P.; BAILLY, G. Characterisation of rhythmic patterns for text-to-speech synthesis.
Speech­ Communication, vol. 15, p. 127-137, 1994.
BERNIETTO, P.; BERTINI, C. Towards a unified predictive model of speech rhythm. Quaderni del
Laboratorio di Linguistica della Scuola Normale Superiore di Pisa, vol 07, p. 2-35, 2007.
BOERSMA, P. The Use of Praat in Corpus Research. In: DURAND, J.; GUT, U.; KRISTOFFEN-
SEN, G. (Orgs). The Oxford Handbook of Corpus Phonology. Oxford: OUP, 2014, p. 342-360.
BOERSMA, P.; WEENINK, D. Praat: doing phonetics by computer [Computer program]. Version
6.0, 2019. Disponível em: <http://www.fon.hum.uva.nl/praat/>. Acesso em: março/2019.
BRINCKMANN, C. Praat Scripting. In: DURAND, J.; GUT, U.; KRISTOFFENSEN, G. (Orgs).
The Oxford Handbook of Corpus Phonology. Oxford: OUP, 2014, p. 361-379.
CAROLL, D. Psychology of language. Belmont: Wadsworth, 1994.
DELLWO, V. Rhythm and speech rate: A variation coefficient for deltaC. In:
KARNOWSKI, P.; SZIGET, I. (Orgs.). Language and Language-Processing. Frankfurt: Peter Lang,
2006, p. 231–241.
DELLWO, V.; WAGNER, P. “Relationships between speech rate and rhythm”. In: Proceedings of the
15th ICPhS Barcelona, p. 471-474, 2003.

24 Leônidas José da Silva Jr. e Plínio A. Barbosa


DETERDING, D. “The rhythm of Singapore English”. In: Proceedings of the fifth Australian inter-
national conference on speech science and technology, Perth, p. 316–321, 1994.
DETERDING, D. The measurement of rhythm: A comparison of Singapore and British English.
Journal of Phonetics, vol, 29, pp. 217–230, 2001.
GALVES, A.; GARCIA, J.; DUARTE, D.; GALVES, C. “Sonority as a basis for rhythmic class discri-
mination”. In: Proceedings of Speech Prosody, Aix-en-Provence, pp. 323–326, 2002.
GUT, U. “Non-native speech rhythm in German”. In Proceedings of the 15th international congress
of phonetic sciences (ICPhS), Barcelona, p. 2437–2440, 2003.
HE, L. “Syllabic intensity variations as quantification of speech rhythm: Evidence from both L1
and L2”. In Proceedings of the 6th international conference on Speech Prosody, Shanghai, p.
466-469, 2012.
LOUKINA, A.; KOCHANSKI, G.; SHIH, C.; KEANE, E.; WATSON, I.; “Rhythm measures with
language-independent segmentation”. In: Proceedings of INTERSPEECH, Brighton, p. 1531-
1534, 2009.
NOOTEBOOM, S. The Prosody of Speech: Melody and Rhythm. In: HARDCASTLE, W.; LA-
VER, J. (Orgs). The Handbook of Phonetic Sciences, Utrecht, Utdallas.Edu, 1997, p. 448-469.
RAMUS, F.; NESPOR, M; MEHLER, J. Correlates of linguistic rhythm in the speech signal. Cog-
nition, n. 73, 1999, p. 265–292.
PIKE, K. The Intonation of American English. Mick: University of Michigan Publications,
1945.
SILVA Jr., l. BARBOSA, P. The Individual Effect of Foreign Accent Degree in English as L2:
A Forensic-based Analysis for Speaker Recognition. Em desenvolvimento.

UM ALGORITMO PARA EXTRAÇÃO AUTOMÁTICA DE PARÂMETROS MÉTRICOS E ACÚSTICOS DO RITMO DA FALA EM L1 E L2 25


CAPÍTULO 2 UM APLICATIVO PARA
ESTIMULAR A MEMORIZAÇÃO
DE PALAVRAS PARA ESCOLARES
DISLÉXICOS POR MEIO
DE UM TECLADO DIGITAL
Felipe S. Batista dos Santos1
Teófilo Ribeiro1
Luciana Cidrim1
Francisco Madeiro1

INTRODUÇÃO

A
dislexia é concebida como um transtorno específico de apren-
dizagem, de origem neurobiológica que compromete a aquisi-
ção da leitura, da escrita e da ortografia (REID; STRNADOVA;
CUMMING, 2013), caracterizado pela dificuldade na habilida-
de de decodificação, soletração, fluência e interpretação. Essas dificulda-
des resultam tipicamente do deficit no componente fonológico da lingua-
gem que é inesperado em relação a outras habilidades (LYON; SHAYWITZ;
SHAYWITZ, 2003; SHAYWITZ, 2006). Na dislexia as dificuldades apre-
sentam-se desde o início da alfabetização (GAGGI et al., 2017; NOGUEI-
RA; CÁRNIO, 2018) e com frequência, o escolar está associado a um baixo
desempenho acadêmico, mesmo atingindo parâmetros cognitivos espera-
dos para a sua faixa etária.
O modelo de ensino tradicional, por sua vez, que privilegia as formas
mais expositivas, geralmente não favorece o aprendizado de escolares com
dislexia. Logo, os métodos mais interativos, práticos e dinâmicos tendem
a estimular a aprendizagem acadêmica de forma mais eficaz (LEÓN; BRA-
VO; FERNÁNDEZ, 2017).

1
Universidade Católica de Pernambuco – UNICAP

27
O avanço da tecnologia vem gerando mudanças e traz novos rumos
para o ambiente educacional (SANDERS, 2018; KRIVEC et al., 2019). A
utilização das Tecnologias da Informação e da Comunicação (TIC) pode
favorecer a aprendizagem acadêmica por meio de conteúdos audiovisuais,
associando palavras, sons e imagens (CIDRIM; MADEIRO, 2017). Os dis-
positivos tecnológicos, em função de sua interatividade, atraem a atenção
dos escolares, sendo também um recurso importante para intervir nas di-
ficuldades acadêmicas de escolares com dislexia. O uso de animações e
desenhos estimula o aprendizado e trabalha a percepção visual da criança
(CAPELLINI et al., 2018).
Em se tratando da linguagem escrita, algumas ferramentas tecnoló-
gicas podem ser utilizadas com escolares disléxicos, como por exemplo, o
teclado digital (HEBERT et al., 2018). Nesse sentido, este capítulo tem por
objetivo apresentar um aplicativo que utiliza um teclado digital com dife-
rentes layouts para estimular a memória visual de palavras frequentemente
escritas de modo incorreto por escolares com dislexia.

MÉTODO
Este aplicativo foi criado por parte de uma equipe multidisciplinar
composta de Fonoaudióloga, Engenheiro, Cientistas da Computação, De-
signer e graduandos do curso de Ciência da Computação da Universidade
Católica de Pernambuco. A equipe vem desenvolvendo aplicativos para
intervir em dificuldades ortográficas em escolares com dislexia no âm-
bito educacional (CIDRIM et al., 2015; CIDRIM; BRAGA, MADEIRO,
2017; SOUTO et al., 2017; CIDRIM; BRAGA; MADEIRO, 2018; GOMEZ;
CIDRIM; MADEIRO, 2019).
O aplicativo foi desenvolvido para o sistema operacional Android. A
versão mínima compatível é Android Oreo (versão 8) e a resolução de tela
mínima compatível é 1080 x 1920 pixels. O aplicativo tem uma tela inicial
cuja finalidade é fornecer ao usuário três fluxos a serem seguidos (Figura
1). São eles:
1. Botão “jogar”, cujo objetivo é iniciar uma tela de menu onde o usuário
é capaz de escolher com quais palavras ele irá jogar (Figura 2).
2. Botão “instruções”, com finalidade de explanar o funcionamento do
aplicativo através de imagens e setas que exemplificam a funciona-
lidade do jogo (Figura 3).
3. Botão “recordes”, que permite listar os recordes e que podem ficar
armazenados após a atividade através de nomes fictícios (Figura 4).

28 Felipe S. Batista dos Santos, Teófilo Ribeiro, Luciana Cidrim e Francisco Madeiro
A tela de menu, na Figura 2, disponibiliza cinco grupos de palavras:
palavras com a letra R (rato/régua) ou o dígrafo RR (carroça/carro), pala-
vras com B (balde/abacaxi) e D (dedo/cadeado), palavras terminadas em R
(professor/mergulhador), palavras com a letra A (abacate/tapete) e a letra
E (escova/pente)e palavras com P (palhaço/sapato) e B (boca/cabide). A es-
colha das palavras foi baseada no estudo de Zorzi (2003) que criou uma
classificação ortográfica para erros frequentemente observados na escrita
de escolares do 1º ao 4º. ano do ensino fundamental.
Uma vez escolhido o grupo de palavras, a partida é iniciada. Como se
observa na Figura 5, a tela de jogo é constituída de um teclado digital que
pode apresentar-se em ordem alfabética ou uma disposição onde as vogais
encontram-se ao lado esquerdo e as consoantes ao lado direito (Figura 6).
Assim, cabe ao jogador escolher qual teclado utilizar.
O s​ oftware conta com uma funcionalidade de sorteio de palavras. Assim,
após selecionada a palavra, randomicamente, é disposta em tela uma imagem
representativa da mesma, para que haja um exercício visual, onde a criança
faça a associação da palavra com a imagem exibida. Há um botão sonoro pelo
qual o jogador poderá ouvir o áudio da palavra reproduzida pelo software
de sonorização de palavras da Google (Figura 5) para que, além de auxiliar
a identificação da palavra, o usuário possa criar mais uma associação e es-
tabelecer a conexão visual e sonora com a palavra. Além de tais recursos,
um personagem lúdico (um pequeno teclado), que pode ser observado nas
Figuras 3, 7 e 8, foi criado para realizar a comunicação entre o aplicativo e
a criança a fim de criar uma interface mais amigável. O jogador é capaz de
interagir com o g​ ame através de botões que permitem: confirmar a palavra
escrita pelo usuário, limpar a palavra escrita ou retornar para a tela de menu.
As condições iniciais do jogo são dadas da seguinte forma: O usuário
possui inicialmente três vidas e recebe um ponto por cada palavra escrita
corretamente. Se a palavra for escrita incorretamente, o jogador perde uma
vida. Ao fim das vidas, há a transição para uma tela de segunda chance.
Como pode ser visto na Figura 7, há a possibilidade de o usuário reescrever
a palavra que ele errou. Nesse sentido, há o seguinte balão de fala do per-
sonagem lúdico: “Você só precisa escrever a palavra que errou para ganhar
uma vida extra!”. Caso ele escreva corretamente, é retornado para tela de
jogo em que se encontrava anteriormente, antes de perder a última vida,
e uma nova palavra será selecionada para que ele continue no fluxo com
uma vida extra; caso contrário, ele será direcionado para tela de registro
(Figura 8). Assim, é solicitado que o usuário entre com o seu nome/apelido,

UM APLICATIVO PARA ESTIMULAR A MEMORIZAÇÃO DE PALAVRAS PARA ESCOLARES DISLÉXICOS POR MEIO DE UM TECLADO DIGITAL 29
para que sua pontuação seja registrada no quadro de pontuações, na tela
de recordes. Além disso, é exibida uma mensagem motivacional ao usuário
pelo seu desempenho, a fim de incentivá-lo a continuar praticando. Os da-
dos do usuário não serão aramazenados.

Figura 1 – Tela inicial do aplicativo.

Figura 2 – Tela de menu para escolha das palavras a serem jogadas.

Figura 3 – Tela de instruções.

30 Felipe S. Batista dos Santos, Teófilo Ribeiro, Luciana Cidrim e Francisco Madeiro
Figura 4 – Tela de recordes.

Figura 5 – Tela do jogo com a disposição do teclado de maneira alfabética.

Figura 6 – Tela do jogo com a disposição do teclado com vogais e consoantes separadas.

UM APLICATIVO PARA ESTIMULAR A MEMORIZAÇÃO DE PALAVRAS PARA ESCOLARES DISLÉXICOS POR MEIO DE UM TECLADO DIGITAL 31
Figura 7 – Tela de segunda chance.

Figura 8 – Tela de registro do usuário.

CONSIDERAÇÕES FINAIS
Este aplicativo pode ser utilizado no âmbito educacional, em paralelo
às práticas mais tradicionais de ensino, tais como, memorização de regras
ortográficas, produções de textos e ditados. Há, ainda, a possibilidade de
o educador ou o escolar adicionar novas palavras e criar novos grupos de
palavras. O uso da tecnologia possibilita um ensino mais lúdico e atrativo,
promovendo interação entre os escolares, colaborando para um processo
de ensino-aprendizagem eficaz.

REFERÊNCIAS
CAPELLINI, S.; LIPORACI, G.; SELLIN, L.; CARDOSO, M.; GIACONI, C.; DEL BIANCO, N. In-
clusion and New Technology for Students with Learning Disorders and Attention Deficit with
Hyperactivity Disorder. Education Sciences and Society, Vol. 9, p. 73-80, 2018.

32 Felipe S. Batista dos Santos, Teófilo Ribeiro, Luciana Cidrim e Francisco Madeiro
CIDRIM, L.; CAJUEIRO, L.; BRAGA, P.; BEZERRA, R.; GAMA, C.; MADEIRO, F. DIS-ORTOGRA-
FANDO: um aplicativo desenvolvido para auxiliar a intervenção com crianças disléxicas. In:
CIDRIM; COSTA (Orgs.) Tecnologias da Informação e da Comunicação (TIC) Aplicadas
às Ciências da Linguagem. Curitiba: CRV, p. 9-22, 2015.
CIDRIM, L.; BRAGA, P.; MADEIRO, F. Prospecção de aplicativos voltados para intervenção na
dislexia. In: LOPES; CIDRIM; MADEIRO (Orgs.). Tecnologias aplicadas às ciências da lin-
guagem. p. 15-38. João Pessoa: Editora da UFPB, 2017.
CIDRIM, L.; BRAGA, P.; MADEIRO, F.; Desembaralhando: Um Aplicativo para a Intervenção no
Problema do Espelhamento de Letras por Crianças Disléxicas. Revista CEFAC, Vol. 20, n. 1,
p. 13-20, 2018.
CIDRIM, L.; MADEIRO, F. Tecnologias da Informação e da Comunicação (TIC) Aplicadas à Disle-
xia: Revisão de Literatura. Revista CEFAC, Vol. 19, n. 1, p. 99-108, 2017.
GAGGI, O.; FACOETTI, A.; GORI, S.; RUFFINO, M.; FRANCESCHINI, S.; GALLIAZZO, G.; CI-
MAN, M.; PALAZZI, C. Serious Games for Early Identification of Developmental Dyslexia.
Computers in Entertainment, Vol. 15, n. 2, p. 89-101, 2017.
GOMEZ, A.; CIDRIM, L.; MADEIRO, F. Brincando de escrever: um aplicativo para auxiliar a escri-
ta de escolares com dislexia. In: CIDRIM; LOPES; MADEIRO (Orgs.) Tecnologias e ciências
da linguagem: vertentes e novas aplicações. São Paulo: Pá de Palavra, 2019.
HEBERT, M.; KEARNS, M.; HAYES B.; BAZIS, P.; COOPER, S. Why Children with Dyslexia Stru-
ggle with Writing and How to Help Them. Language, Speech, and Hearing Services in
Schools, Vol. 49, p. 843-863, 2018.
KRIVEC, T.; BABUDER, M.; GODEC, P.; WEINGERL, P.; ELISINI, U. Impact of digital text varia-
bles on legibility for persons with dyslexia. Dyslexia, Vol. 26, n. 2, 2019.
LEÓN, A.; BRAVO, C.; FERNÁNDEZ A. Review of Android and iOS Tablet Apps in Spanish to Im-
prove Reading and Writing Skills of Children with Dyslexia. Procedia Social and Behavioral
Sciences, n. 273, p. 1383-1389, 2017.
LYON, G.; SHAYWITZ, S.; SHAYWITZ, B. Definiton of Dyslexia. Annals of Dyslexia, Vol. 53, n.
1, p. 1-14, 2003.
NOGUEIRA, D.; CÁRNIO, M. Programa Fonoaudiológico em Compreensão Leitora e Ortografia:
Efeitos na Ortografia em Disléxicos. CoDAS, Vol. 30, n. 2, p. 1-9, 2018.
REID, G.; STRNADOVA, I.; CUMMING, T. Expanding Horizons For Students With Dyslexia In
The 21St Century: Universal Design And Mobile Technology. Journal of Research in Special
Educational Needs, Vol. 13, n. 3, p. 175-181, 2013.
SANDERS, S. Literacy Development: The 21st Century Bilingual Immersion Classroom. Interna-
tional Journal of Bilingual Education and Bilingualism, Vol. 3, n. 2, p. 893– 921, 2018.
SHAYWITZ, S. Entendendo a Dislexia. Um Novo e Completo Programa para todos os níveis
de Problemas de Leitura. Porto Alegre: Artmed, 2006.
SOUTO, T.; CIDRIM, L.; GAMA, C.; MADEIRO, F. Grafitando: Um aplicativo para apoio à Inter-
venção Fonoaudiológica no problema da troca de Grafemas Surdos e Sonorous realizada por
Disléxicos. In: LOPES; CIDRIM; MADEIRO (Orgs.). Tecnologias Aplicadas às Ciências da
Linguagem. p. 71-94. João Pessoa: Editora da UFPB, 2017.
ZORZI, J. Aprendizagem e Distúrbio da Linguagem Escrita: Questões Clínicas e Educacio-
nais. Porto Alegre: Artmed, 2003.

UM APLICATIVO PARA ESTIMULAR A MEMORIZAÇÃO DE PALAVRAS PARA ESCOLARES DISLÉXICOS POR MEIO DE UM TECLADO DIGITAL 33
CAPÍTULO 3 LETRAMENTO DIGITAL
E FORMAÇÃO INICIAL DE PROFESSORES
DE LÍNGUAS EM UMA UNIVERSIDADE
COMUNITÁRIA DO RECIFE
Antonio Henrique Coutelo de Moraes1

INTRODUÇÃO

O
termo letramento, no Brasil, é um conceito recente, inaugurado
por volta de 1980. Antes disso, as pesquisas e estudos relaciona-
dos à apreensão dos códigos pertencentes à língua portuguesa
eram voltados aos processos e métodos de alfabetização, tanto
de crianças quanto de adultos. A falta de um conceito definidor de práticas
mais complexas de escrita e leitura fez com que a palavra e a concepção
de letramento alcançassem espaço na área educacional e das ciências lin-
guísticas, porém cabe aqui destacar que letramento e alfabetização são
fenômenos distintos, como bem explica Soares (2017).

É necessário reconhecer que alfabetização – entendida como a aquisição do sistema


convencional de escrita – distingue-se de letramento – entendido como o desenvol-
vimento de comportamentos e habilidades de uso competente da leitura e da escrita
em práticas sociais: distinguem-se tanto em relação aos objetos do conhecimento
quanto em relação aos processos cognitivos e linguísticos de aprendizagem e, por-
tanto, também de ensino desses diferentes objetos (SOARES, 2017, p. 64).

Considerando as inovações e facilidades fornecidas pelos avanços das


Tecnologias de Informação e Comunicação (TICs) ao longo dos anos, percebe-
mos como o conceito de letramento – acima citado – deixou de ser um hábito
relacionado exclusivamente às práticas de escrita e leitura convencionais.

1
Universidade Católica de Pernambuco – UNICAP

35
Soares (2002) comenta que estamos vivendo a introdução, na socieda-
de, de novas e incipientes modalidades de práticas sociais de leitura e de
escrita, propiciadas pelas recentes tecnologias de comunicação e eletrônica
– o computador, a rede (a web), a Internet.
Nessa perspectiva, este capítulo tem o objetivo de investigar em que
medida as TICs estiveram presentes na formação inicial de professores de
línguas em uma universidade comunitária na cidade do Recife. Para tan-
to, buscamos fundamentação em Fuza (2017) Hall (2018), Marzari e Leffa
(2013), Soares (2017), entre outros.

LETRAMENTO DIGITAL E FORMAÇÃO INICIAL DE PROFESSORES


As novas formas de expressar-se e de compreender o mundo a partir
dos artifícios concebidos pela rede mundial de computadores fizeram surgir
vários modelos utilizados como forma de emissão e recepção de mensagens.

As tecnologias digitais e sites de redes sociais continuarão a expandir as possibilida-


des de construção de identidade do aluno. Embora não precisemos ser especialistas
nessas tecnologias e mundos sociais virtuais, devemos estar cientes de suas possi-
bilidades e ser capazes de projetar contextos de aprendizado que facilitem a par-
ticipação de nossos alunos em sites de redes sociais apropriados (HALL, 2018, p.9).

De fato, essas ferramentas vêm alterando nossa forma de interagir


com o mundo. Nesse sentido, é importante reconhecermos que avanços
tecnológicos e a produção softwares educacionais contribuem para uma
grande aproximação das áreas de educação, linguística e informática. Por
isso, em vez de falarmos em letramento – no singular –, falaremos em le-
tramentos, no plural.

Na verdade, essa necessidade de pluralização da palavra letramento e, portanto,


do fenômeno que ela designa já vem sendo reconhecida internacionalmente para
designar diferentes efeitos cognitivos, culturais e sociais em função ora dos con-
textos de interação com a palavra escrita, ora em função de variadas e múltiplas
formas de interação com o mundo – não só a palavras escrita, mas também a
comunicação visual, auditiva, espacial (SOARES, 2002, p. 155).

Ao atentarmo-nos à seara educacional, não é difícil perceber o distan-


ciamento enfrentado – seja pelos professores ou por seus alunos – em se

36 Antonio Henrique Coutelo de Moraes


adaptarem às múltiplas possibilidades – de recursos ou de estratégias di-
gitais – disponíveis à contribuição nos processos de ensino-aprendizagem.
Cabe destacar, aqui, que, assim como Marzari e Leffa (2013, p. 4),
acreditamos que

Definir um professor como letrado digitalmente implica, portanto, dizer que esse
sujeito não apenas (re)conhece os recursos tecnológicos que estão à sua dispo-
sição, durante sua atuação didático-pedagógica, mas principalmente se apropria
deles, utilizando-os de forma coerente, reflexiva e criativa e, ao fazê-lo, ensina
seus alunos a ler e a escrever em um ambiente diferente – o digital, que requer
novas práticas de leitura e escrita, decorrentes da substituição do papel (texto
impresso) pela tela (texto digital).

A utilização de tecnologias no ambiente escolar ou universitário ain-


da não é uma realidade totalmente concretizada, pois muitas instituições
não possuem recursos financeiros suficientes para compra de dispositivos
digitais importantes para os ambientes de aprendizagem. A inserção de
equipamentos digitais nos espaços destinados às trocas de informação é
interessante tanto para o docente quanto para o discente.
No caso do professor, a necessidade de dominar um ambiente tecnoló-
gico é cada vez mais constante, pois os desafios impostos pela dinamicida-
de que a internet proporciona o estimula a sair de sua zona de conforto em
busca dos aperfeiçoamentos necessários que o tornarão capaz de ensinar
em consonância com as inovações trazidas pelas TICs.
Como bem explicam Coscarelli e Ribeiro (2014), os alunos precisam
ter acesso à informática dentro do ambiente da instituição de ensino, pois
fatores como a exclusão digital – que muitas vezes acontece pela falta de
oportunidade de acesso às tecnologias em casa – podem ser mitigadas
quando o ambiente escolar disponibiliza os recursos necessários ao des-
bravamento dos equipamentos e da rede mundial de computadores.
É evidente que os professores são a peça chave para preparar os alu-
nos ao enfrentamento dos desafios impostos pelo mundo contemporâneo
incontestavelmente imerso nas práticas digitais cada vez mais presentes na
vida cotidiana. Porém, se não houver o comprometimento dos órgãos res-
ponsáveis em elaborar um currículo direcionado à inserção dos graduan-
dos nas modalidades de leitura e escrita digitais, os futuros profissionais
egressos da universidade não serão capazes de orientar seus alunos em
questões voltadas não só ao manuseio dos dispositivos, mas também às
práticas sociais de leitura e de escrita no mundo cibernético.

LETRAMENTO DIGITAL E FORMAÇÃO INICIAL DE PROFESSORES DE LÍNGUAS EM UMA UNIVERSIDADE COMUNITÁRIA DO RECIFE 37
Kenski (2013 apud SILVA; FUZA, 2017) é categórico quando afir-
ma ser necessário modificar os métodos de formação dos professores,
pois, com o novo cenário que se avulta, as competências dos futuros
profissionais acontecerão de uma maneira mais coerente com a rea-
lidade. Contudo, profissionais em formação constroem seus conheci-
mentos baseados em uma realidade que já não faz mais parte das
vivências da atualidade.
Isso quer dizer que esse trabalho exige do professor conhecimento
sólido das possibilidades que as tecnologias podem oferecer ao ensino de
línguas. Marzari e Leffa (2013), sobre esse contexto, afirmam que formar
futuros professores de línguas se constitui uma tarefa bastante complexa,
uma vez que é preciso, ao mesmo tempo, ensiná-los e ensiná-los a ensinar.
Tal fato demanda conhecimento, empenho e dedicação de seus formado-
res. Nesse sentido, formar um professor para atuar na sociedade contem-
porânea, ou pós-moderna, mostra-se uma tarefa complexa, principalmente
diante da diversidade de instrumentos de mediação didático-pedagógica
– o que inclui as tecnologias educacionais.

Na era tecnológica, esse desafio ganha ainda mais força, uma vez que parece não
haver tempo suficiente, principalmente por parte de professores, para aprende-
rem a lidar com tanta inovação de uma só vez. Afinal, a grande maioria desses
profissionais não se sente digitalmente letrada, porque, ao longo de sua for-
mação, praticamente não teve acesso a práticas de leitura e escrita propiciadas
pelos usos do computador e da internet (MARZARI; LEFFA, 2013, p. 3).

Vale ressaltar que, mesmo sendo em sua maioria nativos digitais, os


professores em formação, independentemente da familiaridade com tecno-
logias e redes sociais, sabem pouco sobre formas de aplicá-las ao ensino de
línguas. Aparentemente, essa informação fica a cargo do interesse próprio
dessas pessoas, uma vez que pouco parece ser feito pelo Ensino Superior
pelo Letramento Digital.

Apropriar-se da tecnologia digital, mais especificamente das ferramentas da Web


2.0 e da internet, significa reconhecer ou identificar as inúmeras possibilidades
existentes e saber fazer uso efetivo desses recursos, a fim de atender a um obje-
tivo mais amplo (social, cultural, político, pedagógico, entre outros), que requer
o desenvolvimento das habilidades de leitura e escrita em um ambiente diferen-
ciado (MARZARI; LEFFA, 2013).

38 Antonio Henrique Coutelo de Moraes


Assim, como mencionado anteriormente, um professor letrado digital-
mente reconhece os recursos tecnológicos que estão à sua disposição e se
apropria deles para ensinar seus alunos a interagir no meio digital.
Interessante salientar que lidar com tecnologia é muito mais do que
ter o domínio das funções técnicas de ligar, desligar, digitar, inserir dis-
positivos móveis, etc. Noções como alfabetização e letramento no campo
digital são tão importantes quanto no campo tipográfico. É comum ouvir-
mos falar em práticas de leitura e escrita, principalmente no que se refere
à utilização do papel. Entretanto, em um mundo em que o computador está
cada vez mais presente na vida dos que praticam ou não a escrita, ser digi-
talmente letrado é uma estratégia promissora àqueles que objetivam estar
inseridos em mundo indiscutivelmente dinâmico e mutável.

METODOLOGIA
A pesquisa foi realizada nos cursos de Letras em uma universidade
comunitária da cidade do Recife. A população de estudo se constituiu por
dez (10) sujeitos, estudantes do oitavo período do curso de Letras da univer-
sidade (área de estudo), de ambos os sexos.
Trata-se de um estudo de caráter qualitativo, descritivo. Optamos por
esse tipo de pesquisa para melhor descrever, compreender e explicar as
características da dinâmica de sala de aula, conforme Triviños (2010).
Para a realização da coleta de dados, buscamos realizá-la em dois mo-
mentos: 1) análise da grade curricular, e 2) entrevista com alunos adultos
do curso de Letras. Em seguida, os dados foram registrados a partir da
transcrição das entrevistas e das reflexões acerca da grade curricular, sem
deixar de lado questões vinculadas ao contexto econômico, social e cultu-
ral em que os sujeitos se encontram inseridos.
Na entrevista, buscamos, inicialmente, respostas às seguintes questões:
1) Em que medida a tecnologia esteve presente na sua formação acadêmica?
Descreva situações ou atividades; 2) Cursou/está cursando alguma disciplina
especificamente relacionada à tecnologia? Se sim, a disciplina era parte da
grade curricular do curso de Letras ou de outro curso? E quais os conteú-
dos envolvidos nessa disciplina?; 3) Participou de algum minicurso acerca
do uso de novas tecnologias no ensino de línguas?; 4) Participou de algum
projeto de pesquisa acerca do uso de novas tecnologias no ensino de língua
estrangeira?; 5) Que tecnologias, na sua opinião, são essenciais à formação
de professores de línguas, considerando-se o atual contexto sócio histórico?

LETRAMENTO DIGITAL E FORMAÇÃO INICIAL DE PROFESSORES DE LÍNGUAS EM UMA UNIVERSIDADE COMUNITÁRIA DO RECIFE 39
A análise dos dados foi realizada segundo orientações de Bardin (1977;
2015), com a análise de conteúdo, respeitando os seguintes passos: Os re-
sultados das entrevistas foram transcritos literalmente e, em seguida, rea-
lizamos uma leitura flutuante para a seleção do corpus. Então, realizamos
uma descrição analítica orientada pelas questões de pesquisa e pela funda-
mentação teórica. Por fim, na fase de interpretação referencial, levantamos
reflexões a respeito do conteúdo manifesto e do latente.
O estudo está vinculado ao Projeto de Pesquisa “COMUNICAÇÃO E
TECNOLOGIA: ALGUMAS QUESTÕES DE LEITURA E ESCRITA EM
PRIMEIRA LÍNGUA, SEGUNDA LÍNGUA E LÍNGUA ESTRANGEIRA
POR SURDOS E OUVINTES”, no 502900-LET– 003-2016/1, aprovado
pelo CEP em 28/10/2016 sob o número CAAE 59313816.8.0000.5206.
Todos os sujeitos assinaram o Termo de Consentimento Livre e Escla-
recido digital.

DADOS E DISCUSSÃO
Com o intuito de analisar de que forma as TICs estão inseridas na
formação inicial de professores de línguas em uma universidade comuni-
tária do Recife, aplicamos como instrumento de investigação uma entre-
vista composta por 5 perguntas que abarcaram questões relacionadas ao
uso das tecnologias em ambientes acadêmicos. Um grupo de 10 sujeitos
— concluintes do curso de licenciatura em Letras — foram convidados a
responder o questionário.
Questionamentos sobre o período de formação acadêmica, o estu-
do de disciplinas voltadas à tecnologia — sejam cursadas dentro ou fora
da instituição de origem —, a presença dos formandos em minicursos
específicos sobre os usos da tecnologia no ensino de idiomas, a par-
ticipação em projetos de pesquisa acerca do uso de novas tecnologias
no ensino de uma língua estrangeira e, também, a opinião dos futuros
professores sobre quais tecnologias são indispensáveis à formação da-
queles que pretendem lecionar línguas foram elaborados no intuito de
entender como acontece a inserção das TICs — seja no aprendizado ou
no treinamento dos futuros profissionais — em um curso superior de
licenciatura em Letras.
Os resultados aqui descritos nos apresentaram uma utilização mais
substancial das tecnologias tanto nas exposições de conteúdos em sala
quanto na existência de disciplinas específicas relacionadas à tecnologia.

40 Antonio Henrique Coutelo de Moraes


Tecnologia na Disciplina Minicurso Projeto de Tecnologias essenciais
formação pesquisa

Sujeito 1 P P Aparelhos audiovisuais

Sujeito 2 P P P Internet de boa


qualidade, jogos
educacionais

Sujeito 3 P P P P Recursos tecnológicos

Sujeito 4 P P P Redes sociais

Sujeito 5 P P P Computador, Data show,


Apps educacionais

Sujeito 6 P P Whatsapp

Sujeito 7 P P P Sites, aplicativos, jogos


educacionais

Sujeito 8 P P Jogos educacionais,


repositórios digitais,
celular

Sujeito 9 P P P Notebooks, tablets,


lousa digital

Sujeito 10 P P Aparelhos audiovisuais

Quadro 1 – Respostas dos sujeitos da pesquisa

Analisando as respostas dos entrevistados com relação à utilização


das tecnologias ao longo da formação acadêmica, constatamos nas res-
postas a unanimidade do uso das tecnologias em sala de aula. Porém, ao
examinar as respostas com mais acuracidade, percebemos que a inserção
tecnológica se deu através de dispositivos mais básicos, tais quais Da-
tashow, retroprojetor, computador. A utilização de recursos digitais ain-
da é uma barreira para os professores, principalmente para os veteranos,
pois aprender a manusear tecnologias tão recentes acarreta entraves no
momento de planejar a aula. Moran (2013) é enfático ao afirmar que algu-
mas tecnologias móveis oferecem desafios homéricos aos professores, no
sentido de que não é tão simples planejar uma aula interessante utilizando
como alicerce os recursos tecnológicos. Diante do exposto, “Apesar de o
professor procurar inteirar-se da funcionalidade dessas novas tecnologias
e procurar desenvolver habilidades para operá-las, muitos não se sentem
preparados para integrar esses diferentes domínios na sua prática pedagó-
gica” (ALMEIDA, 2014, p. 36).

LETRAMENTO DIGITAL E FORMAÇÃO INICIAL DE PROFESSORES DE LÍNGUAS EM UMA UNIVERSIDADE COMUNITÁRIA DO RECIFE 41
A maioria dos sujeitos entrevistados relatou ter algum contato mais
próximo com os recursos tecnológicos ao participarem de disciplinas em
que seus conteúdos foram apresentados mediante computador conectado a
projetor de imagens. Um dos entrevistados afirmou “A tecnologia pouco se
fazia presente. Quando utilizada, era por meio de aparelhos para a repro-
dução de slides.” Outro sujeito declarou: “Durante meu período de gradua-
ção, nem os professores nem nós alunos fizemos muito uso de ferramentas
tecnológicas modernas.”
A partir dos relatos dos entrevistados, ficou aparente a utilização dos
recursos digitais em ambiente acadêmico, embora com menor frequência
do que o esperado em um curso superior, já que utilizar tecnologias signi-
fica vencer obstáculos e aprimorar técnicas e métodos no processo de ensi-
no-aprendizagem. Sabendo da importância da inclusão tecnológica na aca-
demia, “O uso de novas tecnologias permite romper barreiras, uma vez que
elas possibilitam o acesso mundial à informação e colocam o cidadão em
contato com diferentes conteúdos, linguagens e diversidades” (ALMEIDA,
2014, p. 39). Ainda de acordo com a entrevista, as disciplinas relacionadas
às tecnologias somente foram ministradas no último período do curso. “Só
houve imersão nos meios digitais no último período, por meio das discipli-
nas: multiletramentos e laboratório de língua portuguesa”, respondeu um
dos entrevistados.
No tópico que trata sobre os minicursos acerca de novas tecnologias,
a adesão a esse tipo de evento não foi unânime. Apenas metade dos en-
trevistados participaram de algum curso de curta duração destinado ao
estudo de novas tecnologias. Se não houver o envolvimento do professor
em formação no universo tecnológico cada vez mais presente no mundo
contemporâneo, esse futuro profissional terá dificuldades — enquanto pro-
fessor formado — em lidar com as inovações em sala de aula trazidas pelas
TICs. Manfredini (2014) assevera a relevância que as TICs desempenham
no dia a dia dos alunos e professores, por serem ferramentas importantes
ao desempenho de atividades dentro e fora da sala de aula.
Quando perguntados a respeito da participação em projetos de pes-
quisa em relação ao uso de tecnologias no ensino de língua estrangeira,
menos da metade dos sujeitos afirmaram ter se envolvido em algum tipo
de pesquisa científica. A pesquisa na universidade é um evento importante
à formação dos futuros profissionais, independente da área escolhida. Ade-
mais, pesquisar significa aprimorar nossa percepção a respeito do meio em
que estamos inseridos, desmistificando, muitas vezes, através da pesquisa,

42 Antonio Henrique Coutelo de Moraes


aspectos subjacentes à realidade que nos cerca e que com ela interagimos.
Por isso, ter conhecimento das ferramentas e dinâmicas no ensino de uma
língua estrangeira é uma forma perspicaz de conhecer práticas pedagógicas
já reconhecidas através de pesquisa científica. Para Bortoni-Ricardo (2008)
o professor em formação que participa de projetos de pesquisa, além de
se tornar beneficiário dos saberes produzidos por outros pesquisadores,
é, também, crítico dos obstáculos encontrados em sua área de atuação,
aprimorando, desta forma, as práticas pedagógicas tão necessárias ao bom
desempenho de seu trabalho.
Questionados sobre as tecnologias essenciais à formação dos professo-
res de línguas, os jogos educacionais foram citados por mais de um entre-
vistado, demonstrando, assim, o interesse dos futuros docentes em utilizar
jogos como ferramentas de ensino. Mesmo havendo opções gratuitas, os
jogos educacionais não são uma realidade nos ambientes acadêmicos por
se tratarem de um produto que, muitas vezes, depende de verbas vultosas
para serem criados.
Tori (2014) esclarece a possibilidade de inserir jogos na educação sem
precisar produzir ou investir financeiramente em jogos educacionais, basta
adaptar os jogos que já existem no mercado ao universo educacional. Ou-
tra possibilidade de incluir jogos — sejam educacionais ou não — em am-
bientes de aprendizagem—, é incentivar os alunos a criarem seus próprios
produtos, aumentando, desta forma, o potencial criativo dos estudantes. Ao
lançar mão de recursos didáticos que superam a lousa e o papel tanto nas
escolas quanto nas universidades é comprovado “que a aprendizagem ba-
seada em jogos digitais pode trazer muitos benefícios, tais como motivação,
retenção, envolvimento e melhoria na percepção visual dos alunos (LEE et
al, 2007, apud, TORI, 2017).
Outros recursos tecnológicos foram citados pelos sujeitos na entrevista,
tais como: celular, notebook, tablets, lousa digital, datashow, computador, apli-
cativos de mensagens, sites. O aplicativo de mensagens, como o WhatsApp,
por exemplo, não foi ignorado, porque em algumas disciplinas o aplicativo
teve seu protagonismo revelado, quando os professores solicitaram de seus
alunos a utilização da ferramenta como recurso à produção de trabalhos.

CONSIDERAÇÕES FINAIS
Impossível viver nos tempos atuais sem a incorporação em nosso dia a
dia dos aparatos tecnológicos que permeiam as esferas da nossa existência.

LETRAMENTO DIGITAL E FORMAÇÃO INICIAL DE PROFESSORES DE LÍNGUAS EM UMA UNIVERSIDADE COMUNITÁRIA DO RECIFE 43
É essencial também afirmar que, na seara educacional, a tecnologia chegou
para ficar. Antes, a escola detinha a exclusividade das informações para
construir o conhecimento. Hoje, não é que a escola tenha deixado de ser
a protagonista nas relações do saber, mas, com a solidificação da internet
na sociedade, outras fontes de informação são utilizadas como forma de
produção do conhecimento.
De fato, existem muitas informações inautênticas no mundo digital, e
os usuários precisam ter um discernimento mais acurado no momento de
aceitar como verdadeiro ou falso o que recebe da internet.
Os professores de língua, ao se graduarem, devem estar competente-
mente familiarizados com o mundo da tecnologia, pois serão capazes de
elaborar planos de aula mais eficazes e de acordo com a realidade em que
estamos inseridos, além de auxiliar na formação de cidadãos com uma
postura mais crítica quanto às frequentes mudanças que as TICs propor-
cionam a cada ano vindouro.
Ademais, é pertinente mencionar a existência de métodos utilizados
no ensino de línguas que desconsideram elementos pertencentes às me-
todologias tradicionais de ensino, como, por exemplo, o material didático
impresso. Metodologias como o Blended Learning apostam em recursos di-
gitais como ferramentas imprescindíveis ao aprendizado, tornando as aulas
mais dinâmicas e interativas.
Os resultados aqui descritos nos apresentaram uma utilização mais
substancial das tecnologias tanto nas exposições de conteúdos em sala
quanto na existência de disciplinas específicas relacionadas à tecnologia,
embora o quadro branco, a caneta e o papel ainda sejam utilizados com
frequência em ambientes em que o conhecimento deveria ser construído
com o apoio recorrente de mecanismos digitais.
Percebemos, diante das respostas dos entrevistados, um contato mais
consistente com o mundo digital, apesar de a maioria dos relatos ser coin-
cidente ao atestar que a convivência com uma disciplina voltada especifi-
camente ao campo da tecnologia só é efetivada no último período do curso.
É escusado afirmar que a educação, quando respaldada por tecnolo-
gia, torna-se mais envolvente, fazendo com que a aprendizagem seja per-
durável, pois são diversas as formas de abordar os conteúdos trabalhados
pelo professor.
A dinamicidade trazida pelas TICs gerou uma realidade totalmente
diferente da que tínhamos há 20 anos. Por isso, as práticas atuais de en-
sino e aprendizagem de uma língua estrangeira precisam seguir o fluxo

44 Antonio Henrique Coutelo de Moraes


que vem sendo imposto pela rede mundial de computadores. Desta forma,
alunos, professores e todos os autores responsáveis por tornar a educação
mais interessante e promissora não ficarão de fora das mudanças atuais e
das que estão por vir.
Diante das reflexões alcançadas através das respostas dos sujeitos ao
questionário, depreendemos a utilização mais efetiva das tecnologias nas
salas de aula dos cursos que formam professores de línguas estrangeiras. É
conveniente mencionar a tomada de consciência pelos futuros profissionais
sobre a importância de cursarem — ainda na universidade — disciplinas
específicas acerca dos recursos digitais.
Os resultados deste estudo, sobre o uso de tecnologias na formação
de professores de línguas em uma universidade comunitária da cidade do
Recife, juntamente a outros estudos relacionados ao ensino inclusivo de lín-
guas, permitiu a reformulação do currículo dos cursos de Letras da Insti-
tuição de Ensino Superior estudada. Além da inserção, no currículo, de dis-
ciplinas acerca do uso de novas tecnologias na educação, as novas tecnolo-
gias passam a dialogar com as diversas disciplinas de maneira transversal.
É inquestionável o fato de que os docentes recém-saídos da universi-
dade ou em formação/em fase de conclusão do curso devem estar aptos a
enfrentar salas de aula repletas de alunos fluentes em uma linguagem ci-
bernética e culturalmente inseridos em um universo digital tão caracterís-
tico das novas gerações. Propiciar o letramento digital de professores para
o entendimento da linguagem usada pelos alunos nativos digitais é uma
necessidade que a universidade deve suprir como forma de minimizar o
quantitativo de professores inábeis ao desempenho da profissão docente
cada vez mais apoiada em recursos tecnológicos.

REFERÊNCIAS
ALMEIDA, N. A.; YAMADA, B. A. G. P.; MANFREDINI, B. F.; ALCICI, S. A. R. Tecnologia na
escola: abordagem pedagógica e abordagem técnica. São Paulo: Cengage Learning, 2014.
BARDIN, L. Análise de conteúdo. São Paulo: Edições 70, 2011.
BORTONI– RICARDO, Stella Maris. O professor pesquisador: introdução à pesquisa qualitativa.
São Paulo: Parábola Editorial, 2008.
COSCARELLI, C. V.; RIBEIRO, A. E. (orgs.) Letramento digital: aspectos sociais e possibilidades
pedagógicas. 3. ed., 1. reimp., Belo Horizonte: Ceale; Autêntica Editora, 2014.
FREI, S. et al. Integrating technology into the curriculum. Huntington beach, CA: Shell Edu-
cation, 2011.
FREITAS, M. T. Letramento digital e formação de professores. Educ. rev., Belo Horizonte, v. 26,
n. 3, p. 335-352, dez. 2010. Disponível em: https://bit.ly/33YKVHb. Acesso em: 03 abr. 2020.

LETRAMENTO DIGITAL E FORMAÇÃO INICIAL DE PROFESSORES DE LÍNGUAS EM UMA UNIVERSIDADE COMUNITÁRIA DO RECIFE 45
HALL, J. K. A Transdisciplinary Framework for SLA: Essential Understandings for L2 Researchers
and Teachers. 3L: Language, Linguistics, Literature, Vol 24(4): 1 – 12, 2018.
LOPES, D. V. As novas tecnologias e o ensino de línguas estrangeiras. Revista Científica Tecno-
logus. Recife: Unibratec, 2011.
MARZARI, G.Q.; LEFFA, V.J. o letramento digital no processo de formação de professores de
línguas. #Tear: Revista de Educação Ciência e Tecnologia, Canoas, v. 2, n. 2, 2013. Disponí-
vel em: https://periodicos.ifrs.edu.br/index.php/tear/article/viewFile/1816/1421. Acesso em: 03
abr. 2020.
MATTAR, J. Games em educação: como os nativos digitais aprendem. São Paulo: Pearson Pren-
tice Hall, 2010.
MORAES, A. H. C. ______ Escrita de seis surdos em língua inglesa: novos olhares sobre o pro-
cesso de aquisição de uma língua. Saarbrüken: Novas Edições Acadêmicas, 2015.
__________; CAVALCANTI, W. M. Tecnologias e língua estrangeira: reflexões sobre o ensino de
inglês para surdos. In: CIDRIM, L.; COSTA, S. C. (orgs) Tecnologias da Informação e Co-
municação (TIC) Aplicadas às Ciências da Linguagem. Curitiba: Editora CRV, 2015.
MORAN, J. M.; MASETTO, M. T.; BEHRENS, M. A. Novas tecnologias e mediação pedagógica.
21. ed. rev. e atual., Campinas, SP: Papirus, 2013.
PRENSKY, M. Teaching digital natives: partnering for real learning. Thousand Oaks, CA:
Corwin, 2010.
SILVA, I. C. S.; FUZA, A. F. Tecnologias digitais na formação de professores em letras. Trem de
Letras, v. 3, n. 1, p. 137-161, 2017.
SOARES, M. Alfabetização e letramento. 7. ed., 1. reimp., São Paulo: Contexto, 2017.
SOARES, M. Novas práticas de leitura e escrita: letramento na cibercultura. Educ. Soc., Campi-
nas, v. 23, n. 81, p. 143-160, dez. 2002.
TORI, Romero. Educação sem distância: as tecnologias interativas na redução de distân-
cias em ensino e aprendizagem. 2. ed. São Paulo: Artesanato Educacional, 2017.
TRIVIÑOS, A. N. S. Introdução à pesquisa em ciências sociais: a pesquisa qualitativa em edu-
cação. 19. reimpr., São Paulo: Atlas, 2010.

46 Antonio Henrique Coutelo de Moraes


CAPÍTULO 4 MINERAÇÃO DE DADOS
TEXTUAIS NÃO ESTRUTURADOS
UTILIZANDO ENSEMBLE DINÂMICO
Raquel Bezerra Calado1
Alexandre Magno Andrade Maciel1

1. CONTEXTUALIZAÇÃO

G
rande parte do volume de dados armazenada pelas empresas en-
contra-se de forma não estruturada. Esse conjunto de dados não
estruturados representa a maior parte da quantidade de todos os
dados relevantes para os negócios. Espera-se que a importância
desses dados continue aumentando nos próximos anos (SCACCHI, 2017).
Ainda de acordo com Scacchi (2017), o volume de informações não
estruturadas deve crescer a uma taxa média de aproximadamente 62% ao
ano. Em 2022, os dados não estruturados podem chegar a 93% de todos os
dados digitais existentes.
Devido à enorme quantidade de dados não estruturados e à varie-
dade de tipos de dados, as ferramentas tradicionais de processamento
de dados não podem mais lidar com eles. O volume de dados cresceu
exponencialmente devido a eventos como a explosão de dados gerados
por máquinas e ao crescente envolvimento humano nas redes sociais, por
exemplo (EBERENDU, 2016).
Os dados de texto são um bom exemplo de informações não estrutu-
radas, que é uma das formas mais simples de dados que podem ser geradas
na maioria dos cenários. O texto não estruturado é facilmente processado
e percebido pelos humanos, mas é significativamente mais difícil para as
máquinas entenderem (ALLAHYARI et al., 2017).

1
Universidade de Pernambuco – UPE

47
É possível extrair informações úteis de dados não estruturados a par-
tir da aplicação de técnicas de mineração de dados, mais especificamente,
de mineração textual. As abordagens de mineração de texto têm como obje-
tivo extrair conhecimento de dados não estruturados ou semiestruturados.
A mineração de dados consiste na aplicação de algoritmos específicos para
extrair padrões de dados (ALLAHYARI et al., 2017).
Os dados contidos em documentos textuais são, do ponto de vista com-
putacional, classificados como não estruturados, ou seja, não organizados
em uma estrutura uniforme. Porém, analisando o texto de uma perspecti-
va linguística, mesmo um documento bastante inócuo demonstra uma rica
quantidade de estrutura semântica e sintática (FELDMAN; SANGER, 2007).
Essa riqueza é a principal ferramenta das técnicas de mineração textual.
Com o passar do tempo, a mineração de texto evoluiu para abranger
uma estrutura integrada. Incluindo técnicas de aprendizado de máquina,
processamento de linguagem natural (em inglês, Natural Language Proces-
sing – NLP), recuperação de informações (em inglês, Information Retrie-
ver – IR) e gerenciamento de conhecimento (CHAKRABORT; PAGOLU;
GARLA, 2014).
O aprendizado de máquina também evoluiu para melhorar e aprimo-
rar seus algoritmos. Nesse sentido, os Sistemas de Múltiplos Classificado-
res (em inglês, Multiple Classifier Selection – MCS) têm sido muito contem-
plados na literatura. Este tipo de abordagem tem se tornando popular por
oferecer alternativas para lidar com problemas não-ortodoxos no mundo
real, cada vez mais complexos, envolvendo imprecisão, incerteza e alta
dimensionalidade dos dados (WOZNIAK; GRANA; CORCHADO, 2014).
Técnicas baseada em MCS buscam selecionar o classificador apropria-
do ou o grupo de classificadores para resolver um determinado problema
(KO; SABOURIN; BRITTO, 2008). Existem dois possíveis esquemas para
selecionar classificadores com MCS: estática ou dinâmica (LIN et al., 2014).
Uma das abordagens MCS mais promissoras é a Seleção Dinâmica de
Ensemble (em inglês, Dynamic Ensemble Selection – DES) (CRUZ; SABOU-
RIN; CAVALCANTI, 2018). Está técnica seleciona os classificadores no mo-
mento do treinamento, de acordo com cada nova amostra apresentada. A
ideia principal do DES é baseada na suposição de que os classificadores
diferentes terão um melhor desempenho em diferentes regiões do espaço
de entrada. Através do uso de DES, se pode determinar o conjunto de
classificadores que resolvem um determinado problema de maneira ideal
(BALLARD; WANG, 2016).

48 Raquel Bezerra Calado e Alexandre Magno Andrade Maciel


Este Capítulo tem como objetivo apresentar e discutir acerca do uso
de DES como técnica viável e eficiente a ser utilizada na mineração de da-
dos textuais não estruturados.

2 CLASSIFICADORES
Classificadores, dentro do domínio de aprendizagem de máquina, são
essencialmente modelos matemáticos (algoritmos) destinados a capturar
os principais recursos de um determinado problema a fim de derivar solu-
ções artesanais para esse problema. Por exemplo, considere o problema de
definir um processo químico para produzir uma dada molécula. O fluxo
convencional requer que os químicos façam uso de seu conhecimento pré-
vio acerca de modelos e do resultado de reações químicas individuais, para
a partir disso criar uma sequência de etapas adequadas que sintetizam a
molécula desejada. Por outro lado, em sua forma mais básica, o uso de clas-
sificadores substitui a etapa de aquisição de conhecimento de domínio pela
tarefa potencialmente mais fácil de coletar um número suficientemente
grande de exemplos de comportamento desejado para “ensinar” o algorit-
mo/classificador de interesse (SIMEONE, 2018).
A coleção de exemplos usados para alimentar e ensinar ao classifica-
dor sobre determinado domínio constitui o conjunto de treinamento. Os
exemplos no conjunto de treinamento são utilizados para alimentar um al-
goritmo de aprendizado para produzir uma “máquina” treinada que realiza
uma determinada tarefa desejada (SIMEONE, 2017).
O aprendizado dos classificadores pode seguir três principais aborda-
gens: supervisionado, semi-supervisionado ou não supervisionado.

2.1. Supervisionado

As técnicas de aprendizado supervisionado constroem modelos pre-


ditivos aprendendo a partir de um conjunto de dados de treinamento que
contém uma grande quantidade de exemplos de treinamento, cada um
correspondente a um evento/objeto. Um exemplo de treinamento consiste
em duas partes: uma instância descrevendo o evento/objeto e um rótulo
que categoriza essa instância de acordo com algum objetivo específico.
As principais tarefas do aprendizado supervisionado são a classificação e
regressão. Na classificação, o rótulo indica a classe à qual o exemplo de
treinamento pertence; na regressão, o rótulo é uma resposta em valor real
correspondente ao exemplo (ZHOU, 2018).

MINERAÇÃO DE DADOS TEXTUAIS NÃO ESTRUTURADOS UTILIZANDO ENSEMBLE DINÂMICO 49


2.2. Não supervisionado
Classificadores de aprendizado não supervisionado são úteis para
identificar padrões ocultos em dados de entrada não rotulados. O termo
“não supervisionado” refere-se à capacidade de aprender e organizar infor-
mações sem fornecer um sinal de erro para avaliar a solução em potencial,
ou seja, diferente da abordagem supervisionada, os algoritmos não super-
visionados não recebem informações sobre as classes as quais as instâncias
pertencem. A falta de orientação para o classificador pode às vezes ser
vantajosa, pois permite que o algoritmo analise padrões que não foram
considerados anteriormente (SATHYA; ABRAHAM, 2013).
Com a classificação baseada em aprendizado não supervisionado, o
objetivo não é fazer previsões, pois não há respostas associadas a cada ob-
servação. Em vez disso, busca-se encontrar uma maneira interessante de
visualizar dados ou em descobrir subgrupos de observações semelhantes
(WANG et al., 2016).

2.3. Semi-supervisionado
O aprendizado semi-supervisionado é o ramo do aprendizado de má-
quina relacionado ao uso de dados rotulados e não rotulados para execu-
tar determinadas tarefas de aprendizado. Conceitualmente situado entre o
aprendizado supervisionado e o não supervisionado, ele permite aproveitar
grandes quantidades de dados não rotulados disponíveis em muitos casos
de uso, em combinação com conjuntos tipicamente menores de dados rotu-
lados (VAN; JESPER; HOOS, 2020).
Normalmente, algoritmos de aprendizado semi-supervisionados ten-
tam melhorar o desempenho do aprendizado supervisionado ou do não
supervisionado, utilizando informações de um dos métodos geralmente as-
sociadas às informações do outro. Por exemplo, ao lidar com um problema
de classificação, pontos de dados adicionais para os quais o rótulo é desco-
nhecido podem ser usados para ajudar no processo de classificação. Para
métodos de agrupamento, por outro lado, o procedimento de aprendizado
pode se beneficiar do conhecimento de que determinados pontos de dados
pertencem à mesma classe (VAN; JESPER; HOOS, 2020).

3. SISTEMAS MÚLTIPLOS CLASSIFICADORES


Sistemas de Múltiplos Classificadores têm ganhado crescente visibi-
lidade em aprendizado de máquina. O crescimento da popularidade dos

50 Raquel Bezerra Calado e Alexandre Magno Andrade Maciel


MCS se dá por que eles têm mostrado grande potencial na resolução de
problemas do mundo real, envolvendo elevada complexidade, imprecisão,
incerteza e alta dimensionalidade dos dados (DIETTERICH, 2000).
Em MCS, a seleção estática escolhe o mesmo classificador ou conjunto
de classificadores para todos os padrões de teste. Enquanto os esquemas
baseados em seleção dinâmica são projetados para escolher diferentes clas-
sificadores para diferentes padrões de teste. Estudos relatam que a seleção
dinâmica apresenta melhor desempenho quando comparado às abordagens
baseadas em seleção estática (CAVALIN; SABOURIN; SUEN, 2013).
Segundo o teorema No Free Lunch (WOLPERT, 2002), não se pode
afirmar que existe um único classificador que seja melhor que todos os
outros classificadores para um determinado problema. Ainda seguindo o
mesmo raciocínio, (WOZNIAK; GRAÑA; CORCHADO, 2014) argumenta
que não existe uma única visão computacional que resolva todos os pro-
blemas. Portanto, utilizar técnicas que combinem classificadores diversos
pode aumentar as taxas de acerto dos modelos criados.
Conforme mostra a Figura 1, sistemas múltiplos classificadores po-
dem ser enquadrados em três fases gerais: (A) Geração, (B) Seleção e (C)
Integração (CRUZ; SABOURIN; CAVALCANTI, 2018). Na primeira fase, o
conjunto de classificadores, também chamado de pool de classificadores é
gerado. Na segunda fase, um único classificador ou um subconjunto com
os melhores classificadores é selecionado. Na terceira e última fase, a deci-
são final é tomada com base na combinação das previsões dos classificado-
res selecionados (KO; SABOURIN; BRITTO, 2008).

Figura 1: Sistemas Múltiplos Classificadores


Fonte: Os autores.

Na Geração, ao originar o pool de classificadores, a precisão e diversi-


dade dos classificadores devem ser levadas em consideração, uma vez que
não há razão para combinar classificadores que cometam os mesmos erros
(CRUZ; SABOURIN; CAVALCANTI, 2018).

MINERAÇÃO DE DADOS TEXTUAIS NÃO ESTRUTURADOS UTILIZANDO ENSEMBLE DINÂMICO 51


Para a Seleção, existem duas possíveis estratégias: estática ou dinâ-
mica (LIN et al., 2014). Na seleção estática, os classificadores são selecio-
nados durante o treinamento. Na seleção dinâmica, os classificadores são
selecionados para cada nova amostra de teste durante a classificação (OLI-
VEIRA; CAVALCANTI; SABOURIN, 2017). A grande vantagem de fazer
uso de abordagens dinâmicas é que cada caso de teste pode exigir o uso de
diferentes modelos (PÉREZ-GÁLLEGO et al., 2019). Cada modelo tem sua
própria área de competência dentro do espaço de entrada (LIN et al., 2014).
A última fase deste processo, denominada de Integração, busca fundir
as saídas dos algoritmos que compõe o ensemble de acordo com uma re-
gra de combinação utilizada (CRUZ; SABOURIN; CAVALCANTI, 2018), as
principais técnicas de fusão serão discutidas na próxima subseção.

3.1 Métodos de Integração

Após montar o ensemble, a decisão final é obtida através da execução


da fase de integração. Essa fase pode se dar a partir de diferentes regras,
as possíveis maneiras de combinar as saídas dos N classificadores de um
ensemble dependem de qual informação é obtida dos membros individuais.
Algumas destas regras de combinação operam somente na classe de saída,
enquanto outras precisam das saídas contínuas que podem ser interpreta-
das como suporte dado pelo classificador para cada uma das classes (AL-
MEIDA, 2011).
Nesta subseção, serão apresentados os principais métodos de integração
de ensemble: Votação Majoritária, Média, Soma, Produto, Máximo e Mínimo.

3.1.1 Votação Majoritária


A votação majoritária é uma das técnicas de fusão mais antigas na
literatura para realizar a tomada de decisão a partir dos resultados dos clas-
sificadores. Ela é utilizada por diversos métodos de criação de ensemble e é
tida como um combinador ideal. Junto com as regras de média e produto,
a votação majoritária é um dos métodos mais usados (ALMEIDA, 2011).
A técnica é uma das mais simples, consiste em classificar a instância
em questão a partir da maioria dos votos.
Na Tabela 1, podemos conferir o funcionamento dessa técnica, onde a
Classe A será o resultado e a resposta dada pelo ensemble, uma vez que ela
recebeu uma maior quantidade de votos em relação a Classe B.

52 Raquel Bezerra Calado e Alexandre Magno Andrade Maciel


Classificador 1 Classificador 2 Classificador 3 Classificador 4 Resultado

Classe A 0,80 0,56 0,10 0,60 3 votos

Classe B 0,20 0,44 0,90 0,40 1 voto

Tabela 1: Votação Majoritária


Fonte: Os autores.

3.1.2 Média
Este método calcula a média dos suportes para cada classe, e a decisão
final é dada pela classe com maior média.
Na Tabela 2, podemos conferir o funcionamento dessa técnica, onde
a Classe A será a resposta dada pelo ensemble, uma vez que o resultado
médio de todos os classificadores foi mais alto em A.

Classificador 1 Classificador 2 Classificador 3 Classificador 4 Resultado

Classe A 0,80 0,56 0,10 0,60 0,515

Classe B 0,20 0,44 0,90 0,40 0,485

Tabela 2: Média
Fonte: Os autores.

3.1.3 Soma
Este método calcula a soma dos suportes para cada classe, e a decisão
final é dada pela classe com maior soma.
Na Tabela 3, podemos conferir o funcionamento dessa técnica, onde a
Classe A será a resposta dada pelo ensemble, uma vez que a soma das esti-
mativas dos classificadores envolvidos foi maior para A.

Classificador 1 Classificador 2 Classificador 3 Classificador 4 Resultado

Classe A 0,80 0,56 0,10 0,60 2,06

Classe B 0,20 0,44 0,90 0,40 1,94

Tabela 3: Soma
Fonte: Os autores.

3.1.4 Produto
A Integração por meio do Produto acontece ao multiplicar os suportes para
cada classe, atribuindo a decisão final para a classe que tiver o maior produto.

MINERAÇÃO DE DADOS TEXTUAIS NÃO ESTRUTURADOS UTILIZANDO ENSEMBLE DINÂMICO 53


Na Tabela 4, podemos conferir o funcionamento dessa técnica, onde
a Classe B será a resposta dada pelo ensemble, uma vez que o produto das
probabilidades dos classificadores é maior em B.

Classificador 1 Classificador 2 Classificador 3 Classificador 4 Resultado

Classe A 0,80 0,56 0,10 0,60 0,027

Classe B 0,20 0,44 0,90 0,40 0,032

Tabela 4: Produto
Fonte: Os autores.

3.1.5 Máximo
Este método busca o suporte máximo para cada classe, e atribui a
decisão final para a classe com o maior suporte máximo.
Na Tabela 5, podemos conferir o funcionamento dessa técnica, onde
a Classe B será a resposta dada pelo ensemble, pois como se pode observar,
em B ocorreu a maior probabilidade obtida (0,90) pelos classificadores.

Classificador 1 Classificador 2 Classificador 3 Classificador 4 Resultado

Classe A 0,80 0,56 0,10 0,60 0,80

Classe B 0,20 0,44 0,90 0,40 0,90

Tabela 5: Máximo
Fonte: Os autores.

3.1.6 Mínimo
Este método calcula busca o suporte mínimo para cada classe, e atri-
bui a decisão final para a classe com o maior suporte mínimo.
Na Tabela 6, podemos conferir o funcionamento dessa técnica, onde
a Classe B será a resposta dada pelo ensemble, pois como se pode observar,
em B ocorreu a menor probabilidade obtida (0,20) pelos classificadores.

Classificador 1 Classificador 2 Classificador 3 Classificador 4 Resultado

Classe A 0,80 0,56 0,10 0,60 0,10

Classe B 0,20 0,44 0,90 0,40 0,20

Tabela 6: Mínimo
Fonte: Os autores.

54 Raquel Bezerra Calado e Alexandre Magno Andrade Maciel


4 SELEÇÃO DINÂMICA DE CLASSIFICADORES
Técnicas baseadas em Seleção Dinâmica baseiam-se na suposição de
que diferentes classificadores são competentes em diferentes regiões locais
do espaço de recursos, essas regiões também são chamadas de regiões de
competência (OLIVEIRA; CAVALCANTI; SABOURIN, 2017).
A competência dos classificadores é simplesmente estimada como o
número de amostras na região de competência que ele classificou correta-
mente (OLIVEIRA; CAVALCANTI; SABOURIN, 2017).
Para escolher quais classificadores pertencem a uma determinada re-
gião, DES utiliza as métricas de avaliação dentro de uma região local para
a instância que está sendo classificada (BALLARD; WANG, 2016).
DES seleciona um ou mais classificadores para a classificação de cada
nova amostra de teste (KO; SABOURIN; BRITTO, 2008). Seleção dinâmica
de classificador (em inglês, Dynamic Classifier Selection – DCS) pode ser
entendida como como um caso específico de DES, onde apenas um classifi-
cador é escolhido (OLIVEIRA; CAVALCANTI; SABOURIN, 2017), por isso,
ambos serão tratados como DES.

Figura 2: Classificação com DES e DCS


Fonte: Os autores.

A Figura 2 apresenta o processo de classificação com DES e DCS.


Como se pode observar, no DES o pool de classificadores C é treinado a
partir de um conjunto pré-determinado e este pool é a entrada dos métodos
de DES. Os classificadores que forem mais competentes são eleitos para
compor o ensemble de classificadores C’. O ensemble de classificadores ge-
rado C’ sempre será menor ou igual a C. Neste cenário, quando uma nova

MINERAÇÃO DE DADOS TEXTUAIS NÃO ESTRUTURADOS UTILIZANDO ENSEMBLE DINÂMICO 55


amostra desconhecida Xj for exposta ao sistema de classificação, o DES
selecionará o melhor ou conjunto de melhores classificadores para tomar
uma decisão sobre a classe dessa amostra. A resposta desses classificadores
será enviada à fase de integração, onde as funções de agregação são execu-
tadas, conforme já discutido em MCS.
Diferente do DES, que elege um conjunto de classificadores, no DCS,
após a geração, um único classificador deve ser escolhido para solucionar
o problema, esta escolha será baseada na competência do mesmo. Então,
para cada nova amostra Xj, um único classificador tomará a decisão sobre
a classe à qual essa amostra pertence.

5 DISCUSSÃO
Várias pesquisas sobre a utilização de ensemble dinâmico em proble-
mas envolvendo dados não estruturados têm sido desenvolvidas ao longo dos
anos. Nesta seção, são apresentados alguns desses trabalhos. Recentes contri-
buições em distintas áreas de aplicações dentro da mineração textual foram
levantadas, onde, nestes estudos, as técnicas dinâmicas foram utilizadas e re-
sultados promissores obtidos. A Tabela 7 apresenta alguns desses trabalhos.

Tema (s) Título Autores Veículo de Publicação Ano

Reconhecimento da From static to dynamic AZIZI, N.; International 2012


escrita árabe. ensemble of classifiers FARAH, N. Journal of
selection: Application Knowledge-based
to Arabic handwritten and Intelligent
recognition Engineering Systems

Classificação de fluxo Dynamic classifier PAN, S.; Knowledge and 2012


de texto. ensemble for positive ZHANG, Y.; LI, X. information systems
unlabeled text stream
classification

Classificação de Dynamic SONG, G., YE, Y., Information Sciences 2016


fluxos textuais com a Clustering Forest: an ZHANG, H., XU,
presença de desvio de ensemble framework to X., LAU, R. Y. K.,
conceito. efficiently classify LIU, F.
textual data stream with
concept drift

Verificação de autoria Dynamic ensemble POTHA, N.; European Conference 2019


selection for author STAMATATOS, E. on Information
verification Retrieval

Análise de combinação Boosting dynamic COSTA, J., SILVA, Neural Computing 2019
de métricas ensemble’s performance C., ANTUNES, M., and Applications
para aumentar o in Twitter RIBEIRO, B.
desempenho do
ensemble dinâmico.

56 Raquel Bezerra Calado e Alexandre Magno Andrade Maciel


Classificação de Mineração de dados não CALADO, R. B.; Dissertação 2019
categoria textual. estruturados utilizando MACIEL, A. M. A.; de Mestrado.
uma combinação de redes Universidade
complexas e ensemble Politécnica de
dinâmico Pernambuco

Tabela 7: Trabalhos Relacionados


Fonte: Os autores.

Em Azizi e Farah (2012), foram propostas duas abordagens para o re-


conhecimento da escrita árabe com base em conjuntos estáticos e dinâ-
micos da seleção de classificadores. O primeiro seleciona estaticamente
o melhor conjunto de classificadores de um conjunto de classificadores já
projetado com base em medidas de diversidade. O segundo representa um
novo algoritmo baseado no conjunto dinâmico de seleção de classificadores
usando a medida de confiabilidade local (AZIZI, N.; FARAH, N., 2012).
O sistema proposto por Azizi e Farah (2012) foi testado no reconhe-
cimento de nomes de cidades tunisinos escritos à mão e os autores mos-
traram experimentalmente que ambas as abordagens fornecem resultados
encorajadores, com a abordagem dinâmica levando a uma melhor taxa de
reconhecimento para o sistema no cenário estudado.
Pan, Zhang e Li (2012) aplicaram ensemble dinâmico para cenários de
classificação de fluxo de texto positivo e não rotulado. Os autores abordaram
o problema de classificar o fluxo de texto positivo e não rotulado com vários
desvios de conceito, construindo um conjunto de validação apropriado e pro-
jetando um novo esquema de ponderação dinâmica na fase de classificação.
Pan, Zhang e Li (2012) levaram em consideração dois aspectos em seus
estudos: mudança repentina do conceito e mudança gradual do conceito.
Para a mudança repentina, os autores afirmam que os interesses dos
usuários podem mudar drasticamente, por exemplo, um gerente na seção
de serviço de uma grande empresa pode se concentrar nos e-mails de fee-
dback sobre o um determinado produto no mercado e, quando um novo
produto for lançado, ele poderá mudar seu interesse para os e-mails de
feedback sobre o novo produto.
Já a mudança gradual acontece quando mudanças gradativas de inte-
resse do usuário e/ou distribuição de dados subjacentes ocorrem ao longo do
tempo. Por exemplo, em um sistema de filtragem de spam, enquanto as ca-
racterísticas dos e-mails de spam são quase as mesmas em um curto período,
os tipos de lixo eletrônico variam gradualmente ou drasticamente em um
longo período de tempo. Assim, o usuário precisa fornecer alguns exemplos

MINERAÇÃO DE DADOS TEXTUAIS NÃO ESTRUTURADOS UTILIZANDO ENSEMBLE DINÂMICO 57


rotulados para o sistema especificado de tempos em tempos e espera que o
sistema possa atualizar seus modelos para capturar o conceito real do fluxo
Os experimentos foram conduzidos em onze cenários diferentes e os
resultados experimentais obtidos no estudo demonstraram que o método
proposto por Pan, Zhang e Li (2012) superaram o estado da arte e supera-
ram também alguns modelos estáticos de ensemble.
Song et al. (2016) apresentam um novo modelo, chamado Dynamic Clus-
tering Forest, para classificação de fluxos textuais com a presença de desvio
de conceito. O modelo é construído com base em várias Árvores de Cluster,
usando duas estratégias: (1) uma estratégia de conjunto adaptável para es-
colher dinamicamente os clusters discriminativos de acordo com a proprie-
dade inerente a um fluxo de dados; (2) uma estratégia de votação dupla que
leva em conta tanto credibilidade quanto a precisão de um classificador.
Com base em cinco fluxos textuais sintéticos e três fluxos textuais do
mundo real, os resultados dos testes empíricos de Song et al. (2016) con-
firmam que o modelo proposto supera outros métodos de classificação de
ponta na maioria dos fluxos textuais de alta dimensão.
Potha e Stamatatos (2019) propuseram um conjunto de empilhamento
de algoritmos simples e uma abordagem de seleção dinâmica de conjun-
tos aplicados a conteúdos textuais construídos nas campanhas relevantes
de avaliação do PAN sobre verificação de autoria em 2014 e 2015. Esses
conteúdos abrangem quatro idiomas (holandês, inglês, grego e espanhol) e
vários gêneros (artigos de jornal, ensaios, resenhas, textos literários etc.).
O empilhamento de algoritmos simples é baseado na generalização
empilhada e aprende padrões de concordância/desacordo entre os algorit-
mos. Em outras palavras, ele aprende quando confiar em um algoritmo. Já
a segunda abordagem seguida por Potha e Stamatatos (2019), baseia-se na
seleção dinâmica de conjuntos e tenta encontrar instâncias de treinamento
relevantes com relação a cada caso de verificação separadamente e depois
filtra e remove os algoritmos que não são muito especializados para o sub-
conjunto de instâncias selecionado.
Os experimentos conduzidos por Potha e Stamatatos (2019) demonstra-
ram que as duas abordagens de conjuntos superam um conjunto de linhas
de base fortes de acordo com experimentos usando dez conjuntos de dados
de benchmark do PAN. O desempenho do DES foi (em média) mais de 5%
melhor que a melhor linha de base nos conjuntos de dados PAN-2014 e mais
de 10% melhor nos conjuntos de dados PAN-2015. Os autores concluíram
que os conjuntos por eles propostos são capazes de lidar com cenários de-
safiadores de verificação e são mais robustos que os modelos individuais.

58 Raquel Bezerra Calado e Alexandre Magno Andrade Maciel


Costa et al. (2019) propuseram melhorar o desempenho da classifica-
ção com ensembles dinâmicos combinando as métricas de desempenho da
maneira mais eficiente possível, retendo exemplos com base em sua im-
portância. A partir do desempenho dos classificadores individualmente, os
autores definiram sua real contribuição para o ensemble. A etapa principal
do algoritmo usa diferentes métricas de desempenho para determinar a
força de cada classificador no conjunto e cada importância de exemplo e,
portanto, a vida útil no processo de aprendizado.
Para avaliar sua abordagem, Costa et al. (2019) utilizaram um estudo
de caso do Twitter. Como os tipos de desvios que ocorrem no contexto das
redes sociais não são conhecidos para cada configuração, os autores simu-
laram diferentes tipos de desvios em um conjunto de dados com informa-
ções de data e hora geradas artificialmente.
Os resultados do trabalho de Costa et al. (2019) demonstraram que
sua abordagem é bastante promissora, pois conseguiram aumentar em 9%
a taxa de acerto (acurácia) da classificação com o ensemble dinâmico. Os
autores acrescentaram que é relevante concluir que, considerando o uso
de métricas de desempenho para determinar o peso de cada classificador
na saída final do conjunto, a melhoria obtida é independente do desvio
padrão que a classe representa e, portanto, pode ser aplicada em diferentes
cenários dinâmicos.
Calado e Maciel (2019) propuseram o desenvolvimento de uma arqui-
tetura de mineração de textos com o objetivo de possibilitar a construção
de um sistema que aplica técnicas de classificação de texto para classifica-
ção de conteúdo dos diários oficiais brasileiros. Para validar a arquitetura
proposta, foram realizados experimentos com as bases de dados não estru-
turados dos diários mencionados.
Durante os experimentos, Calado e Maciel (2019) fizeram uso dos prin-
cipais algoritmos de ensemble dinâmico e estático para classificar, além de
experimentar também algoritmos isolados. Para isso, conduziram um estu-
do dentro de uma empresa que trabalha com a categorização de conteúdos
dos diários oficiais brasileiros. A referida empresa realiza a categorização
através de expressões regulares, que são regras pré-definidas. Por catego-
rização, entenda-se a subdivisão do texto dos diários oficiais em categorias
como “processo”, “nome de juiz”, “vara”, “fórum”, “órgão” dentre outras.
O estudo conseguiu demonstrar que aplicar técnicas de aprendizado
de máquina, em especial, ensemble dinâmico para este cenário, tornou-se
mais eficiente do que seguir utilizando regras pré-definidas ou mesmo, de
utilizar ensembles estáticos ou algoritmos isolados.

MINERAÇÃO DE DADOS TEXTUAIS NÃO ESTRUTURADOS UTILIZANDO ENSEMBLE DINÂMICO 59


Os resultados obtidos pelo trabalho de Calado e Maciel (2019) apon-
taram que a montagem da arquitetura utilizando ensemble dinâmico para
o cenário estudado se mostrou mais promissora do que utilizar ensembles
estáticos, algoritmos isolados ou mesmo seguir utilizando expressões regu-
lares. Sendo 98,82% a maior acurácia entre os classificadores dinâmicos
e 95,70% a maior acurácia entre os classificadores estáticos. O trabalho
conseguiu acertos acima de 90% em todos os experimentos realizados com
ensemble dinâmico, chegando a ter, em alguns casos, 0,99 de precisão em
suas respostas. O que superou todas as taxas anteriormente obtidas com as
expressões regulares.

6. CONSIDERAÇÕES FINAIS
Neste Capítulo, foi apresentada uma técnica que tem apresentado alto
desempenho para lidar com dados textuais não estruturados, o ensemble
dinâmico. Foi mostrado que essa técnica é uma ferramenta poderosa para
lidar com esse tipo de dado e tem sido largamente explorada pela academia
nos últimos anos.
Os trabalhos discutidos são encorajadores. A ideia de se ter algoritmos
especialistas em cada uma das instâncias que lhe forem apresentadas nos
abre um leque de novas possibilidades de aplicações.

REFERÊNCIAS
ALLAHYARI, M.; POURIYEH, S.; ASSEFI, M.; SAFAEI, S.; TRIPPE, E. D.; GUTIERREZ, J. B.;
KOCHUT, K. A brief survey of text mining: classification, clustering and extraction techniques.
Computer Science, 2017.
ALMEIDA, H. A. Método para seleção dinâmica de conjunto de classificadores (Mestrado em En-
genharia da Computação) – Centro de Informática, Universidade Federal de Pernambuco.
Recife. 2011.
AZIZI, N.; FARAH, N. From static to dynamic ensemble of classifiers selection: application to ara-
bic handwritten recognition. International Journal of Knowledge-based and Intelligent
Engineering Systems, Vol. 16, n. 4, p. 279-288, 2012.
BALLARD, C.; WANG, W. Dynamic ensemble selection methods for heterogeneous data mining.
World Congress on Intelligent Control and Automation (WCICA). LNCS, Vol. 12, p. 1021–
1026. 2016.
CALADO, R. B.; MACIEL, A. Mineração de dados não estruturados utilizando uma combinação de
redes complexas e ensemble dinâmico. Dissertação (Mestrado em Engenharia da Computação)
– Escola Politécnica do Recife, Universidade de Pernambuco. Recife. 2019.
CAVALIN, P. R.; SABOURIN, R.; SUEN, C. Y. Dynamic selection approaches for multiple classifier
systems. Springer. Neural Computing and Applications, Vol. 22, n. 3-4, p.673–688, 2013.
CHAKRABORTY, G.; PAGOLU, M.; GARLA, S. Text mining and analysis: practical methods,
examples, and case studies using SAS. SAS Institute, 2014.

60 Raquel Bezerra Calado e Alexandre Magno Andrade Maciel


COSTA, J.; SILVA, C.; ANTUNES, M.; RIBEIRO, B. Boosting dynamic ensemble’s performance in
Twitter. Neural Computing and Applications, p. 1-13, 2019.
CRUZ, R. M. O.; SABOURIN, R.; CAVALCANTI, G. D. C. Dynamic classifier selection: recent
advances and perspectives. Information Fusion, p. 195–216, 2018.
DIETTERICH, T.G. Ensemble methods in machine learning. International workshop on mul-
tiple classifier systems, p. 1–15, 2000.
EBERENDU, A. C. Unstructured data: an overview of the data of big data. International Journal
of Computer Trends and Technology, Vol. 38, n. 1, p. 46-50, 2016.
FELDMAN, R.; SANGER, J. The text mining handbook: advanced approaches in analyzing uns-
tructured data. Cambridge University Press, 2007.
KO, A. H. R.; SABOURIN, R.; BRITTO JR., A. S. From dynamic classifier selection to dynamic en-
semble selection. Pattern Recognition. Elsevier Science Inc., Vol. 41, n. 5, p. 1718–1731, 2008.
LIN, C.; CHEN, W.; QIU, C.; WU, Y.; KRISHNAN, S.; ZOU, Q. Libd3c: ensemble classifiers with
a clustering and dynamic selection strategy. Neurocomputing, Vol. 123, p.424–435, 2014.
OLIVEIRA, D. V.; CAVALCANTI, G. D.; SABOURIN, R. Online pruning of base classifiers for
dynamic ensemble selection. Pattern Recognition, Vol. 72, p. 44–58, 2017.
PAN, S.; ZHANG, Y.; LI, X. Dynamic classifier ensemble for positive unlabeled text stream classi-
fication. Knowledge and Information Systems, Vol. 33, n. 2, p. 267-287, 2012.
PÉREZ-GÁLLEGO, P.; CASTANO, A.; QUEVEDO, J. R.; COZ, J. J. Dynamic ensemble selection for
quantification tasks. Information Fusion, Vol. 45, p. 1–15, 2019.
POTHA, N; STAMATATOS, E. Dynamic ensemble selection for author verification. Springer. Eu-
ropean Conference on Information Retrieval, p. 102-115, 2019.
SATHYA, R.; ABRAHAM, A. Comparison of supervised and unsupervised learning algorithms for
pattern classification. International Journal of Advanced Research in Artificial Intelli-
gence, Vol. 2, n. 2, p. 34-38, 2013.
SCACCHI, M. Competitive intelligence and unstructured data: the business case for text mining.
Competitive Intelligence Magazine, Vol. 20, n. 1, p 26-40, 2017.
SIMEONE, O. A very brief introduction to machine learning with applications to communication
systems. IEEE Transactions on Cognitive Communications and Networking, Vol. 4, n.
4, p. 648-664, 2018.
SIMEONE, O. A brief introduction to machine learning for engineers. arXiv preprint ar-
Xiv:1709.02840, 2017.
SONG, G.; YE, Y.; ZHANG, H.; XU, X.; LAU, R. Y.; LIU, F. Dynamic clustering forest: an en-
semble framework to efficiently classify textual data stream with concept drift. Information
Sciences, Vol. 357, p. 125-143, 2016.
VAN, E.; JESPER, E.; HOOS, H. H. A survey on semi-supervised learning. Machine Learning,
Vol. 109, n. 2, p. 373-440, 2020.
WANG, J.; MIAO, Y.; KHAMIS, A.; KARRAY, F.; LIANG, J. Adaptation Approaches in Unsupervi-
sed Learning: A Survey of the State-of-the-Art and Future Directions. Springer. International
Conference on Image Analysis and Recognition, p. 3-11, 2016.
WOZNIAK, M.; GRANA, M. E.; CORCHADO, E. A survey of multiple classifier systems as hybrid
systems. Information Fusion, p. 3–17, 2014.
WOLPERT, D. H. The supervised learning no-free-lunch theorems. Springer. Soft computing and
industry, p. 25–42, 2002.
ZHOU, Z. A brief introduction to weakly supervised learning. National Science Review, Vol. 5,
n. 1, p. 44-53, 2018.

MINERAÇÃO DE DADOS TEXTUAIS NÃO ESTRUTURADOS UTILIZANDO ENSEMBLE DINÂMICO 61


CAPÍTULO 5 RECONHECIMENTO
AUTOMÁTICO DE
ATIVIDADES HUMANAS
Hemir da Cunha Santiago

1. POR QUE RECONHECER ATIVIDADES HUMANAS?

O
movimento humano tem sido objeto de investigação desde o
século V, quando os primeiros cientistas e pesquisadores ten-
taram modelar o sistema músculo-esquelético humano. As
complexidades anatômicas do corpo humano o tornaram uma
fonte constante de pesquisa até hoje, com muitos estudos anatômicos, fisio-
lógicos, mecânicos, sociológicos e psicológicos realizados para definir seus
elementos-chave (GODFREY et al., 2008).
O reconhecimento de atividades humanas é o processo de identifi-
car corretamente os movimentos realizadas pelo indivíduo. Existem várias
aplicações nesta área, tais como: vídeos de vigilância, interação homem-
-máquina (HCI – Human-Computer Interaction), análises estatísticas em es-
portes, cuidados médicos etc. Esse tipo de reconhecimento fornece um
método mais natural de interagir com o computador do que os convencio-
nais mouse e teclado. Em sistemas de cuidados médicos, as atividades dos
pacientes podem ser monitoradas para facilitar uma recuperação mais rápi-
da (AGGARWAL; RYOO, 2011). Devido à grande variedade de aplicações,
o reconhecimento de atividades humanas se tornou um tópico importante
na comunidade científica, com muitas pesquisas sendo realizadas em todo
o mundo (RAMASAMY RAMAMURTHY, 2018; WANG, 2019).
Em princípio, a movimentação humana pode ser vista apenas como
uma simples atividade física provocada pela contração voluntária dos mús-
culos, porém qualquer movimentação é complexa a ponto de ter relações
com fenômenos relacionados às condições de saúde ou até mesmo ao esta-
do psicológico de um indivíduo (BONOMI, 2010; GODFREY et al., 2008).

63
A atividade humana é geralmente acompanhada com manifestação na po-
sição de partes do corpo, tais como braços erguidos, joelhos dobrados, dedo
em riste, piscar de olhos e outras condições fisiológicas. Neste capítulo, é
abordado o reconhecimento automático das atividades humanas a partir
dos movimentos do corpo ou partes dele.
A habilidade para reconhecer atividades humanas complexas a par-
tir de vídeos possibilita a construção de algumas aplicações importantes.
Sistemas de segurança automatizados em locais públicos como aeropor-
tos e estações de metrô precisam da detecção de atividades suspeitas e
anormais, ignorando as atividades normais. Por exemplo, um sistema
de segurança em um aeroporto deve ser capaz de automaticamente re-
conhecer atividades suspeitas como “uma pessoa deixando uma bolsa”
ou “uma pessoa colocando a sua bolsa em uma lata de lixo”. O reco-
nhecimento de atividades humanas também possibilita o monitoramento
em tempo real de pacientes, crianças e pessoas idosas. A construção de
interfaces homem-máquina baseadas em gestos e ambientes inteligentes
baseados em visão se torna possível com um sistema de reconhecimento
de atividades.
A monitoração contínua e o reconhecimento dos movimentos possibi-
litam uma grande oferta de serviços personalizados em diferentes áreas,
tais como: esportes, segurança, cuidados médicos, rastreamento, residên-
cias inteligentes, interfaces para jogos etc (SILVA, 2013). A Tabela 1 apre-
senta aplicações de reconhecimento de atividades humanas.
No entanto a coleta contínua de informações sobre os movimentos
do usuário pode ser incômoda, além de interferir na execução natural das
suas atividades. Portanto, a escolha adequada da técnica de monitoração
está diretamente relacionada com o desempenho do sistema de reconheci-
mento de atividades. Diversas técnicas podem ser utilizadas para avaliar
e coletar dados sobre a movimentação do indivíduo. Estas técnicas podem
ser divididas em: baseadas em vídeo, na instrumentação do ambiente e em
sensores “vestíveis” (SILVA, 2013).
As técnicas baseadas em vídeo estão associadas ao uso de câmeras,
geralmente em ambiente especialmente preparado e controlado, que ras-
treiam as atividades do usuário continuamente. As desvantagens são a
invasão de privacidade do indivíduo e as dificuldades relacionadas ao
processamento de imagens, quando existem variações de luminosida-
de, mudanças no ambiente, ou múltiplas pessoas nas cenas capturadas
(KHAN, 2011).

64 Hemir da Cunha Santiago


ÁREAS APLICAÇÕES ESPECÍFICAS

Entretenimento Videogame, realidade virtual, interação humano-computador.

Cálculo de energia despendida durante o treino de um atleta,


Esportes
avaliação de desempenho, elaboração de guia de treino e exercícios.

Detecção e aviso remoto sobre situações críticas como quedas de


pessoas idosas ou pacientes em um hospital, detecção de tremores e
Cuidados médicos ataques em portadores de patologias, avaliação das atividades físicas
efetuadas no cotidiano do indivíduo, avaliação de pacientes em
processo de reabilitação.

Registros sobre as atividades realizadas por um indivíduo monitorado,


Segurança e
autenticação biométrica através de sequências de movimentos, alerta
rastreamento
ao usuário sobre o esquecimento de determinada ação importante.

Controle das luzes da residência na presença ou ausência do


Automação e
indivíduo, ligar ou desligar a televisão caso o usuário bata palmas
residências inteligentes
sentado no sofá.

Tabela 1: Aplicações de Reconhecimento de Atividades Humanas.


Fonte: Autor.

As técnicas relacionadas com a instrumentação do ambiente envol-


vem a instalação de diversos sensores nos ambientes de monitoração, que
podem ser um laboratório ou até mesmo a residência do indivíduo monito-
rado. Exemplos de sensores utilizados para este fim são placas de pressão,
chaves do tipo liga-desliga, etiquetas inteligentes, microfones, entre outros.
Estas técnicas têm um custo razoavelmente elevado, pois são necessários
muitos sensores, além disso enfrentam as dificuldades relacionadas à di-
ferenciação entre o indivíduo de interesse e outros presentes no mesmo
ambiente (GODFREY et al., 2008).
As técnicas que abrangem os denominados sensores “vestíveis” (wea-
rable sensors) consistem em sistemas projetados para o uso diário e em-
pregam a utilização de sensores capazes de obter informações fisiológicas
ou mecânicas do indivíduo monitorado, dependendo dos requisitos para a
aplicação desejada. Uma desvantagem dessas técnicas é que os sistemas
utilizam diversos sensores acelerômetros e/ou giroscópios instalados em
diferentes regiões do corpo do indivíduo para capturar sinais de movimen-
tos distintos, o que pode ocasionar uma limitação na execução das ativida-
des diárias (SILVA, 2013).
Com o desenvolvimento da Inteligência Artificial e do Reconheci-
mento de Padrões, os pesquisadores dedicam cada vez mais tempo ao re-

RECONHECIMENTO AUTOMÁTICO DE ATIVIDADES HUMANAS 65


conhecimento de atividades humanas, que é uma tecnologia importante
para a interface homem-máquina. Pessoas diferentes podem ter aparên-
cia diferente para diferentes movimentos corporais, contudo os humanos
ainda podem reconhecer uma grande variedade de movimentos. Mesmo
quando o formato do corpo de uma pessoa não é familiar, ainda assim é
possível reconhecer a atividade humana realizada por essa pessoa devido
à universalidade de alguns movimentos. Entretanto, para um sistema de
Visão Computacional o reconhecimento automático de uma atividade en-
tre outras diferentes, ou mesmo entre indivíduos diferentes, é uma tarefa
desafiadora.

2. CATEGORIZAÇÃO DAS ATIVIDADES HUMANAS


O movimento humano, de acordo com Hamill e Knutzen (2003), en-
volve uma mudança da pessoa de lugar, posição ou postura em relação a
algum ponto do meio ambiente. De uma forma simplória, essa parece ser
uma definição bastante satisfatória. No entanto, Brooke e Whiting (1973)
expandiram essa definição dizendo que o movimento não é uniforme, que
é profundamente estratificado e requer que suas muitas camadas sejam
analisadas ​​e claramente identificadas. Eles também declararam que o mo-
vimento humano, como um conceito, não pode ser restrito ao puramente
físico e que o conceito de movimento humano exige que se reconheça o
‘contexto’ ou ‘forma de vida’ total da qual o movimento humano faz parte;
sociológico, ambiental, psicológico, mecânico, fisiológico e anatômico são
todos os fatores que devem ser incorporados ao conceito de movimento.
A informação de movimento do corpo é uma poderosa ferramenta
para diversas aplicações, conforme mencionado anteriormente, que têm
como pré-requisito a localização do corpo e a extração de suas característi-
cas. Por isso, a comunidade científica tem dedicado esforços para ampliar
os estudos e encontrar melhores técnicas para o problema de localizar um
corpo e extrair suas características em uma imagem, sem restrição. Uma
série de fatores dificulta a detecção, tais como posição do corpo (ou parte
dele), uso de diversos tipos de roupa, oclusão de partes do corpo etc. Isso
faz com que a extração das características de um corpo torne-se uma ativi-
dade difícil e desafiadora.
Existem vários tipos de atividades humanas. Dependendo de sua com-
plexidade, podemos categorizar conceitualmente as atividades humanas
em quatro níveis diferentes (AGGARWAL; RYOO, 2011):

66 Hemir da Cunha Santiago


• Gestos são movimentos elementares da parte do corpo de uma pes-
soa e são os componentes atômicos que descrevem o movimento
significativo de uma pessoa. “Levantar um braço” e “alongar uma
perna” são bons exemplos de gestos.
• Ações são atividades individuais que podem ser compostas por vá-
rios gestos organizados temporalmente, como “caminhar”, “correr”,
“acenar” e “socar”.
• Interações são atividades humanas que envolvem duas ou mais pes-
soas com ou sem objetos. Por exemplo, “duas pessoas se abraçando”
é uma interação entre dois humanos e “uma pessoa que rouba uma
mala de outra” é uma interação humano-objeto envolvendo dois hu-
manos e um objeto.
• Atividades em grupo são as atividades realizadas por grupos concei-
tuais compostos por várias pessoas com ou sem objetos: “Um grupo
de pessoas correndo”, “um grupo em reunião” e “dois grupos brigan-
do” são exemplos típicos.
Como já foi mencionado anteriormente, a análise das atividades hu-
manas é alvo de pesquisas em diversas áreas, integrando o trabalho de
pesquisadores de diferentes campos de estudo, tais como: medicina, fi-
sioterapia, educação física, psicologia e outras. Nos trabalhos de Trew e
Everett (2001) e Godfrey et al. (2008) são listados alguns fatores internos e
externos que afetam a movimentação humana, mostrando que cada tipo de
movimento pode ser analisado das seguintes formas:
• Anatomicamente: descrevendo a estrutura do corpo e a relação entre
as suas partes;
• Fisiologicamente: estudando a maneira como o corpo inicia e contro-
la o movimento;
• Mecanicamente: analisando as relações de força, tempo e distância;
• Psicologicamente: examinando as sensações, percepções e motiva-
ções que estimulam a execução de um movimento;
• Sociologicamente: considerando os diferentes significados dados aos
movimentos em diferentes contextos humanos, e a influência do
contexto social sobre os movimentos executados;
• Ambientalmente: reconhecendo a influência do ambiente no modo
como os movimentos são executados.
Os fatores citados afetam a quantidade e a forma como as atividades
humanas são executadas. Esta relação introduz o conceito de que a partir
de dados obtidos durante a monitoração contínua dos movimentos de uma

RECONHECIMENTO AUTOMÁTICO DE ATIVIDADES HUMANAS 67


pessoa, podem-se extrair informações complexas que relacionem a realiza-
ção de um movimento a um determinado contexto que o motivou, ou ainda
registrar os diferentes tipos de movimentos em uma base de dados para
fins específicos (SILVA, 2013).
Para o ser humano, a identificação de um corpo e do seu movimento é
uma atividade trivial, por ser um elemento familiar aos seus olhos e men-
te. Contudo, para um sistema computacional o processo se torna bastante
complexo, envolvendo uma série de etapas, detalhadas a seguir.

3. METODOLOGIA PARA O RECONHECIMENTO AUTOMÁTICO DE


ATIVIDADES HUMANAS
O computador pode analisar os movimentos através de vídeos filma-
dos por uma câmera que tem o mesmo papel que nossos olhos. Capturar
informações de vídeos com atividades humanas, abstrair sequências de
amostras de treinamento e identificar o tipo de movimento das informa-
ções que obtivemos são problemas que devem ser solucionados na análise
de movimentos em vídeos.
O reconhecimento da atividade humana faz parte da estimação de
movimento baseada em vídeo, que analisa o movimento do sujeito no ví-
deo e, em seguida, prevê o movimento. Esse tipo de reconhecimento pro-
cessa vídeos com pessoas em movimento e realiza o seguinte procedimen-
to: primeiramente, extrai o indivíduo do cenário; em seguida, rastreia o
corpo humano nas sequências de vídeo; então calcula a movimento do
corpo, permitindo o entendimento e a descrição do movimento a partir da
informação obtida (QI; YIN; WU, 2011).
Em trabalhos que utilizam a estimação de movimento para o reco-
nhecimento automático de atividades humanas (AGGARWAL; XIA, 2014;
QI; YIN; WU, 2011), existem três etapas comuns: pré-processamento, ex-
tração de características e classificação. Na etapa de pré-processamento,
a imagem que contém o corpo cuja atividade será reconhecida é alvo de
alterações para possibilitar o reconhecimento. Podem ser introduzidas
alterações na iluminação da imagem, que pode estar escura, ou mesmo
uma conversão do padrão de cores, pois alguns sistemas processam apenas
imagens em níveis de cinza. A detecção do indivíduo na imagem também
faz parte do pré-processamento, visto que apenas a posição do corpo do
indivíduo possui as informações necessárias para as etapas seguintes do
processo de reconhecimento da expressão. Na página seguinte, a Figura 1

68 Hemir da Cunha Santiago


mostra um exemplo de um indivíduo em movimento detectado na etapa de
pré-processamento.
A etapa de pré-processamento também é necessária porque as ima-
gens apresentam diferentes escalas e orientações. Se as imagens são obtidas
com uma câmera fixa, as faces podem ser capturadas em vários tamanhos
e ângulos, devido aos movimentos da pessoa observada. As imagens que
servem como entrada para o sistema podem possuir cenários complexos e
pontos de iluminação com diferentes intensidades e posições, o que pode
tornar a localização, ou o rastreamento do indivíduo em movimento, ainda
mais difícil. O reconhecimento da atividade humana tende a falhar se a
imagem de teste tem uma condição de iluminação diferente das imagens
de treinamento do sistema. Se a iluminação não é uniforme, os pontos de
movimento do corpo podem ser detectados de forma imprecisa, por isso o
pré-processamento é necessário.

Figura 1. Exemplo de indivíduo em movimento detectado na imagem.


Fonte: Autor.

Na etapa seguinte, as características do movimento do indivíduo são


extraídas da imagem, ou sequência de imagens. Entre as características
proeminentes do movimento corporal, devem-se mencionar as posições de:
pernas, braços, mãos e cabeça. As atividades humanas são formadas pela
deformação das características corporais ou ainda por características que
aparecem temporariamente no corpo do indivíduo.

RECONHECIMENTO AUTOMÁTICO DE ATIVIDADES HUMANAS 69


No caso de imagens estáticas, o processo de extração das informações
do corpo refere-se a localizá-lo e suas características na cena. No caso de
sequências de imagens, o processo refere-se a rastrear o indivíduo e suas
características em uma cena. A representação do corpo e o tipo de imagens
de entrada determinam a escolha de mecanismos para a extração automá-
tica de informação das atividades humanas.
Finalmente, as características extraídas são enviadas para um classifi-
cador, que fornecerá a atividade humana reconhecida como saída do siste-
ma. O classificador requer treinamento supervisionado, ou seja, o conjunto
de treinamento consiste de dados rotulados. Uma vez que o classificador
é treinado, ele pode reconhecer imagens de entrada associando-as a um
rótulo de classe em particular. A forma de classificação dependerá do nível
de atividade humana a ser reconhecida (gestos, ações, interações ou ativi-
dades em grupo).
O diagrama de blocos da metodologia de reconhecimento automático
de atividades humanas é mostrado na Figura 2.

Figura 2. Diagrama de blocos da metodologia de reconhecimento de atividades humanas.


Fonte: Autor.

3.1 Sistemas de Reconhecimento Automático de Atividades Humanas

Existem diversos sistemas disponíveis no mercado que já realizam de


forma satisfatória o reconhecimento automático de atividades humanas e
que podem ter as mais diversas aplicações. A seguir são citados, e descritos
resumidamente, quatro desses sistemas:
• Driver Sense (EYESIGHT Automotive, 2020): Driver Sense é um sis-
tema de monitoramento de motoristas (DMS – Driver Monitoring
System), com foco no motorista e em seu estado. O Driver Sense DMS
usa visão computacional e inteligência artificial para detectar em

70 Hemir da Cunha Santiago


tempo real condução distraída e sonolência do motorista. Recursos
avançados incluem o reconhecimento de motoristas, previamente
cadastrados, e detecção de ações (como usar o cinto de segurança e
segurar o celular).
• ViewerSense (EYESIGHT Viewer, 2020): O ViewerSense traz visão
computacional e inteligência artificial, totalmente segura e priva-
da, para as indústrias de radiodifusão e medição de audiência. A
tecnologia de detecção fornece dados analíticos do visualizador em
tempo real, permitindo insights que antes não estavam disponíveis.
Os dados em tempo real revolucionaram o setor de medição de mí-
dia, fornecendo informações precisas de visualização, abrindo no-
vos fluxos de receita para os vários segmentos do setor (provedores
de conteúdo, publicidade e muito mais).
• Gom Correlate (GOM, 2020): Um software livre capaz de medir mo-
vimentos e deformações de objetos usando marcadores de ponto de
referência. Ele é utilizado para a análise dos movimentos realizados
por amputados para avaliar a deformação necessária para as pró-
teses. Essa avaliação é necessária para a definição do material a
ser utilizado na fabricação da prótese. Na Figura 3 é mostrada uma
imagem do software.

Figura 3. Foto do software GOM Correlate.


Fonte: Autor.

• Dartfish Video Analysis (DARTFISH, 2020): É uma solução de aná-


lise de vídeo que permite aos analistas capturar, analisar e com-

RECONHECIMENTO AUTOMÁTICO DE ATIVIDADES HUMANAS 71


partilhar vídeos de sessões de treinamento e partidas. O software
oferece ferramentas para capturar as imagens diretamente na pla-
taforma, marcar eventos em tempo real e fazer upload, organizar e
compartilhar os vários vídeos produzidos. Um vídeo é exibido com
as imagens da partida em uma das telas com um painel de tags e
códigos ao lado, onde um analista é capaz de visualizar instanta-
neamente as principais ações identificadas e sublinhar o que a ação
revela. Na Figura 4 é mostrada uma imagem do software.

Figura 4. Foto do software Dartfish Video Analysis.


Fonte: Autor.

4. CONCLUSÃO
Apesar de o reconhecimento de atividades humanas, como forma de
analisar o comportamento do indivíduo, ser um assunto pesquisado desde
o século XIX, atualmente ainda é um tema que apresenta diversos de-
safios. Realizar esse tipo de reconhecimento de forma automatizada fez
surgir a possibilidade de tornar mais natural a interação entre o homem e
a máquina, visto que um movimento do corpo pode transmitir uma men-
sagem completa, mesmo sem o recurso da linguagem. Sendo considerado
um tipo de comunicação não verbal.
A comunicação não verbal ocorre por meio de gestos, sinais, códigos
sonoros, expressões faciais ou corporais, imagens ou outros códigos repre-
sentativos. Essa comunicação pode ser utilizada de forma isolada, a exem-

72 Hemir da Cunha Santiago


plo dos sinais de trânsito, da mímica ou da linguagem de Libras, linguagem
de sinais para deficientes auditivos.
Neste capítulo foi discutido o papel do movimento do corpo na co-
municação e a sua importância para a identificação da atividade humana.
Também foi abordada a metodologia dos sistemas de reconhecimento au-
tomático de atividades humanas e as diversas áreas em que esses sistemas
podem ser utilizados.

REFERÊNCIAS BIBLIOGRÁFICAS
AGGARWAL, Jake K.; RYOO, Michael S. Human Activity Analysis: A Review. ACM Computing
Surveys (CSUR) Journal, v. 43, n. 3, p. 1-43, abril, 2011.
AGGARWAL, Jake K.; XIA, Lu. Human activity recognition from 3d data: A review. Pattern Re-
cognition Letters, v. 48, p. 70-80, outubro, 2014.
BONOMI, A. G. Physical Activity Recognition Using aWearable Accelerometer: New Pers-
pectives for Energy Expenditure Assessment and Health Promotion. PhD thesis – Uni-
versitaire Pers Maastricht, Eindhoven, 2010.
BROOKE, J.; WHITING, H. Human Movement: A Field of Study: 1. ed. London: Henry Kimpton
Publishers, 1973.
DARTFISH. Disponível em: <https://www.dartfish.com/>. Acesso em: 06 mar. 2020.
EYESIGHT Automotive Solutions. Disponível em: <https://bit.ly/3j6mGLo>. Acesso em: 01 mar. 2020.
EYESIGHT Viewer Sense. Disponível em: <https://bit.ly/3nX9v3f>. Acesso em: 01 mar. 2020.
GODFREY, ACRMDOG et al. Direct measurement of human movement by accelerometry. Medi-
cal engineering & physics, v. 30, n. 10, p. 1364-1386, dezembro, 2008.
GOM CORRELATE. Disponível em: <https://bit.ly/3dyali1>. Acesso em: 06 mar. 2020.
HAMILL, J.; KNUTZEN, K. Biomechanical Basis of Human Movement: 2. ed. Baltimore: Lippin-
cott Williams & Wilkins, 2003.
KHAN, A. M. Human Activity Recognition Using a Single Tri-axial Accelerometer. Phd The-
sis – Department of Computer Engineering, Kyung Hee University. Seoul, 2011.
RAMASAMY RAMAMURTHY, Sreenivasan; ROY, Nirmalya. Recent trends in machine learning
for human activity recognition — A survey. Wiley Interdisciplinary Reviews: Data Mining
and Knowledge Discovery, v. 8, n. 4, p. e1254, 2018.
SILVA, F. G. Reconhecimento de Movimentos Humanos Utilizando um Acelerômetro e
Inteligência Computacional. Dissertação (Mestrado em Engenharia) – Escola Politécnica da
Universidade de São Paulo. São Paulo, p. 105. 2013.
TREW, M.; EVERETT, T. Human Movement: An Introductory Text: 4. ed. Edinburgh: Churchill
Livingstone, 2001.
QI, Wenjuan; YIN, Bo; WU, Jiaojiao. Human Activity Recognition Based on Improved Diamond
Search Block-Matching Method. In: 2011 Fourth International Symposium on Computa-
tional Intelligence and Design. IEEE, 2011. p. 236-239.
WANG, Jindong et al. Deep learning for sensor-based activity recognition: A survey. Pattern Re-
cognition Letters, v. 119, p. 3-11, Março, 2019.

RECONHECIMENTO AUTOMÁTICO DE ATIVIDADES HUMANAS 73


CAPÍTULO 6 AUTOMATIZAÇÃO DE
CHECAGEM DE FATOS: A EXPERIÊNCIA
DE DESENVOLVIMENTO DO
APLICATIVO VERIFIC.AI
Alice Cristiny Ferreira de Souza1
Matheus Barreto Lins Marinho2
Dario Brito Rocha Junior1
Anthony José da Cunha Carneiro Lins1
Carmelo José Albanez Bastos Filho2

1. INTRODUÇÃO

E
m 2017, o termo do ano eleito pelo Dicionário Collins3 foi “Fake
News” (notícias falsas, em português). Esse acontecimento ocor-
reu devido ao fato de um aumento na sua utilização em 365%
em relação ao ano de 20164. Porém, a criação e disseminação de
conteúdos falsos não é uma novidade dos últimos séculos (KAKUTANI,
2018), há quem diga que isto é contemporâneo ao surgimento da própria
linguagem (FIRMO, 2018).
O crescimento das “Fake News” foi estimulado pela mudança na socieda-
de, que passou a viver cada vez mais em rede (CASTELLS, 2017), se organiza-
do em torno de universos interconectados de comunicação digital impulsio-
nados pela internet. A sociedade em rede gerou uma redução da complexida-
de e agilidade na dispersão de conteúdo, permitindo assim que uma notícia,
seja ela verdadeira ou falsa, escrita por qualquer indivíduo, atinja um público
de centenas de milhões de leitores (ALLCOTT; GENTZKOW, 2017).
Mas o que seriam essas notícias falsas? Esse termo tem sido utilizado
para rotular informações adulteradas no contexto ou que são produzidas

1
Universidade Católica de Pernambuco
2
Universidade de Pernambuco
3
Disponível em: <https://bit.ly/3dwZpRE> Acesso em: 07 mai. 2020..
4
Disponível em: <https://bit.ly/3nZoxFN> Acesso em 07 mai. 2020.

75
com o intuito de manipular os leitores (CARDOSO DURIER DA SILVA et
al., 2019). Segundo Tandoc Jr., Lim e Ling (2017), o conceito vem servindo
para designar diferentes tipos de informação: sátira, paródia, fabricação,
manipulação, publicidade e propaganda.
Por isso, há quem diga que “fake news” é um termo obsoleto ou in-
completo e prefira denominar o fenômeno de “desordens da informação”
(WARDLE, 2017). Muito embora ele esteja documentado em diversos mo-
mentos da história, devido ao novo cenário provocado pela sociedade em
rede, assume o protagonismo das preocupações globais do jornalismo e das
comunicações (LAZER et al., 2018) no século 21.
A desinformação tem sido capaz de influenciar o comportamento e a
opinião de pessoas nos mais variados assuntos e perspectivas, entre eles:
saúde, tendo como exemplo no ano de 2020 a infodemia a respeito da CO-
VID-195; e política e economia, onde a desinformação teve seu foco em elei-
ções, principalmente após os casos da Cambridge Analytics (MONTEIRO
et al., 2018).
Este capítulo está organizado da seguinte forma: na seção 2 são abor-
dados os limites e possibilidades no combate da desinformação; a seção
3 do aplicativo Verific.ai, explicando sua estrutura e seu funcionamento
e; por fim na seção 4, encontram-se as conclusões e os trabalhos futuros
relacionado a experiência do desenvolvimento de uma ferramenta para au-
tomatização de checagem de fatos.

2. COMBATE ÀS DESORDENS DA INFORMAÇÃO: LIMITES E


POSSIBILIDADES
Desenvolver mecanismos para proibir, sinalizar ou excluir falsos re-
latórios de notícias no ambiente digital é um passo necessário, no entanto,
dada a complexidade do ecossistema das desordens da informação, entre-
gar soluções de combate à notícia falsa se torna um desafio a ser vencido
ao redor do mundo (NIELSEN; GRAVES, 2017).
Uma das soluções emergidas neste combate ao ecossistema da de-
sinformação é o fact-checking, serviço proposto por jornalistas que busca
através de um processo de verificação de fatos identificar evidências, com-
preender o contexto da informação e o que pode ser inferido a partir dessas
evidências (THORNE; VLACHOS, 2018). Porém, devido à complexidade

5
Disponível em: <https://bit.ly/2GX5uvb> Acesso em 07 mai. 2020.

76 Alice Cristiny F. de Souza, Matheus B. L. Marinho, Dario B. Rocha Jr., Anthony José da C. C. Lins e Carmelo José A. B. Filho
atrelada a essa solução, a conclusão da veracidade do fato analisado pode
demorar dias (HASSAN et al., 2015).
Apesar de os serviços de fact-checking serem uma solução para o com-
bate à desinformação, é importante ressaltar que as mesma se propaga em
grande volume e em rápida velocidade nos meios digitais, tornando esse
processo um desafio (GRAVES, 2018) que demanda uma necessidade para
a criação de sistemas automatizados de verificação de fatos (AFC, sigla em
inglês para Automated Fact-Checking).
A junção do conhecimento jornalístico com as abordagens de Inteli-
gência Computacional tem apontado um caminho viável no combate à de-
sinformação (SOUZA, 2019), pois, através de técnicas de aprendizagem de
máquina e processamento de linguagem natural, faz-se possível a extração
de padrões escondidos nas notícias, possibilitando a construção de mode-
los inteligentes para a classificação da veracidade de um fato. Essa realida-
de, aliada ao processo eleitoral subsequente no Brasil, foi considerada uma
janela de oportunidade para o estudo, concepção, desenvolvimento e teste
de uma ferramenta de AFC (IDEM).

3. O PROTÓTIPO DE APLICATIVO VERIFIC.AI


O Verific.ai foi desenvolvido como pesquisa do mestrado em Indús-
trias Criativas na Universidade Católica de Pernambuco (SOUZA, 2019).
O estudo teve por objetivo a checagem automática de notícias oriundas de
websites, gerando como resposta ao usuário a avaliação do fato verificado,
podendo esta resposta indicar que a notícia é verdadeira ou falsa. Dentre
os objetivos propostos para a ferramenta, podem-se destacar: (i) definição
de critérios relevantes para a identificação da veracidade de uma notícia
em ambiente digital (websites); (ii) produzir um banco de dados contendo
notícias falsas e verdadeiras para posterior uso de técnicas de Inteligência
Artificial, com o intuito de encontrar padrões que possam classificar um
fato como verdadeiro ou falso; (iii) verificar a demanda para utilização de
uma ferramenta de AFC; e (iv) propor um estudo de caso da utilização do
Verific.ai durante o segundo turno das eleições presidenciais brasileiras
2018 (IDEM).

3.1 A experiência de desenvolvimento

A ideia de utilização da plataforma é que o usuário tenha o mínimo de


interação e conhecimento técnico, como também, a resposta fornecida seja

AUTOMATIZAÇÃO DE CHECAGEM DE FATOS: A EXPERIÊNCIA DE DESENVOLVIMENTO DO APLICATIVO VERIFIC.AI 77


de fácil compreensão. É possível observar na Figura 1 as telas propostas
para o Verific.ai, onde a primeira possui uma interface que remete a um
buscador6 – projetada com uma barra de pesquisa onde o usuário coloca o
link que pretende verificar; a segunda tela é referente à página de carrega-
mento, enquanto a ferramenta está processando a solicitação; a terceira e
quarta tela são exemplos da interface de resposta, onde o usuário poderá
obter a informação a respeito da veracidade daquela notícia; e, por fim,
a quinta tela aborda os detalhes do Verific.ai, com a intenção de nortear
aqueles que a utilizam, de como é feita a análise do fato para a formação
do seu veredito.

Figura 1: telas do aplicativo Verific.ai


Fonte: (SOUZA, 2019)

Para utilizar a ferramenta, o usuário precisa apenas de duas informa-


ções: o endereço da notícia que deseja checar (link) e; a fonte de captação
da notícia. Esta última informação é relevante para um posterior moni-
toramento de quais os meios de comunicação digital mais utilizados na
circulação de desinformação. Após inserir as informações, o aplicativo irá
processar aquele link, ou seja, será feita uma análise a partir dos critérios
definidos na Seção 3.3. Para cada ponto abordado, a notícia receberá uma
nota. Por exemplo, se a notícia é de uma fonte confiável, ela receberá
uma pontuação neste critério positiva. Após calculados os valores de cada
critério, é feita uma média ponderada para obtenção da pontuação final
daquela informação. Essa pontuação é convertida numa resposta binária,
verdadeira ou falsa, e retornará ao usuário. Todo esse fluxo pode ser ob-
servado na Figura 2.

6
Ver: <https://www.google.com.br/> Acesso em 07 mai. 2020.

78 Alice Cristiny F. de Souza, Matheus B. L. Marinho, Dario B. Rocha Jr., Anthony José da C. C. Lins e Carmelo José A. B. Filho
Figura 2: sequência de ações de funcionamento do Verific.ai
Fonte: (SOUZA, 2019)

3.2 Tecnologias do Verific.ai

A plataforma é um aplicativo para aparelhos digitais que atuam com o


sistema operacional Android7, além de um serviço com funcionalidades para
validação dos links, numa infraestrutura de computação na nuvem (cloud
computing) desenvolvida utilizando a linguagem de programação ­Python8. A
escolha da linguagem para desenvolvido da regra de negócio do Verific.ai é
fundamentada nas vantagens de processamento e facilidades para manipu-
lação de objetos textuais oferecidas pelo Python. Outro motivo pelo qual se
decidiu utilizar Python são as bibliotecas (códigos já desenvolvidos e dispo-
nibilizados para uso) relacionadas a processamento de texto e aprendizagem
de máquina. Estas serão de suma importância para os trabalhos futuros na
área de inteligência computacional. O serviço é acessado através de chama-
das remotas pelo aplicativo móvel. Está disponível para downloads na Google
Play Store9 desde 16 de outubro de 2018. O foco inicial foi a recepção de links
noticiosos sobre política consumidos ao longo da janela entre o primeiro e o
segundo turno das eleições presidenciais brasileiras de 2018.

3.3 Critérios aplicados

Diferenciar uma informação de uma desinformação é um processo


que demanda primeiramente a compreensão do que é e como se constrói
uma notícia. Esse primeiro passo é fundamental para identificar as regras

7
Disponível em: <https://developer.android.com/> Acesso em 07 mai. 2020.
8
Disponível em: <https://www.python.org/> Acesso em 07 mai. 2020.
9
Disponível em: <https://bit.ly/3nPVKCA> Acesso em 18 dez. 2019.

AUTOMATIZAÇÃO DE CHECAGEM DE FATOS: A EXPERIÊNCIA DE DESENVOLVIMENTO DO APLICATIVO VERIFIC.AI 79


e normas que constituem uma notícia verdadeira, possibilitando, assim,
a criação de critérios que corroboram para este processo de verificação e
identificação da veracidade das informações presentes em um texto.
Observar os preceitos fundamentais de qualidade de uma informação
amplia as chances de escapar da desinformação e reduzem as incertezas
relativas ao problema da confiabilidade de uma notícia (TOMAÉL et al.,
2001). As notícias que trazem em seu conteúdo uma informação falsa ten-
dem a ser feitas sem o cumprimento das normas e processos editoriais
convencionais ao jornalismo (LAZER et al., 2018, p. 1094).
Diante do desafio do combate à desinformação, diversos veículos de
comunicação e instituições têm publicado guias para ajudar na avaliação
de notícias no ambiente digital. Para a definição dos critérios utilizados
na plataforma do Verific.ai, estas são algumas das fontes que serviram de
norte: uma lista10 com oito critérios propostos Factcheck.org11 (dentre eles
está a avaliação da fontes na qual a notícia está publicada e o seu autor); o
projeto Vaza Falsiane!, que disponibilizou uma lista12 com 10 parâmetros
a serem avaliados (nesta lista, vale ressaltar, os pontos de título exclama-
tivo na notícia e se o conteúdo segue as normas gramaticais da língua da
publicação); e os critérios de qualidade propostos por Tomaél et al. (2009),
dentre os quais estão a consistência das informações da notícia e a clareza
nos apontamentos para outras páginas (links como conteúdo da notícia).
Após analisar e avaliar os critérios supracitados, aplicando-os em no-
tícias verídicas e falsas, foram propostas 5 novas regras para a classificação
de uma informação. Estas regras podem ser observadas no Quadro 1 e
foram as implementadas na plataforma do Verific.ai.

Critério Justificativa

Existência da notícia em Quando uma informação é de interesse social e relevante,


sites de veículos de mídia ela terá múltipla veiculação na mídia. Desconfie de notícias
tradicional que não estão publicadas em mais de um portal ou meio de
comunicação.

Se a notícia está em um site já Muita gente vem trabalhando para ajudar a população a
conhecido por compartilhar escapar das notícias falsas, como os serviços de fact-checking e
notícias falsas verificação. Eles já identificaram sites que costumam publicar
conteúdo falso.

10
Disponível em: <https://bit.ly/3588qNz> Acesso em 05 mai. 2020.
11
Disponível em: <https://www.factcheck.org/> Acesso em 05 mai. 2020.
12
Disponível em: <https://bit.ly/3nSUv6B> Acesso em 05 mai. 2020.

80 Alice Cristiny F. de Souza, Matheus B. L. Marinho, Dario B. Rocha Jr., Anthony José da C. C. Lins e Carmelo José A. B. Filho
Se a informação disponível no Sites de notícias falsas costumam usar títulos impactantes para
título está nos dois primeiros atrair leitores, mas nem sempre confirmam o fato no texto.
parágrafos da notícia

Se o título da notícia O uso de sinais de exclamação ou interrogação na titulação de


traz sinais gráficos como notícias não é uma prática do jornalismo, salvo exceções.
exclamação ou interrogação

Se a reportagem divulga a Sites de veículos de mídia jornalística costumam apresentar,


autoria logo abaixo do título da reportagem, o nome do jornalista
responsável ou a fonte do texto. É uma forma de assegurar
credibilidade ao conteúdo.

Quadro 1: Critérios do Verific.ai.


Fonte: Adaptado (SOUZA, 2019)

3.4 Coletas de dados e resultados

Para validar a plataforma do Verific.ai, a mesma foi publicada na Goo-


gle Play no dia 09 de outubro de 2018. A intenção foi: verificar a demanda
de usuários interessados neste tipo de serviço; analisar quais tipos de no-
tícias são mais verificadas, por exemplo, será que o usuário tende a verifi-
car mais informações verdadeiras ou falsas?; e mensurar a capacidade de
verificação da plataforma, ou seja, quantas noticias por período o Verific.ai
analisou. Apesar de ter sido publicado no dia 09 de outubro, o aplicativo
só foi divulgado para o público no dia 16 do mesmo mês, neste caso, o pe-
ríodo de teste aconteceu ao longo de 13 dias, durante o segundo turno das
eleições presidenciais brasileiras de 2018.
O Verific.ai teve um total de 269 instalações em 271 dispositivos dife-
rentes e a Figura 3 relata a quantidade de instalações ao longo do período
de testes. É possível notar que no dia 23 de outubro de 2018 devido a di-
vulgação do Verific.ai num veiculo de comunicação13 ocorreu uma grande
procura da ferramenta, atingindo um total de 70 instalações em um único
dia. A partir desta avaliação, faz-se plausível afirmar que existe sim uma
demanda de pessoas que querem utilizar esse tipo de serviço para checa-
gem de verificação de fatos.
A ferramenta possui três respostas possíveis para o usuário, são elas:
notícia verdadeira, quando a informação checada é confiável; notícia falsa,
quando a notícia em questão não atinge uma pontuação nos critérios ava-
liados; e “algo deu errado”, este caso é quando o Verific.ai não consegue

13
Disponível em: <https://bit.ly/34ZiKqW> Acesso em 11 mai. 2020.

AUTOMATIZAÇÃO DE CHECAGEM DE FATOS: A EXPERIÊNCIA DE DESENVOLVIMENTO DO APLICATIVO VERIFIC.AI 81


processar a notícia informada (um dos possíveis fatores pode ser por que
o link esteja inválido ou fora do ar). O Verific.ai recebeu um total de 373
links para serem verificados, destes, 147 foram identificados como falsos,
131 como verdadeiros e 95 links não foram possíveis de avaliar. Apesar da
maior quantidade de notícias verificadas serem falsas, essa diferença é de
apenas 16 links, desta forma não se pode afirmar que houve uma inserção
maior de notícias falsas ou verdadeiras.

Figura 3: Quantidade de instalações do Verific.ai

Fonte: adaptado (SOUZA, 2019)

Por fim, a premissa de mensurar a capacidade de verificação do Veri-


fic.ai de acordo com o tempo para execução da atividade-fim não tem por
objetivo comparar com o desempenho das agências de checagem de fatos,
mas avaliar a atuação de uma ferramenta de verificação automática de fatos
diante do desafio de diminuir a propagação da desinformação na internet.
Dos 373 links recebidos pelo Verific.ai, 80% foram links únicos, tota-
lizando 132 notícias diferentes, de modo que a plataforma manteve uma
média de verificação de 10,15 boatos/notícias por dia. Neste mesmo perío-
do, foi feito um levantamento da quantidade de notícias verificadas em 7
agências e serviços de checagem de fatos, são eles: Comprova14; Aos Fatos15;

14
Disponível em: <https://projetocomprova.com.br/> Acesso em 08 mai. 2020.
15
Disponível em: <https://aosfatos.org/> Acesso em 08 mai. 2020.

82 Alice Cristiny F. de Souza, Matheus B. L. Marinho, Dario B. Rocha Jr., Anthony José da C. C. Lins e Carmelo José A. B. Filho
Truco16; Lupa17; Fato ou Fake18; Boatos.org19; e E-farsas20. Foram encontra-
das 162 verificações entre verdadeiras e falsas, totalizando uma média de
12,46 boatos/notícias por dia. A partir desse referencial, pode-se observar
a capacidade de acelerar o processo de verificação de fatos através de uma
ferramenta de automação, já que quando comparado com a forma mais
utilizada, que é através de agências e serviços de checagem de premissa
manual e humana, o Verific.ai consegue manter uma taxa de verificação
bem próxima.

4. CONSIDERAÇÕES FINAIS
Ferramentas de automatização de checagem de fatos começam a sur-
gir como forma de acelerar o processo de verificação de informações e
oferecer uma corrida mais justa no combate à desinformação, auxiliando
o trabalho humano já realizado e ofertando novas possibilidades de verifi-
cação. O Verific.ai é uma ferramenta desenvolvida para a identificação de
fatos, através de critérios que determinam a existência de informação ou
desinformação, construída com o trabalho multidisciplinar entre comuni-
cadores e cientistas da computação.
Atestamos a viabilidade de automatizar o processo, bem como o in-
teresse do público por esse tipo de ferramenta, que entrega determinada
autonomia e independência aos usuários de redes sociais digitais e da in-
ternet, em si, para fazer o filtro do que estão consumindo. Por outro lado,
mostramos que o caminho a perseguir ainda é longo na produção de uma
ferramenta automatizada, já que o conhecimento sobre as desordens da
informação ainda está em desenvolvimento, o que de certa maneira ainda
compete de forma desleal com avanço da tecnologia e a velocidade de pro-
cessamento, formatação, ressignificação, produção e consumo de conteúdo
no espaço digital.
A ferramenta servirá de interface para a construção de uma base de
dados para análise com técnicas de IA em trabalhos futuros. Com isso, a
pesquisa aportará estudos futuros no sentido de desenvolver tecnologia de
AFC no que diz respeito à robustez e consistência dos critérios de avalia-

16
Disponível em: <https://apublica.org/truco-antigo/> Acesso em 08 mai. 2020.
17
Disponível em: <https://piaui.folha.uol.com.br/lupa/> Acesso em 08 mai. 2020.
18
Disponível em: <https://g1.globo.com/fato-ou-fake/> Acesso em 08 mai. 2020.
19
Disponível em: <https://www.boatos.org/> Acesso em 08 mai. 2020.
20
Disponível em: <https://www.e-farsas.com/> Acesso em 08 mai. 2020.

AUTOMATIZAÇÃO DE CHECAGEM DE FATOS: A EXPERIÊNCIA DE DESENVOLVIMENTO DO APLICATIVO VERIFIC.AI 83


ção; além de permitir avançar no desenvolvimento de outras capacidades
de ferramentas do gênero, como a verificação de fotos, vídeos e textos;
avançar no tocante à análise de conteúdo; e introduzir técnicas de inteli-
gência artificial que permitam dar celeridade e profundidade à verificação
automática de fatos.

REFERÊNCIAS
ALLCOTT, Hunt; GENTZKOW, Matthew. Social media and fake news in the 2016 election.
Journal of economic perspectives. 2017.
BELL, D. O advento da sociedade pós-industrial: uma tentativa de previsão social. São Paulo:
Cultrix, 1977.
CARDOSO DURIER DA SILVA, Fernando; VIEIRA, Rafael; GARCIA, Ana Cristina. Can machi-
nes learn to detect fake news? a survey focused on social media. Proceedings of the 52nd
Hawaii International Conference on System Sciences. 2019.
CASTELLS, M. A galáxia da internet: reflexões sobre a internet, os negócios e a sociedade. Rio
de Janeiro: Zahar, 2003.
____. O poder da comunicação. São Paulo: Paz e Terra, 2017
D’ANCONA, M. Pós-verdade: a nova guerra contra os fatos em tempos de fake news. Barueri:
Faro editorial, 2018.
FIRMO, E. Reino da trapaça. In: FILGUEIRAS et al. Jornalismo em tempo de pós verdade. For-
taleza: Dummar, 2018. Cap. 3. Edição Kindle.
GRAVES, L. Understanding the promise and limits of automated fact-checking. Oxford:
Reuters Institute for the Study of Journalism, 2018. Disponível em: <https://bit.ly/378zJtD>
Acesso em 06 jan. 2019, às 20h15.
HASSAN, N. et al. The quest to automate fact-checking. Texas: University of Texas Arlington,
2015. Disponível em: <https://bit.ly/3j8ddTY> Acesso em 7 jan. 2019.
JENKINS, H. Cultura da convergência. São Paulo: Aleph, 2008.
JENKINS, H; GREEN, J; FORD, S. Cultura da conexão: criando valor e significado por meio da
mídia propagável. São Paulo: Aleph, 2014.
KAKUTANI, M. A morte da verdade: notas sobre a mentira na era Trump. Rio de Janeiro, In-
trínseca, 2018.
KELLY, K. Inevitável: as 12 forças tecnológicas que mudarão o nosso mundo. Rio de Janeiro: Alta
books, 2017.
KEYES, R. A era da pós-verdade: desonestidade e enganação na vida contemporânea. Petrópolis:
Vozes, 2018.
KUMAR, K. Da sociedade pós-industrial à pós-moderna: novas teorias sobre o mundo con-
temporâneo. Rio de Janeiro: Jorge Zahar, 1997.
LAZER, D. M. J. et al. The science of fake news. Science, [s.l.], v. 359, n. 6380, p.1094-1096, 8
mar. 2018. American Association for the Advancement of Science (AAAS).
LEMOS, A; LÉVY, P. O futuro da internet: em direção a uma ciberdemocracia planetária.
São Paulo: Paulus, 2010.
LÉVY, P. Cibercultura. São Paulo: Ed. 34, 1999.
MONTEIRO, Rafael A., et al. Contributions to the study of fake news in portuguese: New
corpus and automatic detection results. International Conference on Computational Proces-
sing of the Portuguese Language. Springer, Cham, 2018.

84 Alice Cristiny F. de Souza, Matheus B. L. Marinho, Dario B. Rocha Jr., Anthony José da C. C. Lins e Carmelo José A. B. Filho
NIELSEN, R. K.; GRAVES, L. “News you don’t believe”: Audience perspectives on fake news.
Oxford: Reuters Institute for the Study of Journalism, 2017. Disponível em: <https://bit.
ly/37b1uBR> Acesso em 07 jan. 2019.
SHIRKY, C. A cultura da participação: criatividade e generosidade no mundo conectado. Rio de
Janeiro: Zahar, 2011.
SOUZA, A. Aplicativo Verific.AI– automatização de checagem de links de notícias no com-
bate ao ecossistema da desinformação. Dissertação (Mestrado em Indústrias Criativas) –
Universidade Católica de Pernambuco. Recife, 2019.
TANDOC JR, E. C.; LIM, Z. W; LING, R. Defining “fake news”: a typology of scholarly defini-
tions. Journal Digital Journalism, 2017. Disponível em: <https://bit.ly/2IrOjC3> Acesso em
10 jan. 2018.
THORNE, J.; VLACHOS, A. Automated fact cheking: task formulations, methods and fu-
ture directions. Novo México: Proceedings of the 27th International Conference on Compu-
tational Linguistics, 2018. Disponpivel em: <https://bit.ly/2SWcJWu> Acesso em 8 fev. 2019.
TOMAÉL, Maria Inês, et al. Avaliação de fontes de informação na Internet: critérios de
qualidade. Informação & Sociedade. 2001.
WARDLE, C. Noticias falsas. Es complicado. First Draw, 2017. Disponível em: <https://bit.
ly/3q0UU86> Acesso em 12 jan. 2018.
ZATTAR, M. Competência em informação e desinformação: critérios de avaliação do conteú-
do das fontes de informação | Information literacy and disinformation. Liinc em Revista, [s.l.],
v. 13, n. 2, p.285-293, 1 dez. 2017. Liinc em Revista. Disponível em: <https://bit.ly/37d4Hk8>
Acesso em 16 jan. 2019.

AUTOMATIZAÇÃO DE CHECAGEM DE FATOS: A EXPERIÊNCIA DE DESENVOLVIMENTO DO APLICATIVO VERIFIC.AI 85


CAPÍTULO 7 MINERAÇÃO TEXTUAL
PARA RECONHECIMENTO DE EMOÇÕES
Ingryd Pereira 1
George DC Cavalcanti 1

1. INTRODUÇÃO

C
om o decorrer do tempo, as aplicações vão evoluindo e incluin-
do novas características e funcionalidades. Nos últimos tempos,
uma característica que se tornou primordial, principalmente nas
aplicações web, foi a interação em tempo real, permitindo dis-
cussões online. Desta forma, têm surgido várias redes sociais para os mais
variados fins, além de blogs, sites de avaliação, entre outras formas onde o
usuário é capaz de divulgar opiniões e notícias, tornando, assim, disponí-
vel uma grande quantidade de informação (CALAIS GUERRA et al., 2011).
Com essa grande quantidade de redes sociais e seu contínuo cresci-
mento, são apresentados novos desafios na forma em que as informações
são recuperadas e processadas (EIRINAKI et al., 2012). Com este tipo de
interação, os usuários não apenas navegam pelas aplicações, mas também
contribuem ativamente fornecendo conteúdo. E isso se estendeu para os
mais diversos domínios, principalmente para aqueles relacionados à vida
cotidiana, tal como educação, saúde, turismo, comércio, entre outros, fazen-
do com que a Web Social se expandisse exponencialmente, construindo as-
sim uma inteligência coletiva (O’REILLY, 2009; APPELQUIST et al., 2010).
No entanto, informações textuais não são estruturadas e, na maioria
dos casos, sem nenhuma padronização para a composição do texto ou do-
cumento. As aplicações de mineração de dados apenas processam dados
padronizados, o que se torna um grande desafio quando se lida com esses
dados textuais. Para que os textos possam ser padronizados, é necessário

1
Universidade Federal de Pernambuco (UFPE)

87
um pré-processamento, no qual é realizada a transformação desses dados
não estruturados para então dados estruturados, e só áı é possível aplicar a
mineração de dados neles (WEISS et al., 2010).
A mineração de texto é um campo de pesquisa recente e que utili-
za técnicas de mineração de dados, processamento de linguagem natural
(PLN), recuperação de informação, aprendizado de máquina, entre outras.
O seu objetivo é conseguir processar grandes quantidades de dados tex-
tuais não estruturados. Um dos grandes desafios desta área é o processa-
mento de dados gerados por usuário, principalmente aqueles advindos da
comunicação social, devido à informalidade do conteúdo e até mesmo a
erros ortográficos (SHARMA e DEY, 2012).
Todo esse bombardeio de informação das redes sociais nos fornece
relevantes informações que podem ser aplicadas para diversos fins. O reco-
nhecimento de emoções pode ser uma valiosa informação extráıda desses
dados sociais. O reconhecimento de emoção pode, por exemplo, ajudar
empresas a saber qual o sentimento dos seus clientes em relação aos seus
produtos ou serviços, e essa informação ajudar a empresa no processo de
tomada de decisão.
No entanto, essa tarefa de reconhecimento de emoção não é trivial.
Como já vimos anteriormente, por a informação ser textual já é um grande
desafio, mas deve ser acrescentado ainda o desafio da subjetividade das
emoções. As emoções por si só são complexas e podem ser, com facilidade,
confundidas por serem humanos, e, como consequência, também pelas
máquinas. Por esse motivo, as emoções são bastante difíceis de serem in-
terpretadas e necessitam de um tratamento especial para serem usadas por
uma aplicação.
As pesquisas sobre representação de emoções os modelos que ficaram
mais populares foram os modelos categóricos e os dimensionais. O modelo
categórico diz que as emoções são definidas por rótulos categóricos, e o tra-
balho mais famoso é o trabalho de Ekman e Friesen (1971), pois ele define
as “emoções universais”, que são aquelas emoções encontradas em qualquer
localização geográfica, em qualquer gênero e em qualquer idade. O modelo
dimensional já define que emoções é constituída por um conjunto de fatores
(dimensões) e que a junção delas define qual a entonação emocional.
Nas próximas seções são explanados com mais detalhes os seguin-
tes tópicos: reconhecimento de emoções (Seção 2), processamento de texto
(Seção 3), aplicações de reconhecimento de emoções em texto (Seção 4) e
considerações finais (Seção 5).

88 Ingryd Pereira e George DC Cavalcanti


2. RECONHECIMENTO DE EMOÇÕES
Na literatura, não há um consenso sobre a definição de emoção. O
termo “emoção” é confundido com frequência com “sentimento”. Alguns
pesquisadores definem emoção como intensos sentimentos direcionados a
alguém, como respostas a eventos internos e externos que têm um signifi-
cado particular para o organismo. Já os sentimentos, são uma representa-
ção subjetiva das emoções que são experimentadas por um indivíduo de
forma intensa (FEHR e RUSSELL, 1984; Hume, 2012; FOX, 2008).
Modelar, analisar, interpretar e responder ao comportamento natural
afetivo humano é um desafio para sistemas automatizados, uma vez que as
emoções são complexas, subjetivas e com variações significativas de um in-
divíduo para o outro. Desta forma, a definição de categorias discretas (por
exemplo, raiva e felicidade) pode não refletir fielmente os estados emocionais
de uma pessoa (GUNES et al., 2011). Dado isso, diversos estudos foram de-
senvolvidos a fim de se obter uma representação de emoção mais próxima da
realidade. Os modelos mais conhecidos são os categóricos e os dimensionais.
Os modelos categóricos buscam definir rótulos/categorias às emo-
ções. Mas por não haver um ground truth2, existem diversas pesquisas
que propõem modelos categóricos. A pesquisa de Ekman e Friesen (1971) é
bastante interessante porque trata de questões culturais, mas ainda é bas-
tante simples comparada à complexidade das emoções. Eles identificaram
6 emoções: “raiva”, “desgosto”, “medo”, “felicidade”, “tristeza” e “surpresa”.
Essas emoções são universalmente conhecidas, independentemente da cul-
tura ou localização geográfica, e são chamadas de “emoções universais”. A
Figura 1 apresenta exemplos de face mostrando essas emoções universais.

Figura 1. Emoções universais segundo (EKMAN e FRIESEN, 1971)


Fonte: Baseado em (EKMAN e FRIESEN, 1971)

2
Grande verdade na ciência

MINERAÇÃO TEXTUAL PARA RECONHECIMENTO DE EMOÇÕES 89


Um outro trabalho importante é o de Plutchik (2001), que baseia-se na
pesquisa de Ekman e Friesen, e desenvolve a Roda de Emoções (Wheel of
Emotions). A Figura 2 apresenta uma demonstração da Roda de Emoções.
Plutchik sugere que existem oito emoções primárias (“alegria”, “confiança”,
“medo”, “surpresa”, “tristeza”, “antecipação”, “raiva” e “desgosto”) e que elas
estão alinhadas em dois eixos (positivo e negativo). Afirma ainda que cada
emoção presente em um eixo possui uma emoção equivalente inversa no
outro eixo (ex.: “alegria” é o oposto de “tristeza”).
As emoções são complexas, possuem diversos fatores que podem
influenciá-las e não são estáticas, podendo num curto período de tempo
haver mudanças bruscas da emoção de uma pessoa. A pesquisa de Plut-
chik (2001) descreveu as relações entre as emoções, o que é extremamente
útil para entender como as emoções complexas interagem e mudam com
o tempo. As emoções básicas, como descrito por Ekman e Friesen (1971),
são emoções que tem uma maior probabilidade de serem encontradas em
qualquer pessoa. Porém, elas são estados idealizados, pois não são possí-
veis de existir por si só, tendo sempre outros fatores associados a elas. E
só observando essesfatores que é possível descrevê-las. Ainda é possível
combinar essas emoções básicas, gerando assim emoções mais complexas,
por exemplo: a combinação entre “alegria” e “confiança” gera “amor”.

Figura 2. Roda de Emoções (Wheel of Emotions) de Plutchik (2001)


Fonte: Adaptado de Plutchik (2001)

90 Ingryd Pereira e George DC Cavalcanti


Um dos problemas dos modelos categóricos é que diferentes pessoas
podem identificar e relacionar emoções de formas diferentes. Assim, outra
maneira para representar emoções é através de modelos dimensionais, que
tem como objetivo identificar e atribuir valores a componentes nas quais as
emoções são feitas. Um dos mais influentes trabalhos é o de Russell (1997)
que propõe que a experiência emocional é descrita por duas dimensões: va-
lence e arousal. Valence mede o quão positiva ou negativa uma experiência
pode ser sentida, e arousal mede o quão ativa ou excitante a experiência foi.
As dimensões valence e arousal são responsáveis por identificar o
“Core affect”. Proposto por Barrett (2006), o “Core affect” é o componente
principal do ato conceitual do modelo emocional. Esta percepção emocio-
nal tem uma característica que não é discreta, e ainda pode haver uma
mudança de categoria de uma experiência emocional dependendo de seu
humor ou afeto. A Figura 3 mostra a representação dimensional do valence
e arousal. Mostra como a variação de intensidade do arousal e valence muda
de uma emoção para outra, por exemplo: um alto arousal, mas tendo um
baixo valence pode representar a emoção “raiva”, enquanto se houver um
alto valence pode representar a emoção de “excitação”.

Figura 3. Dimensões arousal e valence


Fonte: Baseado no “Core affect” proposto por Barrett (2006)

MINERAÇÃO TEXTUAL PARA RECONHECIMENTO DE EMOÇÕES 91


3. PROCESSAMENTO DE TEXTO
A Figura 4 mostra uma abstração do processamento de texto. Este
processamento é subdividido em 5 etapas, sendo elas, coleta de dados, pré-
-processamento, extração de características, predição e avaliação, e que são
descritas com mais detalhes nas próximas seções.

Figura 4. Modelo de processamento de texto


Fonte: Elaborado pelo autor (2020)

3.1. Coleta de dados

Nessa etapa de coleta de dados, os dados são extráıdos de suas res-


pectivas fontes. Essa etapa depende do tipo de aplicação. Por exemplo, se o
objetivo é analisar emoções a partir de publicações no Twitter, dados dessa
rede social devem ser extráıdos e armazenados.
Nessa etapa também é feita a rotulação dos dados, que servirão de ex-
plos para o treinamento dos modelos e para a avaliação. No entanto, esta é
uma tarefa difícil por diversos fatores: sarcasmo, gírias, erros ortográficos
e ainda nem sempre anotadores concordam sobre as anotações emocionais.

3.2. Pré-processamento

A etapa de pré-processamento é responsável pela padronização do


texto e pela limpeza das informações, deixando apenas aquelas que são
relevantes para a aplicação.

3.2.1. Tokenização
O primeiro passo no tratamento de texto é a tokenização, que é a quebra
do fluxo de caracteres em palavras ou, mais precisamente, tokens (WEISS et
al., 2010). Nessa etapa, é realizada a divisão do segmento de texto em vários
pedaços, e o delimitador entre esses pedaços são os espaços em branco. A
Tabela 1 possui uma demonstração de como se dá a divisão dos tokens.

3.2.2. Remoção de stopwords


Existem algumas palavras extremamente comuns, que são de pouco
valor na seleção de documentos correspondentes à necessidade do usuário

92 Ingryd Pereira e George DC Cavalcanti


e podem ser excluídas do vocabulário sem danos. Estas palavras são cha-
madas de stopwords (MANNING et al., 2008). Geralmente são palavras
funcionais, que não denotam nenhum sentido e não auxiliam na classifi-
cação do texto, podendo até atrapalhar em alguns casos. A Tabela 2 possui
um exemplo de remoção de stopwords. Neste exemplo, os termos ‘o’, ‘em’,
‘a’, ‘da’, ‘de’, ‘que’, ‘pra’, estariam na lista de stopwords.

Entrada [‘esqueci o cartão em casa a caminho da rodoviária, acabei de descobrir que da pra
sacar dinheiro s/ o cartão, amando muito o @bradesco agora :)’]

Saída [‘esqueci’, ‘o’, ‘cartão’, ‘em’, ‘casa’, ‘a’, ‘caminho’, ‘da’, ‘rodoviária,’ ‘acabei’, ‘de’,
‘descobrir’, ‘que’, ‘da’, ‘pra’, ‘sacar’,‘dinheiro’, ‘s/’, ‘o’, ‘cartão,’, ‘amando’, ‘muito’, ‘o’,
‘@bradesco’, ‘agora’, ‘:)’]

Tabela 1. Processo de tokenização

Entrada [‘esqueci’, ‘o’, ‘cartão’, ‘em’, ‘casa’, ‘a’, ‘caminho’, ‘da’, ‘rodoviária’, ‘acabei’, ‘de’,
‘descobrir’, ‘que’, ‘da’, ‘pra’, ‘sacar’, ‘dinheiro’, ‘s/’, ‘o’, ‘cartão,’, ‘amando’, ‘muito’, ‘o’,
‘@bradesco’, ‘agora’, ‘:)’]

Saída [‘esqueci’, ‘cartão’, ‘casa’, ‘caminho’, ‘rodoviária,’ ‘acabei’, ‘descobrir’, ‘sacar’,


‘dinheiro’, ‘s/’, ‘cartão,’, ‘amando’, ‘muito’, ‘@bradesco’, ‘agora’, ‘:)’]

Tabela 2. Exemplo de remoção de stopwords

3.2.3. Lemmatization e Stemming

Devido à variação linguística comum, palavras podem ser flexionadas de


diversas maneiras, por exemplo “democracia”, “democrático” e “democratiza-
ção”. No entanto, essa variação é referente a uma mesma família e com signi-
ficação semelhante, o que poderiam ser representadas por um mesmo termo.
O objetivo da lematização e do stemming é reduzir as palavras a uma
forma básica comum, a fim de reduzir a variabilidade linguística (MAN-
NING et al., 2008). O que difere entre os dois é que o steamming reduz a
palavra ao radical sem sufixo, já o lemmatization reduz a uma palavra na
sua forma básica, assim como mostrado na Tabela 3.

Entrada Saída Saída


Stemming Lemmatization

Casebre
Casinha Cas Casa
Casarão

Tabela 3. Exemplo de Stemming e Lemmatization

MINERAÇÃO TEXTUAL PARA RECONHECIMENTO DE EMOÇÕES 93


3.2.4. POS-tagger
O POS-tagger tem como objetivo identificar a classe gramatical das
partes de um documentos, por exemplo, substantivos, verbo e adjetivos.
Essa informação pode enriquecer o conhecimento sobre um texto, e até
mesmo servir como discriminante para reduzir o dicionário da aplicação
(TOUTANOVA et al., 2003). Por exemplo: um classificador que reconhece
emoções pode dar mais ênfase aos termos marcados como adjetivos, ou
ainda, podemos eliminar todos os termos marcados como artigos, caso não
possuam informação relevante para o classificador.

3.2.5. Léxicos emocionais


Emoção é um conceito complexo, dado que uma mesma palavra, mas
em contextos diferentes pode indicar diferentes emoções. No entanto, mui-
tas vezes palavras diferentes são indicativos de emoções iguais, por exem-
plo: “delicioso” e “gostoso” indicam a emoção da alegria, “sombrio” e “cho-
ro” são indicativos de tristeza, “gritos” e “fervuras” são indicativos de raiva,
entre outras. Dessa maneira, um léxico emocional é uma lista de palavras
indicativas de cada emoção e que é usada como auxiliar de modelos de
identificação de emoção (MOHAMMAD e TURNEY, 2010).

3.3. Métodos de extração de características

Apesar do dado de origem ser textual, os modelos de predição só con-


seguem interpretar dados numéricos. Dado isto, é necessário fazer uma
transformação/representação do texto em números, que é conhecido como
extração de características. Existem diversos métodos para realizar essa
extração de características, e o método mais utilizado até hoje é o TF-IDF
(abreviação do inglês term frequency–inverse document frequency), que calcu-
la a razão entre a frequência do termo no documento ou frase e a frequên-
cia do termo em todo o conjunto de dados.
Pesquisas mais recentes estão investindo no uso de extratores de ca-
racterísticas mais complexos, que utilizam até mesmo redes neurais ou
deep learning para realizar a representação do texto. Alguns exemplos de
métodos mais recentes são: Word2vect (MIKOLOV et al., 2013), Fast text
(BOJANOWSKI et al., 2017), Glove (PENNINGTON et al., 2014), Elmo (PE-
TERS et al., 2018), BERT (DEVLIN et al., 2018), RoBERTa (LIU et al., 2019),
XLNet (YANG et al., 2019). A principal vantagem do uso desse tipo de
abordagem é que eles levam em consideração o contexto das palavras e

94 Ingryd Pereira e George DC Cavalcanti


representam as informações semaˆnticas e sintáticas. No entanto, isso faz
com que o espaço de característica cresça significadamente, o que exigirá
mais esforço dos modelos de predição.

3.4. Modelos de predição

A emoção não é uma variável constante. Em um único texto, é possí-


vel que a pessoa interprete diversas emoções. Isso é mais um dos desafios
enfrentados para o reconhecimento de emoção em texto. Uma abordagem
amplamente utilizada é realizar o reconhecimento da emoção de trechos de
texto (normalmente frases) e considerar a emoção predominante daquele
texto, ou seja, aquela emoção que mais se repete (YADOLLAHI et al., 2017).
Os modelos de classificação são utilizados para o reconhecimento de
emoções categóricas. No geral, qualquer modelo que classificação de texto
pode ser utilizado para o reconhecimento de emoção. Mas, como qualquer
outra aplicação, deve ser experimentado e testado qual o tipo de algoritmo
melhor se qualifica para o domínio da aplicação. Alguns modelos que já foram
utilizados para o reconhecimento de emoção e obtiveram sucesso são: Support
vector machine (SVM), Naive Bayes, Hidden Markov Model (HMM), Ensemble,
K-Nearest Neighbors (KNN) e Linear classifier (YADOLLAHI et al., 2017).
Nos modelos dimensionais de reconhecimento de emoção, é neces-
sária a utilização de modelos de previsão para inferir os valores de cada
dimensão. Normalmente, as dimensões são valores numéricos contínuos
que ficam dentro de um intervalo específico, que delimita o valor mínimo
e máximo daquela dimensão. A combinação da intensidade de cada dimen-
são definem a “entonação” da emoção daquele texto. Modelos de regressão
são comumente usado para esta tarefa.

4. APLICAÇÕES
O segmento de relacionamento entre empresas e clientes é uma área
que está encontrando diversos usos para o reconhecimento de emoções em
texto. Uma aplicação realizada por Coussement e Van den Poel (2008) clas-
sifica e-mails de reclamações dos clientes com o intuito de prever possíveis
atritos, usando esta informação no auxílio a tomada de decisão, buscando
assim evitar futuros atritos.
Estrada et al. (2020) classificam opiniões educacionais, ou seja, opiniões
a respeito de dados dentro de um domínio educacional, em um Ambiente de
Aprendizado Inteligente, e para isso realiza o reconhecimentos de emoções

MINERAÇÃO TEXTUAL PARA RECONHECIMENTO DE EMOÇÕES 95


centradas na aprendizagem (engajamento, excitação, tédio e frustração). Esta
aplicação consegue refletir o estado emocional dos alunos em relação a pro-
fessores, exames, trabalhos de casa e projetos acadêmicos, entre outros.
Desmet e Hoste (2013) utilizam o reconhecimento de emoção em pla-
taformas onlines para identificar indicativos de comportamento suicida. As
redes sociais são comumente utilizadas por pessoas para expressar suas
opiniões, sentimentos e até pensamentos suicidas. Fazer esse monitoramen-
to manualmente é inviável, considerando os especialistas em sobrecarga de
informações, e uma aplicação de reconhecimento de emoções pode ser
usada para identificar emoções que indiquem um comportamento suicida.
Sistemas de diálogo são um campo de pesquisa relevante. Estes siste-
mas realizam a geração de conteúdo de mensagens de texto em uma con-
versação, buscando gerar respostas coesas e relevantes. A abordagem de
Zhou et al. (2018) propõe uma Máquina de Chat Emocional (ECM, sigla em
inglês), acredita-se que seja o primeiro trabalho a incluir o fator emocional
na geração de conversas. Para determinar a emoção da resposta gerada,
a emoção mais frequente dos tópicos recentes é determinada de forma a
fornecer uma indicação da resposta geral.

5. CONSIDERAÇÕES FINAIS
O reconhecimento de emoções em texto é uma tarefa complexa. Ela
enfrenta desafios significativos, como: a dificuldade de estruturação de
informação textual, a padronização e limpeza de dados textuais, reduzin-
do a quantidade de dados e deixando apenas os dados importantes para o
domínio da aplicação, a dificuldade do reconhecimento imposta pela com-
plexidade das emoções, o fato de a emoção não ser um fator estático em
um texto, e a dificuldade de encontrar o modelo que melhor realiza a re-
presentação das emoções.
São muitos desafios impostos em uma única tarefa. No entanto, os
benefícios que o reconhecimento de emoções pode trazer a uma aplicação,
torna a área muito atrativa para pesquisadores. Uma empresa pode utilizar
uma aplicação de reconhecimento de emoção para saber qual a opinião
dos consumidores em relação a seus produtos ou serviços, ou ainda, um
político pode utilizar uma aplicação de reconhecimento de emoções em
redes sociais para saber qual o sentimento da população em relação a ele.
Esta é uma área de pesquisa recente e que ainda possui muito o que
evoluir. Também é uma área em amplo crescimento, principalmente com o

96 Ingryd Pereira e George DC Cavalcanti


popularidade das redes sociais e da grande geração de conteúdo por usuá-
rios. Além disso, é uma tendência a utilização de aplicações com caracterís-
ticas ou até mesmo todo o comportamento com entonação emocional, por
exemplo, um chatbot, que pode realizar o reconhecimento de emoção de
texto falado pelo usuário e gerar uma resposta com entonação emocional.

AGRADECIMENTOS

Esse trabalho foi parcialmente financiado pela CNPq (Conselho Na-


cional de Desenvolvimento Científico e Tecnológico).

REFERÊNCIAS

APPELQUIST, D.; BRICKLEY, D.; CARVAHLO, M.; IANNELLA, R.; PASSANT, A.; PEREY, C.;
STORY, H. A standards-based, open and privacy-aware social web. W3C Incubator Group
Report, Vol. 6, 2010.
BARRETT, L. Solving the emotion paradox: Categorization and the experience of emotion. Perso-
nality and Social Psychology Review, Vol. 10, n. 1, p. 20–46, 2006.
BOJANOWSKI, P.; GRAVE, E.; JOULIN, A.; MIKOLOV, T. Enriching word vectors with subword
information. Transactions of the Association for Computational Linguistics, Vol. 5, p.
135–146, 2017.
CALAIS GUERRA, P.; VELOSO, A.; MEIRA JR, W.; ALMEIDA, V. From bias to opinion: a trans-
fer-learning approach to real-time sentiment analysis. In: Proceedings of the 17th ACM
SIGKDD International Conference on Knowledge Discovery and Data Mining, p. 150–
158, 2011.
COUSSEMENT, K.; VAN DEN POEL, D. Integrating the voice of customers through call center
emails into a decision support system for churn prediction. Working papers of faculty of eco-
nomics and business administration, Ghent University, Belgium, Ghent University, Faculty of
Economics and Business Administration, 2008.
DESMET, B.; HOSTE, V. Emotion detection in suicide notes. Expert Systems with Applications,
Vol. 40, n. 16, p. 6351–6358, 2013.
DEVLIN, J.; CHANG, M.; LEE, K.; TOUTANOVA, K. Bert: Pre-training of deep bidirectional trans-
formers for language understanding. arXiv preprint arXiv:1810.04805, 2018.
EIRINAKI, M.; PISAL, S.; SINGH, J. Feature-based opinion mining and ranking. Journal of Com-
puter and System Sciences, Vol. 78, n. 4, p. 1175–1184, 2012.
EKMAN, P.; FRIESEN, W. Constants across cultures in the face and emotion. Journal of Perso-
nality and Social Psychology, Vol. 17, n. 2, 1971.
ESTRADA, M.; CABADA, R. Z.; BUSTILLOS, R.; GRAFF, M. Opinion mining and emotion recogni-
tion applied to learning environments. Expert Systems with Applications, 150:113265, 2020.
FEHR, B.; RUSSELL, J. Concept of emotion viewed from a prototype perspective. Journal of Ex-
perimental Psychology: General, Vol. 113, n. 3, p. 464, 1984
FOX, E. Emotion science: An integration of cognitive and neuroscience approaches. Palgra-
ve Macmillan, 2008.

MINERAÇÃO TEXTUAL PARA RECONHECIMENTO DE EMOÇÕES 97


GUNES, H.; SCHULLER, B.; PANTIC, M.; COWIE, R. Emotion representation, analysis and syn-
thesis in continuous space: A survey. In: Automatic Face & Gesture Recognition and Workshops
(FG 2011), International Conference on 2011 IEEE, pages 827–834. IEEE, 2011.
HUME, D. Emotions and moods. In: Organizational Behavior, p. 258–297, 2012.
LIU, Y.; OTT, M.; GOYAL, N.; DU, J.; JOSHI, M.; CHEN, D.; LEVY, O.; LEWIS, M.; ZETTLE-
MOYER, L.; STOYANOV, V. Roberta: A robustly optimized bert pretraining approach. arXiv
preprint arXiv:1907.11692, 2019.
MANNING, C.; RAGHAVAN, P.; SCHUTZE, H. Introduction to information retrieval. Cam-
bridge University Press, 2008.
MIKOLOV, T.; CHEN, K.; CORRADO, G.; DEAN, J. Efficient estimation of word representations
in vector space. arXiv preprint arXiv:1301.3781, 2013.
MOHAMMAD, S.; TURNEY, P. Emotions evoked by common words and phrases: Using mechani-
cal turk to create an emotion lexicon. In: Proceedings of the NAACL HLT 2010 workshop on
computational approaches to analysis and generation of emotion in text, p. 26–34. Association
for Computational Linguistics, 2010.
O’REILLY, T. What is web 2.0. ”O’Reilly Media, Inc.”, 2009.
PENNINGTON, J.; SOCHER, R.; MANNING, C. Glove: Global vectors for word representation.
In: Proceedings of the 2014 conference on empirical methods in natural language processing
(EMNLP), p. 1532–1543, 2014.
PETERS, M.; NEUMANN, M.; IYYER, M.; GARDNER, M.; CLARK, C.; LEE, K.; ZETTLEMOYER,
L. Deep contextualized word representations. arXiv preprint arXiv:1802.05365, 2018.
PLUTCHIK, R. The nature of emotions human emotions have deep evolutionary roots, a fact that
may explain their complexity and provide tools for clinical practice. American Scientist, Vol.
89, n. 4, p. :344–350, 2001.
RUSSELL, J. 13-reading emotion from and into faces: Resurrecting a dimensional-contextual pers-
pective. The psychology of facial expression, p. 295– 320, 1997.
SHARMA, A.; DEY, S. A comparative study of feature selection and machine learning techniques
for sentiment analysis. In: Proceedings of the 2012 ACM research in applied computation sympo-
sium, p. 1–7, 2012.
TOUTANOVA, K.; KLEIN, D.; MANNING, C.; SINGER, Y. Feature-rich part-of-speech tagging
with a cyclic dependency network. In: Proceedings of the 2003 conference of the North Ame-
rican chapter of the Association for Computational Linguistics on human language technology,
Vol. 1, p. 173–180. Association for Computational Linguistics, 2003.
WEISS, S.; INDURKHYA, N.; ZHANG, T.; DAMERAU, F. Text mining: predictive methods for
analyzing unstructured information. Springer Science & Business Media, 2010.
YADOLLAHI, A.; SHAHRAKI, A.; ZAIANE, O. Current state of text sentiment analysis from opi-
nion to emotion mining. ACM Computing Surveys (CSUR), Vol. 50, n. 2, p. 1– 33, 2017.
YANG, Z.; DAI, Z.; YANG, Y.; CARBONELL, J.; SALAKHUTDINOV, R.; LE, Q. Xlnet: Generali-
zed autoregressive pretraining for language understanding. In Advances in neural infor-
mation processing systems, p. 5754–5764, 2019.
ZHOU, H.; HUANG, M.; ZHANG, T.; ZHU, X.; LIU, B. Emotional chatting machine: Emotional
conversation generation with internal and external memory. In Thirty-Second AAAI Conferen-
ce on Artificial Intelligence, 2018.

98 Ingryd Pereira e George DC Cavalcanti


SOBRE OS AUTORES

ALEXANDRE MAGNO ANDRADE MACIEL possui graduação em Ciência da Compu-


tação pela Universidade Católica de Pernambuco (2003), mestrado e doutorado em Ciência da
Computação pela Universidade Federal de Pernambuco (2007 e 2012) e Livre Docência pela
Universidade de Pernambuco (2018). Atualmente é Cientista-chefe do Parque Tecnológico de
Eletro-eletrônicos de Pernambuco (Parqtel). Foi Coordenador Geral de Inovação e Cientista-che-
fe do Instituto de Inovação Tecnológica da Universidade de Pernambuco. Faz parte do quadro
efetivo da Escola Politécnica de Pernambuco na qual é professor associado da Graduação em En-
genharia da Computação, membro permanente do Programa de Pós-Graduação em Engenharia
da Computação e coordenador da Especialização em Ciência de Dados e Analytics. É membro da
Câmara de Inovação da FACEPE (Fundação de Amparo à Pesquisa do Estado de Pernambuco) e
foi Pesquisador Visitante da Agência Estadual de Tecnologia da Informação (ATI). É Bolsista de
Produtividade em Desenvolvimento Tecnológico do CNPq - Nível 2, recebeu o Prêmio Santan-
der de Ciência e Inovação na categoria Tecnologia da Informação e Educação e é co-fundador
da empresa Vocal Lab Sistemas da Informação LTDA. Tem experiência na área de Ciência da
Computação, com ênfase em Inteligência Computacional, atuando principalmente nos seguintes
temas: Reconhecimento de Padrões e Mineração de Dados e Informática na Educação.
alexandre.maciel@upe.br

ALICE C. F. DE SOUZA é graduada em Comunicação Social – Habilidade em Jornalismo,


pós-graduada em Direitos Humanos e mestre em Indústrias Criativas, pela Universidade Cató-
lica de Pernambuco (Unicap). É repórter licenciada do Diario de Pernambuco, onde cobre há
10 anos desenvolvimento urbano, direitos humanos e saúde; e colaboradora da Agência Retruco
de Jornalismo. Atualmente, é integrante do projeto Confere.ai, uma ferramenta para checagem
automática de fatos desenvolvida em parceria com o Sistema Jornal do Commercio de Comuni-
cação (SJCC) e selecionada pelo Desafio de Inovação do Google News Initiative (GNI) na Amé-
rica Latina. Alice de Souza é ainda integrante da 3ª Geração da Rede de Jovens Jornalistas da
América Latina Distintas Latitudes, ex-bolsista Cosecha Roja e bolsista da Fundação Gabo. Tem
29 anos e trabalhos reconhecidos em mais de 30 prêmios locais, nacionais e internacionais de
jornalismo. Foi a repórter mais premiada do Nordeste nos anos de 2018 e 2019, segundo ranking
do Jornalistas&Cia. 
alicecristiny@gmail.com

ANTHONY LINS é Doutor em Biotecnologia pelo Renorbio (UFRPE), tendo como tema de
pesquisa Aplicação de Aprendizagem de Máquina no Diagnóstico de Declínio Cognitivo e De-
mência de Alzheimer baseado em Testes Cognitivos e Marcadores Genéticos. Possui título de
Mestre em Engenharia da Computação, com ênfase em Inteligência Computacional (Poli/UPE),

99
onde pesquisou a Paralelização de Algoritmos baseados em Cardumes utilizando Unidades de
Processamento Gráfico. Atualmente na Universidade Católica de Pernambuco, está como docen-
te e pesquisador no curso de Jogos Digitais, no Mestrado em Indústrias Criativas e do Núcleo de
Pesquisas em Ciências Ambientais e Biotecnologia. Obteve o 1o lugar na 8a edição do Torneio
Regional de Inteligência Computacional do IEEE Argentina CIS – 2018. É pesquisador entusiasta
na área de inteligência computacional aplicada em saúde e processos ambientais, jogos e arte-
fatos interativos. Consultor em projetos de inovação com Inteligência Artificial junto a diversas
empresas como Fitec, Sistema Jornal do Commercio de Comunicação, In Forma e Pickcells.
anthony.lins@unicap.br

ANTONIO HENRIQUE COUTELO DE MORAES é licenciado em Letras – Português e


Inglês (2009), Mestre (2012) e Doutor (2018) em Ciências da Linguagem pela Universidade Ca-
tólica de Pernambuco. Licenciado em Pedagogia pelo Centro Universitário Internacional (2017).
Atualmente é professor e coordenador dos cursos de Letras – Português e Inglês e Letras – Por-
tuguês e Espanhol do Centro de Teologia e Ciências Humanas da Universidade Católica de Per-
nambuco, e Professor Colaborador do Programa de Pós-graduação em Ciências da Linguagem.
Tem experiência na área de Letras, atuando principalmente nos seguintes temas: língua estran-
geira, inglês, português, surdo, ensino-aprendizagem, Libras e Tecnologias.
antonio.moraes@unicap.br

CARMELO J. A. BASTOS FILHO é, atualmente, Diretor de Ambientes de Inovação e For-


mação Superior da Secretaria de Ciência, Tecnologia e Inovação de Pernambuco, professor as-
sociado do quadro efetivo da Escola Politécnica da Universidade de Pernambuco (UPE) e livre
docente. É o coordenador da Rota TIC Mangue Digital, ação conjunta com a SUDENE e MDR. É
o coordenador da especialização em Inteligência Artificial da UPE. É conselheiro da Sociedade
Brasileira de Inteligência Computacional, sócio conselheiro da Sociedade Brasileira de Ótica e
Fotônica (SBFOTON), sócio da Sociedade Brasileira de Microondas e Optoeletrônica (SBMO)
e Membro sênior do IEEE. Ele é Bolsista de Produtividade em Pesquisa do CNPq desde 2008,
sendo promovido a bolsista nível 1D em 2018. Ele publicou em torno de 300 artigos científicos
e coordenou vários projetos de pesquisa financiados pelo CNPq/Universal, FACEPE, FINEP,
CHESF (P&D ANEEL), FITec, Alcatel-Lucent e Fiat-Chrysler.
carmelo.filho@upe.br

DARIO BRITO ROCHA JÚNIOR é graduado em Comunicação Social – Habilitação em


Jornalismo pela Universidade Católica de Pernambuco (2001, mestre em Letras/Linguística e
doutor em Design da Informação (ambos pela Universidade Federal de Pernambuco – 2005 e
2017). Atualmente é professor nos cursos de graduação em Jornalismo e em Jogos Digitais e do
Mestrado Profissional em Indústrias Criativas da Universidade Católica de Pernambuco. Tem
experiência na área de Comunicação, com ênfase em Jornalismo e Editoração, atuando princi-
palmente nos seguintes temas: narrativa transmídia, linguagem, editoração, multimodalidade,
coerência e suporte. Atuou no Jornal do Commercio (PE) durante dez anos ocupando cargos de
repórter, repórter sênior, colunista assistente e editor assistente, tendo vencido e/ou sendo fina-
lista, entre outros, de prêmios como o Carrefour de Jornalismo e o Imprensa Embratel.
dario.brito@unicap.br

FELIPE SANTANA BATISTA DOS SANTOS é natural de Recife, Pernambuco, Mestrando


em Engenharia de Software pela Universidade Federal de Pernambuco (UFPE). É Bacharel em
Ciência da Computação na Universidade Católica de Pernambuco (UNICAP). Atuou como pes-

100 Ingryd Pereira e George DC Cavalcanti


quisador no Programa de Iniciação Científica (PIBIC) na área de Linguística, Letras e artes pela
UNICAP, no desenvolvimento de aplicativos destinados ao transtorno da Dislexia. Atua como
Engenheiro de Software no Centro de Estudos e Sistemas Avançados do Recife (C.E.S.A.R).
Tem experiência na área de desenvolvimento Web e Mobile, gestão de processos com BPMN e
desenvolvimento de sistemas Omnichannel com Processamento de Linguagem Natural (PLN).
felipe.santanasb@gmail.com

FRANCISCO MADEIRO é natural de Fortaleza, Ceará. Tem Doutorado em Engenharia


Elétrica pela Universidade Federal da Paraíba (2001), atual Universidade Federal de Campina
Grande (UFCG). É bolsista de Produtividade em Pesquisa (PQ) do Conselho Nacional de De-
senvolvimento Científico e Tecnológico (CNPq). De 2012 a 2018 foi bolsista de Produtividade
em Desenvolvimento Tecnológico e Extensão Inovadora (DT) do CNPq. É Professor Associado
da Universidade de Pernambuco (UPE) e Professor Adjunto da Universidade Católica de Per-
nambuco (UNICAP). Suas atividades de pesquisa concentram-se em processamento de sinais,
telecomunicações, inteligência computacional e tecnologias da informação e da comunicação
aplicadas a ciências da linguagem. Em 2008 recebeu o prêmio Destaque em Ensino da Escola
Politécnica de Pernambuco (POLI) da UPE. Em 2013 recebeu o Troféu Ciência e Tecnologia,
categorias Destaque em Pesquisa e Destaque em Ensino, da POLI/UPE. Recebeu o Prêmio PO-
LI-UPE-Ciência, Tecnologia e Inovação, categoria Destaque em Pesquisa, ano 2018. Tem atuado
na liderança de equipes multidisciplinares para o desenvolvimento de aplicativos voltados para
dislexia. Obteve Livre-Docência pela UPE em 2014.
francisco.madeiro@unicap.br

GEORGE DARMITON DA CUNHA CAVALCANTI é Doutor em Ciência da Computa-


ção pela Universidade Federal de Pernambuco. Atualmente, Cavalcanti é professor associado
do Centro de Informática (CIn) da Universidade Federal de Pernambuco (UFPE) e membro
associado do Laboratório de Imagem, Visão e Inteligência Artificial da École de Technologie
Supérieure (ETS), Montreal, Canadá. Cavalcanti é bolsista de produtividade do CNPq desde de
2011 e atualmente é bolsista nível PQ-1D. Em 2019, foi professor visitante na École de Technolo-
gie Supérieure, Montreal, Canadá. Autor de mais de 200 artigos publicados em periódicos e em
congressos internacionais. Suas áreas de pesquisa incluem aprendizagem de máquina, reconhe-
cimento de padrões, processamento de imagens e visão computacional.
gdcc@cin.ufpe.br

HEMIR DA CUNHA SANTIAGO é Doutor em Ciência da Computação com ênfase em Inte-


ligência Computacional pela Universidade Federal de Pernambuco (UFPE). Atualmente, realiza
estágio de pós-doutorado no Programa de Pós-Graduação em Engenharia de Sistemas PPGES, na
Universidade de Pernambuco (UPE). É pesquisador em projetos de P&D na In Forma Software,
empresa de tecnologia da informação para a gestão integrada de ativos em empresas do setor
elétrico, e professor do curso superior de Tecnologia em Análise e Desenvolvimento de Sistemas
na Faculdade Senac. Suas áreas de pesquisa incluem estimação de movimento, reconhecimento
de expressões faciais, reconhecimento de atividades humanas, visão computacional, gestão de
riscos e data science.
hemir.santiago@gmail.com

INGRYD VANESSA DE SÁ TELES PEREIRA é doutoranda em Ciência da Computação


pela Universidade Federal de Pernambuco (UFPE), mestre em Engenharia da Computação pela
Universidade de Pernambuco (UPE) e bacharel em Sistemas de Informação pela Universidade

Sobre os autores 101


Federal Rural de Pernambuco (UFRPE), Unidade Acadêmica de Serra Talhada (UAST). Foi in-
tegrante do grupo de pesquisa MiningBR, no qual realizou estudos sobre Mineração de Textos,
mais especificamente na área de Análise de Sentimento. Em 2017-2018 fez parceria com a Uni-
versidade de Hamburgo, no qual realizou pesquisas na área de computação afetiva. Suas áreas
de pesquisa incluem reconhecimento de padrões, aprendizado de máquina, computação afetiva,
processamento de áudio e mineração de texto.
ivstp@cin.ufpe.br

LEÔNIDAS JOSÉ DA SILVA JR. é linguista com graduação em Turismo pela Universidade
Católica de Pernambuco (1998) e em Letras (português e inglês) pela União das Escolas Superio-
res da Funeso (2004), mestrado em Linguística pela Universidade Federal da Paraíba (2009) e
doutorado em Linguística pela Universidade Federal da Paraíba (2013). Tem pós-doutorado em
Fonética experimental com ênfase em Prosódia de L2 pela Universidade Estadual de Campinas
(2019). Atualmente é Professor Adjunto 3 da Universidade Estadual da Paraíba e Pesquisador de
Pós-Doutorado em Fonética experimental pela Universidade Estadual de Campinas com ênfase
em Análise fonético-forense a partir da Prosódia de L2. Sua área de atuação é a Fonética experi-
mental, especialmente os seguintes temas: análise e modelamento do segmento e da prosódia da
fala, prosódia experimental de L2, ciências da fala e da linguagem, ensino de fonética (de L2) do
inglês. É membro da Luso-Brazilian Association of Speech Sciences (LBASS) e do Phonologie de
l’Anglais Contemporain – (PAC) e do corpo editorial de alguns periódicos nacionais. Tem publi-
cações em periódicos especializados e anais de congressos nacionais e internacionais.
leonidas.silvajr@gmail.com

LUCIANA CIDRIM possui graduação em Fonoaudiologia (1995) pela Universidade Católica


de Pernambuco (UNICAP), Mestre (2004) e Doutora (2019) em Ciências da Linguagem pela UNI-
CAP. Atualmente realiza estágio pós-doutoral na UNICAP. É graduanda em Formação Pedagógi-
ca em Letras pelo Centro Universitário UNINTER. Especialista em Linguagem e Fonoaudiologia
Educacional pelo Conselho Federal de Fonoaudiologia (CFFa.). Tem formação em Dislexia pela
Associação Brasileira de Dislexia (ABD/SP). É membro da Sociedade Brasileira de Fonoaudiolo-
gia. Participa de projetos de desenvolvimento de aplicativos destinados a escolares com transtor-
nos de aprendizagem, em especial, dislexia.
luciana.cidrim@unicap.br

MATHEUS MARINHO é Mestrando em Inteligência Computacional pela Universidade de


Pernambuco (UPE) e formado em Ciência da Computação na Universidade Católica de Pernam-
buco (UNICAP). Foi aluno PIBIC entre os anos 2016 e 2018 na área de pesquisa envolvendo
dependabilidade e modelagem utilizando Redes de Petri, sendo premiado em terceiro lugar na
categoria de ciências exatas e da terra na 19ª Jornada de Iniciação Científica (2017), realizada
pela UNICAP. Atualmente é Líder Técnico em um projeto de desenvolvimento de uma ferra-
menta inteligente para verificação automática de fatos.
matheuzmarinho@gmail.com

RAQUEL BEZERRA CALADO é Bacharel em Sistemas de Informação pela Universidade


de  Pernambuco e Mestre em Engenharia da Computação pela Universidade de Pernambuco.
Atuou durante dois anos como pesquisadora bolsista na empresa Kurier Tecnologia, onde desen-
volveu sua pesquisa com foco em mineração de documentos textuais não estruturados e classifi-
cação de documentos jurídicos, essas são também suas áreas de estudo atualmente.
rbc2@ecomp.poli.br

102 Ingryd Pereira e George DC Cavalcanti


TEÓFILO RIBEIRO DA SILVA NETO nasceu em Paulista, Pernambuco, Brasil, 1998. Alu-
no do Curso de Bacharelado em Ciência da Computação na Universidade Católica de Pernambu-
co (UNICAP). Atuou como pesquisador no Programa de Iniciação Científica (PIBIC) na área de
Linguística, Letras e Artes. Atua como Desenvolvedor de Software. Tem experiência na área de
Sistemas Distribuídos e Desenvolvimento Mobile.
teofilo_ribeiro@hotmail.com

PLÍNIO A. BARBOSA é linguista com graduação em Engenharia Eletrônica pelo Institu-


to Tecnológico de Aeronáutica (1988), mestrado em Engenharia Eletrônica e Computação pelo
Instituto Tecnológico de Aeronáutica (1990) e doutorado em Signal-Image-Parole/Option Parole
pelo Institut de la Communication Parlée e Institut National Polytechnique de Grenoble, Fran-
ça (1994). Tem título de livre-docente em Fonética e Fonologia pela Universidade Estadual de
Campinas (2006). Atualmente é professor associado 3 da Universidade Estadual de Campinas.
Sua área de atuação é a Fonética experimental, especialmente os seguintes temas: análise e
modelamento da prosódia da fala, prosódia experimental, teoria de sistemas dinâmicos e de
osciladores acoplados, ciências da fala e da linguagem, ensino de fonética do francês. É membro
do conselho da International Phonetic Association, do corpo editorial de vários periódicos na-
cionais e internacionais. Tem mais de 140 publicações em periódicos especializados e anais de
congressos nacionais e internacionais. É também o autor de Incursões em torno do ritmo da fala
pela Pontes, Prosódia pela Parábola e Manual de Fonética Acústica Experimental com Sandra
Madureira (PUC-SP).
pabarbosa.unicampbr@gmail.com

WASLON TERLLIZZIE ARAÚJO LOPES nasceu em Petrolina, Pernambuco, em 29 de


dezembro de 1974. Recebeu o diploma de Engenheiro Eletricista e o título de Mestre em Enge-
nharia Elétrica pela Universidade Federal da Paraíba em 1998 e 1999, respectivamente. Recebeu
o título de Doutor em Engenharia Elétrica pela Universidade Federal de Campina Grande em
junho de 2003. Foi professor e chefe do Núcleo de Telecomunicações do Curso de Engenharia
Elétrica da Faculdade ÁREA1, Salvador, BA, no período de agosto de 2003 a dezembro de 2009.
Waslon Terllizzie foi professor do Departamento de Engenharia Elétrica da Universidade Fede-
ral de Campina Grande de dezembro de 2009 a março de 2015 onde atuou como tutor do Grupo
PET-Engenharia Elétrica da UFCG de março de 2014 a abril de 2015. Foi Professor Visitante
na Universidade de Toronto, Canadá, entre novembro de 2018 e outubro de 2019. Atualmente
é Professor Associado do Departamento de Engenharia Elétrica do Centro de Energias Alter-
nativas e Renováveis da Universidade Federal da Paraíba em João Pessoa. Suas atividades de
pesquisa concentram-se em quantização vetorial robusta, sistemas de comunicações sem fio,
comunicações móveis, teoria das comunicações e processamento digital de imagens e sinais de
voz, áreas em que tem mais de duas centenas de trabalhos publicados em congressos, revistas e
livros, nacionais e internacionais.
waslon@ieee.org

Sobre os autores 103

Você também pode gostar