Escolar Documentos
Profissional Documentos
Cultura Documentos
A BIG DATA E
INTERNET DAS
COISAS (IOT)
Priscila Gonçalves
Mineração de textos
(Text Mining)
Objetivos de aprendizagem
Ao final deste texto, você deve apresentar os seguintes aprendizados:
Introdução
O processo de extração de conhecimento e informação a partir de dados
de bases textuais é denominado Text Mining — mineração de textos em
português — e pode ser realizado a partir de diversas técnicas, cada vez
mais desenvolvidas.
Neste capítulo, você aprenderá a reconhecer o conceito de Text Mining,
saberá descrever o processo de descoberta de conhecimento em textos
e conhecerá as principais ferramentas de mineração de textos.
de dados. Essa técnica é bastante utilizada pelo marketing para saber quais
objetos podem ajudar na segmentação, como, por exemplo, segmentando o
mercado em subconjuntos de clientes, e cada um desses subconjuntos poderá
ser direcionado para uma estratégia de marketing diferente, com padrões
diferentes para diferentes tipos de clientes.
■ tokenização;
■ remoção de StopWords;
■ redução do léxico;
■ frequência de documentos;
■ naive Bayes;
■ conflação;
■ normalização de sinônimos;
■ indexação.
Mineração: o minerador detectará padrões embasado no algoritmo definido.
Assimilação: os usuários/clientes utilizarão conhecimento gerado para
apoiar decisões que devam ser tomadas.
Acesse o site a seguir e saiba mais a respeito das informações não estruturadas e da
mineração de textos.
https://goo.gl/9XZEBF
Mineração de textos (Text Mining) 11
Leituras recomendadas
ARANHA, C. et al. Um modelo de desambigüização de palavras e contextos. 2004. Disponível
em: <http://www.lbd.dcc.ufmg.br/colecoes/til/2004/0011.pdf>. Acesso em: 4 jan. 2019.
BRITO, M. Aspectos teóricos da mineração de dados e aplicação das regras de classifica-
ção para apoiar o comércio. 2012. Disponível em: <https://www.devmedia.com.br/
aspectos-teoricos-da-mineracao-de-dados-e-aplicacao-das-regras-de-classificacao-
-para-apoiar-o-comercio/25429 >. Acesso em: 4 jan. 2019.
DP6. Text Mining: extraindo informação de dados não estruturados. 06 fev. 2016. Dispo-
nível em: <https://blog.dp6.com.br/text-mining-extraindo-informa%C3%A7%C3%A3o-
-de-dados-n%C3%A3o-estruturados-fc509ff3043c>. Acesso em: 4 jan. 2019.
12 Mineração de textos (Text Mining)
FAYYAD, U. M.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From Data Mining to Knowledge Discovery
in Databases. Artificial Intelligence Magazine, v. 17, n. 3, p. 37-54, 1996. Disponível em: <ht-
tps://www.aaai.org/ojs/index.php/aimagazine/article/view/1230>. Acesso em: 4 jan. 2019.
FELDMAN, R.; SANGER, J. TheText Mining Handbook. Cambridge: Cambridge University
Press, 2009.
FERREIRA, R. S. 10 Ferramentas e bibliotecas para trabalhar com Data Mining e Big Data – Parte
1. 02 jun. 2017. Disponível em: <https://imasters.com.br/data/10-ferramentas-e-bibliotecas-
-para-trabalhar-com-data-mining-e-big-data-parte-01>. Acesso em: 4 jan. 2019.
GONÇALVES, L. Categorização em Text Mining. 2002. 173 f. Dissertação (Mestrado em
Ciências da Computação e Matemática Computacional) – Universidade de São Paulo,
São Carlos, 2002. Disponível em: <http://www.teses.usp.br/teses/disponiveis/55/55134/
tde-22062015-202748/publico/LeaSilviaMGoncalves.pdf>. Acesso em: 4 jan. 2019.
PIATETSKY, G. R, Python Duel As Top Analytics, Data Science software. 2016. Disponível
em: <https://www.kdnuggets.com/2016/06/r-python-top-analytics-data-mining-data-
-science-software.html>. Acesso em: 4 jan. 2019.
RAMAKRISHNAN, R.; GEHRKE, J. Sistemas de Gerenciamento de Banco de Dados. 3. ed.
Porto Alegre: Penso, 2013.
Conteúdo: