Escolar Documentos
Profissional Documentos
Cultura Documentos
Agenda
• Converter PDF em plain text
• Use Python
• Stop Words
• Pesquise as bibliotecas apropriadas
Cronograma de atividades
3/14
Prof. Alberto Pena Lara Aula No 25/40 : Stop words
Analíse automática de artigos
4/14
Prof. Alberto Pena Lara Aula No 25/40 : Stop words
Conversão PDF plain text
5/14
Prof. Alberto Pena Lara Aula No 25/40 : Stop words
Conversão PDF em plain text
Dados quantitativos
6/14
Prof. Alberto Pena Lara Aula No 25/40 : Stop words
Bibliotecas
7/14
Prof. Alberto Pena Lara Aula No 25/40 : Stop words
Arquivos Natural Language Tool Kit
import n l t k 3
import s t r i n g 4
import m a t p l o t l i b . p y p l o t as p l t 6
8/14
Prof. Alberto Pena Lara Aula No 25/40 : Stop words
Stop words
9/14
Prof. Alberto Pena Lara Aula No 25/40 : Stop words
Código 2: Remover stopwords
10/14
Prof. Alberto Pena Lara Aula No 25/40 : Stop words
Words cloud
11/14
Prof. Alberto Pena Lara Aula No 25/40 : Stop words
Código 3: Gerar Words Cloud
12/14
Prof. Alberto Pena Lara Aula No 25/40 : Stop words
Figura 1: Words Cloud
Atividade individual
Use as bibliotecas Python supracitadas
1 Use o programa da aula anterior.
A-23
2 Comverter o PDF em plain text.
3 Remova as stop words.
4 Gere uma lista de palavras
5 Crie para cada três artigos da sua bibliografia um Word Cloud
6 Use o programa do 2o bimestre para plotar as Word Clouds.
14/14
Prof. Alberto Pena Lara Aula No 25/40 : Stop words