Escolar Documentos
Profissional Documentos
Cultura Documentos
❑ Aplicações de NLP.
Jacob Eisenstein
Aplicações
• Classificação de texto.
• Sumarização de texto.
– Tokenização.
– Normalização.
– Anotação.
Tokenização
• Textos → Unidades de processamento:
“At eight o'clock on Thursday morning... Arthur didn't feel very good.”
• Como tokenizar:
– Rio de Janeiro.
– Fernando Pessoa.
– Fim de semana.
Normalização
Tokens com grafias distintas (mas mesmo significado)
• Stemização (Stemming):
• Lematização (Lemmatization):
? Aplicações de NLP.
– Principais etapas
– Framework CRISP-DM
Conteúdo coberto
• Processamento de Linguagem Natural (NLP).
– Definição
– Aplicações de NLP
– Técnicas de Pré-processamento