Você está na página 1de 2

Atividade de Aula – Trabalho Prático

Disciplina ASP – Análise de Sentimento e Processamento de Texto

Nome do aluno

Nome do aluno

Nome do aluno

Nome do aluno

Nome do aluno

Objetivos
Exercitar os seguintes conceitos vistos em aula:

 Utilizar um modelo vetorizado de comentários contidos em um dataset.

 Realizar o treino de um modelo baseado em um dataset.

 Realizar predições com os dados de teste.

 Avaliar a eficiência do modelo.

Enunciado

Utilizando os arquivos .pkl gerados com a vetorização dos textos, criem um modelo preditivo
no Colaboratory que utilize os arquivos de treino e teste do Kaggle In Class no link:
https://www.kaggle.com/t/84ccdf9070e24f9092fdc4ad8ad400b5 para gerar dados de
sentimentos. Em seguida, para avaliar seu modelo, utilize a métrica de precisão média, a
função da biblioteca scikit-learn conhecida como score() . Utilize cada um dos .pkl para
verificar qual deles terá a melhor taxa de acerto ao final. Esse score deverá ser submetido
no Kaggle in Class, onde haverá um rankeamento dos melhores resultados.

Atividades

Os alunos deverão desempenhar as seguintes atividades:

1. Criar um modelo preditivo de análise de sentimentos utilizando os arquivos de treino


e teste do Kaggle.

2. Usar os arquivos pkl de cada membro do grupo para verificar a performance do


modelo.

3. Avaliar o modelo utilizando a métrica score do scikit learn, também conhecida como
precisão média.

4. Gerar um arquivo csv separado por vírgulas contendo o id de cada frase do arquivo
de teste e o valor que foi predito para o sentimento (1 ou 0). O arquivo terá o seguinte
formato:

Id,Predicted
5814_8,1
12081_1,0
2314_2,1

5. Submeter o arquivo no Kaggle in Class.

6. Compartilhar com o professor o link do Colaboratory criado.

7. A sua solução pode conter descrições à vontade no código sobre eventuais escolhas
na implementação.

Você também pode gostar