Você está na página 1de 7

UNIVESP

RELATÓRIO FINAL DE ESTÁGIO NÃO


OBRIGATÓRIO

Engenharia de Computação
Polo Guaratinguetá/SP

Augusto Henrique Fornitani de Aguiar Cerqueira — RA 2003869


UNIVESP - Relatório Final de Estágio (Engenharias)

Sumário
1. Introdução / apresentação da instituição.............................................................................4
2. Atividades desenvolvidas durante o estágio........................................................................5
3. Considerações finais...........................................................................................................6
4. Referências bibliográficas...................................................................................................7
3

UNIVESP - Relatório Final de Estágio (Engenharias)

RELATÓRIO FINAL DE ESTÁGIO NÃO OBRIGATÓRIO

APRESENTAÇÃO

Nome: Augusto Henrique Fornitani de Aguiar Cerqueira RA: 2003869

Curso: Engenharia de Computação

Nome do Supervisor Responsável pela Empresa: Erick Nimtz

Empresa/Entidade: Etapa Educacional - Eireli

Ramo de Atividade: Ensino

Período de Estágio: de: 01 / 06 / 2021 a 22 / 06 / 2022


4

UNIVESP - Relatório Final de Estágio (Engenharias)

1. Introdução / apresentação da instituição

Fundada no início dos anos 1970 por um grupo de jovens recém-formados da


Universidade de São Paulo, inicialmente a empresa tinha como objetivo ajudar o
acesso de estudantes a boas universidades, na forma de curso pré-vestibular.
Tendo obtido grande êxito nessa empreitada, o grupo continuou crescendo.
Na década seguinte, foi fundado o Colégio Etapa. Continuando sua trajetória, em
1990 foi criado o Sistema Etapa, para difundir o conteúdo e valores do grupo para
colégios parceiros. Atualmente, o nome “Etapa” é fortemente reconhecido, porque
muitos de seus alunos são aprovados nas melhores universidades nacionais e
internacionais.
Entre os principais serviços disponibilizados pelo grupo, há o curso
preparatório para vestibulares (presente em 4 unidades), o colégio com ensino
infantil ao médio (3 unidades em 2 cidades), sistema pedagógico completo (Sistema
Etapa, para escolas parceiras), ensino superior (faculdade ESEG) e colégio especial
para estudantes que pretendem estudar no exterior (Etapa Internacional). Além
disso, para suporte às operações da empresa, há a Gráfica Editora Guteplan, para
atendimento às escolas do grupo e do sistema Etapa; e a Editora Núcleo, para
desenvolvimento do material.
Com tantos ramos de atuação e forte competição no mercado em que a
empresa atua, é necessário um alto investimento em tecnologia. Por isso, em 2018 o
Grupo Etapa consolidou seus esforços na compra e reforma de um edifício inteiro,
voltado à tecnologia da empresa. Hoje, o edifício localizado à Rua Vergueiro, 1883
(em São Paulo/SP) deixa claro logo em sua entrada o compromisso do Grupo Etapa
com a tecnologia: há ali uma grande placa, com o logotipo da empresa e o nome
“Centro de Tecnologia e Pesquisa Educacional”.
Nesse novo prédio, há um setor inteiro dedicado à criação de sites, bancos de
dados, jogos educacionais, suporte técnico e pedagógico. No mesmo setor, situa-se
a equipe de Ciência de Dados, que atua de integradamente às demais equipes.
É nesse contexto que se apresenta a ligação entre empresa e universidade —
conforme estabelecido no Projeto Pedagógico dos Bacharelados da Univesp, em
sua seção 2.2, objetivos dos cursos incluem fomentar: a capacidade de identificar e
resolver problemas; buscar e produzir conhecimento; tomar decisões em cenários de
5

UNIVESP - Relatório Final de Estágio (Engenharias)

incertezas, entre outros. Tais objetivos acadêmicos são, também, partes


fundamentais na carreira do profissional em Computação.
Por fim, destacando os objetivos propostos: aprender sobre os fundamentos e
possibilidades da carreira de Ciência de Dados, em complemento à atuação
profissional anterior, como designer e desenvolvedor web.

2. Atividades desenvolvidas durante o estágio

Dentro dessa empresa, a área de Ciência de Dados atua na extração e


recebimento de dados de diversas fontes, sejam bancos de dados ou registros em
outros formatos, como PDF. Grande parte do trabalho consiste na extração e
tratamento de dados, para ficarem disponíveis em formatos mais modernos e
propícios ao trabalho com código.
Um exemplo: para saber quais alunos foram aprovados em determinada
universidade, uma das tarefas envolvia converter o PDF da lista de aprovados em
texto, transformar o texto em formato tabular (como .csv ou .pickle), comparar o
dataframe gerado com registros nos bancos de dados e gerar um novo dataframe
com registros de alunos Etapa aprovados. Para que mais registros fossem pareados
(entre a base de dados da empresa e as listas de aprovados das universidades), o
estagiário desenvolveu métodos de comparação com junção difusa (fuzzy match).
Em outra atividade recorrente, fazia-se um modelo de regressão logística
para predizer quais características (features) dos registros de candidatos (a uma
prova para obtenção de bolsas no Colégio Etapa) seriam as mais importantes. Tal
tarefa recorrente envolveu tratar dados, cruzá-los com outros de diversas fontes
internas e externas, para que no fim fosse criado um modelo de grande precisão.
Essa prova de bolsas também inclui a tarefa de correção da prova de acordo com
TRI – Teoria de Resposta ao Item. Todos esses estágios foram consolidados em
scripts, desenvolvidos pelo estagiário.
Na mesma linha de pensamento, de ETL (extract, transform, load), foram
conduzidos trabalhos de agrupamento (clustering), para que o Colégio tivesse
formas numéricas de se comparar a concorrentes, considerando certos conjuntos de
dados.
Diversas foram as ferramentas vistas na empresa, que também foram
apresentadas no conteúdo da Univesp: Python, SQL, notebooks Jupyter, IDEs.
6

UNIVESP - Relatório Final de Estágio (Engenharias)

Também o conhecimento em Cálculo, Estatística e afins, obtido no ambiente


acadêmico, teve aplicação direta em diversas ocasiões.
Durante todas as tarefas, o conhecimento técnico obtido em disciplinas da
Univesp foram essenciais, destacando-se: PES300 (Estatística e Probabilidade) e
COM120 (Algoritmos e Programação de Computadores), COM150 (Fundamentos
Matemáticos para Computação), COM160 (Estruturas de Dados), COM300 (Bancos
de Dados). Também foram muito importantes as disciplinas do Semestre Comum:
SOC100, LET110, LET100 e INT100. Sem estas últimas, teria tido mais dificuldades
com a parte “social” do trabalho, pois o conhecimento técnico não é o mais
importante, no contexto educacional.
Algumas tarefas, por sua especialização, não foram cobertas pelas disciplinas
da Univesp, mas os conceitos gerais foram úteis. Um exemplo: conhecimento sobre
a Teoria de Resposta ao Item (TRI). Por ser específico, não cabe tratar disso
durante o curso, mas por ser uma teoria com fortes fundamentos matemáticos
(originalmente vem da Psicometria), as bases estabelecidas na matriz curricular da
Univesp permitiram adentrar de forma bem sucedida o campo de conhecimento
abrangido pela TRI.
De igual modo, ferramentas específicas da área não foram abordadas.
Exemplos incluem: Orange Data Mining, KNIME Desktop, R, Julia.

3. Considerações finais

Pode-se concluir que o objetivo inicial, que era aprender sobre a prática
profissional de Ciência de Dados, de maneira a complementar minha formação
preexistente, foi atingido. Não só pude por em prática e solidificar os conhecimentos
aprendidos com a Univesp, mas também pude aprender diversas novas ferramentas
e técnicas, que possivelmente não teria visto.
Pontos positivos incluem a grande liberdade em usar o tempo no escritório
para leituras de conteúdo científico: artigos, papers, publicações e afins. Uma
grande parte do tempo foi usada para aprender a teoria (buscando via Google
Scholar e ferramentas similares). Já sobre os negativos, o principal foi a
comunicação: a equipe toda vinha de formações diferentes, e de certa forma estava
desconexa, de forma que a cada momento se falava em “línguas diferentes”, quando
o objetivo final era o mesmo. Isso atrapalhou o progresso consideravelmente,
7

UNIVESP - Relatório Final de Estágio (Engenharias)

principalmente no começo. Um exemplo, falou-se informalmente “dummyzação”,


quando o termo que teria me indicado um melhor caminho de estudo seria
“classificação binária” ou “one-hot encoding”.
De forma geral, foi um bom aprendizado para se ter ideia do que é possível na
área, indo de encontro aos objetivos iniciais.

4. Referências bibliográficas

ROVER, Ardinete; MELLO, Regina Oneda. Normas da ABNT: Orientações


para a produção científica. 1. ed. Joaçaba: Editora Unesc, 2020.

Você também pode gostar