Você está na página 1de 20

ANÁLISE DESCRITIVA DOS DADOS DE UM CURSO DE CAPACITAÇÃO

PROFISSIONAL ONLINE USANDO A LINGUAGEM DE PROGRAMAÇÃO


R – UM ESTUDO DE CASO

Thiago Marques Teixeira de Oliveira - ProfEstathiMarques@gmail.com


Centro Federal de Educação Tecnológica Celso Suckow da Fonseca

Leonardo Trajano Dias Garcia - leotrajano97@gmail.com


Centro Federal de Educação Tecnológica Celso Suckow da Fonseca

Lucas Daflon Scoralick - lucasdafsco@gmail.com


Centro Federal de Educação Tecnológica Celso Suckow da Fonseca

Gildete Aparecida Mendonça de Morais - gildete.morais@aluno.cefet-rj.br


Centro Federal de Educação Tecnológica Celso Suckow da Fonseca

Resumo: Este estudo apresenta uma análise descritiva dos dados provenientes do curso
“Comunidade de Estatística e Ciência de Dados” realizado de forma online, utilizando a
linguagem de programação R como ferramenta de análise estatística. O artigo constitui um
estudo de caso, explorando os dados coletados do referido curso. A pesquisa inicia-se
contextualizando o cenário do curso e destacando a importância da análise descritiva na
compreensão dos padrões e tendências dos dados. A metodologia adotada abrange a
coleta de dados, seguida pela preparação e organização das variáveis para análise na
linguagem de programação R e a IDE R Studio. A aplicação do software R Studio permite
uma análise detalhada e visualização eficaz dos dados, contribuindo para uma
compreensão abrangente do comportamento dos participantes. As conclusões do estudo
fornecem uma compreensão do cenário dos alunos que adquirem o curso de capacitação
profissional online, além de destacar possíveis áreas de melhoria e otimização. Este artigo
contribui para a literatura acadêmica ao demonstrar a eficácia da análise descritiva
utilizando a linguagem R na interpretação de dados de cursos online, oferecendo insights
valiosos para instrutores, pesquisadores e profissionais envolvidos no desenvolvimento e
aprimoramento de cursos de capacitação profissional.

Palavras-chave: Curso online, Estatística, Ciência de dados, Linguagem R, capacitação


profissional.
ANÁLISE DESCRITIVA DOS DADOS DE UM CURSO DE CAPACITAÇÃO
PROFISSIONAL ONLINE USANDO A LINGUAGEM DE PROGRAMAÇÃO
R – UM ESTUDO DE CASO

1 INTRODUÇÃO

A Terceira Revolução Industrial, que também recebe o nome de Revolução Tecno-


Científica, começou em meados do século XX, trazendo como principal elemento
transformador o avanço no setor de informática. Diferentemente das duas Revoluções
anteriores, marcadas, respectivamente, pela máquina a vapor e pela eletricidade, que se
restringiram mais para o lado produtivo em si, a Terceira R.I. promoveu mudanças que
impactaram para além da cadeia produtiva, trazendo mudanças para o cotidiano das
pessoas. De acordo com Silva, Silva e Gomes (2002), a Terceira R.I. extrapola o aspecto
tecnológico, sendo “um processo econômico, político e cultural em curso, de grande
dinamismo e alta complexidade.”

A Educação foi um dos setores mais afetados, sobretudo com o avanço das
chamadas Tecnologias da Informação e Comunicação (TICS). Em relação a
regulamentações, houve a transformação da Educação a Distância (EaD) no Brasil em
modalidade formal de ensino com o Decreto 5.622 em 2005, sob a premissa da
necessidade de formação de profissionais para atuar na educação básica (SANTOS;
ASSUMPÇÃO; CASTRO, 2019). Por outro lado, da iniciativa privada, houve o boom da
criação de conteúdo online, marcado principalmente pela disponibilização de aulas
gravadas e/ou ao vivo dos mais variados tipos de conteúdo. Atualmente, ainda se vive esse
momento, de forma mais intensa do que nunca, com professores buscando diversas
técnicas para atrair visualizações, curtidas e compartilhamentos na rede.

Em meio a tantos criadores de conteúdos e plataformas, há a chamada Comunidade


de Estatística do Prof. Thiago Marques, uma edtech que possui cursos de capacitação
profissional online oferecidos há mais de quatro anos no mercado. Um de seus produtos, a
Comunidade de Estatística e Ciência de dados (CECD), trata-se de algo maior do que
apenas um local para se assistir aulas, já que o foco principal é ofertar um ecossistema
completo de aprendizagem em Estatística e Ciência de Dados, com foco mercadológico e
aplicado a linguagens de programação.

O objetivo deste artigo é realizar uma análise descritiva dos dados ligados ao produto
Comunidade de Estatística e Ciência de Dados (CECD), obtidos através da plataforma
Hotmart, na qual ele é comercializado, utilizando a linguagem de programação R e a IDE R
Studio. O foco será direcionado para tópicos como a demanda de alunos inscritos,
faturamento, o perfil dos alunos e os tipos de pagamentos oferecidos. Tópicos como análise
de gênero, da formação original e de idade dos alunos também serão analisados, com vista
a avaliar se as ações sociais do curso têm sido efetivas. O estudo pode ser identificado
como um estudo de caso, uma vez que o seu objeto de análise é uma empresa específica.
2 REVISÃO BIBLIOGRÁFICA

A Estatística é uma ciência antiga, com raízes na antiguidade, quando era usada
para coletar dados populacionais, registros de colheitas, cheias do rio Nilo, entre outros
aspectos ligados à fenômenos naturais, o que a caracterizava como auxiliar da
administração pública (CALVO, 2004).

De acordo com Cunha (1968 apud Diehl, Souza e Domingos, 2007), a palavra
estatística foi usada pela primeira vez no século XIV, com o significado de “ciência das
coisas do estado”, com fins descritivos. A análise de dados que a Estatística realiza permite
a busca por padrões, relações entre variáveis e aplicação de testes de hipóteses para
comprovar (ou não) suposições acerca de determinados fenômenos.

Atualmente, tornou-se possível coletar muito mais dados do que em qualquer outro
momento da história. De acordo com Noveli, Heller e Noveli (2018), isso tem ocorrido por,
ao menos, duas razões: uma tecnológica e outra humana. Os autores argumentam que a
dimensão tecnológica está ligada ao uso de smartphones e sensores, o que permite coletar-
se um alto volume de dados em tempo real, além dos avanços em telecomunicações, que
ampliou o volume e a velocidade de tais dados. Já a dimensão humana é caracterizada
pela geração voluntária das pessoas de dados em massa de si mesmas por meio da
apropriação de tais tecnologias (NOVELI; HELLER; NOVELI, 2018).

O termo big data tem sido utilizado para descrever o fato de que a quantidade de
dados disponíveis em empresas para análise possui alto volume, alta variedade e alta
velocidade (DHAR, 2013). A grande questão é transformar todo esse enorme volume de
dados em informação de forma a gerar valor para as empresas na forma de vantagem
competitiva (ERICKSON; ROTHBERG, 2014). De acordo com o estudo de Al-Ammary
(2014), cada vez mais o conhecimento tem sido percebido como um dos ativos mais
valiosos em decorrência dele permitir formular estratégias que levem a construção de
vantagens competitivas sustentáveis.

Com todos esses avanços, houve um forte aumento na demanda por profissionais
que tenham conhecimentos estatísticos, matemáticos e de programação para trabalhar na
área que hoje é conhecida como Ciência de Dados (ou data science). De acordo com
Watson (2014, p. 1248): “As empresas estão reconhecendo o valor potencial desses dados
e estão implementando tecnologias, pessoas e processos para aproveitar as
oportunidades.” Uma definição para o termo Ciência de Dados é a de Dhar (2013, p. 64):
“o estudo da extração generalizada de conhecimento a partir de dados.”

O relatório da UNESCO de 2010 “Engineering: Issues, Challenges and Opportunities


for Development” (Engenharia: Questões, Desafios e Oportunidades para o
Desenvolvimento em livre tradução pelos autores) já mostrava uma queda global de
interesse dos jovens, sobretudo das mulheres, por cursos de engenharia, ciência e
tecnologia (UNESCO, 2010). Os argumentos incluem a consideração da base matemática
necessária ser muito abstrata, desconectada, difícil e até mesmo “chata” por muitos alunos.
No caso específico do Brasil, um relatório da Organização para Cooperação e
Desenvolvimento Econômico aponta que, em 2019, apenas 17% das matrículas no país
são em cursos de engenharia, tecnologia e matemática (FALCÃO, 2019). Torna-se
necessário, então, medidas que visem reverter este quadro, tanto por parte da iniciativa
pública quanto da iniciativa privada.

Considerando todo o contexto descrito, a Comunidade de Estatística do Prof. Thiago


Marques foi criada, de acordo com o seu website, “da necessidade de adequar o ensino da
Estatística para as demandas atuais do Mercado de trabalho de forma aplicada,
colaborativa, com direcionamento e foco em soluções por meio de linguagens de
programação e sem deixar de lado a teoria necessária para entender o porquê das
análises.” Além disso, o curso possui iniciativas próprias que visam estimular o público
feminino e jovem a realizá-lo, por meio de descontos especiais. Dessa forma, o curso não
se restringe à pura busca do lucro, tendo, em sua raiz, apelos sociais tão necessários de
acordo com os dados mostrados acerca da formação em exatas especialmente no Brasil.

3 MATERIAIS E MÉTODOS

Este artigo possui caráter quantitativo, uma vez que faz uso de dados numéricos e
recorre a métodos estatísticos para se realizar afirmações. Por outro lado, ao se abordar
uma pessoa jurídica, uma empresa, ele se caracteriza como um estudo de caso. De acordo
com Goode e Hatt (1975, apud LAZZARINI 1995, p.17), a técnica é “um modo de organizar
os dados em termos de uma determinada unidade escolhida”.
Neste estudo foi aplicada a análise descritiva no banco de dados da Comunidade de
Estatística e Ciência de Dados do Prof.Thiago Marques. As variáveis foram retiradas da
plataforma Hotmart e analisadas com a utilização da linguagem de programação R que é
“amplamente utilizada, pois fornece uma vasta coleção de pacotes de software que
abrangem uma ampla gama de técnicas de análise de dados para realizar desde análises
estatísticas simples até as mais complexas” segundo Shimizu e Ferreira (2023).
A análise feita tem como objetivo expor o perfil dos alunos de acordo com gênero,
idade, formação, entre outros aspectos, além de investigar aspectos financeiros do produto,
como renda, meios de pagamentos e quantidade de alunos. Há, contudo, também a busca
por relacionar os dados obtidos com questões relevantes no contexto social, principalmente
quanto à presença das mulheres no campo da ciência e tecnologia. Uma pergunta
norteadora neste sentido seria: “Como o perfil dos alunos do curso Comunidade de
Estatística do Prof. Thiago Marques se relaciona com o perfil nacional dos estudantes?”
A partir desse momento, a investigação foi dividida em duas etapas, que delimitaram
o método sistemático da pesquisa: i) busca na base de dados e ii) análise descritiva.

3.1 Busca na base de dados


Para este estudo, utilizou-se a base de dados da Hotmart, que é uma plataforma
digital onde o modelo de negócios é baseado na venda e distribuição de produtos digitais,
operando como uma rede de afiliados. Duas bases diferentes foram usadas: A) do perfil
dos alunos, que respondem a um questionário quando adquirem o curso; B) dos dados da
transação em si. Tais bases apresentam-se discrepantes em volume de dados, pois o
questionário tornou-se obrigatório somente no início de 2022. Devido a isso, portanto, uma
análise cruzada entre as duas não será factível de ser realizada e as análises serão
divididas em duas vertentes, uma em cada base.
A busca foi realizada nos meses de outubro e novembro de 2023 e os dados são da
base A são de 2022 e 2023, enquanto que os dados da base B são de 2020 a 2023. Na
primeira etapa, foi feito o carregamento de pacotes do R e o carregamento do banco de
dados. As variáveis foram renomeadas e selecionadas filtrando os produtos que foram
analisados. Foi realizada a verificação de dados faltantes. A estrutura de dados foi vista e
resumida e houve o tratamento dos dados. Todas essas etapas descritas estão indicadas
na Figura 1.

Figura 1. Busca na base de dados.

Fonte: Elaborado pelos autores.

A base A, que engloba os dados dos alunos, continha dezenove (19) variáveis, das
quais os autores decidiram extrair dez (10) para elaborar as análises da subseção 4.1. Tais
variáveis, juntamente com uma breve descrição e do tipo de cada uma delas, podem ser
observadas na Tabela 1.

Tabela 1 - Variáveis usadas da Base A.

Nome da Variável no R Breve descrição Categoria


sexo Sexo do aluno Categórica

faixa_etaria Faixa etária do aluno Categórica

descoberta_comunidade O meio pelo qual o aluno


descobriu o curso (Linkedin, Categórica
Instagram, etc)

estudante_sim_nao Resposta à pergunta: Categórica


Você é estudante de
graduação?

area_formacao Área de formação do aluno Texto

empresa Empresa na qual o aluno Texto


trabalha

cargo Cargo que o aluno ocupa Texto

atuacao Área de atuação do aluno Texto

cluster_formacao Cluster de formação do aluno Categórica

conhecimento_r Nível de conhecimento de R Categórica


antes de ingressar no curso
Fonte: Elaborado pelos autores.

A base B, que engloba os dados acerca de aquisição do curso, continha cinquenta


e sete (57) variáveis, das quais os autores decidiram extrair dezenove (19) para elaborar
as análises da subseção 4.2. Tais variáveis, juntamente com uma breve descrição e do tipo
de cada uma delas podem ser observadas na Tabela 2.

Tabela 2 - Variáveis usadas da Base B.

Nome da Variável no R Breve descrição Categoria

nome_prod Nome do produto Texto

transacao Código da Transação Texto

tipo_moeda Tipo de Moeda Utilizada Texto

preco_produto Preço do produto, que Numérico


contém % da Hotmart

preco_oferta Preço do produto que não Numérico


contém % da Hotmart

preco_original Preço convertido em R$ Numérico


para compradores de fora
do Brasil

numero_parcela Número de parcelas do Número inteiro


pagamento

numero_recorrencia Indica a quantidade de Número inteiro


vezes que um mesmo
cliente comprou o produto
(ou quando paga uma nova
parcela)

dt_venda Data da venda DD/MM/AAAA

dt_confirm Data de confirmação do DD/MM/AAAA


pagamento
nome_aluno Nome do aluno inscrito Texto
(pessoa física ou jurídica)

email Email usado na compra Texto

pais País no qual a compra foi Texto


realizada

codigo_produto Código do produto Texto


comprado

codigo_oferta Código da oferta comprada Texto

tipo_pagamento Meio de pagamento Categórica


utilizado na compra

tipo_pagamento_oferta Se o tipo de pagamento é Categórica


assinatura, parcelado em 12
x, apenas à vista ou outros

cupom Código promocional usado Texto


na compra do produto

dt_venc_assin Data de vencimento da DD/MM/AAAA


assinatura
Fonte: Elaborado pelos autores.

3.2 Análise descritiva


A análise descritiva consiste em descrever as principais tendências nos dados
existentes e em observar situações que levam a novos fatos.
Neste trabalho foram analisados a quantidade de alunos matriculados no curso
Comunidade de Estatística e Ciência de Dados do Prof.Thiago Marques. Foi feito o
agrupamento de dados de receita em transações únicas por ano, mês e dia. A receita total
(em R$) por dia também foi estudada, assim como a quantidade de alunos por tipo de meios
de pagamento. Foi feito o levantamento do ticket médio da oferta por ano, dispersão do
total de alunos versus a receita por ano e trimestre e a dispersão do total de alunos versus
a receita por ano do curso.
Como existem alunos de outros países e não somente do Brasil, os quartis dos
preços das ofertas por país também foram pesquisados. Análises referente a quantidade
de alunos homens e mulheres, faixa etária, com graduação, com conhecimento na
linguagem R, origem da descoberta do curso e por fim a relação da formação versus o sexo
dos alunos foram feitas.

4 RESULTADOS E DISCUSSÕES

As subseções a seguir descrevem as análises realizadas sobre o perfil do aluno e


sobre a aquisição dos cursos. É importante ressaltar mais uma vez que o questionário que
coleta informações sobre o perfil do aluno foi implementado muito tempo após o início das
vendas do curso, apenas no início de 2022, o que justifica a discrepância entre o tamanho
das duas bases estudadas. Desta forma, não foi possível relacionar os dados de perfil de
alunos com os dados da aquisição do curso, este cruzamento não representaria a totalidade
das aquisições.

4.1 Análise dos dados de perfil do aluno


Em uma análise inicial do perfil, é possível perceber nas Figuras 2 e 3 a maior
presença de alunos do sexo masculino, que representam 67,9% do total de alunos, e das
áreas Tecnologia da Informação e Comunicação e Ciências Naturais, Matemática,
Estatística, representando 53% do total de alunos. Mas há uma certa surpresa na
participação de alunos de Ciências Sociais, Jornalismo e Informação, uma vez que o curso
ofertado é da área de Exatas.

Figura 2 - Proporção dos alunos por sexo.

Fonte: Elaborado pelos autores.


Figura 3 - Quantidade de alunos por área de atuação.

Fonte: Elaborado pelos autores.

Segundo dados do Instituto Brasileiro de Geografia e Estatística (IBGE) (2021), a


proporção de mulheres em áreas de exatas tende a ser menor que a de homens. A
proporção de mulheres matriculadas nos cursos que compõem a Figura 3 no ano de 2019
está descrita no Quadro 1. Os cursos relacionados à Ciências Exatas possuem as menores
proporções, que foram destacadas em negrito.

Quadro 1 - Proporção de homens e mulheres por áreas.

dados

Área Total Mulheres

Educação 785.059 65,6%

Artes 106.994 57,0%

Humanidades (exceto línguas) 24.516 32,4%

Engenharia e profissões correlatas 397.070 21,6%

Produção e processamento 153.692 40,9%

Negócio e administração 886.588 53,7%

Direito 831.831 55,2%

Ciências sociais e comportamentais 363.556 70,4%

Comunicação e informação 68.773 58,8%


Matemática e estatística 12.464 32,7%

Computação e Tecnologia da 248.454 13,3%


informação e Comunicação (TIC)
Fonte: IBGE (2021).

Para calcular uma proporção esperada de mulheres no curso Comunidade de


Estatística do Prof. Thiago Marques, segundo estatística do IBGE, inicialmente agregamos
as áreas do IBGE com as correspondentes da Hotmart, conforme pode ser observado no
Quadro 2.

Quadro 2 - Proporção esperada do IBGE, agregada conforme categorias do Hotmart.

dados

Área IBGE Total Mulheres Área Total Mulheres


hotmart agregado

Educação 785.059 65,6% 11 | 305.523 63,7%


Educação,
Artes e
Artes 106.994 57,0% Humanidade
s
Humanidade 24.516 32,4%
s (exceto
línguas)

Engenharia e 397.070 21,6% 66 | 550.762 26,9%


profissões Engenharia,
correlatas Produção e
construção
Produção e 153.692 40,9%
processamen
to

Negócio e 886.588 53,7% 33 | 1.718.419 54,4%


administraçã Negócios,
o Administraçã
o e Direito
Direito 831.831 55,2%

Ciências 363.556 70,4% 22 | Ciências 432.329 68,5%


sociais e Sociais,
comportame Jornalismo e
ntais Informação

Comunicaçã 68.773 58,8%


oe
informação

Matemática e 12.464 32,7% 44 | Ciências 12.464 32,7%


estatística naturais,
Matemática,
Estatística
Computação 248.454 13,3% 55 | 248.454 13,3%
e Tecnologia Tecnologias
da da
informação e Informação e
Comunicaçã Comunicaçã
o (TIC) o
Fonte: IBGE (2021).

A partir das proporções esperadas, foi realizado a ponderação com os números de


alunos de cada categoria. A proporção esperada de mulheres, a partir dos dados do IBGE,
é de 36,4%. Para verificarmos se esta proporção é equivalente à proporção de 32,1%
observada no curso, foi realizado teste de hipótese com o nível de significância de 5%,
considerando: i) hipótese nula que estas proporções são iguais e ii) a hipótese alternativa
que tais proporções são diferentes. Para o cálculo do teste de hipótese foram utilizadas as
equações (1) e (2) apresentadas a seguir.
( 1 2)
= 1 1
( )
1 2

(1)
onde

1 2
e = 1 −

1 2
(2)

Uma vez que o Z calculado foi de 0,999, sendo menor do que 1,96 (Z crítico para
nível de significância de 5%), decide-se pela aceitação da hipótese nula, ou seja, a
proporção de mulheres no curso está dentro da proporção esperado para as áreas inscritas,
segundo dados de proporção do IBGE. No entanto, este resultado demonstra que as
iniciativas de atração de mulheres, por meio de descontos no valor dos cursos para este
grupo, não têm sido suficientes para atrair este perfil de alunos. Torna-se necessário, então,
repensar novas estratégias para alcançar ainda mais esse público-alvo.
Por meio das Figuras 4 e 5, é possível perceber que a maior parte das pessoas que
se inscrevem no curso têm idades entre 26 e 41 anos (63,3%) e já possuíam algum
conhecimento em R (69,5%). Já a Figura 6 demonstra que a maioria dos alunos inscritos
conheceu o curso por meio do Linkedin e do Youtube, plataformas nas quais o canal do
curso possui, em relação a quantidade de inscritos, respectivamente, 34.207 e 33.500.
Estes dados indicam que, provavelmente, o público do curso é majoritariamente de
profissionais já atuantes na área, que desejam aprimorar seus conhecimentos e não de
profissionais que estão buscando uma nova formação.
Figura 4 - Distribuição de alunos por faixa etária.

Fonte: Elaborado pelos autores.

Figura 5 - Distribuição de alunos por conhecimento em R.

Fonte: Elaborado pelos autores.


Figura 6 - Meio pelo qual o aluno conheceu o curso.

Fonte: Elaborado pelos autores.

Um outro tipo de gráfico, a chamada Nuvem de Palavras, foi utilizado para


representar as respostas fornecidas pelos alunos a duas questões abertas: i) qual é a sua
área de formação?; e ii) qual empresa você trabalha?. Neste tipo de gráfico, quanto maior
a palavra, maior a sua frequência dentre os dados analisados. Além disso, palavras com
tons de cor semelhantes também apresentam frequências similares. As Figuras 7 e 8
apresentam, respectivamente, uma nuvem de palavras relativa às áreas de formação dos
alunos e as empresas nas quais os mesmos trabalham.

Figura 7 - Nuvem de palavras da área de formação dos alunos.


.

Fonte: Elaborado pelos autores.


Figura 8 - Nuvem de palavras das empresas em que os alunos trabalham.

Fonte: Elaborado pelos autores.

4.2 Análise dos dados de aquisição do curso


Para análise de vendas, verifica-se, pelas Figuras 9 e 10, uma tendência de queda
do número de alunos durante os anos e esta queda parece ser acompanhada também pela
queda da receita, vide Figuras 11 e 12. Ao se buscar respostas para o comportamento
observado, é necessário levar em conta o cenário de pandemia preponderantemente em
2021. Ele parece apontar um crescimento atípico do número de alunos nesse período
acompanhado pela receita, que provavelmente possam ser explicados pelo aumento do
tempo que as pessoas tiveram que ficar cumprindo as medidas de isolamento social em
suas casas. Logo, ao se comparar o ano de 2020 com o ano de 2022, o que parecia ter
sido um decréscimo significativo da receita, agora não mais e em 2023 os mesmos voltam
a cair significativamente.
Figura 9 - Total de alunos por ano.

Fonte: Elaborado pelos autores.

Figura 10 - Evolução detalhada por data de inscrição, da quantidade de alunos por data.

Fonte: Elaborado pelos autores.


Figura 11 - Total de receitas por ano.

Fonte: Elaborado pelos autores.

Figura 12 - Evolução da receita por data.

Fonte: Elaborado pelos autores.

Em relação a forma de pagamento e número de parcelas, é possível observar que


houve algumas alterações no comportamento durante os anos, vide Figuras 13 e 14.
Destaca-se o surgimento do PIX no final de 2020, que proporcionalmente tem crescido em
relação aos demais meios de pagamento (representava em torno de 5,7% das compras em
2021, 10,6% em 2022 e 13% em 2023), enquanto o cartão de crédito tem perdido espaço
(representava em torno de 82% das compras em 2020, 78% em 2021, 60,6% em 2022 e
66,7% em 2023). Ao se observar o número de parcelas, o pagamento a vista continua sendo
a preferência. No entanto, o comportamento tem apresentado instabilidade nos anos; em
2021 teve o pico com 52,7% das compras, sendo 2022 o pior ano, com queda para 32,8%
e em 2023 uma leve recuperação, representando 33,3% das compras. Por outro lado, o
parcelamento em 12x teve crescimento consistente desde de 2020 (representava em torno
de 13,5% em 2020, 16,7% em 2021, 47% em 2022 e 43,5% em 2023).

Figura 13 - Meios de pagamentos usados na compra.

Fonte: Elaborado pelos autores.

Figura 14 - Número de parcelas.

Fonte: Elaborado pelos autores.


Na Figura 15, que contém gráficos do tipo Boxplot relacionados ao valor do ticket
médio, ao se analisar o comportamento dessa variável durante os anos, há um claro
aumento na variação do valor. Observando-se a Figura 16 é possível notar que em 2020 e
2021, quando a variação do ticket médio era menor, havia uma clara correlação positiva
entre a quantidade de alunos e receita. No entanto, para os anos de 2022 e 2023, esse
comportamento é menos evidente. Esse comportamento, junto ao comportamento de
tendência de aumento do número de parcelas, pode indicar que o valor do ticket médio
praticado está além do valor ideal para manter a atração de alunos e aumento de receita.
Figura 15 - Boxplot do Ticket médio por ano

Fonte: Elaborado pelos autores.


Figura 16 - Gráfico de dispersão do valor da receita por aluno.

Fonte: Elaborado pelos autores.


6 CONSIDERAÇÕES FINAIS

Apesar dos esforços em campanhas para atração do público feminino, o percentual


de mulheres inscritas no curso acompanha a proporção de mulheres, segundo IBGE (2021),
para as áreas de atuação do estudante identificadas na plataforma. No entanto, se
comparado com a proporção de mulheres nos cursos de Computação e Tecnologia da
informação e Comunicação (TIC), público alvo deste curso, a proporção de mulheres
inscritas é bem superior (32,1% contra 13,3% dos cursos de TIC). Logo, apesar de ter como
público alvo profissionais de TIC, avalia-se que campanhas mais direcionadas a públicos
femininos de outras áreas de atuação podem ter maior impacto na atração deste público,
assim como parcerias com organizadores de eventos e iniciativas de fomento a esse
público.
Ainda sobre o perfil do estudante, profissionais já com algum conhecimento dos
conceitos e já atuantes no mercado, parecem ser o principal consumidor, logo, há
oportunidades de explorar a divulgação do curso como uma proposta de realocação no
mercado de trabalho para profissionais fora da área.
A partir das análises estatísticas sobre aquisição do curso, é possível concluir que
há uma tendência de queda no número de alunos e receitas, esta tendência pode estar
relacionada com o aumento do valor do ticket médio durante os anos, que também parece
ter influenciado uma tendência de aumento do número de parcelas para contratação do
curso. Portanto, há uma indicação de redução do valor do ticket médio e elaboração de
novas trilhas de conteúdos a fim de atrair novos estudantes.

REFERÊNCIAS

AL-AMMARY, J. The Strategic Alignment between Knowledge Management and


Information Systems Strategy: The Impact of Contextual and Cultural Factors. Journal of
Information & Knowledge Management, v. 13, n. 1, p. 1-12, mar. 2014.

BRASIL, Instituto Brasileiro de Geografia e Estatística. Estatísticas de Gênero - Indicadores


sociais das mulheres no Brasil: IBGE, 2021. Disponível em: Estatísticas de Gênero -
Indicadores sociais das mulheres no Brasil | IBGE (Tabela 25). Acesso em 02/12/2023.

CALVO, M. C. M. Estatística descritiva. Florianópolis: UFSC, 2004.

CUNHA, S. E. Estatística descritiva: na psicologia e na educação. Rio de Janeiro:


Forense, 1968.

DHAR, V. Data science and prediction. Communications of the ACM, v. 56, n. 12, p. 64-
73, dez. 2013.

DIEHL, C. A.; SOUZA, M. A. de; DOMINGOS, L. E. C. O USO DA ESTATÍSTICA


DESCRITIVA NA PESQUISA EM CUSTOS: ANÁLISE DO XIV CONGRESSO
BRASILEIRO DE CUSTOS. ConTexto - Contabilidade em Texto, Porto Alegre, v. 7, n.
12, 2009. Disponível em: https://seer.ufrgs.br/index.php/ConTexto/article/view/11157.
Acesso em: 3 dez. 2023.
ERICKSON, S.; ROTHBERG, H. Big Data and Knowledge Management: Establishing a
Conceptual Foundation. Electronic Journal of Knowledge Management, v. 12, n. 2, p.
101-109, jun. 2014.

FALCÃO, M. Falta interesse por formação em ciências exatas. Valor Investe, 14 out. 2019.
Disponível em: https://valorinveste.globo.com/objetivo/empreenda-
se/noticia/2019/10/14/falta-interesse-por-formacao-em-ciencias-exatas.ghtml. Acesso em:
03 dez. 2023.

GOODE, W. J.; HATT, P. K. Métodos em pesquisa social. Tradução de Carolina


Martuscelli Bori. 5. ed. São Paulo: Nacional, 1975.

LAZZARINI, S. G. Estudo de Caso: aplicabilidade e limitações do método para fins de


pesquisa. Economia & Empresa, v. 2,n. 4, São Paulo, out./dez. 1995.

NOVELI, M.; HELLER, P. M.; NOVELI, C. P. Inteligência de negócios ou ciência de dados?


O que dados bibliográficos inicialmente nos dizem?. Revista Eletrônica Gestão e
Serviços, v. 10, n.2, p. 2790-2807, jul./dez. 2019.

SANTOS, C. M. D.; CASTRO, A. D. C.; ASSUMPÇÃO, G. D. S. A Engenharia de Produção


na modalidade a distância: Levantamento quantitativo de cursos de graduação de 2008 a
2019. In: ENEGEP 2019 – Encontro Nacional de Engenharia de Produção, 2019, Santos.
Anais. Santos. Disponível em:
http://www.abepro.org.br/publicacoes/artigo.asp?e=enegep&a=2019&c=37721. Acesso
em: 2 dez. 2023.

SHIMIZU, I; FERREIRA, J. C. Perdendo seu medo de utilizar o programa R para análise


estatística. Jornal Brasileiro de Pneumologia, v. 49, 2023.

SILVA, D. B.; SILVA, R. M.; BARRETO, Maria de Lourdes Gomes. O Reflexo da Terceira
Revolução Industrial na Sociedade. In: XXII Encontro Nacional de Engenharia de Produção,
2002, Curitiba. Anais. Porto Alegre. Disponível em:
https://abepro.org.br/biblioteca/enegep2002_tr82_0267.pdf. Acesso em: 1 dez. 2023.

UNESCO. Engineering: issues, challenges and opportunities for development. Londres:


UNESCO, 2010. 336p.

WATSON, H. J. Tutorial: big data analytics: concepts, technologies, and applications.


Communications of the Association for Information Systems, v. 34, p. 1247-1268, abr.
2014.

Você também pode gostar