Você está na página 1de 6

1 INTRODUÇÃO

Acompanhando o inegável avanço da tecnologia e o aumento dos sistemas de


armazenamento de dados, tal como a facilidade e necessidade em obtê-los, cresce a necessidade
do mercado em buscar profissionais aptos a trabalhar com análise e modelagem dos mesmos.
E, ao considerar o tamanho que estes bancos de dados costumam assumir, também são
necessários softwares que ajudem tais profissionais a cumprirem suas metas. Neste trabalho
falaremos sobre a importância de um dos softwares dedicados a atingir este objetivo: o software
R.
Criado em 1993 por Ross Ihaka e Robert Gentleman, na Universidade de Auckland, Nova
Zelândia, o software R é, além de uma linguagem de programação, um ambiente computacional
voltado à análise, visualização, interpretação e manipulação de dados estatísticos, que vem
ganhando destaque entre empresas e profissionais da área de estatística, sendo inclusive tema
de investimentos e pesquisas de empresas como a Microsoft e Oracle. Grande parte desse
reconhecimento se deve a dois vantajosos diferenciais que o R apresenta em relação a boa parte
de seus concorrentes.
Em primeiro lugar, trata-se de um software open-source, o que facilita a contribuição do
público na melhoria do mesmo e, graças a isso, além dos pacotes iniciais inclusos no software
disponibilizado para download, em sua comunidade chamada CRAN, estão disponíveis
aproximadamente 9 mil pacotes extras, criados em sua maioria por usuários que desejam
melhorar a experiência no uso do software.
E como segunda vantagem, o R é um software completamente gratuito, mantendo-se com
doações voluntárias. Esta segunda trata-se de um grande incentivo na hora de decidir com qual
software trabalhar, visto que boa parte dos softwares voltados à estatística tem um preço
considerado alto. Mas vale salientar que algumas empresas ainda se sentem inseguras em
relação ao uso do R pois, sendo um software gratuito e sem fins lucrativos, não possui um
contrato de assistência técnica em caso de erro.
O software R também tem diversas aplicações em pesquisas acadêmicas, podendo ser
utilizado em áreas como biologia, medicina, econometria, finanças e várias outras. Justamente
por ser tão abrangente e gratuito, é fácil entender como seu uso ajudaria a reduzir os custos de
uma pesquisa sem abdicar-se de sua qualidade. Com poderosas ferramentas de análise, grande
capacidade de geração de tabelas e gráficos e sua enorme quantidade de pacotes disponíveis, o
R consegue competir facilmente com outros softwares pagos.
Atestando-se então as vantagens que este software traz e todas suas possíveis aplicações,
é imprescindível que os alunos de estatística da UFPE saibam como lidar com o mesmo. E
considerando também as dificuldades que boa parte dos alunos do ensino médio no Brasil tem
com disciplinas envolvendo lógica matemática, fica também necessário analisar o desempenho
dos alunos no R e em disciplinas ligadas ao mesmo, como também criar maneiras de facilitar o
contato entre os alunos e uma linguagem tão importante para a área que estão cursando.

2 METODOLOGIA
Inicialmente foi realizada a revisão do material bibliográfico dos livros Estatística Básica
(Bussab, W. O. e Moretin, P. A. 2017), Métodos Quantitativos Estatísticos(Guimarães, P. R. B.
(2008).) e Análise descritiva de dados(Reis, E. A. e Reis, I. A. 2002). Tal revisão foi feita com
o intuito de garantir uma melhor precisão na etapa seguinte, que consistia em uma análise
descritiva dos dados obtidos.
Com o objetivo de traçar um perfil dos alunos do curso de Estatística ingressantes no
semestre 2019.1, foram aplicados surveys com questões relacionadas ao primeiro contato que
estes estudantes possuíram com o curso e com linguagens de programação, mais
especificamente com a disciplina de Análise Exploratória de Dados (A.E.D.) e à linguagem de
programação R. O primeiro questionário foi realizado no dia 02 de maio, durante uma das aulas
da disciplina, sendo aplicado a um total de 20 alunos.
Além dos questionários com os alunos que frequentam o curso, também foi feito um
questionário para os alunos que optaram por abandoná-lo, com o objetivo de entender melhor
quais dificuldades os levaram a tomar esta decisão. Este questionário foi realizado pela
plataforma Google Forms, estando disponível no link https:// .
Na realização desta análise, foram utilizados –
Já o segundo --
3 RESULTADOS
3.1 ANÁLISE DAS NOTAS
Com a ajuda da professora Maria Cristina Raposo, ministrante da disciplina A.E.D. em
2019.1, conseguimos obter as notas das avaliações realizadas. Os dados referentes a eles estão
presentes no quadro 1.
Avaliação
Medida
1ª 2ª Avaliação Notas após 2ª 3ª Prova Média Final
Avaliação chamada Avaliação Final

Mínimo 1 0 1,5 3,5 3

1º Quartil 3,25 3,75 3,75 5,56 4,75

Mediana 4,5 5,62 5,75 6,87 5,12

3ª Quartil 7,0 8,12 8 8,18 5,75

Máximo 9,25 9,75 9,75 10 7

Média 5,01 5,58 5,58 6,89 5,04

Os dados do quadro 1 são representados nos gráficos 1 à 6, apresentados a seguir. Vale-


se destacar que entre as notas da primeira e segunda avaliação, seria dada como média da
primeira unidade a maior nota. Já a média da segunda unidade é dada pela média aritmética
entre a terceira avaliação e o trabalho.
Ambas as distribuições representadas nos gráficos 1 e 2 possuem assimetria positiva, pelo
fato de a mediana estar mais próxima do primeiro quartil. Não houve outliers em nenhum dos
casos. É interessante notar que houve um aumento entre as notas da primeira e segunda unidade,
mas a mediana permaneceu abaixo da nota mínima para aprovação.

No gráfico 3 temos um histograma utilizando as notas que ficaram definidas na primeira


unidade baseado nos critérios apresentados anteriormente. Nele, vemos que maior parte dos
alunos tiveram suas notas entre 3 e 5. Vemos também que apenas 25% dos alunos conseguiram
notas superiores a 7. É preocupante também a grande quantidade de notas entre 0 e 2.

.3.2 RESULTADO DOS QUESTIONÁRIOS


Da primeira pesquisa realizada, foram obtidos os dados representados nos gráficos 1 à 5.
Como já mencionado anteriormente, nesta etapa a pesquisa foi aplicada a um total de 20 alunos.

Gráfico 1 Gráfico 2
Gráfico 3 Gráfico 4

Gráfico 5
Com base nos gráficos 1 e 5 pode-se concluir que boa parte dos alunos já conheciam o
suficiente do curso para esperar trabalhar com programação no mesmo, tendo pouco menos
que a metade destes já começado a preparar-se, mesmo que em outras linguagens. Apesar
disto, como pode ser visto no gráfico 2, a baixa taxa de frequência dos alunos na
monitoria(onde é ensinada a utilização do R), indica que mesmo sabendo da importância da
programação no curso de Estatística, poucos alunos estão entrando em contato com o R em
sala de aula.
Do gráfico 2 também podemos extrair que, mesmo com o baixo desempenho da turma,
como mostrado na tabela 1, poucos alunos têm uma frequência alta nas aulas de monitoria,
apesar de a mesma oferecer ajuda tanto na aprendizagem da linguagem R, quanto dos
assuntos teóricos da disciplina.
Já no gráfico 3 temos informações que podem ir contra as mostradas no gráfico 2, pois
nele os alunos declaram preferir a parte prática da disciplina, porém anteriormente declaram
não frequentar ou frequentar poucas vezes as monitorias. Um possível explicação seria a de
que estes alunos estejam realizando o estudo do R fora da sala de aula. Tal explicação é ----,
levando em consideração os dados apresentados na tabela 2, onde temos as notas da 4ª
avaliação, que consistia em um projeto realizado no R.
No gráfico 4 temos um resultado não esperado, onde os alunos declaram ter maior
dificuldade nos assuntos referentes à estatística descritiva. Era esperado que eles
apresentassem uma maior facilidade neste tema, visto que ele já foi visto durante o ensino
médio, enquanto as séries estatísticas seriam um assunto novo.

Você também pode gostar