Você está na página 1de 5

PUC MINAS

PROGRAMA DE PÓS-GRADUAÇÃO EM ADMINISTRAÇÃO


ANÁLISE QUANTITATIVA DE DADOS – 1º SEMESTRE DE 2023

• Professor: Humberto Elias Garcia Lopes


• Titulação: Doutor em Administração, UFMG, 2001.
• Currículo Lattes: http://lattes.cnpq.br/8839646757469273
• Currículo com artigos para download: https://www.researchgate.net/profile/Humberto_Elias_Lopes
• Contato fora do horário de aula: exclusivamente pelo sistema de mensagens do Canvas AVA.

PLANO DE ENSINO
1) EMENTA

Linguagem R e Python em análise quantitativa de dados. Interface do R e do R Studio. Comandos básicos em


linguagem R. Estruturas de dados: vetores atômicos, matrizes e data frames. Criação e análise de tabelas e
gráficos em R. Variáveis qualitativas e quantitativas. Cálculo de medidas de tendência central, dispersão
absoluta e relativa.

2) OBJETIVOS

Dar ao aluno os conhecimentos básicos para:

1) compreender a definição e as aplicações da análise de dados;


2) estabelecer a relação entre análise de dados e pesquisa;
3) entender a interface do R Studio, utilizando seus recursos;
4) usar a linguagem R para interpretar e criar códigos para análise de dados;
5) analisar dados usando o R Studio;
6) escrever relatórios de análise de maneira coerente e consistente.

3) MÉTODOS DIDÁTICOS

• Aulas na modalidade EAD assíncrona.


• Listas de exercícios para prática do conteúdo ensinado.

4) UNIDADES DE ENSINO

MÓDULO 1 – Primeiros passos

• O que é a linguagem R.
• Instalação do R e da IDE R Studio.
• Operações matemáticas em linguagem R.

MÓDULO 2 – Preparando os Dados

• Estruturas de dados em linguagem R.


• Vetores atômicos.
• Fatores.
• Matrizes com dados quantitativos e qualitativos.
• Data frames.
• Localizando valores específicos ou uma faixa de valores em uma estrutura de dados.

MÓDULOS 3 E 4 – Primeiras Análises

• Formas de apresentação de resultados: tabelas, gráficos e medidas-resumo.


• Criação de tabelas em linguagem R.
• Apresentação gráfica em linguagem R para variáveis qualitativas e quantitativas.
• Medidas de tendência central.
• Medidas de dispersão absoluta.
• Medidas de dispersão relativa.

5) PROCESSO DE AVALIAÇÃO

A avaliação do processo de ensino e aprendizagem ocorrerá da seguinte maneira:

Item Valor Data-limite da Postagem Conteúdo


Primeira avaliação 35,0 02/05 Unidades 1 e 2
Segunda avaliação 35,0 30/05 Todo o conteúdo da disciplina
Relatório de análise 30,0 30/05 -
Reavaliação 35,0 09/06 Todo o conteúdo da disciplina

A primeira e segunda avaliações serão individuais e gerenciadas pelo Canvas. Uma vez iniciada a prova, o
aluno terá até 2 (duas) horas para submeter as respostas. Os atrasos na postagem das respostas serão
penalizados com redução de 10 (dez) pontos na nota por dia de atraso.

O relatório de análise consiste em um código, em linguagem R, desenvolvido individualmente pelo aluno e


contendo a análise de dados de um assunto do seu interesse. Esse código deverá rodar sem erros e ser
autossuficiente, ou seja, não deverá demandar arquivos adicionais para funcionar.

O referido código deverá conter os seguintes elementos, no mínimo:

a) uma estrutura de dados bem definida (vetores atômicos, fatores, matrizes ou data frames);
b) dados claramente mostrados (estes dados podem ser fictícios, mas têm que fazer sentido);
c) explicações claras sobre o propósito de cada comando (utilizar # para isto);
d) uma linha contendo operações matemáticas;
e) duas tabelas;
f) três gráficos de tipos diferentes;
g) medidas-resumo;
h) análise dos resultados no final do código (usar # para escrever esta análise);
i) comandos e comentários sem problemas com acentuação ou outros sinais gráficos.

Não haverá segunda chamada para o relatório de análise. Entregas posteriores à data limite serão
penalizadas com a perda de 10 (dez) pontos da nota para cada dia de atraso.

O aluno reprovado poderá fazer uma reavaliação no dia 09/06. Esta prova, porém, substituirá a nota da
primeira ou da segunda avaliação, a que for menor.
6) REFERÊNCIAS

Acock, A. C. (2014). A gentle introduction to Stata (4o ed). Stata Press.

Aggarwal, C. (2014). An introduction to cluster analysis. In Data clustering: Algorithms and

applications. CRC Press.

Beysolow, T. (2017). Introduction to deep learning using R: a step-by-step guide to learning and

implementing deep learning models using R. Apress.

Bhat, A. (2014). K-medoids clustering using partitioning aroud medoids for performing face
recognition. International Journal of Soft computing, Mathematics and Control, 3(3).

https://doi.org/10.14810/ijscmc.2014.3301

Bierens, H. J. (2005). Introduction to the Mathematical and Statistical Foundations of Econometrics.

Cambridge University Press.

Boehmke, B., & Greenwell, B. (2019). K-means Clustering (p. 399–416).

https://doi.org/10.1201/9780367816377-20

Caffo, B. (2015). Developing data products in R. Leanpub.

Caffo, B. (2016). Statistical inference for data science. Leanpub.

Caffo, B. (2017). Advanced linear models for data science. Leanpub.

Caffo, B. (2019). Regression models for data science in R. Leanpub.

Caffo, B., Peng, R., & Leek, J. (2018). Executive data science: A guide to training and managing the

best data scientists. Leanpub.

Chambers, R. L., & Skinner, C. J. (2003). Analysis of survey data. John Wiley & Sons.
Everitt, B. S., & Hothorn, T. (2006). Cluster analysis. In A handbook of statistical analyses using R (p.

243–258). Chapman & Hall/CRC.


Fávero, L. P., & Belfiore, P. (2017). Manual de análise de dados: Estatística e modelagem

multivariada com Excel, SPSS e Stata (1o ed). Elsevier.

Fischetti, T. (2015). Data analysis with R: load, wrangle, and analyze your data using the world’s

most powerful statistical programming language. Packt Publishing.

Gujarati, D. N., & Porter, D. (2010). Basic Econometrics (5o ed). McGraw-Hill Higher Education.

Hair, J., Black, W. C., Babin, B. J., & Anderson, R. E. (2018). Multivariate data analysis (8o ed). Cengage

Learning EMEA.
Härdle, W., & Simar, L. (2003). Applied Multivariate Statistical Analysis. Springer.

Heiss, F. (2016). Using R for introductory econometrics. Florian Heiss.

Heumann, C., Schomaker, M., & Shalabh. (2016). Introduction to statistics and data analysis with

exercises, solutions and applications in R. Springer.

Horton, N. J., & Kleinman, K. (2015). Using R and R Studio for data management, statistical analysis,

and graphics (2o ed). CRC Press.

Husson, F., Lê, S., & Pagès, J. (2017). Exploratory multivariate analysis by example using R. Capman

& Hall/CRC.

Irizarry, R. A., & Love, M. (2015). Data analysis for the life sciences. Leanpub.

Kassambara, A. (2017). Practical guide to cluster analysis in R unsupervised machine learning.

STHDA.

Kaufman, L., & Rousseeuw, P. (1990). Partitioning around medoids (Program PAM). In Finding

groups in data: An introduction to cluster analysis (p. 68–125). Wiley-Interscience.

Ketchen, D. J., & Shook, C. L. (1996). The application of cluster analysis in strategic management

research: An analysis and critique. Strategic Management Journal, 17(6), 441–458.

https://doi.org/10.1002/(SICI)1097-0266(199606)17:6<441::AID-SMJ819>3.0.CO;2-G

Lopes, H. E. G., & Gosling, M. de S. (2021). Cluster analysis in practice: Dealing with outliers in

managerial research. RAC - Journal of Contemporary Administration, 25(1).

https://doi.org/10.1590/1982-7849rac2021200086

Maechler, M. (2019). Package “cluster”. CRAN. https://svn.r-project.org/R-packages/trunk/cluster

Norusis, M. J. (2006). Ordinal Regression. In SPSS 15.0 Statistical Procedures Companion (p. 69–89).

Prentice-Hall.

Pearson, R. K. (2018). Exploratory data analysis using R. Chapman & Hall/CRC.


Peng, R. (2016). Exploratory data analysis with R. Leanpub.

Raykov, Y., Boukouvalas, A., Baig, F., & Little, M. (2016). What to do when k-means clustering fails:

A simple yet principled alternative algorithm. PLoS ONE, 11(9), 1–28.

https://doi.org/10.1371/journal. pone.0162259

Rencher, A. C. (2002). Methods of Multivariate Analysis (2o ed). Wiley Interscience.


Sun, L., Chen, G., Xiong, H., & Guo, C. (2017). Cluster analysis in data-driven management decisions.

Journal of Management Science and Engineering, 2(4), 227–251.

https://doi.org/10.3724/SP.J.1383.204011

Velmurugan, T., & Santhanam, T. (2010). Computational complexity between k-means and k-

medoids clustering algorithms for normal and uniform distributions of data points. Journal

of Computer Science, 6(3), 363–368.

Yu, H., Wang, X., Wang, G., & Zeng, X. (2020). An active three-way clustering method via low-rank

matrices for multi-view data. Information Sciences, 507, 823–839.

https://doi.org/10.1016/j.ins.2018.03.009

Você também pode gostar