Você está na página 1de 23

Aula Estatística

Curso de Formação NEO

Itaú Unibanco
AGENDA

1. Introdução

2. Funções Básicas no R

3. Usando o R

4. Exemplos de Projetos anteriores

2
Objetivo da Aula

Habilitar o participante para aplicação prática dos conceitos básicos da


linguagem R

 Transmitir conceitos básicos da linguagem R e suas principais funções

 Apresentar aplicações do R em séries temporais, regressão e análise


exploratória de dados

 Apresentar materiais para aprofundamento na linguagem

3
Introdução

“DATA IS THE NEW OIL”

4
Introdução

>
Decisões baseadas Decisões baseadas
em dados em opinião

5
Introdução

Decisões baseadas
em dados
Visualização

“Data Science is an interdisciplinary


field about processes and systems to
extract knowledge or insights Machine Data Estatística
Science
from data in various forms, either Learning

structured or unstructured, which is a


continuation of some of the data
analysis fields such as statistics, data
mining, and predictive analytics.” -
Wikipedia
Data Mining

6
Introdução | O que é R?

O gráfico abaixo mostra o crescimento da profissão “Cientista de Dados”,


segundo o LinkedIn

7
Introdução | O que é R?

Em 2015, o R foi a principal ferramenta utilizada segundo uma pesquisa


feita com profissionais da área

8
Introdução | O que é R?

O R é uma linguagem de programação amplamente utilizada para Análise de


Dados, Modelagem Estatística, Simulação e Visualização

 O sistema R é uma linguagem de programação orientada a objetos


 O R é derivado da linguagem S, desenvolvida pela Bells Laboratory nos
anos 80
 Em alta no mercado: aproximadamente 2 milhões de pessoas utilizam o R
regularmente e sua base de usuários tem aumentado 40% por ano

9
Introdução | O que é R?

Sua grande adoção pelos profissionais é devido a algumas vantagens que


seu uso proporciona

 OPEN-SOURCE!!!
 Ótima capacidade gráfica
 Extremamente flexível
 O trabalho é reproduzível pelo script criado
 Vibrante comunidade e possibilidade de utilizar pacotes de terceiros

10
Introdução | O que é R?

Existem milhares de pacotes disponibilizados pela comunidade


gratuitamente

 “The great beauty of R is that you can modify it to do all sorts of things,
and you have a lot of prepackaged stuff that’s already available, so you’re
standing on the shoulders of giants.” - Hal Varian, chief economist do
Google

Retirado de: NYT

6560 pacotes de terceiros

11
Introdução | O que é R?

O gráfico abaixo mostra o número de crescimento do número de pacotes


disponíveis no repositório do R

Fonte: http://r4stats.com/articles/popularity/

12
Introdução | O que é R?

Exemplos de visualizações usando o R

Fonte:http://www.nytimes.com/interactive/2012/05/05/sports/b Fonte: https://twitter.com/miguelrios/status/340506256534024193


aseball/mariano-rivera-and-his-peers.html?ref=baseball&_r=0

13
Introdução | O que é R?

Exemplos de visualizações usando o R

14
Introdução | O que é R?

Exemplos de visualizações usando o R

15
Introdução | O que é R?

Exemplos de visualizações usando o R

16
Introdução | O que é R?

O R é uma ferramenta poderosa atuando em diversas áreas da análise de


dados.

 Exemplos de aplicações:
 Basic Statistics

 Probability Distributions
 Big Data Analytics
 Machine Learning
 Optimization and Mathematical Programming
 Signal Processing
 Simulation and Random Number Generation
 Statistical Modeling
 Statistical Tests

17
Introdução | Conteúdo da Aula

Análise Exploratória de
Primeiros Passos Séries Temporais
Dados
 Criação de variáveis e  Analise de distribuição  Média Móvel
atribuição de valores de uma ou mais
 Amortização
variáveis
 Expressões Lógicas Exponencial
 Identificação de
 Medidas de resumo  Avaliação e construção
anomalias e outliers
de modelos de previsão
 Importação de dados
 Criação de gráficos
de diferentes tipos (csv,
txt, xls)  Exploração de
relacionamento entre
 Instalação de pacotes
variáveis
externos
 Criação de funções

18
Introdução | Usando o R

Para essa aula, iremos usar o RStudio, que serve como uma interface gráfica da
linguagem R, ajudando na sua utilização

Links para download


 Para baixar o R:
https://cran.r-project.org/bin/windows/base/
 Para baixar o RStudio:
https://www.rstudio.com/products/rstudio/download/

19
Introdução | Usando o R

Os principais ambientes do RStudio são identificados abaixo

Arquivos e
Script variáveis
Usamos essa parte do RStudio para escrevermos e
armazenarmos nosso código

Gráficos e ajuda
Console

20
Introdução | Usando o R

Estrutura dos objetos no R

Fonte: https://www3.nd.edu/~mclark19/learn/Introduction_to_R.pdf

21
Introdução | Usando o R

Estrutura do código no R

Fonte: https://www3.nd.edu/~mclark19/learn/Introduction_to_R.pdf

22
Introdução | Usando o R

Existem algumas estruturas de controle que podem ser usadas no R, assim como
em outras linguagens de programação, permitindo o controle do fluxo de
execução

 If, else: testar determinada condição


 for: executar um loop por uma quantidade definida de vezes
 while: executar um loop até uma condição ser satisfeita
 break: quebra a execução de um loop
 next: pula uma rodada do loop
 return: retorna um valor ao fim de uma função

23

Você também pode gostar