Escolar Documentos
Profissional Documentos
Cultura Documentos
1 1 7
1 .
4 .25
Data 14
s Wrangling
a re
i n h
s L
a v e
o N
d r
Pe
-6 1
1 1 7
1 .
4 .25
14 s
Preparação de a reDados no R
i n h
s L
a v e
o N
ed r
P
Data wrangling
• Utilizaremos, principalmente, o dplyr -6 1
1 1 7
1 .
• O dplyr é um pacote contido no tidyverse 4 . 25
14
s
a re
i n h
• Contém funções úteis para a manipulação/preparação de bancos de dados
s L
• Material para referência: a v e
o N
d r
Pe
• https://dplyr.tidyverse.org/
• https://github.com/rstudio/cheatsheets/blob/master/data-transformation.pdf
• Wickham, H. & Grolemund, G. R for Data Science: https://r4ds.had.co.nz/index.html
Data wrangling
-6 1
1 7 1
• Pipe: encadeamento de diversas funções em sequência
5 1 .
• Rename: alteração de nomes de variáveis 4. 2
1 4 e criação de novas variáveis
•
e s
Mutate: alteração de conteúdo das variáveis
r
• a em critérios lógicos
Filter: seleção de observações comhbase
• Select: seleção de variáveiss L i n
• ve com medidas resumo (estatísticas descritivas)
Summarise: criação deatabelas
o N das observações com base em critérios
• r
Group by: agrupamento
e d
• Join: junção P(merge) de bancos de dados
-6 1
1 1 7
1 .
4 .25
14 s
re
Criação de Projects eaScripts R Markdown
i n h
s L
a v e
o N
ed r
P
R Markdown
-6 1
1 1 7
• Introdução ao R Markdown 1 .
• Formatação básica do texto 4 .25
• s 14
Inserção de fórmulas
a re
• Chunks
i n h
• s LDOC)
Gerando outputs (HTML; PDF,
v e
N a
ero
• Material para referência:
d
P
• https://rmarkdown.rstudio.com/index.html
-6 1
1 1 7
1 .
4 .25
14 s
Projetos de Data Science a re
& Analytics no GitHub
i n h
s L
a v e
o N
ed r
P
Git
• Software útil para o controle de versões -6 1
1 1 7
1 .
254 .
• Registra as alterações feitas nos arquivos 1 4
re s
h a
i n
Lcom o Github
• Vamos utilizá-lo em conjunto
v es
N a
r o
dcomputador (https://git-scm.com/downloads)
P
• Instalar o Git noe
• Basta avançar todas as etapas nas configurações sugeridas
Github
• Site utilizado para hospedar os arquivos -6 1
1 1 7
1 .
• https://github.com/ 4 .25
s 14
a re
n h que podem ser compartilhadas,
• Organizado em repositórios (pastas)
i
s L
e
inclusive, podem ser publicadas
a v
o N
e r
d e compartilhar seu portfólio de projetos
• Útil para armazenar
P
• Os arquivos do computador podem ser enviados ao Github (pelo Git)
Git e Github
• Add e Commit -6 1
1 1 7
1 .
• 4 25
.
4
Crie uma pasta na área de trabalho de seu computador
1
• e s apenas # Versão 1
No RStudio, crie um novo script e escreva
r
• Salve este arquivo na pasta com n a Versão Exemplo.R
ohnome
• L i
Dentro da pasta, clique comso botão direito do mouse e escolha Git Bash Here
a v e
o N
• No Git, escreva d r
git init (inicializa o Git na pasta selecionada)
Pe “Versão Exemplo.R” (adiciona o arquivo para o índice)
• Escreva git add
• Para gerar versões utilize o comando git commit -m “título” (são as versões)
O nome do commit, exemplo: “Primeira Versão”
Git: configuração inicial
• Na primeira vez em que utiliza o Git, há um cadastro7-inicial 6 1
.1 1
2 5 1
4 4 .
s 1
a re
i n h
s L
a v e
o N
e d r
P mensagem, digite um comando e depois o outro
• Após surgir esta
Normalmente, ela surge após
• git config --global user.email “seu email” o primeiro commit. Depois de
• git config --global user.name “seu nome” cadastrar, refaça o commit
Git e Github
• Push -6 1
1 1 7
1 .
• 4 . 25
Em seu Github, crie um novo repositório e nomeie
1 4 como preferir
• Copie o link do repositório criado
r e s
• h a
L i n
No Git, escreva git remote add origin ..........(link de sua pasta)..........
• s
Por fim, digite git push –u origin
ve
master (envia o arquivo para o repositório,
ficando na ramificação a principal)
o N
d r
e que for feito, solicitará login no Github
• Pvez
Na primeira
N a meio do
d r o browser
P e
Git e Github
• Criando e comparando versões -6 1
1 1 7
1 .
• Abra o arquivo Versão Exemplo e escreva mais 425
.
4 uma linha: # Versão 2
1 o Git Bash Here na pasta
e
• Após salvar, feche e com o botão direito
r sabra
a
nh
• Utilize os mesmos procedimentos:
Li
v es
a
• git add “Versão Exemplo.R”
N
r o
• git commit -m “Segunda
d Versão”
Note que não foi
Pe master
necessário informar
• git push –u origin novamente o endereço
• Também é possível fazer o pull dos arquivos do repositório que foi indicado
-6 1
1 1 7
1 .
4 .25
14 s
Funções e Iterações a re
com Pacote Purrr
i n h
s L
a v e
o N
ed r
P
Functions, Purrr
-6 1
1 1 7
• Criando funções no R 1 .
• Atribuindo condições (“IF”) 4 .25
• Iterações com Purrr (funções map) s 14
a re
i n h
• Material para referência: s L
a v e
o N
d r
• Wickham, H. & Grolemund, G. R for Data Science: https://r4ds.had.co.nz/index.html
Pe
• https://github.com/rstudio/cheatsheets/blob/master/purrr.pdf