Você está na página 1de 20

-6 1

1 1 7
1 .
4 .25
Data 14
s Wrangling
a re
i n h
s L
a v e
o N
d r
Pe
-6 1
1 1 7
1 .
4 .25
14 s
Preparação de a reDados no R
i n h
s L
a v e
o N
ed r
P
Data wrangling
• Utilizaremos, principalmente, o dplyr -6 1
1 1 7
1 .
• O dplyr é um pacote contido no tidyverse 4 . 25
14
s
a re
i n h
• Contém funções úteis para a manipulação/preparação de bancos de dados
s L
• Material para referência: a v e
o N
d r
Pe
• https://dplyr.tidyverse.org/
• https://github.com/rstudio/cheatsheets/blob/master/data-transformation.pdf
• Wickham, H. & Grolemund, G. R for Data Science: https://r4ds.had.co.nz/index.html
Data wrangling
-6 1
1 7 1
• Pipe: encadeamento de diversas funções em sequência
5 1 .
• Rename: alteração de nomes de variáveis 4. 2
1 4 e criação de novas variáveis

e s
Mutate: alteração de conteúdo das variáveis
r
• a em critérios lógicos
Filter: seleção de observações comhbase
• Select: seleção de variáveiss L i n
• ve com medidas resumo (estatísticas descritivas)
Summarise: criação deatabelas
o N das observações com base em critérios
• r
Group by: agrupamento
e d
• Join: junção P(merge) de bancos de dados
-6 1
1 1 7
1 .
4 .25
14 s
re
Criação de Projects eaScripts R Markdown
i n h
s L
a v e
o N
ed r
P
R Markdown
-6 1
1 1 7
• Introdução ao R Markdown 1 .
• Formatação básica do texto 4 .25
• s 14
Inserção de fórmulas
a re
• Chunks
i n h
• s LDOC)
Gerando outputs (HTML; PDF,
v e
N a
ero
• Material para referência:
d
P
• https://rmarkdown.rstudio.com/index.html
-6 1
1 1 7
1 .
4 .25
14 s
Projetos de Data Science a re
& Analytics no GitHub
i n h
s L
a v e
o N
ed r
P
Git
• Software útil para o controle de versões -6 1
1 1 7
1 .
254 .
• Registra as alterações feitas nos arquivos 1 4
re s
h a
i n
Lcom o Github
• Vamos utilizá-lo em conjunto
v es
N a
r o
dcomputador (https://git-scm.com/downloads)
P
• Instalar o Git noe
• Basta avançar todas as etapas nas configurações sugeridas
Github
• Site utilizado para hospedar os arquivos -6 1
1 1 7
1 .
• https://github.com/ 4 .25
s 14
a re
n h que podem ser compartilhadas,
• Organizado em repositórios (pastas)
i
s L
e
inclusive, podem ser publicadas
a v
o N
e r
d e compartilhar seu portfólio de projetos
• Útil para armazenar
P
• Os arquivos do computador podem ser enviados ao Github (pelo Git)
Git e Github
• Add e Commit -6 1
1 1 7
1 .
• 4 25
.
4
Crie uma pasta na área de trabalho de seu computador
1
• e s apenas # Versão 1
No RStudio, crie um novo script e escreva
r
• Salve este arquivo na pasta com n a Versão Exemplo.R
ohnome
• L i
Dentro da pasta, clique comso botão direito do mouse e escolha Git Bash Here
a v e
o N
• No Git, escreva d r
git init (inicializa o Git na pasta selecionada)
Pe “Versão Exemplo.R” (adiciona o arquivo para o índice)
• Escreva git add
• Para gerar versões utilize o comando git commit -m “título” (são as versões)
O nome do commit, exemplo: “Primeira Versão”
Git: configuração inicial
• Na primeira vez em que utiliza o Git, há um cadastro7-inicial 6 1
.1 1
2 5 1
4 4 .
s 1
a re
i n h
s L
a v e
o N
e d r
P mensagem, digite um comando e depois o outro
• Após surgir esta
Normalmente, ela surge após
• git config --global user.email “seu email” o primeiro commit. Depois de
• git config --global user.name “seu nome” cadastrar, refaça o commit
Git e Github
• Push -6 1
1 1 7
1 .
• 4 . 25
Em seu Github, crie um novo repositório e nomeie
1 4 como preferir
• Copie o link do repositório criado
r e s
• h a
L i n
No Git, escreva git remote add origin ..........(link de sua pasta)..........
• s
Por fim, digite git push –u origin
ve
master (envia o arquivo para o repositório,
ficando na ramificação a principal)
o N
d r
e que for feito, solicitará login no Github
• Pvez
Na primeira

• Após atualizar, é possível verificar que o arquivo já está em seu Github!


Git e Github: conexão inicial
• Caso seja a primeira vez que utiliza o Git, há um login -6 1
1 1 7
5 1 .
4 . 2
1 4
re s
h a
Li n
v es Esta é por

N a meio do

d r o browser

P e
Git e Github
• Criando e comparando versões -6 1
1 1 7
1 .
• Abra o arquivo Versão Exemplo e escreva mais 425
.
4 uma linha: # Versão 2
1 o Git Bash Here na pasta
e
• Após salvar, feche e com o botão direito
r sabra
a
nh
• Utilize os mesmos procedimentos:
Li
v es
a
• git add “Versão Exemplo.R”
N
r o
• git commit -m “Segunda
d Versão”
Note que não foi

Pe master
necessário informar
• git push –u origin novamente o endereço

• No Github, a nova versão já está disponível e podemos compará-las!


Git e Github
• Criando ramificações no repositório -6 1
1 1 7
1 .
425
.
• Nos comandos anteriores, alteramos a ramificação
1 4 principal do repositório
e
• Poderíamos criar ramificações novas no
r s
Github
h a
i n
L branch”
• git checkout -b “nome da nova
v es
• No Git, já há a indicaçãoa de mudança da “master” para a “nova”
o N
d r
Pe
• Os mesmos procedimentos de add e commit
• git push -u origin “nome da nova branch”
Git e Github
• Importando repositórios (Clone e Pull) -6 1
1 1 7
1 .
4 .
• Pode ser útil trazer para seu computador arquivos25
4 que estão no Github
s 1meio da função clone
• Uma forma de “baixar” tais arquivos é epor
r
h a
L i n
v e s
• Crie uma pasta em seu computador
• Dentro da pasta, com oabotão direito do mouse, abra o Git Bash Here
o N
e d r
• No Github, no repositório de interesse, clique em code e copie o link
• No Git, digitePgit clone ..........(link do repositório)..........
• Para baixar novamente, após alterações no Github, indique cd “repositório”
• Na sequencia, digite git pull (o arquivo foi atualizado no computador)
Git e Github
• Copiando repositórios públicos (Fork) -6 1
1 1 7
1 .
25
4. no Github
• É possível copiar repositórios que estão publicados
1 4
s
re
• Procure por algum tema de interesse h a
L i n
• Acesse o repositório
v es
a existe o botão Fork
• No canto superior direito,
N
r
• Após clicar, poderá
d over o repositório em sua lista (em seu perfil)
Pe
Git, Github e RStudio
• É possível integrar o Git, Github e RStudio -6 1
1 1 7
1 .
254 .
• No RStudio, clique em File → New Project 1 4 → Version Control → Git
re s
h a
L i
• Em “Repository URL” basta indicar n o link do repositório no Github
v es
N a
d r o
• Após criar um documento (R Script, R Markdown), clique em Git e
P e
faça o commit e, em seguida, o push

• Também é possível fazer o pull dos arquivos do repositório que foi indicado
-6 1
1 1 7
1 .
4 .25
14 s
Funções e Iterações a re
com Pacote Purrr
i n h
s L
a v e
o N
ed r
P
Functions, Purrr
-6 1
1 1 7
• Criando funções no R 1 .
• Atribuindo condições (“IF”) 4 .25
• Iterações com Purrr (funções map) s 14
a re
i n h
• Material para referência: s L
a v e
o N
d r
• Wickham, H. & Grolemund, G. R for Data Science: https://r4ds.had.co.nz/index.html
Pe
• https://github.com/rstudio/cheatsheets/blob/master/purrr.pdf

Você também pode gostar