Você está na página 1de 33

Prof.

Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Aula 10.1
Tecnologia da Informação - Turma dos Feras RFB
(Bônus)

Prof. Victor Dalton


2022
1 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Sumário
SUMÁRIO ...............................................................................................................................................................2

TIDYVERSE .............................................................................................................................................................3

Comando Select .................................................................................................................................................... 4


Comando Filter ..................................................................................................................................................... 5
Comando Arrange ................................................................................................................................................. 6
Comando Mutate .................................................................................................................................................. 7
Comando GGPLOT ............................................................................................................................................... 9
Estética no gráfico............................................................................................................................................... 12
Lapidando o Gráfico ............................................................................................................................................ 13
Comando Summarize .......................................................................................................................................... 14
Comando GROUP_BY ......................................................................................................................................... 16
Colocando em gráficos ........................................................................................................................................ 17
Tipos de visualização ........................................................................................................................................... 19
Gráfico de Linhas ................................................................................................................................................ 19
Gráfico de barra .................................................................................................................................................. 20
Histograma......................................................................................................................................................... 21
Boxplots ............................................................................................................................................................. 23

QUESTÕES COMENTADAS PELO PROFESSOR ...................................................................................................... 24

CONSIDERAÇÕES FINAIS ..................................................................................... ERRO! INDICADOR NÃO DEFINIDO.

LISTA DE QUESTÕES ............................................................................................................................................ 29

GABARITO – CONHECIMENTOS COMUNS ............................................................................................................. 32

RESUMO DIRECIONADO ....................................................................................................................................... 33

Comandos dplyr .................................................................................................................................................. 33


Comandos ggplot2 .............................................................................................................................................. 33

2 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Tidyverse
Tidyverse é um pacote guarda-chuva, onde dentro deste encontram-se alguns diversos (sub)pacotes, a
saber:

 ggplot2: Pacote de gráficos de camadas.


 dplyr: transformação de dados.
 purrr: Programação funcional
 readr: importar arquivos de texto.
Estes pacotes permitem ao usuário fazer o Ciclo da Ciência de Dados, um protocolo bem definido sobre como
“fazer” ciência de dados. O ciclo pode ser visto na figura a seguir.

Alguns princípios fundamentam o tidyverse, estes princípios são:

 Reutilizar estruturas já existentes de dados.


 Organização de funções simples.
 Aderir a programação funcional (Pacote purr)
 Projetado para ser utilizado por usuários.

A partir de então, vamos aprofundar nossos conhecimentos sobre o tidyverse. Ainda, lembro que todos os
comandos ilustrados a partir deste momento devem ser praticados por você no R Studio, conforme orientado na
videoaula.

3 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Comando Select
O comando Select faz parte da biblioteca dplyr, lembrando que esta é a biblioteca responsável pela
transformação de dados.

Este comando é utilizado para selecionar colunas de um banco de dados, lembrando muito a função select
simples de um SQL.

Vamos considerar o trabalho com o gapminder, este dataframe vai ser a nossa base de estudo.

Perceba que temos 6 colunas e 1.704 linhas.

Quando utilizamos o seguinte comando.

library(gapminder)

library(dplyr)

gapminder %>%

select(country, continent)

Neste caso estamos chamando as bibliotecas gapminder (como já dito, a nossa base de dados) e a biblioteca
dplyr (para utilização do comando select).

Desvendadas as duas primeiras linhas, vamos para as linhas posteriores.

Chamamos a nossa base de dados gapminder e com o conector %>% escolhemos as colunas country e
continent com o comando select.

4 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

O resultado que é retornado acaba sendo uma base de dados com as 1.704 linhas porém agora com apenas
duas colunas, sendo elas country e continent.

Comando Filter
O uso do comando filter é exatamente para filtrar as linhas da nossa base de dados.

Este comando lembra muito a filtragem através do comando WHERE no SQL.

Ainda utilizando a base de dados gapminder, vamos analisar o seguinte comando

library(gapminder)

library(dplyr)

gapminder %>%
filter(year == 1992)

Neste comando queremos encontrar os valores na nossa base de dados onde a coluna “year” tenha o valor
“1992”, sendo assim, serão mostradas todas as linhas onde o valor 1992 seja encontrado na coluna year.

Neste caso temos todas as 6 colunas, porém agora apenas 142 linhas, onde todas as linhas são referentes ao
ano de 1992.

5 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

O comando filter aceita mais de um parâmetro, sendo assim, é possível “garimpar” valores que tenham mais
potencial para a análise de dados. Veja o exemplo a seguir.

library(gapminder)

library(dplyr)

gapminder %>%

filter(country == "Brazil", year == "2002")

Neste comando queremos encontrar a linha que na coluna “country” tenha o valor “Brazil” e na coluna “year”
tenha o valor “2002”.

Neste caso temos apenas uma linha que corresponde ao país Brasil no ano de 2002.

Comando Arrange
O comando arrange é um comando de ordenação, sendo assim, podemos visualizar as informações da base
de dados ordenados conforme nos for mais conveniente.

Vamos analisar o seguinte código utilizando o comando arrange.

library(gapminder)
library(dplyr)

gapminder %>%

arrange(lifeExp)

Neste caso estamos colocando em ordem crescente os valores da coluna lifeExp (Expectativa de vida) nos
utilizando da base de dados gapminder.

6 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Perceba que foi retornado os valores de lifeExp do menor para o maior, sendo Rwanda o país com a menor
expectativa de vida.

É possível colocar em ordem decrescente adicionando o comando desc dentro do comando arrange. Veja o
código a seguir.

library(gapminder)

library(dplyr

gapminder %>%

arrange(desc(lifeExp))

Pronto! Agora a expectativa de vida vai aparecer em ordem decrescente.

Este é o retorno do comando para ordem decrescente. Veja como o Japão apresenta a maior expectativa de
vida, tendo seu auge em 2007.

Comando Mutate
Este comando é útil para criação de uma nova coluna ou até mesmo para a modificação de uma coluna já
existente.

Consideramos que a expectativa de vida na nossa base de dados está em anos, porém gostaríamos de ver a
expectativa de vida em meses, desta forma podemos usar o comando mutate. Observe o código abaixo.

library(gapminder)

library(dplyr)

gapminder %>%

mutate(lifeExp = lifeExp*12)

7 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Sabendo que o ano tem doze meses multiplicamos o valor por 12, assim modificamos a coluna.

Repare na coluna lifeExp e veja a mudança ocorrida com o comando mutate.

Para criar uma nova coluna utilizamos também o comando mutate. Analise o seguinte código.

library(gapminder)

library(dplyr)

gapminder %>%

mutate(lifeExpMonths = lifeExp*12)

Agora temos uma nova coluna chamada lifeExpMonths, que é uma coluna onde a expectativa de vida é
calculada em meses, preservando assim a coluna lifeExp. Tal coluna irá ser acrescentada ao nosso dataframe, mais
à direita, sem modificar as colunas já existentes.

8 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Comando GGPLOT
O comando ggplot faz parte do pacote ggplot2. Este é o comando que permite a construção de gráficos no
tidyverse.

Observe o seguinte código

library(gapminder)

library(dplyr)

library(ggplot2)

# Gapminder 2002
gapminder2002 <- gapminder %>%

filter(year == "2002")

Aqui temos a listagem da nossa variável gapminder2002.

Além de chamar a biblioteca ggplot2 também criamos uma variável gapminder2002, onde essa variável
mostra os valores referentes apenas ao ano de 2002.

A partir deste momento podemos criar diversas possibilidades de gráficos. Vamos dar uma olhada em alguns
comandos.

ggplot(gapminder2002, aes(x = pop, y = gdpPercap)) + geom_point()

Neste gráfico é possível perceber que a população (pop) está no eixo x, enquanto o PIB (gdpPercap) está no
eixo y.

O comando geom_point() permite a construção de um gráfico de dispersão.

9 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Agora vamos trabalhar com um outro gráfico.

ggplot(gapminder2002, aes(x = pop, y = lifeExp)) + geom_point()

Perceba que neste novo código trocamos o eixo y para a expectativa de vida (lifeExp).

Além de trabalhar com quais parâmetros vão estar no eixo x ou eixo y, é possível colocar escala logarítmica
nos eixos. Repare no seguinte comando

ggplot(gapminder2002, aes(x = pop, y = lifeExp)) + geom_point() + scale_x_log10()

10 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Perceba a adição do comando scale_x_log10() no código. Isto quer dizer que colocamos o eixo x em escala
logarítmica utilizando a base 10. Em alguns casos, a colocação de um eixo em base logarítmica permitirá uma
visualização mais “agradável” do gráfico.

ggplot(gapminder2002, aes(x = pop, y = lifeExp)) + geom_point() + scale_x_log10()+ scale_y_log10()

Agora com o comando scale_y_log10(), temos também o eixo y em escala logarítmica na base 10.
Perceba que todos os comandos para criação de gráficos são feitos em camadas, isso que torna o ggplot2 uma
ferramenta muito organizada para criação de gráficos.

11 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Conhecendo a forma de criar gráficos, vamos dar uma visualizada em como trabalhar a estética do gráfico.

Estética no gráfico
Destaques visuais podem ajudar na análise dos dados em uma distribuição de um gráfico.

Através da estética podemos analisar pontos que podem ser importantes para a análise de dados e o pacote
ggplot2 dá essa possibilidade.

Análise o seguinte código

library(gapminder)

library(dplyr)

library(ggplot2)

gapminder2002<- gapminder %>%


filter(year == 2002)

ggplot(gapminder2002, aes(x = pop, y = lifeExp, color = continent, size = gdpPercap)) +geom_point()


+scale_x_log10()

Perceba que interessante. Agora colocamos um pouco mais de cor em nosso gráfico.

Com o comando color = continent temos a representação de cada continente com uma cor diferente, além
do comando size = gdpPercap permitir dar tamanhos diferentes para os pontos sendo diretamente proporcional
ao PIB de cada país.

12 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Lapidando o Gráfico
Depois de aprender a fazer a trabalhar com a estética de um gráfico, vamos aprender a replicar gráficos para
cada categoria.

Digamos que queremos olhar os valores de população, expectativa de vida, e PIB por cada continente, vamos
utilizar o seguinte comando.

library(gapminder)

library(dplyr)

library(ggplot2)

gapminder2002 <- gapminder %>%

filter(year == 2002)

ggplot(gapminder2002, aes(x=pop, y = lifeExp, size = gdpPercap)) + geom_point() + scale_x_log10() +


facet_wrap(~ continent)

Utilizando o comando facet_wrap(~ continent) é possível criar um gráfico de pontos para cada continente,
analisando separadamente os continentes, cada um em sua “face”.

E se for necessário criar novos gráficos para cada ano? Bem, vamos trocar a última linha do código acima pelo
código abaixo.

13 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

ggplot(gapminder, aes(x = gdpPercap, y = lifeExp, color = continent)) +geom_point() + scale_x_log10() +


facet_wrap(~ year)

Agora além de replicar os gráficos por ano, ainda utilizamos o conceito de color para distinguir os países em
relação ao continente.

Comando Summarize
Esse comando é utilizado para sumarizar os dados em alguma métrica de interesse, como por exemplo a
média, mediana, a variância, a frequência, a proporção, entre outros.

Para sumarizar uma coluna da base podemos utilizar esse comando.

Veja o código abaixo

library(gapminder)

library(dplyr)

gapminder %>%

summarize (medianLifeExp = median(lifeExp))

14 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Neste caso utilizamos o comando summarize para encontrar a mediana da expectativa de vida na nossa base
de dados. Porém não foi uma boa estratégia pois temos diversos anos e fica complicado a comparação desta
forma, então vamos filtrar utilizando o comando já conhecido filter.

library(gapminder)

library(dplyr)

gapminder %>%
filter(year == 2002) %>%
summarize (medianLifeExp = median(lifeExp))

Agora temos a mediana da expectativa de vida no ano específico de 2002.


Podemos ainda ver qual o maior PIB em determinado ano, vamos analisar o seguinte código

library(gapminder)

library(dplyr)

gapminder %>%
filter(year == 1957) %>%

summarize (medianLifeExp = median(lifeExp), maxGdpPercap = max(gdpPercap))

Pronto, agora temos a mediana da expectativa de vida e o maior valor do PIB no ano de 1957.

15 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Comando GROUP_BY
Este comando agrupa uma coluna pelas suas categorias. As vezes ele é útil para sumarizar por agrupamentos.
Veja o código abaixo.

library(gapminder)

library(dplyr)

gapminder %>%

group_by(year) %>%

summarize (mediaLifeExp = mean(lifeExp), maxGdpPercap = max(gdpPercap))

Perceba que aqui agrupamos os valores por ano, sendo possível encontrar a média da expectativa de vida e o
valor máximo do PIB em cada ano.

Agora digamos que queremos encontrar valores de média e máximo para um ano específico, neste caso vamos
nos valer do comando filter.

library(gapminder)
library(dplyr)

gapminder %>%

filter(year == 1997) %>%

group_by(continent) %>%

summarize (medianLifeExp = median(lifeExp), maxGdpPercap = max(gdpPercap))

16 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Perceba que encontramos valores de média e o maior valor de PIB para os continentes no ano de 1997.

Colocando em gráficos
Conhecidos os comandos, vamos agora juntar tudo que aprendemos até o momento e criar gráficos a partir
da nossa base de dados.

Acompanhe o seguinte código.

library(gapminder)
library(dplyr)

library(ggplot2)

por_ano<- gapminder %>%

group_by(year, continent) %>%


summarize(mediaLifeExp = mean(lifeExp),

maxGdpPercap = max(gdpPercap))

ggplot(por_ano, aes(x = year, y = mediaLifeExp, color = continent)) + geom_point() + expand_limits(y = 0)

A variável “por_ano” é uma nova base de dados onde está agrupada pela ordem dos anos e continente. Neste
caso estamos analisando um gráfico onde mostra a evolução da média de vida da população (eixo y) pelo passar
do tempo em ano (eixo x).

17 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Perceba também que neste código nós iniciamos o eixo y em 0 pelo comando expand_limits(y = 0). Este
comando é utilizado para normalizar nosso gráfico de pontos, fazendo o eixo y começar no zero.
Pode-se utilizar o comando filter para olhar algo específico. No exemplo abaixo queremos obter dados apenas
relacionados ao ano de 1987.

library(gapminder)
library(dplyr)
library(ggplot2)

por_ano<- gapminder %>%

filter (year == 1987) %>%

group_by (continent) %>%

summarize (mediaLifeExp = mean(lifeExp), mediaGdpPercap = mean(gdpPercap))

ggplot(por_ano, aes(x = mediaGdpPercap, y = mediaLifeExp, color = continent)) + expand_limits (y = 0) +


geom_point()

Perceba que na segunda parte do código criamos uma nova variável em que queremos apenas os valores onde
na coluna “year” tenho um valor correspondente a 1987, agrupado por continentes.

18 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

No caso é construído um gráfico de pontos comparando a média do PIB em relação à média da expectativa de
vida.

Tipos de visualização
Existem diversos tipos de gráficos de linhas, gráficos de barras, histogramas, boxplots, gráficos de dispersão
(o tipo que vimos até agora), entre outras infinidades de gráficos. Vamos dar uma olhada como montar os 4
primeiros tipos de gráficos citados.

Gráfico de Linhas
Este é um tipo de gráfico para representação de séries temporais, ou seja, para observação de fatos ao longo
do tempo.
Observe o código a seguir.

library(gapminder)
library(dplyr)

library(ggplot2)

por_ano<- gapminder %>%


group_by(year, continent) %>%

summarize(mediaLifeExp = mean(lifeExp),

19 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

maxGdpPercap = max(gdpPercap))

ggplot(por_ano, aes(x = year, y = mediaLifeExp, color = continent)) + geom_line() + expand_limits(y = 0)

O comando geom_line() permite a exibição de um gráfico do tipo gráfico de linha. Neste caso estamos
analisando a média de vida (eixo y) pelo tempo (eixo x).

Gráfico de linha

Gráfico de barra
O gráfico de barras é muito útil para análise de dados categóricos, onde são representados por barras de
mesma largura mas com altura proporcional a seu valor.

library(gapminder)

library(dplyr)

library(ggplot2)

por_continente <- gapminder %>%

filter (year == 1952) %>%

group_by (continent) %>%

summarize (medianGdpPercap = median(gdpPercap))

20 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

ggplot(por_continente, aes(x = continent, y=medianGdpPercap)) + geom_col()

Neste código é mostrado a relação do PIB por continente. A camada geom_col() permite que seja feito um
gráfico do tipo gráfico de barras.

Gráfico de Barras

Histograma
Histograma se parece muito com um gráfico de barras, porém sua finalidade é demonstrar uma distribuição
de frequências.

No caso do histograma a base representa uma classe e altura representa a frequência absoluta ou a
quantidade com o valor que essa classe ocorre.

library(gapminder)

library(dplyr)

21 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

library(ggplot2)

gapminder_2002 <- gapminder %>%

filter(year == 2002) %>%

mutate(pop_by_mil = pop / 1000000)

ggplot(gapminder_2002, aes(x =pop_by_mil)) + geom_histogram(bins = 50) + scale_x_log10()

O código acimo mostra como a população em 2002 está distribuída. O comando geom_histogram() permite
a criação de um histograma.

O uso do comando bins é referente a quantidade de barras utilizadas para criar o histograma. Por padrão o
ggplot2 utiliza 30 barras ou intervalos, isso pode ser mudado através deste comando.

Histograma

22 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Boxplots
Boxplot é uma ferramenta gráfica para análise de outliers, ajudando como complementação da análise de
dados.

Este é um tipo de gráfico que se utiliza dos conceitos de primeiro quartil, mediana, terceiro quartil e valores
de máximo e mínimo.

library(gapminder)

library(dplyr)

library(ggplot2)

gapminder1952 <- gapminder %>%

filter(year == 1952)

ggplot (gapminder1952, aes(x = continent, y = gdpPercap)) + geom_boxplot() + scale_y_log10()

Neste código é feito a criação do gráfico do tipo boxplot pelo uso do comando geom_boxplot().

Boxplot

23 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Questões comentadas pelo professor


1. (Direção Concursos – Questão inédita – Tidyverse – 2021)
Considere a seguinte base de dados.

Qual das seguintes alternativas seria impressa depois de utilizar o comando world_happiness %>% filter
(Happiness.Score > 7.5)?
A)

B)

24 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

C)

Comentário:

Veja que queremos valores de Happiness.Score maiores que 7.5, portanto queremos a alternativa que
apresente valores maiores de 7.5.

Na alternativa a) o valor é 5.99, portanto não faz sentido que este seja o valor impresso na tela.
Na alternativa b) temos valores muito inferiores a 7.5, não tem a possibilidade de ser esta a resposta

Na alternativa c) temos valores acima de 7.5, portanto esta é nossa alternativa correta.

Resposta correta, alternativa c

2. (Direção Concursos – Questão inédita – Tidyverse – 2021)


Observe o código abaixo.

gap_2007 <- filter(gapminder, year == 2007) ggplot(gap_2007, aes(___)) + geom_point()

Quando este código é compilado é dado o seguinte gráfico.

25 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Qual das seguintes alternativas completa o espaço aes(___).


A) x= lifeExp, y = gdpPercap, color = continet, size = pop

B) x= lifeExp, y = gdpPercap, size = pop, color = lifeExp

C) x= gdpPercap, y = lifeExp, color = continet, size = pop

D) x= lifeExp, y = gdpPercap, size = continet, size = pop


Comentário:

Vamos começar pelos eixos. O valor do eixo x corresponde a coluna lifeExp e o valor do eixo y corresponde a
coluna gpdPercap, portanto a alternativa c) está incorreta.

Pela legenda percebemos que o tamanho é relativo a coluna pop, portanto a letra d) já se mostra incorreta.
A cor é relativa ao continente, portanto a letra b) está incorreta.

Logo a nossa alternativa correta é a letra a)

Resposta correta, alternativa a.

3. (Direção Concursos – Questão inédita – Tidyverse – 2021)


Observe a base de dados.

O seguinte código foi escrito

cereal %>% summarize(med_rating = median(rating), avg_sugars = mean(sugars))

Qual das alternativas corresponde a saída de impressão.

A)

B)

26 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

C)

Comentário:
Vamos analisar cada uma das opções.

Na alternativa a) temos duas variáveis calculadas, med_rating que faz parte do comando, e med_sugar, que
não faz parte do comando. Portanto essa alternativa é incorreta.

Na alternativa b) temos med_rating, que foi pedido no código, e avg_sugar, que também foi pedido no
código, porém como não fizemos a leitura de todos os arquivos aqui temos uma alternativa que é muito forte para
ser a correta.

Na alternativa c) temos min_cals e max_cals, que são dois comandos que não estão no código.
Portanto a alternativa b) é a correta

Resposta correta, alternativa b

4. (Direção Concursos – Questão inédita – Tidyverse – 2021)

Observe a base de dados.

27 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

O código acima gera o seguinte gráfico

Qual das alternativas corresponde a este gráfico:


A) geom_bar()

B) geom_box()

C) geom_hist()

D) geom_col()

Comentário:
Primeiro é preciso perceber que este é um gráfico de barras, portanto o código para que isto ocorra é
geom_col().

Resposta correta, alternativa d

28 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

Lista de questões
1. (Direção Concursos – Questão inédita – Tidyverse – 2021)
Considere a seguinte base de dados.

Qual das seguintes alternativas seria impressa depois de utilizar o comando world_happiness %>% filter
(Happiness.Score > 7.5)?
A)

B)

C)

29 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

2. (Direção Concursos – Questão inédita – Tidyverse – 2021)

Observe o código abaixo.

gap_2007 <- filter(gapminder, year == 2007) ggplot(gap_2007, aes(___)) + geom_point()

Quando este código é compilado é dado o seguinte gráfico.

Qual das seguintes alternativas completa o espaço aes(___).

A) x= lifeExp, y = gdpPercap, color = continet, size = pop

B) x= lifeExp, y = gdpPercap, size = pop, color = lifeExp

C) x= gdpPercap, y = lifeExp, color = continet, size = pop

D) x= lifeExp, y = gdpPercap, size = continet, size = pop

3. (Direção Concursos – Questão inédita – Tidyverse – 2021)


Observe a base de dados.

30 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

O seguinte código foi escrito

cereal %>% summarize(med_rating = median(rating), avg_sugars = mean(sugars))

Qual das alternativas corresponde a saída de impressão.

A)

B)

C)

4. (Direção Concursos – Questão inédita – Tidyverse – 2021)

Observe a base de dados.

31 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Tecnologia da Informação - Turma dos Feras RFB (Bônus) Aula 10.1

O código acima gera o seguinte gráfico

Qual das alternativas corresponde a este gráfico:

A) geom_bar()

B) geom_box()
C) geom_hist()

D) geom_col()

Gabarito

1. C 3. B
2. A 4. D

32 de 33| www.direcaoconcursos.com.br
Prof. Victor Dalton
Informática p/ XXXX Aula 00

Resumo direcionado
Comandos dplyr
Select() Seleciona colunas

Arrange() Ordena a base de dados

Filter() Filtra linhas

Mutate() Cria/Modifica colunas

Group_by() Agrupa a base de dados

Summarise() Sumariza a base de dados

Comandos ggplot2
ggplot() Obtém o painel onde se encontra o gráfico

geom_point() Constrói um gráfico de dispersão

color Adiciona cor em relação a uma variável

size Valor do tamanho dos pontos no gráfico de dispersão

geom_line() Cria um gráfico de linhas

geom_col() Cria um gráfico de colunas

Geom_histogram() Cria um histograma

bins Permite mudar a quantidade de colunas em um histograma

geom_boxplot() Cria um boxplot

facet_warap Replica gráficos para cada categoria de uma variável

33 de 33| www.direcaoconcursos.com.br

Você também pode gostar