Você está na página 1de 10

3/15/23, 3:27 PM Desafio do curso | Coursera

1. Cenário 1, perguntas 1-7 1 / 1 ponto

Como parte da equipe de Ciência de dados da Gourmet Analytics, você usa


Data Analytics para aconselhar empresas do setor de alimentos. Suas funções
envolvem limpar, organizar e visualizar dados para chegar a insights que
beneficiarão seus clientes. Como membro de uma equipe colaborativa,
compartilhar suas análises com outras pessoas é uma parte importante do seu
trabalho.

Seu cliente atual é Chocolate and Tea, uma rede de cafeterias em ascensão.

O restaurante combina um extenso menu de chás finos com barras de


chocolate de diversos lugares do mundo. Sua seleção variada inclui de tudo,
desde chocolate ao leite com banana, chocolate branco com tangerina e
chocolate amargo com pistache e figo. A lista enciclopédica de barras de
chocolate é a base do apelo da marca Chocolate and Tea. As vendas de barras
de chocolate são o principal gerador de receita.

Chocolate and Tea tem como objetivo servir barras de chocolate altamente
avaliadas pela crítica profissional. A empresa também costuma modificara
continuamente o cardápio para garantir que seja um reflexo da diversidade
global da produção de chocolate. A equipe de gerenciamento atualiza
regularmente a lista de barras de chocolate para alinhá-la às classificações
mais recentes e garantir que a lista contenha barras de vários países.

Os membros solicitaram a coleta e análise de dados sobre as classificações de


chocolate mais recentes. Em particular, eles gostariam de saber quais países
produzem as barras de chocolate super amargo mais bem avaliadas (uma alta
porcentagem de cacau). Com esses dados em mãos, eles poderão criar seu
próximo menu de barras de chocolate.

Sua equipe recebeu um conjunto de dados que apresenta as classificações


mais recentes de milhares de chocolates de todo o mundo. Clique aqui para
acessar o conjunto de dados. Considerando os dados e a natureza do trabalho
https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 1/10
3/15/23, 3:27 PM Desafio do curso | Coursera

que você fará para seu cliente, sua equipe concorda em usar R para este
projeto.

Um colega de equipe pergunta sobre os benefícios de usar R para o projeto.


Você menciona que R pode processar rapidamente muitos dados e criar
visualizações de dados de alta qualidade. Qual é o outro benefício do uso
de R para o projeto?

Limpar dados automaticamente

Escolher um tópico para análise de dados

Reproduzir e compartilhar facilmente uma análise

Definir um problema e fazer as perguntas certas

Correto
Outro benefício de usar R para o projeto é que ele pode reproduzir e
compartilhar facilmente uma análise.

2. Continuação do cenário 1 1 / 1 ponto

Antes de começar a trabalhar com seus dados, é necessário importar e salvá-


los como um data frame. Para começar, você abre seu espaço de trabalho em
RStudio e carrega a biblioteca de tidyverse. Em seguida, carregue um arquivo
.csv contendo os dados para RStudio e armazene-o em uma pasta de projeto
denominada flavors_of_cacao.csv.

Você usa a função read_csv() para importar os dados do arquivo .csv.


Suponha que o nome do data frame seja chocolate_df e que o arquivo .csv
esteja no diretório de trabalho. Qual bloco de código permite que você crie
o data frame?

chocolate_df <- "flavors_of_cacao.csv"(read_csv)

chocolate_df + read_csv("flavors_of_cacao.csv")

read_csv("flavors_of_cacao.csv") + chocolate_df

chocolate_df <-read_csv("flavors_of_cacao.csv")

Correto
O bloco de código chocolate_df <-read_csv("flavors_of_cacao.csv")permite
criar o data frame. Neste bloco de código:

chocolate_df é o nome do data frame que armazenará os dados.

<- é o operador de atribuição para atribuir valores ao data frame.

read_csv() é a função que importará os dados para o data frame.

https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 2/10
3/15/23, 3:27 PM Desafio do curso | Coursera

"flavors_of_cacao.csv" é o nome do arquivo que a função read.csv() recebe


como argumento.

3. Continuação do cenário 1 1 / 1 ponto

Agora que você criou um data frame, deseja saber mais sobre como os dados
são organizados. O data frame contém centenas de linhas e muitas colunas.

Suponha que o nome do seu data frame seja flavors_df. Qual bloco de
código permite revisar a estrutura do data frame?

select(flavors_df)

str(flavors_df)

summarize(flavors_df)

filter(flavors_df)

Correto
Você escreve o bloco de código str(flavors_df). Neste bloco de código:

str() é a função que retornará a organização da estrutura do data frame e


fornecerá informações de alto nível, como os nomes das colunas e o tipo
de dados contidos nessas colunas.

flavors_df é o nome do data frame que a função str() recebe como


argumento.

4. Continuação do cenário 1 1 / 1 ponto

Em seguida, você começa a limpar seus dados. Ao verificar os títulos das


colunas no seu data frame, você percebe que a primeira coluna é denominada
Company...Maker.if.known. (Observação: O ponto após known faz parte do
nome da variável.) Por uma questão de clareza e consistência, você decide
renomear esta coluna como Brand(sem ponto no final).

Suponha que a primeira parte do seu bloco de código seja:

flavors_df %>%

Qual bloco de código você adiciona para alterar o nome da coluna?

rename(Company...Maker.if.known. = Brand)

rename(Company...Maker.if.known. , Brand)

rename(Brand = Company...Maker.if.known.)

rename(Brand, Company...Maker.if.known.)
https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 3/10
3/15/23, 3:27 PM Desafio do curso | Coursera

Correto
Você escreve o bloco de código rename(Brand =
Company...Maker.if.known.).

Neste bloco de código:

rename() é a função que irá alterar o nome da sua coluna.

Dentro dos parênteses da função, escreva o novo nome (Brand), seguido de


um sinal de igual, para então incluir o nome que deseja alterar
(Company...Maker.if.known. ).

5.Depois de visualizar e limpar seus dados, você determina quais variáveis são mais relevantes para sua 1 / 1 ponto
análise. Seu foco principal está em Rating, Cocoa.Percent, and Company.Location. Você decide usar a
função select() para criar um novo data frame com apenas essas três variáveis.

Suponha que a primeira parte do seu código seja:

trimmed_flavors_df <- flavors_df %>%

Adicione o bloco de código que permite selecionar as três variáveis.

1  

Executar

Redefinir

Qual local da empresa aparece na linha 1 do seu tibble?

Escócia

Columbia

França

Canadá

Correto
Você adiciona o bloco de código select(Rating, Cocoa.Percent,
Company.Location) para selecionar as três variáveis. O código correto é
trimmed_flavors_df <- flavors_df %>% select(Rating, Cocoa.Percent,
Company.Location). Neste bloco de código:

A função select() permite selecionar variáveis específicas para seu novo


data frame.

select() coleta os nomes das variáveis que você deseja escolher como
argumento: Rating, Cocoa.Percent, Company.Location.

https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 4/10
3/15/23, 3:27 PM Desafio do curso | Coursera

França aparece como local da empresa na linha 1 do seu tibble.

6.Em seguida, selecione as estatísticas básicas que podem ajudar sua equipe a entender melhor o 1 / 1 ponto
sistema de classificação em seus dados.

Suponha que a primeira parte do seu código seja:

trimmed_flavors_df %>%

Você deseja usar as funções resume() e sd() para encontrar o desvio padrão da classificação para
seus dados. Adicione o bloco de código que permite encontrar o desvio padrão para a variável
Rating.

1  

Executar

Redefinir

Qual é o desvio padrão da classificação?

0,4780624

0,3720475

0,4458434

0,2951794

Correto
Você adiciona o bloco de código summarize(sd(Rating)) para encontrar o
desvio padrão para a variável Rating. O código correto é
trimmed_flavors_df %>% summarize(sd(Rating)). Neste bloco de código:

A função resume() permite exibir estatísticas resumidas. Você pode usar a


função resume() em combinação com outras funções, como mean(), max()
e min() para calcular estatísticas específicas.

Nesse caso, use sd() para calcular a estatística de desvio padrão para a
variável Rating.

O desvio padrão da classificação é 0,4780624.

7.Depois de concluir sua análise do sistema de classificação, você determina que qualquer classificação 0 / 1 ponto
maior ou igual a 3,5 pontos pode ser considerada uma classificação alta. Também está ciente de que a
Chocolate and Tea classifica como super amargo o chocolate de uma barra cuja porcentagem de cacau
é maior ou igual a 70%. Você decide criar um novo data frame para descobrir quais barras de chocolate
atendem a essas duas condições.

https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 5/10
3/15/23, 3:27 PM Desafio do curso | Coursera

Suponha que a primeira parte do seu código seja:

best_trimmed_flavors_df <- trimmed_flavors_df %>%

Você deseja aplicar a função filter() às variáveis Cocoa.PercenteRating. Adicione o bloco de código
que permita filtrar o data frame para barras de chocolate que contenham pelo menos 70% de
cacau e uma classificação de pelo menos 3,5 pontos.

1  

Executar

Redefinir

Qual classificação aparece na linha 1 do seu tibble?

4,25

3,75

4,00

3,50

Incorreto
Reveja o vídeo sobre organização de dados em R para relembrar seu
conhecimento.

8.Agora que você limpou e organizou seus dados, está pronto para criar visualizações de dados úteis. Sua 0 / 1 ponto
equipe atribui a você a tarefa de criar uma série de visualizações com base nas solicitações da equipe
de gerenciamento da Chocolate and Tea. Você decide usar ggplot2 para criar seus elementos visuais.

Suponha que sua primeira linha de código seja:

ggplot(data = best_trimmed_flavors_df) +

Você deseja usar a função geom_bar() para criar um gráfico de barras. Adicione o bloco de código
que permite criar um gráfico de barras com a variável Rating no eixo X.

1  

Executar

Redefinir

Quantas barras seu gráfico de barras exibe?

https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 6/10
3/15/23, 3:27 PM Desafio do curso | Coursera

Incorreto
Reveja o vídeo sobre geoms para relembrar seu conhecimento.

9.Seu gráfico de barras revela os locais que produzem as barras de chocolate mais bem avaliadas. Para 0 / 1 ponto
ter uma ideia melhor da classificação específica de cada local, você gostaria de destacar cada barra.

Suponha que você esteja trabalhando com o bloco de código:

ggplot(data = best_trimmed_flavors_df) +

geom_bar(mapping = aes(x = Company.Location))

Adicione um bloco de código à segunda linha de código para mapear o elemento estético alpha
para a variável Rating.

NOTA: os três pontos (...) indicam onde adicionar o bloco de código.

1 geom_bar(mapping = aes(x = Company.Location, ...))

Executar

Redefinir

De acordo com seu gráfico de barras, quais são as duas localizações da empresa que produzem as
barras de chocolate mais bem avaliadas?

Canadá e Amsterdã

Canadá e França

Escócia e Amsterdã

EUA e França

Incorreto
Reveja o vídeo sobre estética para relembrar seu conhecimento.

10. Continuação do cenário 2 1 / 1 ponto

Um colega de equipe cria um novo gráfico com base nos dados sobre barras de
chocolate. O colega de equipe solicita que você faça algumas revisões em seu
código.

Suponha que seu colega de equipe compartilhe o bloco de código a seguir:

https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 7/10
3/15/23, 3:27 PM Desafio do curso | Coursera

ggplot(data = best_trimmed_flavors_df) +

geom_bar(mapping = aes(x = Rating)) +

Qual bloco de código você adiciona à terceira linha para criar facetas de
contorno da variável Rating?

facet_wrap(Rating~)

facet_wrap(Rating)

facet(~Rating)

facet_wrap(~Rating)

Correto
Você escreve o bloco de código facet_wrap(~Rating). Neste bloco de
código:

facet_wrap() é a função que permite criar facetas de contorno de uma


variável.

Dentro dos parênteses da função facet_wrap(), digite um til (~) seguido do


nome da variável (Rating).

11. Continuação do cenário 2 1 / 1 ponto

Sua equipe criou algumas visualizações básicas para explorar diferentes


aspectos dos dados de barras de chocolate. Você se ofereceu para adicionar
títulos aos gráficos. Você começa com um gráfico de dispersão.

Suponha que a primeira parte do seu bloco de código seja:

ggplot(data = trimmed_flavors_df) +

geom_point(mapping = aes(x = Cocoa.Percent, y = Rating)) +

Qual bloco de código você adiciona à terceira linha para adicionar o título
Suggested Chocolate ao seu gráfico?

labs(Suggested Chocolate = title)

labs(title = “Suggested Chocolate”)

labs(Suggested Chocolate)

labs <- "Suggested Chocolate"

Correto
Você escreve o bloco de código labs(title = “Suggested Chocolate”). Neste
bloco de código:

https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 8/10
3/15/23, 3:27 PM Desafio do curso | Coursera

labs() é a função que permite adicionar um título ao seu gráfico.

Nos parênteses da função labs(), escreva a palavra título, seguida de um


sinal de igual e o texto específico do título entre aspas (“Suggested
Chocolate”).

12. Continuação do cenário 2 1 / 1 ponto

Em seguida, crie um novo gráfico de dispersão para explorar a relação entre


diferentes variáveis. Você deseja salvar seu gráfico para poder acessá-lo mais
tarde. Além disso, está ciente de que a função ggsave() tem como padrão salvar
o último gráfico exibido em RStudio, e está pronto para escrever o código a fim
de salvar seu gráfico de dispersão.

Suponha que suas duas primeiras linhas de código sejam:

ggplot(data = trimmed_flavors_df) +

geom_point(mapping = aes(x = Cocoa.Percent, y = Rating)) +

Qual bloco de código você adiciona à terceira linha para salvar seu gráfico
como um arquivo pdf com “chocolate” definido como o nome do arquivo?

ggsave(“pdf.chocolate”)

ggsave(“chocolate.pdf”)

ggsave(chocolate.pdf)

ggsave(“chocolate.png”)

Correto
Você adiciona o bloco de código ggsave(“chocolate.pdf”) para salvar seu
gráfico como um arquivo pdf com “chocolate” definido como o nome do
arquivo. Neste bloco de código:

Dentro dos parênteses da função ggsave(), digite uma aspa seguida do


nome do arquivo (chocolate), um ponto final, o tipo de formato do arquivo
(pdf) e uma aspa de fechamento.

13. Continuação do cenário 2 1 / 1 ponto

Como etapa final do processo de análise, você cria um relatório para


documentar e compartilhar seu trabalho. Antes de compartilhar seu trabalho
com os membros do gerenciamento da Chocolate and Tea, você se reunirá com
sua equipe e obterá feedback. Sua equipe deseja que a documentação inclua
todo o seu código e exiba todas as suas visualizações.

https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 9/10
3/15/23, 3:27 PM Desafio do curso | Coursera

Você deseja registrar e compartilhar cada etapa de sua análise, possibilitar


que seus colegas de equipe executem seu código e exibir suas
visualizações. O que você usa para documentar seu trabalho?

Um notebook de R Markdown

Um banco de dados

Uma planilha

Um data frame

Correto
Você usa um notebook de R Markdown para documentar seu trabalho. O
notebook permite registrar e compartilhar cada etapa de sua análise,
possibilita que seus colegas de equipe executem seu código e exiba suas
visualizações.

https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 10/10

Você também pode gostar