Você está na página 1de 1

Padrão de resposta esperado

a) Para pessoas não técnicas, o cientista de dados deve pensar que o público
depende exclusivamente dele para que as informações sejam interpretadas
corretamente. Sendo assim, é ideal a construção de visualizações com imagens
estáticas, considerando também que algumas pessoas podem preferir visualizar os
dados em formato interativo, como em dashboards.

É importante mencionar que simplificar os dados não significa adulterar as


informações, mas sim resumi-las, tomando o cuidado de elucidar ao público tudo que
for extremamente necessário para a compreensão da informação. Na imobiliária, o
cientista de dados poderá optar por construir gráficos estáticos para a parte da
equipe que tem conhecimentos básicos em informática e gráficos dinâmicos para a
outra metade do grupo gestor. Em ambos os casos, é possível utilizar bibliotecas
contidas nas linguagens Python e R.

b) Uma possível solução seria a elaboração de gráficos separados utilizando as


linguagens Python e R: um para representar os pagantes do trimestre e outro para os
inadimplentes. Os dados podem ser analisados com as bibliotecas específicas de cada
linguagem e, em seguida, exportados para o Excel, de modo a facilitar a
visualização pela equipe gestora.

Outra solução possível seria a realização de um comparativo entre os pagantes e


inadimplentes do trimestre. Dessa forma, a equipe gestora poderia observar as
porcentagens, interpretando riscos e projetando possíveis medidas a serem tomadas
para a diminuição do número de inadimplentes. Esse comparativo poderia ser feito
por meio de gráficos construídos também com as bibliotecas das linguagens R
e Python, ou diretamente no Excel, dependendo do volume de dados.

c) Para a solução dessa questão, seria suficiente utilizar o seguinte código com o
método describe() de Python:

-------------------------------------------------------------

import pandas as pd

x = pd.read_excel('CAMINHO_DO_DIRETÓRIO\DadosDesafio.xlsx',
sheet_name='resultadosFinanceiros')

print(x.describe())

-------------------------------------------------------------

Como produto final, método describe() irá exibir o resultado da média


de cada coluna, bem como os valores mínimo e máximo, além de outros cálculos, como
a contagem de registros de cada coluna.

Você também pode gostar