Escolar Documentos
Profissional Documentos
Cultura Documentos
usadas
Bem-vindo ao Milestione Challenge, neste cenário, você explorará estatísticas descritivas no conjunto de
dados de bicicletas usadas.
Nota -
[13]:
df = pd.read_csv("Bicicletas_usadas.csv")
Questão 1
(a) A partir do conjunto de dados fornecido acima, calcule a média para todas as colunas
numéricas, converta-a em dicionário e salve-a na variável média .
(b) A partir do conjunto de dados fornecido acima, calcule a mediana para todas as colunas
numéricas, converta-a em dicionário e salve-a na variável mediana .
(c) A partir do conjunto de dados fornecido acima, calcule a moda para todas as colunas
numéricas, converta-a em dicionário e salve-a na moda variável.
(d) A partir dos valores médios, medianos e moda da coluna kms_driven , é uma distribuição
positivamente assimétrica.
- Se a resposta para a afirmação acima for sim, atribua o valor sim como string, caso contrário, valor
não como string na variável kms_driven.
Salve as saídas para (a), (b) e (c) no seguinte formato -
Exemplo -
{'idade': 85,85,
'kms_dirigido': 1500,01,
'poder': 200,01}
Nota- Aqui arredonde os valores médios e medianos para duas casas decimais e a moda para o número
inteiro.
[57]:
imprimir (média)
mediana = df.mediana()
modo = df.mode()
Questão 2
(a) Da coluna proprietário obtenha a contagem de todas as categorias e converta-a em dicionário
e salve-a na variável proprietário .
- Se a resposta para a afirmação acima for sim, atribua o valor sim como string, caso contrário, valor
não como string na variável class_imb.
Para a pergunta (a), salve a saída no seguinte formato -
Exemplo -
proprietário =
classe_imb =
Arquivo "<ipython-input-58-7a9c7a6960d5>" , linha 1
proprietário =
^
SyntaxError: sintaxe inválida
Questão 3
Para o conjunto de dados fornecido, encontre o seguinte -
Exemplo -
{'idade': 85,85,
'kms_dirigido': 1500,01,
'poder': 200,01}
Nota- Aqui arredonde os valores para duas casas decimais e converta todas as variáveis em dicionário.
[59]:
p_var =
p_sd =
Arquivo "<ipython-input-59-039e0a8010f1>" , linha 1
p_var =
^
SyntaxError: sintaxe inválida
Pergunta 4
Para o conjunto de dados fornecido, encontre o seguinte -
preço_iqr =
iqr_kms_drive =
Pergunta 5
(a) A partir do conjunto de dados fornecido, encontre a matriz de correlação para todas as colunas
numéricas e salve-a em varibale df_corr . Aqui, arredonde os valores para duas casas decimais.
- Se a resposta para a afirmação acima for sim, atribua o valor sim como string, caso contrário, valore
não como string na variável Age_Price.
(c) A partir de df_corr a potência está negativamente correlacionada com o preço.
- Se a resposta para a afirmação acima for sim, atribua o valor sim como string, caso contrário, valor
não como string na variável Power_Price.
Para as questões (a), salve a saída no seguinte formato -
Exemplo -
'kms_drive': 0,3,
'potência': 0,18,
'preço': 0,58}}
[ ]:
df_corr =
Idade_Preço =
Preço_energia =
Pergunta 6
(a) A partir do conjunto de dados fornecido, encontre a assimetria para todas as colunas numéricas
e salve-a em varibale df_skew . Aqui, arredonde os valores para duas casas decimais.
- Se a resposta para a afirmação acima for sim, atribua o valor sim como string, caso contrário, valor
não como string na variável Age_Skew.
(c) De df_skew a potência é altamente distorcida.
- Se a resposta para a afirmação acima for sim, atribua o valor sim como string, caso contrário, valor
não como string na variável Power_Skew.
Para a pergunta (a), salve a saída no seguinte formato -
{Nome da coluna: valor}
Exemplo -
{'idade': 55,85,
'kms_drive': 76,01,
'poder': 61,01}
[ ]:
df_inclinação =
Idade_inclinação =
Potência_Inclinação =
imprimir(df_corr, arquivo = f)
imprimir(Idade_Preço, arquivo = f)
imprimir (Power_Price, arquivo = f)
com open('question6.txt', 'a') como f:
imprimir(df_skew, arquivo = f)
imprimir (Idade_Skew, arquivo = f)
imprimir (Power_Skew, arquivo = f)
[ ]:
Desc_Stats_Question.ipynb
Bicicletas_usadas.csv
pontuação.py
Terminal 1
importar ast
importar JSON
def get_file(nome_do_arquivo):
dados = f.readlines()
pontuação = 0
tentar:
#Questão 1
q1 = 0
pergunta1 = get_file("pergunta1.txt")
pergunta1_1 = ast.literal_eval(pergunta1[0])
pergunta1_3 = ast.literal_eval(pergunta1[2])
if(md5(str(question1_1).encode()).hexdigest() == "5234e07f99ab2b913f26a9dd0d37a3e7" e
md5(str(question1_2).encode()).hexdigest() == "8cf61882c16304cb93aed577e57073b1" e
md5(str(question1_3 ) .encode()).hexdigest() == "7dfebef1f84a7c27b5562b8e84f692b0" e
md5(str(question1[3]).encode()).hexdigest() == "a6105c0a611b41b08f1209506350279e"):
q1 = q1 +20
exceto:
q1 = 0
#Questão 2
tentar:
q2 = 0
pergunta2 = get_file("pergunta2.txt")
pergunta2_1 = ast.literal_eval(pergunta2[0])
if(md5(str(question2_1).encode()).hexdigest() == "69f10a3346bf0f8d8b902a06642ae4ca" e
md5(str(question2[1]).encode()).hexdigest() == "a6105c0a611b41b08f1209506350279e"):
q2 = q2 + 10
exceto:
q2 = 0
#Questão 3
tentar:
q3 = 0
pergunta3 = get_file("pergunta3.txt")
pergunta3_1 = ast.literal_eval(pergunta3[0])
pergunta3_2 = ast.literal_eval(pergunta3[1])
if(md5(str(question3_1).encode()).hexdigest() == "7759614969fe59a095a56b8eb2f6e812" e
md5(str(question3_2).encode()).hexdigest() == "ba8c0fd84352dd004ac3af7eb5ad13d3"):
q3 = q3 + 20
exceto:
q3 = 0
#Pergunta4
tentar:
q4 = 0
pergunta4 = get_file("pergunta4.txt")
if(md5(str(question4[0]).encode()).hexdigest() == "f19bb046ca4ba9a016360ca151cc8a0a" e
md5(str(question4[1]).encode()).hexdigest() == "3804bd983ddd0d379c3167b9126fc866") :
q4 = q4 +10
exceto:
q4 = 0
#Pergunta5
tentar:
q5 = 0
pergunta5 = get_file("pergunta5.txt")
pergunta5_1 = ast.literal_eval(pergunta5[0])
if(md5(json.dumps(question5_1, sort_keys=True).encode('utf-8')).hexdigest() ==
"25fa51b43ce1c5bbc55fa494ce634be1" e md5(str(question5[1]).encode()).hexdigest () ==
"a6105c0a611b41b08f1209506350279e" e md5(str(question5[2]).encode()).hexdigest() ==
"7fa3b767c460b54a2be4d49030b349c7"):
q5 = q5 +20
exceto:
q5 = 0
#Pergunta6
tentar:
q6 =0
pergunta6 = get_file("pergunta6.txt")
pergunta6_1 = ast.literal_eval(pergunta6[0])
if(md5(str(question6_1).encode()).hexdigest() == "cf85a8394c75181155a2b67a581601b0" e
md5(str(question6[1]).encode()).hexdigest() == "7fa3b767c460b54a2be4d49030b349c7"):
q6 = q6 +20
exceto:
q6 = 0
tentar:
pontuação = q1 + q2 + q3 + q4 + q5 + q6
print("FS_SCORE:{0}%".formato(pontuação))
exceto:
imprimir("FS_SCORE:0%")