Escolar Documentos
Profissional Documentos
Cultura Documentos
Escuela de Ingenierı́a
Departamento de Ciencia de la Computación
Actividad 1:
Exploración de Datos en Python
Aplicaciones en Ciencia de Datos e Inteligencia Artificial
1 Introducción
Python se ha posicionado como el lenguaje de programación más utilizado para el desarrollo de proyectos
de Aprendizaje de Máquina. Lo anterior, entre otros factores, es debido a que en este lenguaje se han
desarrollado un conjunto de librerı́as altamente especializadas para las distintas etapas o tareas dentro
de un proyecto en esta área.
En esta actividad, a través de ejemplos simples, usted explorará algunas de las funcionalidades de un
conjunto de librerı́as muy utilizadas por los cientı́ficos de datos del ecosistema Python.
2 Instrucciones de la actividad
2.1 Lectura y análisis exploratorio de datos
a
• Abrir entorno de programación, de preferencia utilizar google colab o jupyter notebook.
• Cargar la base de datos de nombre ”ejemplo data.csv”. En esta parte recomendamos explorar las
diferentes opciones de read que tiene disponible la librerı́a Pandas, identificando los argumentos
disponibles en cada una de ellas.
• Identifique los tipos de varibles que hay disponibles en la base de datos (df.types o df.info()).
1
2.2 Estadı́sticas descriptivas
• Utilizando el siguiente código, cree un diccionario con 20 datos que contenga al menos dos atributos
continuos y un string (por ejemplo: nombre, nota, edad).
• Utilizando la base de datos antes creada, genere un histograma para cada variable continua con las
funciones de pandas.
• Luego de esto, importe (instalar de ser necesario) la librerı́a matplotlib y replique los histogramas.
• Genere un gráfico de dispersión con matplotlib, cambie los colores, agregue nombre a los ejes,
agregue tı́tulo, cambie los rangos de los ejes.
• Piense e implemente otro tipo de gráfico con alguna de las dos bases de datos que hemos utilizado.