Você está na página 1de 5

Evaluación Final (A) 2019 – 10

Semipresencial – Programa a Distancia

Asignatura

Inteligencia de Negocios

Docente : Esther Balbuena Alarcón

Consigna de trabajo

A. Diseña una solución de inteligencia de negocios de mediana complejidad


haciendo uso de metodología y herramientas de inteligencia de Negocios
empleadas en clase: MySql Workbench, PowerBI desktop y la suite de Pentaho
para la creación de un proyecto BI.
B. Instrucciones:
- Desarrolla las preguntas planteadas:
- Revisa la rúbrica de evaluación en la que podrás conocer los aspectos que
se evaluarán en el producto que estás entregando.
- Guarda el archivo y envíalo a través del ícono Evaluación Final de tu aula
virtual.

PREGUNTAS:

1. Identificar del cuadro de información mostrado: dimensiones, hecho y medidas, y


con ello elabora un modelo dimensional de alto nivel. (5 puntos)

Temáticas sobre los que les gusta informarse en Redes Sociales

FACEBOOK TWITTER

TIPO DE INFORMACIÓN BAJO MEDIO ALTO BAJO MEDIO ALTO


1-4 5-7 8-10 1-4 5-7 8-10
Deportes 47 20 33 45 19 30
Política 22 34 44 23 30 47
General 10 27 63 0 27 53
Social 19 28 53 40 29 31
Espectáculos/Farándula 20 32 48 9 29 62
Vida familiar 20 32 42 54 28 18
Cultura 10 27 55 26 27 47
Relacionada con la
escuela 11 29 65 53 34 23
Inteligencia de Negocios

Bajo, medio, alto: Frecuencia de accesos semanales

Hechos:
Frecuencia en redes sociales

Dimensiones
- Tipo de información
- Tipo de Red social

Medidas
- Cuenta de ingresos por tipo de red social
- Cuenta de ingresos por tipo de información
- Cuenta de ingresos por tipo de red social e información

Modelo de alto nivel

2. CASO Datos Abiertos. (9 puntos)


Elija un conjunto de datos del portal de datos abiertos:
https://www.datosabiertos.gob.pe/, u otra fuente de su elección y
desarrolle lo siguiente:
- Describa la fuente elegida.

La fuente que se ha elegido para la realización del presente trabajo es el tipo de cultivo
por comunidad de la zona Loreto y Amazonas teniendo en cuenta los nombres de las
comunidades como también el tipo de manchales por comunidad, así como también
el cultivo que se cultiva en esa región y el año de la encuesta,

- Modelo dimensional, que contenga como mínimo una tabla de hecho y tres
dimensiones. (Presentar Modelo lógico)

El modelo lógico de datos que se tiene es el siguiente:

Evaluación Final 2019 – 10 - A Página 2


Inteligencia de Negocios

- Realice proceso ETL para carga de datos al datamart. (Presente loa archivos
de trabajo y pantallas de desarrollo y resultados)

- ¿Cuáles son las preguntas analíticas que puede responder con su modelo?
(Indique por lo menos 2)

o Tipo de vegetales x comunidad + cantidad


o Tipo de vegetales x manchales.
o Tipo de vegetales x zonas y cuecas

- Qué tipo de gráficos usaría para presentar su resultado. Justifique su


respuesta.

Evaluación Final 2019 – 10 - A Página 3


Inteligencia de Negocios

Gráficos circulares: esto se debe a que la cantidad de datos que se puede mapear por
ejemplo las comunidades con sus cantidades de tipos de vegetales ingresan
perfectamente en un gráfico circular.

Gráfico linear: con esto podemos comprar dos variables por ejemplo el tipo de
producto, su cantidad y la cantidad de productos de este tipo que se encuentra en una
determinara región o en una comunidad.

3. CASO BASKETBALL. (6 puntos)

En el conjunto de datos Basketball.csv se encuentran las siguientes columnas para


diferentes jugadores:

 height: altura en pies


 weight: peso en libras
 success_field_goals: porcentaje de tiros de campo exitosos
 success_free_throws: porcentaje de tiros libres exitosos
 avg_points_scored: puntos promedio anotados por juego

Enlace a fuente de datos:


https://raw.githubusercontent.com/Feynman27/PythonSandbox/master/data/
basketball.csv

Intentar predecir el porcentaje de tiros de campo exitosos para un jugador en base al


resto de variables utilizando la regresión lineal.

Los datos se han de dividir en un conjunto de entrenamiento que contenga el 80% de


los datos y otro de test con el resto.

Cuestiones:
¿Cuál es el modelo planteado?

El modelo que se plantea es uno de regresión lineal ya que se encuentra normalizado


la BD solo se utilizará un elemento del programa Pentaho:

¿Cuál es el R2 del modelo?

El R2 del modelo es 0.8

Evaluación Final 2019 – 10 - A Página 4


Inteligencia de Negocios

Evaluación Final 2019 – 10 - A Página 5

Você também pode gostar