Escolar Documentos
Profissional Documentos
Cultura Documentos
Integrantes:
Bogotá D.C.
Análisis exploratorio
1) Detalle en una tabla del tipo de variable y la escala de medida de cada una de las 15 variables.
ID
YEAR
TITLE
IMDB ID
IMDB TITLE
IMDB YEAR
KIND
GENRES
COUNTRIES
IMDB
RATING
IMDB VOTES
LANGUAGES
RUNTIMES
CERTIFICATES
NUMBER OF
SEASONS
1) ¿ Tiene relación el rating con el número de votos ?
VOTOS VS RATING
25000000
20000000
15000000
10000000
5000000
0
0 20 40 60 80 100 120
A partir de la tabla anterior podemos decir que el rating y los votos tienen una relación
parcialmente directa, ya que el rating dependerá de la cantidad de votantes, a mayor cantidad de
votantes (Buenos votos, malos votos) en una serie o película el rating será mayor o menor, para
este caso observamos que entre más votos mayor será el rating. Esta relación se aprecia más en el
rango de puntuación de 60-95.
Utilidad: Gracias a esto podemos concluir si el numero de votos pueden inferir en el rating del
programa o serie.
2) ¿ La media y la mediana que nos pueden decir sobre rating ?
Gracias a la tabla de datos sobre el rating, podemos obtener que las películas con más
rating y las películas con menos rating, las cuales fueron:
Películas con mayor rating:
The Chosen
A Night to Remember
Peliculas con menor rating:
Por medio del Boxplot realizado, podemos afirmar que al menos el 75% de las películas se
encuentran en una puntuación de rating de 60.
Observando el primer 25% del boxplot, podemos concluir que las películas ubicadas en
este porcentaje están en el rating entre 10-30.
Observando los datos atípicos podemos concluir que algunas de las películas y/o series de
Netflix aun no han obtenido rating o no obtuvieron.
Gracias a la mediana podemos concluir la película que se encuentra en la mitad del rating
es:
Acá podemos observar que el mínimo esta entre 10 y 15 el cual su frecuencia fue de 6 y el máximo
del rating esta entre 95 y 100 donde su frecuencia fue de 7.
Gracias al histograma anterior podemos inferir que los años de más producción de contenido en
Netflix se encuentran entre 2001 a 2005.
5) ¿Cuál fue el formato más famoso y menos famoso en Netflix?
A partir de la tabla de frecuencia y el histograma anterior podemos observar que las mini series de
televisión son las menos famosas, contrario a esto obtenemos que las películas vendrían siendo el
contenido más visto(famoso).
Gracias a las grafica podemos observar que no hay una relación directa entre el rating y el tiempo
de duración.
8) ¿Cual es el genero mas famoso ?
Gracias al histograma que generamos gracias a la base de datos podemos observar que el género
más visto o popular es el de crimen.