Você está na página 1de 7

Proyecto 1: Estadística Descriptiva

Integrantes:

Jesus David Castillo Torres


Código: 1720010939

Juan Pablo Gómez Quintero


Código: 1720010383

Julián Enrique Muñoz


Código: 1720010534

Bogotá D.C.
Análisis exploratorio
1) Detalle en una tabla del tipo de variable y la escala de medida de cada una de las 15 variables.

CUALITATIVA ORDINAL NOMINAL CUANTITATIVA INTÉRVALO RAZÓN

ID

YEAR

TITLE

IMDB ID

IMDB TITLE

IMDB YEAR

KIND

GENRES

COUNTRIES

IMDB
RATING

IMDB VOTES

LANGUAGES

RUNTIMES

CERTIFICATES

NUMBER OF
SEASONS
1) ¿ Tiene relación el rating con el número de votos ?

VOTOS VS RATING
25000000
20000000
15000000
10000000
5000000
0
0 20 40 60 80 100 120

A partir de la tabla anterior podemos decir que el rating y los votos tienen una relación
parcialmente directa, ya que el rating dependerá de la cantidad de votantes, a mayor cantidad de
votantes (Buenos votos, malos votos) en una serie o película el rating será mayor o menor, para
este caso observamos que entre más votos mayor será el rating. Esta relación se aprecia más en el
rango de puntuación de 60-95.

Utilidad: Gracias a esto podemos concluir si el numero de votos pueden inferir en el rating del
programa o serie.
2) ¿ La media y la mediana que nos pueden decir sobre rating ?

 Gracias a la tabla de datos sobre el rating, podemos obtener que las películas con más
rating y las películas con menos rating, las cuales fueron:
Películas con mayor rating:

The Chosen
A Night to Remember
Peliculas con menor rating:

National Geographic: Predators at War


South Park: Winter Wonderland

 Por medio del Boxplot realizado, podemos afirmar que al menos el 75% de las películas se
encuentran en una puntuación de rating de 60.

 Observando el primer 25% del boxplot, podemos concluir que las películas ubicadas en
este porcentaje están en el rating entre 10-30.
 Observando los datos atípicos podemos concluir que algunas de las películas y/o series de
Netflix aun no han obtenido rating o no obtuvieron.
 Gracias a la mediana podemos concluir la película que se encuentra en la mitad del rating
es:

Seeta Aur Geeta


 Gracias a la media podemos observar que al menos 524 se encuentran en la
mediana(Peliculas/Series)

3) ¿Cuál seria la mayor y la menor frecuencia de rating?

Acá podemos observar que el mínimo esta entre 10 y 15 el cual su frecuencia fue de 6 y el máximo
del rating esta entre 95 y 100 donde su frecuencia fue de 7.

4) ¿En qué años se produjo más contenido en Netflix?

Gracias al histograma anterior podemos inferir que los años de más producción de contenido en
Netflix se encuentran entre 2001 a 2005.
5) ¿Cuál fue el formato más famoso y menos famoso en Netflix?

A partir de la tabla de frecuencia y el histograma anterior podemos observar que las mini series de
televisión son las menos famosas, contrario a esto obtenemos que las películas vendrían siendo el
contenido más visto(famoso).

7) ¿Tiene el rating alguna relación con la duración de la película?

Gracias a las grafica podemos observar que no hay una relación directa entre el rating y el tiempo
de duración.
8) ¿Cual es el genero mas famoso ?

Gracias al histograma que generamos gracias a la base de datos podemos observar que el género
más visto o popular es el de crimen.

4) Cálculo de medidas descriptivas de alguna de las variables. Como ejemplo de reporte


estadístico, consulte: https://goo.gl/EifPKq

Você também pode gostar