Escolar Documentos
Profissional Documentos
Cultura Documentos
MQA
Achei no Kaggle no seguinte link. Ele foi feito por um engenheiro de dados
chamado Gregory Smith através de web scraping do seguinte website:
https://www.vgchartz.com/gamedb/.
É um dataset sobre venda de videogames mundialmente.Segundo o Kaggle, o
dataset foi upado faz 5 anos. Tem 16598 linhas e 11 colunas.
3)Variáveis
Missing data
Rank 0
Nome 0
Plataforma 0
Ano 271
Gênero 0
Publisher 58
NA_vendas 0
EU_vendas 0
JP_vendas 0
outras_vendas 0
Global_vendas 0
4)Estatística descritiva
Podemos ver que somente 11 mil nomes de jogos, dentre 16 mil registros, são
únicos. O nome mais comum foi Need for Speed: Most Wanted com 12 repetições.
Separando estas 12 linhas podemos entender o que acontece:
5) Primeiras Análises
Para satisfazer a curiosidade óbvia, vamos ver os jogos top 10 de vendas mundiais:
Agora observando todos os jogos lançados entre 1980 e 2020 e observando seus
valores de vendas notamos o seguinte formato:
Conforme o post do Kaggle, esta base foi colhida faz 5 anos (ou seja, 2016) porém,
alguns dados referentes ao ano 2017 e 2020 estão presentes no dataset,
provavelmente algum erro no banco de dados. Na minha opinião, poderíamos retirar
todos os dados posicionados depois de 2015 para trabalhar com essa base com
mais confiança. Fora isso, é uma bela curva, poderíamos explorar o porquê dessa
queda na segunda década do novo século.