O documento descreve o banco de dados MNIST, que contém imagens de dígitos manuscritos utilizados para treinar redes neurais. Ele contém 60 mil exemplos de treino e 10 mil de teste, cada um com 784 atributos representando os pixels da imagem e um atributo de classe. Além disso, apresenta o pacote H20, que permite processamento distribuído de machine learning.
O documento descreve o banco de dados MNIST, que contém imagens de dígitos manuscritos utilizados para treinar redes neurais. Ele contém 60 mil exemplos de treino e 10 mil de teste, cada um com 784 atributos representando os pixels da imagem e um atributo de classe. Além disso, apresenta o pacote H20, que permite processamento distribuído de machine learning.
O documento descreve o banco de dados MNIST, que contém imagens de dígitos manuscritos utilizados para treinar redes neurais. Ele contém 60 mil exemplos de treino e 10 mil de teste, cada um com 784 atributos representando os pixels da imagem e um atributo de classe. Além disso, apresenta o pacote H20, que permite processamento distribuído de machine learning.
• Tratados e centralizados • 60 mil exemplos de treino • 10 mil exemplos de teste
http://yann.lecun.com/exdb/mnist/ Estrutura
• Cada linha possui 785 atributos
• Os primeiros 784 representam cada um o valor rgb de um pixel • O atributo 785 é a classe (digito) • Para visualizar no r é preciso transformar de volta em matriz (28 x 28) H20
• Super pacote de machine learing e ia
• Processamento “distribuído” https://www.h2o.ai/
• Mantido e suportado por especialistas
renomados da área • Disponível em várias plataformas
A Análise de Dados em Python É Amplamente Facilitada Por Uma Variedade de Bibliotecas Poderosas e Ferramentas Específicas para Lidar Com Diferentes Aspectos Do Processo de Análise