Você está na página 1de 2

Documentação do Conjunto de Dados do Titanic

Introdução
Este documento descreve um conjunto de dados que contém informações sobre os passageiros
do navio Titanic. O conjunto de dados fornece detalhes sobre a classe das cabines, gênero, idade,
sobrevivência e outras informações relevantes sobre os passageiros a bordo.

Base de Dados
O conjunto de dados do Titanic é armazenado em um arquivo CSV chamado "Conjunto de Dados
- Titanic.csv". O arquivo contém as seguintes colunas:

• ID_Passageiro: Um identificador exclusivo para cada passageiro.


• Sobreviveu: Indica se o passageiro sobreviveu ou não. Os valores possíveis são
"Sobreviveu" ou "Não Sobreviveu".
• Classe: A classe da cabine em que o passageiro estava numerada de 1 a 3.
• Nome: O nome do passageiro.
• Sexo: O sexo do passageiro, indicado como "Mas" (masculino) ou "Fem" (feminino).
• Idade: A idade do passageiro.
O arquivo usa o ponto e vírgula (;) como delimitador de coluna.

Código em Python
O código em Python lida com o conjunto de dados do Titanic, realiza várias análises e gera
relatórios e gráficos para visualização dos resultados. O código é dividido em várias etapas,
conforme descrito a seguir:

Passo 1: Leitura do Arquivo CSV


O código utiliza a biblioteca Pandas para ler o arquivo CSV "Conjunto de Dados - Titanic.csv" e
carregar os dados em um DataFrame.

Passo 2 a 6: Análises de Dados


O código realiza uma série de análises de dados, incluindo:

• Contagem total de passageiros.


• Contagem de passageiros por sexo (homens e mulheres).
• Contagem de sobreviventes e mortos por sexo.
• Cálculo da percentagem de sobreviventes por classe.
• Cálculo da média de idade total e por sexo.
• Identificação do passageiro mais velho e mais novo.
Passo 7: Geração de Relatório e Salvamento em Arquivo
O código gera um relatório com os resultados das análises e salva-o em um arquivo CSV
chamado "Relatorio_Titanic.csv". O relatório inclui informações sobre o número total de
passageiros, número de homens e mulheres, número de sobreviventes e mortos, percentagem
de sobreviventes por classe, média de idade total e por sexo.

Passo 8: Gráficos
O código gera dois tipos de gráficos:

• Gráfico de linha que mostra a percentagem de sobreviventes por classe.


• Gráfico de pizza que representa a distribuição de gênero dos passageiros.
Passo 9: Exibição do Resultado dos Passageiros mais Velho e mais Novo
O código exibe o nome e a idade do passageiro mais velho e do passageiro mais novo na tela.
Execução do Código
Para executar o código, é necessário ter a biblioteca Pandas instalada. O arquivo CSV "Conjunto
de Dados - Titanic.csv" deve estar na mesma pasta onde o código é executado.

O resultado das análises, gráficos e informações sobre os passageiros mais velho são exibidos na
tela.
Conclusão
Este conjunto de dados e o código fornecem uma análise detalhada dos passageiros a bordo do
Titanic, incluindo informações sobre sobrevivência, classe, gênero e idade. As análises e
visualizações ajudam a entender melhor a composição e as estatísticas dos passageiros. O
código pode ser adaptado e expandido para análises adicionais, se necessário.

Você também pode gostar