Você está na página 1de 3

Big Data e Data Science 2016

Parte 3: Gerenciamento de Bancos de Dados com o SQL


Talitha Faustino Speranza
Fundao Getulio Vargas

Lista de Exerccios

O objetivo da lista criar uma base de dados contendo todas as sries do Banco Mundial e
fazer consultas SQL bsicas base. Os arquivos .csv com os dados (de at 2014) sero
distribudos junto com a lista. Eles tambm podem ser obtidos diretamente da fonte, no
Kaggle (https://www.kaggle.com/).

Parte 1: Criao da Base

1. Crie uma base de dados vazia chamada wdi.

2. Crie uma tabela chamada CountryNotes. Ela dever conter os campos

- C ountryCode, do tipo varchar(5),


- S eriesCode, do tipo varchar(100),
- D escription, do tipo varchar(2000).


Voc deve preencher a tabela a partir do arquivo CountryNotes.csv. No esquea de passar
para o comando LOAD INFILE todo o caminho para o arquivo, utilizando o caracter \ para
escape.

3. Exiba os valores do campo CountryCode da tabela CountryNotes. Quantos caracteres so


realmente necessrios para cada campo desta coluna? Modifique o tipo do campo
CountryCode, para que apenas um nmero fixo de caracteres seja aceito.

4. Crie as demais tabelas da base, de acordo com o diagrama ER da pgina seguinte. Os


arquivos .csv correspondentes s tabelas so homnimos.

Dica: Caso crie uma tabela cuja chave estrangeira pertence a uma tabela que ainda no foi
criada, voc pode adicionar a chave a esta tabela depois, via ALTER TABLE. Por exemplo,
Voc pode precisar adicionar uma restrio tabela CountryNotes.

5. Gere o diagrama ER para a base de dados wdi. Compare com o que foi fornecido e
verifique se a estrutura base est correta.

6. Exporte cada uma das bases para um arquivo externo. Voc pode escolher qualquer
formato que no seja .csv.

Envie seus scripts de criao, seu diagrama ER e seus arquivos de dados exportados para
talitha.speranza@fgv.br.
Parte 2: Consultas Base

Exporte TODOS os resultados das consultas a seguir para algum formato de escolha que
no seja .csv, exceto quando indicado.

1. Qual a sigla/chave primria da Alemanha? Repare que os dados esto em ingls. Isso
significa que voc deve buscar por Germany.

2. Liste todas as sries disponveis para cada pas. Para isso, voc deve criar uma query que
devolva uma tabela com as seguintes colunas:

- SeriesCode, o cdigo da srie, da tabela Series


- IndicatorName, o nome da srie, da tabela Series
- CountryCode, o cdigo do pas para o qual a srie est disponvel, da tabela
Indicators

O MySQL indica quantas linhas sua consulta gerou. Ento, quantas sries h na base do
Banco Mundial? No necessrio exportar os resultados.

Dica: Caso fique na dvida em relao s chaves primrias/estrangeiras ou aos campos das
tabelas, consulte o diagrama ER.

3. Liste a quantidade de sries por pas. Quais so os trs pases com o maior nmero de
sries?

Dica: Voc precisar das clusulas GROUP BY e ORDER BY.

4. Liste a definio curta (ShortDefinition), o nome da srie e o cdigo de todas as sries


cujo nome contenha a palavra gdp (sigla em ingls para Gross Domestic Product, o PIB).

Dica: No precisa se preocupar com maisculas e minsculas;

5. Qual o cdigo da srie do PIB per capita em dlares constantes? Em ingls, o nome da
srie GDP per capita (constant 2005 US$).

6. No ano de 2012, em qual pas o PIB per capita a dlares constantes foi o maior?

7. Obtenha toda a srie (isto , todos os pares Value, Year) do PIB per capita a dlares
constantes da Alemanha.

Envie seus scripts com as querys, suas respostas e seus arquivos de dados exportados para
talitha.speranza@fgv.br.