Escolar Documentos
Profissional Documentos
Cultura Documentos
https://www.linkedin.com/in/joao-leopoldo-e-silva/
DIA 01: 12/04
Humanidades Digitais e bancos de dados
ANTES
DE
COMEÇARMOS
...
1. O que vamos aprender não é trivial
PARA NÓS:
TECNOLOGIA É UM MEIO E NÃO UM FIM
O que eu já fiz? O que eu vi na TI?
Arte-educação
Arquivo Desenvolver programas de
Iniciação científica computador
Projetos de pesquisa
Grupos de pesquisa Analisar dados em pesquisas
Mestrados
Analista de governança de dados Mercado de trabalho
O que eu já fiz? O que eu vi na TI?
Arte-educação
Arquivo Desenvolver programas de
Iniciação científica computador
Projetos de pesquisa
Grupos de pesquisa Analisar dados em pesquisas
Mestrados
Analista de governança de dados Mercado de trabalho
DIRETO AO ASSUNTO:
TEORIA:
PRÁTICA:
Humanidades Digitais (1)
Instalar um banco de dados (1)
O que é um banco de dados (1)
Implementar uma estrutura de dados (2)
Ler uma estrutura de dados (2)
Manipular uma arquitetura de dados (2)
Planejar uma estrutura de dados (2)
Alimentar tabelas (2)
Escrever linguagem SQL (2 e 3)
Extrair relatórios (2 e 3)
Sobre bancos de dados:
https://www.ime.usp.br/~jef/apostila.pdf
Cursos de SQL:
https://www.udemy.com/course/aprenda-sql-do-zero/
https://www.udemy.com/course/the-complete-sql-bootcamp/
Sites legais:
https://www.postgresql.org/
https://www.postgresqltutorial.com/
https://www.w3schools.com/sql/
DIA 01: 12/04
Humanidades Digitais e bancos de dados
- Humanidades Digitais
- Bancos de dados
- Instalação do PostgreSQL
- Trocar umas ideias
Instalação do
PostgreSQL
1 Digitais
(digital humanities)
Introdução
The Economist (2017): a commodity mais valiosa do
mundo não é mais o petróleo, mas a informação
Autor(a) desconhecido(a)
● PERSPECTIVA 1): as ciências humanas não podem ficar
presas ao estudo e relacionamento de informações presentes
somente na plataforma física do papel
Autor(a) desconhecido(a)
• Como melhorar o acesso à
informação e ao
conhecimento?
Análise
INFORMAÇÃO
Organizaçã
o
DADO
CONHECIMENTO
DADO INFORMAÇÃO CONHECIMENTO
PARA POLÍTICAS
PÚBLICAS
O que é ‘Humanidades Digitais’?
• Desafios:
“Desenvolver”, “Criar”, “Gerar”,
“Arquitetar”
HUMANIDADES
CIÊNCIAS DA COMPUTAÇÃO
HUMANIDADES
HUMANIDADES DIGITAIS
● Compreender processos computacionais
● Aprender linguagens de programação ● Usando computação, entender padrões ou
novas conexões entre pessoas ou
evidências materiais
CIÊNCIAS DA COMPUTAÇÃO
http://history-lab.org/
Contexto das ‘Humanidades Digitais’
Humanities Computing (Humanidades Computacionais)
1970: surgimento de centros de estudo dedicados a este trabalho (Association for Computers and
the Humanities (ACH) - 1978); tópico comum de conferências e produções regulares, passando
a ser reconhecido como parte do escopo trabalhado por linguistas
Contexto das ‘Humanidades Digitais’
http://www.heartlessmachine.com/shop/aurisonitus-caeruleodenta-airpod-fossil
Contexto das ‘Humanidades Digitais’
ESPAÇO
“GEOGRAFIA” VIRTUAL
Contexto das ‘Humanidades Digitais’
● Armazenar (organizar)
● Analisar (qualitativa e quantitativa)
● Publicar (divulgar)
https://humanidadesdigitais.org/manifesto-das-humanidades-digitais/
https://www.humanitiesblast.com/manifesto/Manifesto_V2.pdf
Estado da arte das Humanidades Digitais
TaDiRAH (Taxonomia das Atividades de Pesquisa nas Humanidades Digitais) - EUA e Europa
• Língua anglófona (inglês)
Captura
Criação
Enriquecimento
Análise
Interpretação
Armazenamento
Disseminação
Meta-Atividades
● 2016: 37 cursos
● EUA: 22
● CANADA: 6
● INGLATERRA: 5
● IRLANDA: 3
● AUSTRALIA: 1
• Doutorado (8%)
• Mestrado (22%)
• Graduação (8%)
DITO
Distribuição física de centros de
Humanidades Digitais reflete
economias de alta renda versus de
média e baixa renda e distribuição da
penetração da internet
NÃO-DITO
Não reflete uso da internet entre
aqueles com educação superior
[universitária] ou a taxa de troca em
várias formas de comunicação
presentes nas tecnologias de
comunicação e informação
(ADHO, 2012)
(TERRAS, 2011) e (ADHO, 2012)
Estado da arte das Humanidades Digitais no Brasil
Oliveira e Martins (2017). O Estado da Arte em Pesquisas sobre Humanidades Digitais no Brasil
● Tema pouco estudado; Falta de identificação à área; área dominante em língua inglesa
Estado da arte das Humanidades Digitais no Brasil
Os autores argumentam a diferença entre a presença das áreas a partir de texto de Berry (2011), que
discute a apropriação da tecnologia pelas ciências humanas em duas grandes ondas:
• estudo de repositórios digitais
• uso de softwares para análise de materiais eletrônicos
FACEPAGER GEPHI
(extração –mineração- de dados do Facebook) (construção de mapas de redes - pontos de ligação entre polos)
Análise dados textuais
IRAMUTEQ
(leitura de textos)
(construção de mapas de conceitos)
(parametrização através da linguística - peso às palavras)
Análise de dados
○ Manipulação de dados
○ Geração de gráficos
○ Construção de mapas
Análise de dados
○ Manipulação de dados
○ Geração de gráficos
○ Construção de mapas
várias etapas:
raspagem,
armazenamento,
limpeza, etc...
DADO CONHECIMENTO
“mundo real” (PgAdmin ou qualquer outro
programa para processar as
infos)
INFORMAÇÃO
(bd-relacional)
“modelo do mundo real,
representação, mini-mundo”
Introdução a bancos de
2 dados relacionais
O que é um ‘banco de dados’?
O QUE É
● Armazenar dados
COMO
● Arquitetar estruturas de dados
● Alimentar o banco de dados
● Extrair relatórios
● Cruzar informações
USANDO O QUE
● Linguagem de programação (SQL)
O que é uma ‘tabela’?
Planilhas
● Um schema é composto
por várias tabelas
3 PostgreSQL
Site oficial PostgreSQL
https://www.postgresql.org/
Documentação
https://www.postgresql.org/files/documentation/pdf/12/postgresql-12-US.pdf
(Inglês - versão atual - 12)
3 4
5 6
7 8
9 10
11 12
O Stack
Builder é
utilizado para
instalar
extensões no
PostgreSQL
13 … mas, no
nosso caso,
não vamos
instalar
nenhuma...
14
1
5
https://dbeaver.io/
Humanidades Digitais: introdução a
bancos de dados e SQL para pesquisa em
humanidades
DIA 01: 12/04
Humanidades Digitais e bancos de dados
- Modelo-entidade Relacionamento
- Modelo físico
- SQL create, alter, drop, delete, insert
- Construir tabelas
- Alimentar tabelas
O que é um ‘banco de dados’?
O QUE É
● Armazenar dados
COMO
● Arquitetar estruturas de dados
● Alimentar o banco de dados
● Extrair relatórios
● Cruzar informações
USANDO O QUE
● Linguagem de programação (SQL)
Banco de dados
● Um schema é composto
por várias tabelas
CRIAR tabela(s)
usar interface do PgAdmin4 e depois verificar códigos
● CREATE
● ALTER
● DROP ALTERAR tabela(s)
modificar direto no código e depois executar via PgAdmin4
boolean
https://www.w3schools.com/sql/sql_alter.asp
Primeiros passos...
EXEMPLO
• TIPO DA VACINA
• NOME DA VACINA
• SE FOI APROVADA OU NÃO
• QUANDO FOI CRIADA
DDL
(Data Definition Language - Linguagem de Definição de Dados)
MER
CREATE TABLE uf(
id_uf integer PRIMARY KEY,
uf varchar(2)
);
https://www.w3schools.com/sql/sql_insert.asp
DML - UPDATE
https://www.w3schools.com/sql/sql_update.asp
DML - DELETE
https://www.w3schools.com/sql/sql_delete.asp
DDL - ALTER
https://www.w3schools.com/sql/sql_alter.asp
DDL - DROP
https://www.w3schools.com/sql/sql_alter.asp
5 Importar dados
BANCO DE DADOS QUE VAMOS TRABALHAR
Banco relacional: relacionamentos
O que é um arquivo .csv?
- Importar tabelas
- Importar dados
- SQL select
- Extrair relatórios
● DIA 01: vimos um pouco de Humanidades
Digitais, aprendemos o que é e para que
serve um banco de dados e instalamos o
PostgreSQL
SELECT -> selecione os campos das tabelas que você quer levantar
FROM -> indique as tabelas que os campos de seu interesse fazem parte
WHERE -> condição (pode servir como JOIN também)
AND / OR -> condição adicional (uma consulta pode ter vários AND e/ou vários OR)
DML - SELECT
SELECT tipo_vacina
FROM vacina
● Quais são os tipos de vacina
que tenho na base de
dados? SELECT DISTINCT tipo_vacina
FROM vacina
DML - SELECT
Toda extração de relatório começa com uma pergunta
que será transformada em código SQL
SELECT tipo_vacina
● Quais são os tipos de vacina FROM vacina
que tenho na base de
dados? SELECT DISTINCT tipo_vacina
FROM vacina
BÔNUS
SELECT nome_vacina
● Qual o nome das vacinas
FROM vacina
que não são de RNA? WHERE tipo_vacina != ‘RNA’
Extração de relatórios na
SELECT -> selecione os campos das tabelas que você quer levantar
FROM -> indique as tabelas que os campos de seu interesse fazem parte
GROUP BY -> obrigatório utilização quando há função de agregação no SELECT
ORDER BY -> ordenar pelo campo
● count()
● Contagem de dados
● sum()
● Soma de valores
● avg()
● Estatística (média, moda, ...)
● ...
DML - SELECT
SELECT COUNT(aprovada)
● Quantas vacinas foram
FROM vacina
aprovadas? WHERE aprovada = True
DML - SELECT
BÔNUS
BÔNUS
BÔNUS
BÔNUS
3 considerando a cardinalidade
(relacionamento entre tabelas)
https://www.devmedia.com.br/sql-join-entenda-como-funciona-o-retorno-dos-dados/31006
CARDINALIDADE
PODER DO BANCO DE DADOS
RELACIONAL
FROM tabela1
JOIN tablea2
ON tabela1.campo_pk = tabela2.campo_fk
CONSULTA COM DUAS OU MAIS TABELAS
INSERT INTO uf
VALUES
(1,'SP'),
(2,'MG'),
(3,'PB');
SELECT ocorrencia.data_ocorrencia,
vitima.tipo_vitima,
vitima.nome,
vitima.genero,
vitima.idade,
vitima.cor_raca
FROM ocorrencia
JOIN vitima
ON vitima.id_ocorrencia = ocorrencia.id_ocorrencia
DML – SELECT
SELECT ocorrencia.data_ocorrencia,
violencia.tipo_violencia,
autor.instituicao
FROM ocorrencia
JOIN violencia
ON violencia.id_ocorrencia= ocorrencia.id_ocorrencia
JOIN autor
ON autor.id_ocorrencia = ocorrencia.id_ocorrencia
DML – SELECT
SELECT autor.instituicao,
count(violencia.tipo_violencia),
FROM ocorrencia
JOIN violencia
ON violencia.id_ocorrencia= ocorrencia.id_ocorrencia
JOIN autor
ON autor.id_ocorrencia = ocorrencia.id_ocorrencia
GROUP BY autor.instituicao
DML - SELECT
https://www.w3schools.com/sql/default.asp
https://www.devmedia.com.br/sql-basico/28877
https://www.devmedia.com.br/sql-avancado/28889
CONSEQUENTEMENTE, POR FIM,
....
ANTES
DE
FINALIZARMOS
...
1. O que aprendemos não é trivial
UMA PROPOSTA:
REDE DE TROCA DE IDEIAS SOBRE
TECNOLOGIA PARA AS CIÊNCIA
SHUMANAS
Sobre bancos de dados:
https://www.ime.usp.br/~jef/apostila.pdf
Cursos de SQL:
https://www.udemy.com/course/aprenda-sql-do-zero/
https://www.udemy.com/course/the-complete-sql-bootcamp/
Sites legais:
https://www.postgresql.org/
https://www.postgresqltutorial.com/
https://www.w3schools.com/sql/