Escolar Documentos
Profissional Documentos
Cultura Documentos
Faço isso como verificação da qualidade do trabalho para garantir que meus
métodos são justos. E para ter certeza de que estou prestando atenção a
qualquer parcialidade que possa interferir no resultado. Como analista, você
deve fazer isso também. Às vezes ficamos muito próximos de nossos
dados. Então, afastar-se e perguntar a nós mesmos se nossos processos fazem
sentido é fundamental. Mas vamos voltar um pouco e definir o que é
metadados. Metadados são dados sobre dados. Como eu disse: profundo.
Algumas tabelas não exigem uma chave primária. Por exemplo, uma tabela de
receitas pode ter várias chaves estrangeiras e não ter uma chave primária. Uma
chave primária também pode ser construída usando múltiplas colunas de uma
tabela. Este tipo de chave primária é chamada de chave composta. Por
exemplo, se customer_id e location_id são duas colunas de uma chave
composta para uma tabela de clientes, os valores atribuídos a esses campos em
qualquer linha determinada devem ser únicos dentro de toda a tabela.
Cenário:
Neste caso, você pode descobrir qual é o sabor mais popular usando unidades
vendidas como sua medida. Em particular, pode-se usar a coluna de unidades
vendidas para calcular o número total de unidades vendidas durante o ano para
cada sabor. Infelizmente, o conjunto de dados não fornece a quantidade de
vendas anuais por sabor. Neste caso, seu próximo passo seria perguntar a suas
parte interessadas se os dados das vendas anuais por sabor estão disponíveis
em outra fonte. Caso contrário, você pode acrescentar uma declaração sobre as
limitações dos dados atuais à sua análise.
Se for verificado que a temperatura afeta as vendas, você será capaz de oferecer
a suas parte interessadas uma visão como a que se segue: "Quando as máximas
diárias estão acima de X graus, a média de vendas de sorvete aumenta em Y.
Portanto, a empresa deve planejar o aumento do estoque durante esses tempos
para maximizar as vendas".
Você pode usá-los para determinar se uma data específica cai em um fim de
semana ou feriado e adicionar uma coluna à sua planilha que reflita estas
informações. Assim, você pode descobrir se as vendas nos fins de semana e
feriados são maiores do que as vendas em outros dias. Isto será útil para saber
para fins de planejamento de inventário e marketing.
Se assim for, seu próximo passo seria descobrir como acessar os dados dos
clientes da empresa. Você pode então juntar os dados de receita de vendas à
tabela de dados do cliente para categorizar cada venda como de um cliente novo
ou retornando e analisar a diferença de lucratividade entre os dois conjuntos de
clientes. Estas informações ajudarão suas partes interessadas a desenvolverem
campanhas de marketing para tipos específicos de clientes a fim de aumentar a
fidelidade à marca e a rentabilidade geral.
Conclusão
Explorando metadados
Serão exibidos os metadados da foto, que podem lhe dizer qual o tipo de arquivo
que é; a data e a hora em que foi tirada; a geolocalização, ou onde foi tirada; que
tipo de dispositivo foi usado para tirar a foto; e muito mais. Surpreendente, não é?
Vamos a um outro exemplo. Toda vez que você envia ou recebe um e-mail, os
metadados são enviados juntamente com aquela mensagem. Você pode
encontrá-los clicando em "Mostrar Original" ou "Ver Detalhes da mensagem".
Título e descrição
Qual é o nome do arquivo ou website que você está examinando? Que tipo de
conteúdo ele contém?
Etiquetas e categorias
Qual é a visão geral dos dados que você tem? Os dados são indexados ou
descritos de uma forma específica?
Fotos
Sempre que uma foto é capturada com uma câmera, metadados como nome de
arquivo da câmera, data, hora e geolocalização são coletados e salvos com ela.
E-mails
Planilhas e documentos
Websites
Cada página web tem uma série de campos de metadados padrão, tais como
etiquetas e categorias, nome do criador do site, título e descrição da página web,
hora da criação e qualquer iconografia.
Arquivos digitais
Livros
Os metadados não são apenas digitais. Cada livro tem um número de metadados
padrão nas capas e no interior que o informarão de seu título, nome do autor, um
índice, informações da editora, descrição dos direitos autorais, índice e uma breve
descrição do conteúdo do livro.
Gerenciamento de metadados
Os arquivos CSV utilizam texto simples e delimitados por caracteres. Assim, cada
coluna ou campo fica claramente distinto de outro depois de importar. Como
vimos, os CSVs são separados por vírgula, e geralmente o aplicativo de planilhas
detectará automaticamente essas separações. Mas às vezes, você pode precisar
indicar que o separador é outro caractere ou um espaço, selecionando as
diferentes opções nesta janela.
Agora nosso arquivo CSV está pronto para trabalhar em nossa planilha. Eu passo
a maior parte do meu tempo no trabalho analisando planilhas cheias de
informações sobre saúde. Normalmente começo procurando em um conjunto de
dados maior. Então eu puxo um subconjunto dele para uma planilha para que eu
possa trabalhar com ela. Talvez eu queira analisar o crescimento anual da
demanda dos usuários no Google Search por certos serviços de saúde, como a
telemedicina. Ou talvez eu queira olhar para conjuntos de dados de organizações
externas de saúde ou agências para obter mais informações sobre esta tendência.
Por exemplo, com a telemedicina, talvez eu olhe para uma planilha que liste os
fornecedores de telemedicina. Há tantas maneiras de as planilhas o ajudarem a
encontrar os insights que você precisa. Uma fonte que eu uso muito é o
Repositório de dados da organização mundial de saúde.
Este é um lugar onde qualquer pessoa pode acessar dados de código aberto.
Como você pode ver, há toneladas de dados disponíveis. Você pode pesquisar
por tema, categoria, indicador e país. Você também pode acessar o site
Metadados da organização Mundial de Saúde, se você quiser aprender mais
sobre os dados no repositório.
Para nosso exemplo, vamos olhar para médicos por país e ano.
Esta informação seria útil para um projeto de análise de dados que investiga
quantos médicos estão disponíveis para tratar pacientes dentro de uma
determinada população em comparação com outras populações. Para obter estes
dados, vamos começar nessa página web, que contém o conjunto de dados que
desejamos. Depois faremos o download dos dados como um arquivo CSV.
Após a revisão dos dados para ter certeza que estão claros, podemos nomeá-los
e começar nosso trabalho.
Sabemos que é muita informação para absorver, mas você ficará muito mais
confortável com isso, quanto mais você praticar. A seguir, vamos aprender a
classificar e filtrar seus dados para se concentrar nas informações relevantes para
você.
Classificar e filtrar
Nos últimos vídeos, você aprendeu sobre os dados internos e externos. Agora vou
lhe mostrar como concentrar-se apenas nos dados que são relevantes para o
problema que você está tentando resolver. Isso é útil se você estiver trabalhando
com uma planilha muito grande e complexa, que os analistas de dados encontram
o tempo todo. Ter muitos dados pode dificultar para encontrar e analisar
rapidamente as informações que você precisa. As análises de projetos não são as
mesmas. Muitas vezes os analistas de dados processam, visualizam e usam os
dados de forma muito diferente, mesmo que venham exatamente da mesma fonte.
Vamos a um exemplo. Verifique esta planilha que mostra as vendas do
representante de uma empresa e onde eles trabalham. Diferentes analistas de
dados podem querer informações diferentes da planilha, e é lá que a triagem e a
filtragem começam. Classificar e filtrar os dados em uma planilha nos ajuda a
personalizar a forma como os dados são apresentados. Eles também podem
organizar os dados para que os analistas possam se concentrar nas partes que
importam. Pense nisso como uma lupa para nossos dados. Vamos começar com
a classificação. A classificação envolve a organização dos dados em uma ordem
significativa para facilitar a compreensão, a análise, e a visualização. Os dados
podem ser classificados em ordem crescente ou decrescente e em ordem
alfabética ou numérica. A classificação pode ser feita em toda planilha ou apenas
em uma única coluna ou tabela. Você também pode classificar por múltiplas
variáveis. Por exemplo, se nosso conjunto de dados contém os campos de cidade
e estado, podemos classificar primeiro por cidade e depois por estado.
Sempre que você estiver classificando dados, é sempre uma boa ideia congelar
primeiro a linha de cabeçalho. Para isso, vamos destacar a linha. Em seguida, a
partir do menu Ver, escolha congelar uma linha.
Isso fixa a linha no lugar. Agora, quando nos deslocamos pela planilha, a linha de
cabeçalho permanece visível para que saibamos a categoria de cada coluna.
Assim está ótimo pra mim. Agora vamos classificar a planilha inteira. Vamos
classificar primeiro por cidade. Para fazer isso, selecione a coluna da cidade,
depois use a seta direcional pra baixo para classificar a planilha. Selecione de A a
Z.
Na caixa de diálogo, certifique-se de que "Os dados têm linha de cabeçalho" esteja
marcada.
O filtro oculta temporariamente qualquer coisa que não atenda à condição. Mas
note que, mesmo que eles não estejam visíveis, eles ainda estão lá. Quando
chegar a hora de ver a planilha inteira novamente, simplesmente remova o filtro.
Olá. Bem-vindo de volta. Ao longo deste curso, você viu como o BigQuery pode
ser usado para visualizar e analisar dados de toneladas de fontes. Agora vamos
explorar os diferentes níveis de conta que o BigQuery oferece, para que você
saiba como escolher o nível certo para suas necessidades e como você pode
acessá-los. O BigQuery é oferecido para você sem nenhum custo. Existem
opções pagas disponíveis, mas não vamos precisar delas para as atividades
deste curso. Em vez disso, vamos falar sobre dois tipos de conta: sandbox e
avaliação gratuita. Uma conta sandbox está disponível sem nenhum custo e
qualquer um com uma conta no Google pode fazer login e usar. Há algumas
limitações para este tipo de conta. Por exemplo, você tem um máximo de 12
projetos por vez. Isso significa que se você quiser para fazer um 13º projeto, vai
ter que excluir um dos seus 12 projetos originais. Ela também não permite que
você insira novos registros em um banco de dados ou atualize os valores dos
campos de registros existentes. Essa Linguagem de Manipulações de Dados ou
DML não tem têm suporte no sandbox No entanto, você vai precisar fazer isso
nas atividades do curso. Você pode ler mais sobre as limitações de uma conta
sandbox na documentação do BigQuery. Este é o tipo de conta que vamos usar
para a maioria de nossas atividades. É simples de configurar. Então, mais tarde
neste vídeo vamos revisar cada um desses passos necessários para criar uma
conta. Antes disso, porém, devemos falar sobre a outra maneira de usar o
BigQuery sem custos. A avaliação gratuita do Google Cloud. A avaliação gratuita
dá acesso a mais do que o BigQuery tem a oferecer com menos limitações no
geral. A avaliação gratuita oferece US$ 300 em crédito para uso no Google Cloud
durante os primeiros 90 dias. Você não chegará nem perto desse limite de gastos
se usar o console BigQuery somente para praticar consultas SQL. Depois de
gastar os US$ 300 de crédito ou depois de 90 dias, a sua avaliação gratuita vai
expirar e você vai precisar selecionar pessoalmente atualizar para uma conta
paga a fim de trabalhando no Google Cloud. Seu método de pagamento não será
cobrado automaticamente após o término da sua avaliação gratuita. A avaliação
gratuita exige que você configure uma opção de pagamento no Google Cloud.
Mas a menos que você opte por uma atualização da conta, ele não vai cobrar
você. Porém, ele exige, sim, que você insira um tipo de pagamento. Nós
entendemos se você não se sentir confortável com essa opção. Este é um dos
motivos pelos quais existe a conta sandbox do BigQuery, para que você não
precise inserir nenhuma informação de pagamento. Com qualquer tipo de conta,
você pode atualizar para uma conta paga a qualquer momento e manter todos
os seus projetos existentes. Se você configurar uma conta para avaliação
gratuita mas optar por não atualizar para uma conta paga quando seu período
de teste terminar, você pode então configurar uma conta sandbox. No entanto,
os projetos da sua avaliação não serão transferidos para sua sandbox. Seria
como recomeçar do zero. Apenas algo para ter em mente. Agora vamos definir
sua conta sandbox, que você pode transformar em avaliação gratuita ou atualizar
para uma conta paga se preferir. Primeiro, nós vamos para a página de
documentação do sandbox do BigQuery. Em seguida, vamos para o canto
superior direito para fazer login em quaisquer contas do Google que você desejar
para usar para a conta sandbox do BigQuery. Vamos então selecionar o
botão"Vá para BigQuery" na página de documentação. Isso nos leva a um menu
suspenso para selecionar um país e para ler os termos do contrato de serviço.
Isso nos levará ao espaço de trabalho SQL, que vamos usar nas nossas
próximas atividades. Escolha "Criar projeto" e dê um nome ao projeto, gerando-
lhe um ID. Escolha "Criar" e, então, "Pronto". Aí está. No próximo vídeo, vamos
explorar o que cada parte do espaço de trabalho SQL faz e como vamos usá-lo
em atividades futuras. Vejo você lá.
Olá. Neste vídeo, aprenderemos sobre cada parte do espaço de trabalho do SQL
no BigQuery para que você possa usá-lo durante este curso e ao longo de sua
carreira como analista de dados. É uma ferramenta extremamente valiosa e
amplamente popular, então entender como ela funciona será de grande ajuda.
Fique à vontade para acompanhar em sua tela enquanto exploramos o BigQuery.
Observe que minha tela parece um pouco diferente da sua, já que a interface do
BigQuery é constantemente atualizada. Não se preocupe se for o caso, pois
pequenas diferenças não o impedirão de entender o básico. Para começar, vá
para a página de entrada do BigQuery e faça login na conta em que você criou
anteriormente. Para navegar até o espaço de trabalho do SQL, selecione o menu
no lado esquerdo da tela e role para baixo até o cabeçalho do Big Data. Em
seguida, passe o mouse sobre o rótulo do BigQuery e clique em “espaço de
trabalho do SQL” no menu suspenso. Agora que estamos no espaço de trabalho
do SQL, vamos pesquisar conjuntos de dados públicos, selecionar um conjunto
de dados por meio do Data Explorer, executar uma consulta e carregar nossos
próprios dados para consulta. Primeiro, vamos procurar um conjunto de dados
público para usar. Para selecionar um conjunto de dados público, navegue até o
menu Explorador no lado esquerdo da tela. Clique no botão “Adicionar dados”
no canto superior direito do menu. Em seguida, no menu suspenso, selecione
“Explorar conjuntos de dados públicos”. Isso abrirá o marketplace e mostrará os
conjuntos de dados públicos disponíveis. Vamos para a barra de pesquisa do
marketplace procurar noaa_lightning, um conjunto de dados que usaremos em
uma atividade futura. Clique no conjunto de dados “Cloud-to-Ground Lightning
Strikes”. Isso nos dará uma descrição e uma pré-visualização do conjunto de
dados que captura observações sobre a atividade de raios e padrões climáticos
nos Estados Unidos. Clique em “Visualizar conjunto de dados”. Isso o levará de
volta ao espaço de trabalho do SQL e criará uma guia para o conjunto de dados.
Podemos então voltar à guia Editor que abrimos ou clicar em “Compor nova
consulta” para começar a escrever com SQL. À esquerda, observe que a lista
suspensa de dados públicos do BigQuery está no menu Explorador. Podemos
clicar na seta para expandir a lista de dados do BigQuery e escolher um novo
conjunto de dados. Vamos selecionar o primeiro conjunto de dados na lista
suspensa, austin_311. Quando fazemos isso, ele se expande para mostrar a
tabela dentro do conjunto de dados. Podemos abrir o conjunto de dados para
uma pré-visualização. A guia Esquema contém os nomes de cada coluna no
conjunto de dados. A guia Detalhes contém metadados adicionais, como a data
de criação do conjunto de dados. A guia Pré-visualização contém as primeiras
linhas do conjunto de dados. Nesta página, podemos clicar em “Consultar” para
criar automaticamente uma nova janela do editor com o modelo para uma
consulta já preenchida. A partir daqui, coloque um asterisco após selecionar,
onde nosso cursor aparece, e execute a consulta. Parabéns, você executou uma
consulta do SQL no BigQuery. A consulta que você executou retornou linhas do
conjunto de dados que são preenchidas em uma janela abaixo da interface do
editor. Os resultados de qualquer consulta executada também serão exibidos
aqui. Agora, digamos que você tenha os resultados de uma pesquisa que deseja
fazer o upload para o BigQuery e analisar usando o SQL. Para adicionar seus
próprios dados ao BigQuery, escolha o ID do projeto que deseja adicionar.
Selecione o ícone de três pontos verticais para abrir as opções do projeto e
escolha “Criar conjunto de dados”. Atribua um nome ao conjunto de dados que
o ajudará a identificá-lo mais adiante, como por exemplo, upload_test_dataset.
Em seguida, clique em “Criar conjunto de dados”. Depois, vá para o menu
Explorador e escolha os três pontos verticais ao lado do conjunto de dados na
lista suspensa Projetos. Agora vamos selecionar o ícone de criar tabela, que
abre uma janela pop-up. Em Fonte e criar tabela de, selecione “Fazer upload” ou
qualquer método de sua preferência para fazer o upload de seus dados. Aqui,
podemos fazer o upload de qualquer arquivo de dados, como por exemplo,um
arquivo CSV. Vamos dar à nossa tabela um nome útil, como test_table. Verifique
se o esquema está definido para detecção automática e selecione “Criar tabela”.
Há muito mais por vir com o BigQuery. Fique à vontade para assistir novamente
a este vídeo a qualquer momento e continue praticando. Vejo você em breve.
BigQuery em ação
Usando o BigQuery
BigQuery é um armazém de dados no Google Cloud que os analistas de dados
podem usar para consultar, filtrar grandes conjuntos de dados, agregar
resultados e realizar operações complexas.
Uma próxima atividade é realizada em BigQuery. Esta leitura fornece instruções
para criar sua própria conta BigQuery, selecionar conjuntos de dados públicos e
carregar arquivos CSV. No final desta leitura, você pode confirmar seu acesso
ao console BigQuery antes de passar para a atividade.
Tipos de contas BigQuery
Existem dois tipos diferentes de contas: sandbox e free trial. Uma conta sandbox
permite que você pratique consultas e explore gratuitamente conjuntos de dados
públicos, mas tem restrições adicionais para além das quotas e limites padrão.
Se você preferir usar BigQuery com os limites padrão, você pode criar uma conta
de teste gratuita em seu lugar. Mais detalhes:
Uma conta sandbox gratuita não pede um método de pagamento. No entanto,
ela limita a 12 projetos. Também não permite que você insira novos registros em
um banco de dados ou atualize os valores de campo dos registros existentes.
Estas operações de linguagem de manipulação de dados (DML) não são
suportadas no sandbox.
Uma conta experimental gratuita requer um método de pagamento para
estabelecer uma conta faturável, mas oferece total funcionalidade durante o
período experimental.
Com qualquer tipo de conta, você pode atualizar para uma conta paga a qualquer
momento e reter todos os seus projetos existentes. Se você criar uma conta
experimental gratuita, mas optar por não atualizar para uma conta paga quando
seu período experimental terminar, você ainda poderá criar uma conta sandbox
gratuita naquele momento. No entanto, os projetos de sua conta de teste não
serão transferidos para sua conta sandbox. Seria como recomeçar do zero.
Com SQL, o uso de maiúsculas geralmente não importa. Você poderia escrever
SELECT ou selecionar ou SeLeCT. Ambos iriam funcionar! Mas se você usar
maiúsculas como parte de um estilo consistente, suas consultas parecerão mais
profissionais.
Para escrever consultas SQL como um profissional, é sempre uma boa ideia
usar todas em letras maiúsculas para iniciar as cláusulas (por exemplo, SELECT,
FROM, WHERE, etc.). As funções também devem estar todas em letras
maiúsculas (por exemplo, SUM()). Os nomes das colunas devem ser todos em
letras minúsculas. (consulte a seção sobre o Snake_case, mais adiante neste
guia). Os nomes das tabelas devem estar em CamelCase (consulte a seção
sobre CamelCase mais adiante neste guia). Isto ajuda a manter suas consultas
consistentes e mais fáceis de ler, sem afetar os dados que serão puxados
quando você os executar. A única vez que escrever com letra maiúscula importa
é quando ela está dentro de aspas (mais sobre aspas abaixo).
Na maioria das vezes, também não importa se você usa aspas simples '' ou
aspas duplas '' quando se refere a strings. Por exemplo, o SELECT é uma
cláusula inicial. Se você colocar o SELECT entre aspas como 'SELECT' ou
"SELECT", então o SQL o tratará como uma string de texto. Sua consulta
retornará um erro porque sua consulta necessita de uma cláusula SELECT.
Mas há duas situações em que importa que tipo de aspas que você usa:
A segunda situação é quando sua string tem aspas dentro dela. Suponha que
você tenha uma coluna de alimentos favoritos em uma tabela chamada
FavoriteFoods e a outra coluna corresponda a cada amigo.
Amigo Favorite_food
Rachel DeSantos Shepherd’s pie
Sujin Lee Tacos
Najil Okoro Spanish paella
Você pode notar como a comida favorita de Rachel contém um apóstrofo. Se
você usasse aspas simples em uma cláusula WHERE para encontrar o amigo
que tem esta comida favorita, seria parecido com isto:
Não vai funcionar. Se você executar esta consulta, será exibido um erro. Isto
porque SQL reconhece uma cadeia de texto como algo que começa com uma
citação 'e termina com outras aspas’. Portanto, na consulta ruim acima, o SQL
pensa que o Favorite_food que você está procurando é 'Shepherd'. Apenas
'Shepherd' porque o apóstrofo em Shepherd termina a string.
Em geral, esta deveria ser a única vez que você usaria aspas duplas em vez de
aspas simples. Deste modo, sua consulta ficaria assim:
SQL entende as strings de texto como começando com umas aspas simples ' ou
aspas dupla". Como está string começa com aspas duplas, o SQL esperará
outras aspas duplas para sinalizar o fim da string. Isto mantém o apóstrofo a
salvo, de modo que retorna "Shepherd's pie" e não "Shepherd".
À medida que você se sentir mais confortável com SQL, você será capaz de ler
e entender as consultas num relance. Mas não tem problema ter comentários na
consulta para se lembrar do que você está tentando fazer. E se você compartilhar
sua consulta, isso também ajuda os outros a compreendê-la.
Por exemplo,
Você pode usar # no lugar dos dois traços, --, na consulta acima, mas tenha em
mente que # não é reconhecido em todos os dialetos SQL (o MySQL não
reconhece #). Portanto, é melhor usar e ser consistente nisso. Quando você
adiciona um comentário a uma consulta usando --, o mecanismo de consulta de
banco de dados ignorará tudo na mesma linha depois de --. Continuará a
processar a consulta a partir da próxima linha.
Nomes "Snake_case" para colunas
The following table features the results of this query: f0: 8 f1: 4 total_tickets: 8
Number_of_purchases: 4
A tabela a seguir apresenta os resultados desta consulta: f0: 8 f1: 4 total_tickets:
8 Number_of_purchases: 4
Resultados:
f0 f1 total_tickets number_of_purchases
8 4 8 4
As duas primeiras colunas são denominadas f0 e f1 porque não foram nomeadas
na consulta acima. O padrão SQL é f0, f1, f2, f3, e assim por diante. Nomeamos
as duas últimas colunas total_de_tickets e número_de_compras para que estes
nomes de colunas apareçam nos resultados da consulta. É por isso que é
sempre bom dar nomes úteis a suas colunas, especialmente quando se utilizam
funções. Após executar sua consulta, você quer ser capaz de compreender
rapidamente seus resultados, como as duas últimas colunas que descrevemos
no exemplo.
Além disso, você pode notar como os nomes das colunas têm um sublinhado
entre as palavras. Nunca deve haver espaços nos nomes. Se 'total_tickets'
tivesse um espaço e parecesse 'total tickets' então SQL renomearia SUM(tickets)
como apenas 'total'. Por causa do espaço, SQL usará 'total' como o nome e não
entenderá o que você quer dizer com 'tickets'. Portanto, os espaços são ruins em
nomes SQL. Jamais use espaços.
A melhor prática é usar o Snake_case. Isto significa que 'total tickets', que tem
um espaço entre as duas palavras, deve ser escrito como 'total_tickets' com um
sublinhado em vez de um espaço.
Nomes CamelCase para tabelas
Você também pode usar letras maiúsculas CamelCase ao nomear sua tabela. O
uso de letras maiúsculas do CamelCase significa que o início de cada palavra
será maiúsculo, como um camelo de duas corcovas (bactriano). Portanto, a
tabela TicketsByOccasion utiliza o padrão CamelCase. Observe que a letra
maiúscula da primeira palavra em CamelCase é opcional; camelCase também é
usado. Algumas pessoas diferenciam entre os dois estilos chamando
CamelCase, PascalCase e reservando CamelCase para quando a primeira
palavra não é maiúscula, como um camelo de um só salto (Dromedary); por
exemplo, ticketsByOccasion.
Recuo
Como regra geral, você quer manter o comprimento de cada linha em uma
consulta <= 100 caracteres. Isto facilita a leitura de suas consultas. Por exemplo,
verifique esta consulta com uma linha com >100 caracteres:
SELECT CASE WHEN genre = 'horror' THEN 'Will not watch' WHEN genre =
'documentary' THEN 'Will watch alone' ELSE 'Watch with others' END AS
Watch_category, COUNT(
SELECT CASE WHEN genre = 'horror' THEN 'Will not watch' WHEN genre =
'documentary' THEN 'Will watch alone' ELSE 'Watch with others' END AS
Watch_category, COUNT(
Agora é muito mais fácil entender o que você está tentando fazer com a cláusula
SELECT. Claro, ambas as consultas funcionarão sem problemas, pois o recuo
não importa em SQL. Mas o recuo adequado ainda é importante para manter as
linhas curtas. E será valorizado por qualquer pessoa que ler sua consulta,
inclusive você mesmo!
Comentários multi-linha
Se você fizer comentários que ocupem várias linhas, você pode usar -- para cada
linha. Ou, se você tiver mais de duas linhas de comentários, pode ser mais limpo
e mais fácil é usar /* para iniciar o comentário e */ para fechar o comentário. Por
exemplo, você pode usar o -- método como abaixo:
-- Date: September 15, 2020 -- Analyst: Jazmin Cisneros -- Goal: Count the
number of rows in the table SELECT COUNT(*) number of rows -- the * stands
for all so count all FROM table
-- Data: 15 de setembro de 2020 -- Analista: Jazmin Cisneros -- Objetivo: Conta
o número de linhas na tabela SELECT COUNT(*) número de linhas -- o *
representa todos, portanto, conte todos da tabela SELECT COUNT(*)
Em SQL, não importa qual método você usa. A SQL ignora os comentários,
independentemente do que você usa: #, --, ou /* e */. Portanto, depende de você
e de sua preferência pessoal. O método /* e */ para comentários de várias linhas
geralmente parece mais limpo e ajuda a separar os comentários da consulta.
Mas não há um método certo ou errado.
Ao ingressar em uma empresa, você pode esperar que cada empresa utilize sua
própria plataforma SQL e dialeto SQL. A plataforma SQL que eles usam (por
exemplo, BigQuery, MySQL ou SQL Server) é onde você escreverá e executará
suas consultas SQL. Mas tenha em mente que nem todas as plataformas SQL
fornecem editores de scripts nativos para escrever código SQL. Os editores de
texto SQL fornecem uma interface onde você pode escrever suas consultas SQL
de uma maneira mais fácil e codificada por cores. Na verdade, todo o código com
o qual temos trabalhado até agora foi escrito com um editor de texto SQL.
Se sua plataforma SQL não tiver codificação por cores, você pode pensar em
usar um editor de texto como Sublime Text ou Atom. Esta seção mostra como o
SQL é exibido no Sublime Text. Aqui está uma consulta no Sublime Text.
Com o Sublime Text, você também pode fazer edições avançadas como a
eliminação de travessões em várias linhas ao mesmo tempo. Por exemplo,
suponha que sua consulta, de alguma forma, tivesse recuos nos lugares errados
e tivesse este aspecto:
Isto é realmente difícil de ler, então você vai querer eliminar esses travessões e
começar de novo. Em uma plataforma SQL regular, você teria que ir em cada
linha e pressionar BACKSPACE para apagar cada travessão por linha. Mas no
Sublime, você pode se livrar de todos os travessões ao mesmo tempo,
selecionando todas as linhas e pressionando Command (ou CTRL em Windows)
+ [. Isto elimina os travessões de todas as linhas. Em seguida, você pode
selecionar as linhas que deseja recuar (isto é, linhas 2, 4 e 6) pressionando a
tecla Command (ou a tecla CTRL no Windows) e selecionando essas linhas.
Depois, mantendo pressionada a tecla Command (ou a tecla CTRL no Windows),
pressione ] para recuar as linhas 2, 4, e 6 ao mesmo tempo. Isto limpará sua
consulta e fará com que ela se pareça com isto:
O Sublime Text também suporta expressões regulares. Expressões regulares
(ou regex) podem ser usadas para procurar e substituir padrões de string em
consultas. Não falaremos aqui sobre as expressões regulares, mas talvez você
queira aprender mais sobre elas por conta própria, pois são uma ferramenta
muito poderosa.