Você está na página 1de 12

Limpando bases com o Google Sheets

Por Marco Túlio Pires, da Escola de Dados

Apesar de o Google Sheets ser um aplicativo Web voltado para o processamento de planilhas,
é possível fazer limpezas rápidas usando algumas funções. Em alguns casos é mais conveniente
manter a tabela no mesmo programa, em vez de exportá-la para manipulação em outros aplicativos.
Vamos limpar ​
uma tabela raspada de um ​
PDF do Instituto de Segurança Pública do Rio de Janeiro
usando o ​
PDFtables​
.

Importando o arquivo para o Google Sheets


A primeira coisa que precisamos fazer é importar o arquivo para o Google Sheets. Para fazer isso é
muito fácil. A partir de qualquer planilha no Google Sheets clique em ​
Arquivo > ​
Importar e depois
escolha a aba “Upload”. Agora é só arrastar o arquivo da tabela para dentro da janela do seu
navegador.

Criar nova planilha​


Selecione “​ Abrir agora​
” e clique em “​ ”.
Tirando o grosso
Vamos começar fazendo algumas edições na parte de cima da tabela. Clique no número 1, referente
à primeira linha. Isso vai fazer com que ela seja selecionada por completo. Segure a tecla shift e
selecione também a segunda linha, clicando no número dois. Em seguida, clique com o botão direito
Excluir linhas 1 - 2​
em cima de qualquer um dos números e escolha “​ ”.
Vamos colocar agora os dois termos “Grande” e “Niterói” na mesma célula, e apagar a primeira
linha. Tabém vamos apagar a linha em branco que ficou entre os nomes das colunas e o restante das
linhas, apagar as duas últimas linhas e as colunas B e C (o mesmo procedimento para apagar linhas,
mas clicando nas letras!). Também selecionaremos a tabela toda e mudaremos a fonte para Arial e o
tamanho para 10. Vamos dar o nome de “Crimes” para a coluna A. Ficou assim:
Já está bem melhor, né?

Nova coluna
Agora vamos criar uma coluna nova chamada “Categoria”. É que a planilha do Instituto de
Segurança Pública do Rio foi organizada com as categorias na mesma coluna que os crimes. O ideal
é que essas duas entidades estejam separadas. Pra criar uma coluna nova, basta clicar com o botão
direito em cima da coluna A e selecionar “Inserir 1 à direita”. Assim teremos uma nova coluna B.
Vamos nomeá-la “Categoria”.

Aa categorias estão na coluna A. São os termos digitados em letras maiúsculas. Vamos copiá-los para
a nova coluna clicando sobre cada um deles e puxando, com o mouse, o cando inferior direito da
seleção, onde aparece um pequeno quadrado azul. Basta clicar nele e arrastá-lo para a direita até
preencher a célula ao lado com um pontilhado. Daí é só soltar e o texto será copiado. O bom e velho
copiar e colar também funciona.

Preenchendo células em branco


Agora vamos preencher a coluna categoria com seus valores respectivos. Basta clicar em cada um
dos valores e fazer o mesmo movimento anterior, só que dessa vez para baixo, preenchendo todas as
células em branco até a célula antes da categoria seguinte. Faça isso com todos os nomes de
categorias. Cuidado para não apagar uma das categorias abaixo acidentalmente!
Formatação automática
Como os crimes não estão em letras maiúsculas (apenas a primeira letra de cada palavra), vamos
padronizar a coluna categoria também. Crie uma coluna nova à direita da coluna “Categoria” e dê o
mesmo nome: “Categoria”. Nessa nova coluna vamos escrever a fórmula ​ .
=proper(b2)​
Clique fora da célula e arraste a seleção até o fim da coluna. Você vai ver que todos os valores serão
corrigidos automaticamente!

Selecione a coluna C inteira (basta clicar na letra C) e depois em “Editar” e “Copiar”. Em seguida,
selecione a coluna B inteira e clique em “Editar”, “Colar Especial” e “Colar somente os ​
valores”​
.
Agora você pode apagar a coluna C. Clique com o botão direito em cima da letra C e selecione
“Excluir coluna”.

Ordenando e agrupando para excluir


Temos que apagar os nomes das categorias que sobraram na coluna A. Pra fazer isso vamos
adicionar um asterisco na frente de cada nome e depois ordenar a coluna A por ordem alfabética.
Essa dica vai fazer com que todas as categorias fiquem agrupadas lá no topo, facilitando o trabalho
de apagá-las de uma vez só.

Para editar uma célula, basta clicar duas vezes em cima dela e acrescentar o asterisco na frente do
texto e apertar a tecla enter. Para ordenar, basta clicar na seta que aparece quando você passa o
mouse sobre o cabeçalho da coluna A, bem ao lado da letra. Clicando nele você pode escolher a
opção “Classificar página A -> Z”.

Atenção! ​
Certifique-se que sua primeira linha está congelada (passe o mouse no topo da caixa que
abriga o número 1, na esquerda, até o cursor do mouse virar uma luva. Quando isso acontecer,
clique e arraste a linha para baixo, até o “pé” do número 1. Se der certo, você vai perceber que a
linha que separa os nomes das colunas do restante das linhas agora está mais grossa).

Com todas as categorias agrupadas, basta excluir as linhas correspondentes.


Localizar e substituir
Veja que a tabela possui células com valores “-”. Vamos apagar todos esses valores de uma só vez
usando o recurso “Localizar e substituir” do Google Sheets. Clique em qualquer lugar da tabela e
clique em “Editar” e selecionar “Localizar e substituir...”. Digite “-” da primeira caixa de texto e
deixe a segunda em branco. Em seguida, clique em “Substituir tudo”.
Apague as colunas G e H, pois elas apresentam resultados consolidados. Esses resultados podemos
obter facilmente usando fórmulas em análises posteriores.

Localidade
Não se esqueça de alterar a localidade da sua planilha para o seu país. Isso vai ser importante para
que os números, datas e outras informações sejam interpretadas usando o padrão mais adequado
para a sua localidade. Para fazer isso é só clicar em “Arquivo”, “Configurações de planilha…”, e
selecionar a localidade mais apropriada para você.
Agora a sua tabela já está pronta para ser analisada! Tente aplicar as mesmas técnicas em outras
tabelas e veja se consegue combinar estratégias diferentes para conseguir resultados cada vez
melhores!

Você também pode gostar