Você está na página 1de 53

 

Preparar dados para análise - Obter


dados no Power BI

Introdução
Como a maioria de nós, você trabalha para uma empresa em que é necessário
criar relatórios do Microsoft Power BI. Os dados residem em vários arquivos e
bancos de dados diferentes. Esses repositórios de dados são diferentes uns dos
outros, alguns estão no Microsoft SQL Server, alguns no Microsoft Excel, mas
todos os dados estão relacionados.

Transcrição do Vídeo
Este módulo está levando você a jogar ... parte absolutamente
essencial de trabalhar com nosso
... que é como colocar seus dados lá, afinal, é a primeira coisa que
você pode
precisa ser capaz de fazer antes de entrar em toda a diversão
... de ser capaz de criar belas visualizações com esses dados para que
este
módulo irá guiá-lo através de diferentes tipos de dados e como você
trabalha com eles, porque há
são coisas específicas, dependendo de que tipo de dados você está
trabalhando com qualquer realidade
... trabalharemos com muitos tipos diferentes de dados para trazê-los
para o nosso
... você pode estar trabalhando com algo tão simples como uma planilha
plana do Excel ... veja é
... arquivo e vai demorar
É verdade que também dá uma olhada em como você trabalharia com bancos
de dados relacionais
como servidor sequencial e nenhum banco de dados sequencial se você
tiver seus dados
esse formato estruturado de lista e as considerações para
como você armazena dados em nosso de acordo com ... o desempenho
ele precisa de acordo com o tipo de dados para que você possa aprender
muito sobre todas essas coisas e como fazer
boas escolhas para que você obtenha o melhor resultado de seus
relatórios por
... painel no final também irá guiá-lo por algumas soluções de
problemas
tão típicas mensagens de erro e coisas que você fica muito bom para se
adiantar a esse tipo de
coisa porque, inevitavelmente, quando você trabalha pela primeira vez
com algo, você pode receber essas mensagens de erro, então
... uma maneira muito boa de entender isso e também há um laboratório
neste módulo que mostrará a você
quarenta e cinco minutos, mas experiência prática de trabalhar com
nosso
atrás do desktop e conectando-se a essas fontes de dados que você vai
para trabalhar com c é o servidor de arquivos e sequências e para
analise e visualize esses dados e veja como ... se divertiu com este?

Observação

As seções do módulo anteriores ao laboratório são puramente informativas.


Você terá a oportunidade de trabalhar com os dados reais durante o
laboratório.

No cenário deste módulo, você trabalha para a Tailwind Traders. A liderança


sênior lhe atribuiu a tarefa de criar um conjunto de relatórios que dependem de
dados de vários locais diferentes. O banco de dados que acompanha as
transações de vendas está no SQL Server, um banco de dados relacional que
contém quais itens cada cliente comprou e quando. Ele também controla qual
funcionário fez a venda, junto com o nome e a ID do funcionário. No entanto,
esse banco de dados não contém a data de contratação do funcionário, seu
cargo ou quem é o seu gerente. Para obter essas informações, você precisa
acessar os arquivos que o departamento de Recursos Humanos mantém no
Excel. Você solicita constantemente que eles usem um banco de dados SQL,
mas eles ainda não tiveram a chance de implementar isso.

Quando um item é enviado, a remessa é registrada no aplicativo de warehouse,


que é novo na empresa. Os desenvolvedores optaram por armazenar dados no
CosmosDB, como um conjunto de documentos JSON.

A Tailwind Traders tem um aplicativo que ajuda com projeções financeiras, para
que eles possam prever como serão suas vendas nos meses e anos futuros, com
base nas tendências anteriores. Essas projeções são armazenadas no Microsoft
Azure Analysis Services. Aqui está uma exibição das várias fontes de dados das
quais você será solicitado a combinar dados.
Captura de tela do Power Query entregando dados de vários locais para o Power BI.

Para criar relatórios, você deve extrair dados das várias fontes de dados.
Interagir com o SQL Server é diferente do Excel, portanto, você deve aprender
as nuances de ambos os sistemas. Depois de aprender as particularidades de
cada sistema, use o Power Query (o mecanismo de consulta usado pelo Power
BI e pelo Excel) para ajudar você a limpar os dados, renomeando colunas,
substituindo valores, removendo erros e combinando os resultados da consulta.
Depois que os dados forem limpos e organizados, você estará pronto para criar
relatórios no Power BI. Por fim, você publicará o conjunto de dados e os
relatórios combinados no PBIS (serviço do Power BI). Nesse local, outras
pessoas podem usar o conjunto de dados e criar os próprios relatórios ou
podem usar os relatórios que você já criou. Além disso, se outra pessoa criou
um conjunto de dados que você gostaria de usar, você também pode criar
relatórios com base nele!

Este módulo se concentrará na primeira etapa para obter os dados das


diferentes fontes de dados e importá-los para o Power BI usando o Power
Query.

Ao final deste módulo, você saberá como:

 Identificar e conectar-se a uma fonte de dados


 Obter dados de um banco de dados relacional, como Microsoft SQL
Server
 Obter dados de um arquivo, como o Microsoft Excel
 Obter dados provenientes de aplicativos
 Obter dados do Azure Analysis Services
 Selecionar um modo de armazenamento
 Corrigir problemas de desempenho
 Resolver erros de importação de dados

Obter dados de arquivos


As organizações geralmente exportam e armazenam dados em arquivos. Um
formato de arquivo possível é o arquivo simples. O arquivo simples é um tipo
de arquivo que tem apenas uma tabela de dados e cada linha de dados fica na
mesma estrutura. O arquivo não contém hierarquias. É provável que você esteja
familiarizado com os tipos mais comuns de arquivos simples, que são arquivos
de valores separados por vírgulas (.csv), arquivos de texto delimitado (.txt) e
arquivos de largura fixa. Outro tipo de arquivo seria arquivos de saída de
diversos aplicativos, como pastas de trabalho do Microsoft Excel (.xlsx).

O Power BI Desktop permite que você obtenha dados de vários tipos de


arquivos. Você pode encontrar uma lista das opções disponíveis ao usar o
recurso  Obter dados  no Power BI Desktop. As seções a seguir explicam como
importar dados de um arquivo do Excel armazenado em um computador local.
Cenário

A equipe de RH (Recursos Humanos) da Tailwind Traders preparou um arquivo


simples que contém alguns dos dados de funcionários da organização, como
nome do funcionário, data de contratação, cargo e gerente. Eles solicitaram que
você crie relatórios do Power BI usando esses dados e dados que estão
localizados em várias outras fontes de dados.

Localização do arquivo simples

A primeira etapa é determinar qual local de arquivo você deseja usar para
exportar e armazenar seus dados.

Os arquivos do Excel podem estar em um dos seguintes locais:

 Local – Você pode importar dados de um arquivo local para o


Power BI. O arquivo não é movido para o Power BI e não
permanece um link para ele. Em vez disso, um novo conjunto de
dados é criado no Power BI e os dados do Excel são carregados
nele. Da mesma forma, as alterações no arquivo original do Excel
não são refletidas no conjunto de dados no Power BI. Você pode
usar a importação de dados locais para dados que não são
alterados.

 OneDrive for Business  – Você pode efetuar pull de dados do


OneDrive for Business para inserir no Power BI. Esse método é
eficaz para manter o arquivo do Excel e o conjunto de dados, os
relatórios e os dashboards do Power BI sincronizados. O Power BI
se conecta regularmente ao arquivo no OneDrive. Se alguma
alteração for encontrada, o conjunto de dados, os relatórios e os
dashboards serão atualizados automaticamente no Power BI.

 OneDrive – Pessoal  – Você pode usar dados de arquivos de uma


conta pessoal do OneDrive e obter muitos dos mesmos benefícios
que obteria com o OneDrive for Business. No entanto, você
precisará entrar com sua conta pessoal do OneDrive e selecionar a
opção Mantenha-me conectado. Verifique com o administrador
do sistema para saber se esse tipo de conexão é permitido em sua
organização.

 SharePoint – Sites de Equipe  – Salvar seus arquivos do Power BI


Desktop em Sites de Equipe do SharePoint é semelhante a salvar no
OneDrive for Business. A principal diferença é como você se conecta
ao arquivo no Power BI. Você pode especificar uma URL ou
conectar-se à pasta raiz.

Captura de tela da obtenção de dados de arquivos armazenados localmente ou na nuvem do OneDrive ou


do SharePoint.

Conectar-se aos dados em um arquivo

No Power BI, na guia Página Inicial, selecione  Obter dados. Na lista exibida,


selecione a opção que você precisa, como  Texto/CSV ou  XML. Para este
exemplo, você selecionará  Excel.

Captura de tela do Excel de seleção no menu suspenso Obter dados na Faixa de Opções da Página Inicial.

Dependendo da sua seleção, você precisará localizar e abrir a fonte de dados.


Pode ser solicitado que você entre em um serviço, como o OneDrive, para
autenticar sua solicitação. Neste exemplo, você abrirá a pasta de trabalho do
Excel  Dados de funcionários  que está armazenada na Área de Trabalho.
Captura de tela da seleção do arquivo chamado dados de funcionários armazenado na área de trabalho

Selecionar os dados do arquivo a serem importados

Depois que o arquivo tiver se conectado ao Power BI Desktop, a


janela Navegador será aberta. Esta janela mostra os dados que estão
disponíveis na fonte de dados (o arquivo do Excel neste exemplo). Você pode
selecionar uma tabela ou uma entidade para visualizar o conteúdo e garantir
que os dados corretos sejam carregados no modelo do Power BI.

Marque as caixas de seleção das tabelas que você deseja trazer para o Power BI.
Essa seleção ativa os botões  Carregar  e  Transformar Dados , conforme
mostrado na imagem a seguir.

Captura de tela da janela Navegador no Power BI Desktop.

Agora você tem a opção de selecionar o botão  Carregar  para carregar


automaticamente os dados no modelo do Power BI ou selecionar o botão
Transformar Dados  para iniciar o Editor do Power Query, no qual você pode
examinar e limpar os dados antes de carregá-los no modelo do Power BI.

Geralmente recomendamos que você transforme os dados, mas esse processo


será discutido posteriormente neste módulo. Para este exemplo, selecione
Carregar.

Alterar o arquivo de origem

Talvez seja necessário alterar o local de um arquivo de origem de uma fonte de


dados durante o desenvolvimento ou no caso de um local de armazenamento
de arquivos ser alterado. Para manter seus relatórios atualizados, você precisará
atualizar os caminhos de conexão do arquivo no Power BI.

O Power Query fornece várias maneiras para realizar essa tarefa, para que você
faça esse tipo de alteração quando necessário.

1. Configurações da fonte de dados  


2. Configurações de consulta  
3. Editor Avançado

Captura de tela da janela de configurações Fonte de Dados no Power BI Desktop.


Obter dados de fontes de dados
relacionais
Se a sua organização usa um banco de dados relacional para registrar as
transações de vendas, você pode usar o Power BI Desktop para estabelecer uma
conexão com o banco de dados relacional da sua organização, em vez de obter
dados de arquivos simples individuais.

Conectar o Power BI ao seu banco de dados o ajudará a monitorar o progresso


do seu negócio e identificar tendências, para que você possa prever os números
de vendas, planejar orçamentos e definir indicadores de desempenho e de
metas.  O Power BI Desktop pode se conectar a vários bancos de dados
relacionais que estão na nuvem ou no local.

Cenário

A equipe de Vendas da Tailwind Traders solicitou que você se conecte ao banco


de dados SQL Server local da organização e coloque os dados de vendas no
Power BI Desktop para criar relatórios de vendas.
Captura de tela do Fluxo de dados do banco de dados SQL para o Power BI.

Conectar-se a dados em um banco de dados relacional

Você pode usar o recurso  Obter dados no Power BI Desktop e selecionar a


opção aplicável para seu banco de dados relacional. Para este exemplo,
selecione a opção  SQL Server , conforme mostrado na captura de tela a
seguir.  
Captura de tela do menu Obter Dados expandido para mostrar o SQL Server.

 próxima etapa é inserir o nome do servidor de banco de dados e um nome de banco


de dados na janela Banco de dados SQL Server. As duas opções no modo de
conectividade de dados são: Importação (selecionada por padrão, recomendada)
e DirectQuery. Na maioria das vezes, você seleciona Importação.  Outras opções
avançadas também estão disponíveis na janela Banco de dados SQL Server, mas você
pode ignorá-las por enquanto.

Captura de tela dos detalhes do banco de dados do SQL Server.


Depois de adicionar os nomes do servidor e do banco de dados, você será
solicitado a entrar com um nome de usuário e uma senha. Você terá três opções
de conexão:

 Windows  – Use sua conta do Windows (credenciais do Azure


Active Directory).

 Banco de dados  – Use suas credenciais de banco de dados.  Por


exemplo, o SQL Server tem o próprio sistema de conexão e
autenticação, que às vezes é usado.  Se o administrador de banco
de dados lhe forneceu uma entrada exclusiva para o banco de
dados, talvez seja necessário inserir essas credenciais na guia Banco
de dados.

 Conta Microsoft  – Use suas credenciais da conta Microsoft. Essa


opção é geralmente usada para os serviços do Azure.

Selecione uma opção de conexão, insira seu nome de usuário e sua senha e, em
seguida, selecione  Conectar.

Captura de tela dos detalhes de autorização do banco de dados.

Selecionar dados para importar

Depois que o banco de dados tiver sido conectado ao Power BI Desktop, a


janela  Navegador  exibirá os dados que estão disponíveis na fonte de dados (o
banco de dados SQL neste exemplo). Você pode selecionar uma tabela ou uma
entidade para visualizar o conteúdo e garantir que os dados corretos sejam
carregados no modelo do Power BI.  

Marque as caixas de seleção das tabelas que você deseja trazer para o Power BI
Desktop e, em seguida, selecione a opção  Carregar  ou  Transformar Dados .
 Carregar  – Carrega automaticamente os dados em um modelo do
Power BI em seu estado atual.

 Transformar dados  – Abre seus dados no Microsoft Power Query,


em que você pode executar ações como excluir linhas ou colunas
desnecessárias, agrupar os dados, remover erros e muitas outras
tarefas de qualidade de dados.

Captura de tela da janela Navegador com as tabelas disponíveis.

Importar dados escrevendo uma consulta SQL  

Outra maneira de importar dados é escrever uma consulta SQL para especificar
apenas as tabelas e colunas de que você precisa.

Para escrever sua consulta SQL, na janela  Banco de dados SQL Server , insira
os nomes do servidor e do banco de dados e, em seguida, selecione a seta ao
lado de  Opções avançadas para expandir esta seção e exibir suas opções. Na
caixa de  Instrução SQL , escreva a instrução de consulta e, em seguida,
selecione OK. Neste exemplo, você usará a instrução de SQL Select  para
carregar as colunas ID, NAME e SALESAMOUNT  da tabela SALES.
Captura de tela da caixa de diálogo do banco de dados do SQL Server com uma consulta SQL

Alterar configurações da fonte de dados  

Depois de criar uma conexão de fonte de dados e carregar dados no Power BI


Desktop, você pode retornar e alterar as configurações de conexão a qualquer
momento. Essa ação geralmente é necessária devido a uma política de
segurança da organização, por exemplo, quando a senha precisa ser atualizada
a cada 90 dias. Você pode alterar a fonte de dados, editar permissões ou
cancelar permissões.

Na guia  Página Inicial, selecione Transformar dados  e, em seguida, selecione


a opção  Configurações da fonte de dados .

Captura de tela do menu Transformar dados expandido com as configurações de Fonte de Dados
realçadas
Na lista de fontes de dados exibida, selecione a fonte de dados que você deseja
atualizar. Em seguida, clique com o botão direito do mouse nessa fonte de
dados para exibir as opções de atualização disponíveis ou use os botões de
opção de atualização no canto inferior esquerdo da janela. Selecione a opção
de atualização que você precisa, altere as configurações conforme necessário e,
em seguida, aplique as alterações.

Captura de tela das opções de configurações da Fonte de dados.

Você também pode alterar as configurações da fonte de dados no Power


Query. Selecione a tabela e, em seguida, selecione a opção  Configurações da
fonte de dados  na faixa de opções Página Inicial . Como alternativa, você
pode acessar o painel  Configurações de Consulta  no lado direito da tela e
selecionar o ícone de configurações ao lado de Fonte (ou clicar duas vezes em
Fonte). Na janela que é exibida, atualize os detalhes do servidor e do banco de
dados e, em seguida, selecione  OK.
Captura de tela do botão de configurações da Fonte de dados.

Depois de fazer as alterações, selecione  Fechar e Aplicar  para aplicar essas


alterações às configurações de fonte de dados.

Escrever uma instrução SQL

Como mencionado anteriormente, você pode importar dados para seu modelo
do Power BI usando uma consulta SQL. SQL é uma linguagem de programação
padronizada que é usada para gerenciar bancos de dados relacionais e executar
várias operações de gerenciamento de dados.

Considere o cenário em que seu banco de dados tenha uma tabela grande
composta por dados de vendas de vários anos.  Os dados de vendas de 2009
não são relevantes para o relatório que você está criando. Essa é a situação em
que o SQL é benéfico porque permite que você carregue apenas o conjunto de
dados necessário, especificando colunas e linhas exatas em sua instrução SQL e,
em seguida, importando-as para o modelo de dados. Você também pode unir
tabelas diferentes, executar cálculos específicos, criar instruções lógicas e filtrar
dados em sua consulta SQL.

O exemplo a seguir mostra uma consulta simples em que ID, NAME e


SALESAMOUNT são selecionadas na tabela SALES.

A consulta SQL começa com uma instrução  Select, que permite que você
escolha os campos específicos que deseja efetuar pull do seu banco de
dados. Neste exemplo, você deseja carregar as colunas ID, NAME e
SALESAMOUNT.

SQL

SELECT
ID
, NAME
, SALESAMOUNT
FROM
FROM especifica o nome da tabela da qual você deseja extrair os dados. Nesse
caso, é a tabela SALES. O exemplo a seguir é a consulta SQL completa:

SQL

SELECT
ID
, NAME
, SALESAMOUNT
FROM
SALES

Ao usar uma consulta SQL para importar dados, tente evite o uso do caractere
curinga (*) em sua consulta. Se usar o caractere curinga (*) em sua instrução
SELECT, você importará todas as colunas que não forem necessárias da tabela
especificada.

O exemplo a seguir mostra a consulta usando o caractere curinga.  

SQL

SELECT *
FROM
SALES

O caractere curinga (*) importará todas as colunas da tabela  Sales. Esse


método não é recomendado porque ocasionará dados redundantes em seu
modelo de dados, o que causará problemas de desempenho e exigirá etapas
adicionais para normalizar os dados para criar relatórios.  

Todas as consultas também devem ter uma cláusula WHERE. Essa cláusula


filtrará as linhas para selecionar somente os registros filtrados desejados. Neste
exemplo, se você quiser obter dados de vendas recentes após 1º de janeiro de
2020, adicione uma cláusula WHERE. A consulta evoluída ficaria parecida com o
exemplo a seguir.

SQL

SELECT
ID
, NAME
, SALESAMOUNT
FROM
SALES
WHERE
OrderDate >= ‘1/1/2020’

A melhor prática é evitar fazer isso diretamente no Power BI. Em vez disso,
considere escrever uma consulta como esta em uma exibição. Uma exibição é
um objeto em um banco de dados relacional, semelhante a uma tabela. As
exibições têm linhas e colunas e podem conter quase todos os operadores na
linguagem SQL. Se o Power BI usa uma exibição, ao recuperar os dados, ela
participa da dobragem de consultas, um recurso do Power Query. A dobragem
de consultas será explicada posteriormente, mas, em suma, o Power Query
otimizará a recuperação de dados de acordo com o modo como os dados serão
usados posteriormente.
Obter dados de um banco de dados
NoSQL
Algumas organizações não usam um banco de dados relacional, mas usam um
banco de dados  NoSQL . Um banco de dados NoSQL (também conhecido
como não SQL, não apenas SQL ou  não relacional) é um tipo flexível de banco
de dados que não usa tabelas para armazenar dados.  

Cenário

Os desenvolvedores de software da Tailwind Traders criaram um aplicativo para


gerenciar o envio e o acompanhamento de produtos de seus depósitos que
usam o CosmosDB, um banco de dados NoSQL, como o repositório de dados. 
Esse aplicativo usa o Cosmos DB para armazenar documentos JSON, que são
formatos de arquivo de padrão aberto usados principalmente para transmitir
dados entre um servidor e um aplicativo Web. Você precisa importar esses
dados para um modelo de dados do Power BI para criar relatórios.

Conectar-se a um banco de dados NoSQL (Azure Cosmos DB)

Nesse cenário, você usará o recurso  Obter dados  no Power BI Desktop. No


entanto, desta vez, você selecionará a opção  Mais...  para localizar e conectar-
se ao tipo de banco de dados que você usará. Neste exemplo, você selecionará
a categoria  Azure ,  Azure Cosmos DB  e, em seguida,  Conectar.

Na janela  Visualizar Conector , selecione  Continuar e insira as credenciais do


banco de dados. Neste exemplo, na janela  Azure Cosmos DB , você pode
inserir os detalhes do banco de dados. Especifique a URL do ponto de
extremidade da conta do Azure Cosmos DB da qual você deseja obter os dados
(você pode obter a URL na folha  Chaves  no seu portal do Azure). Como
alternativa, insira o nome do banco de dados, o nome da coleção ou use o
navegador para selecionar o banco de dados e a coleção a fim de identificar a
fonte de dados.

Se você estiver se conectando a um ponto de extremidade pela primeira vez,


como está neste exemplo, insira sua chave de conta. Você pode encontrar essa
chave na caixa  Chave Primária  na folha  Chaves Somente leitura  do portal
do Azure.

Importar um arquivo JSON

Os registros de tipo JSON devem ser extraídos e normalizados para serem


colocados em relatórios, portanto, transforme os dados antes de carregá-los no
Power BI Desktop.

Depois de se conectar à conta do banco de dados, a janela  Navegador  será


aberta, mostrando uma lista de bancos de dados nessa conta. Selecione tabela
que você deseja importar. Neste exemplo, você selecionará a tabela Product. O
painel de visualização mostra apenas itens de Registro porque todos os
registros no documento estão representados como um tipo de Registro no
Power BI.

Selecione o botão  Editar  para abrir os registros no Power Query.  

No Power Query, selecione o botão  Expansor no lado direito do cabeçalho da


Coluna1 , o que exibirá o menu de contexto com uma lista de campos.
Selecione os campos que você deseja carregar no Power BI Desktop, desmarque
a caixa de seleção  Usar o nome da coluna original como prefixo  e, em
seguida, selecione OK.

Examine os dados selecionados e, se estiver satisfeito, selecione  Fechar e


Aplicar  para carregar os dados no Power BI Desktop.

Agora os dados se assemelham a uma tabela com linhas e colunas. Nesse


momento os dados do Cosmos DB podem ser relacionados com os dados de
outras fontes de dados e, eventualmente, podem ser usados em um relatório do
Power BI.
Obter dados de serviços online
Para dar suporte às operações diárias, as organizações frequentemente usam
uma variedade de aplicativos de software, como SharePoint, OneDrive,
Dynamics 365, Google Analytics e assim por diante. Esses aplicativos produzem
os próprios dados. O Power BI pode combinar os dados de vários aplicativos
para produzir insights e relatórios mais significativos.

Cenário

A Tailwind Traders usa o SharePoint para colaborar e armazenar dados de


vendas. É o início do novo ano financeiro e os gerentes de vendas desejam
inserir novas metas para a equipe de vendas. O formulário que a liderança usa
fica no SharePoint. Você é solicitado a estabelecer uma conexão com esses
dados no Power BI Desktop, para que as metas de vendas possam ser usadas
junto com outros dados de vendas para determinar a integridade do pipeline de
vendas.

As seções a seguir examinam como usar o recurso  Obter Dados  do Power BI


Desktop para se conectar a fontes de dados produzidas por aplicativos
externos. Para ilustrar esse processo, é fornecido um exemplo que mostra como
se conectar a um site do SharePoint e importar dados de uma lista online.  

Conectar-se a dados em um aplicativo

Ao se conectar a dados em um aplicativo, você começa da mesma maneira que


faria ao se conectar a outras fontes de dados: selecionando o recurso  Obter
dados no Power BI Desktop. Em seguida, selecione a opção que você precisa na
categoria de  Serviços Online . Neste exemplo, você seleciona Lista do
SharePoint Online.  

Depois de selecionar Conectar, você será solicitado a fornecer a URL do


SharePoint. Essa URL é aquela que você usa para entrar no site do SharePoint
por meio de um navegador da Web. Você pode copiar a URL do seu site do
SharePoint e colá-la na janela de conexão no Power BI. Não é necessário inserir
o caminho de arquivo completo da URL; você só precisa carregar a URL do site
porque, quando estiver conectado, poderá selecionar a lista específica que
deseja carregar. Dependendo da URL que você copiou, talvez seja necessário
excluir a última parte da URL, conforme ilustrado na imagem a seguir.
Depois de inserir a URL, selecione  OK. O Power BI precisa autorizar a conexão
com o SharePoint, portanto, entre com sua conta Microsoft e, em seguida,
selecione  Conectar.

Escolher os dados do aplicativo a serem importados

Depois que Power BI estabelecer a conexão com o SharePoint, a


janela Navegador será exibida, como faz quando você se conecta a outras
fontes de dados. A janela exibe as tabelas e as entidades no seu site do
SharePoint. Selecione a lista que você deseja carregar no Power BI Desktop.
Assim como quando você importa de outras fontes de dados, você tem a opção
de carregar dados automaticamente no modelo do Power BI ou iniciar o Editor
do Power Query para transformar os dados antes de carregá-los.

Para este exemplo, selecione a opção carregar.


Selecionar um modo de
armazenamento
A maneira mais popular de usar dados no Power BI é importá-los para um
conjunto de dados do Power BI. Importar os dados significa que os dados serão
armazenados no arquivo do Power BI e serão publicados junto com os
relatórios do Power BI. Esse processo ajuda a facilitar a interação direta com os
dados. No entanto, essa abordagem pode não funcionar para todas as
organizações.

Para continuar com o cenário, você está criando relatórios do Power BI para o
departamento de Vendas na Tailwind Traders, em que importar os dados não é
um método ideal. A primeira tarefa que você precisa realizar é criar os conjuntos
de dados no Power BI para poder criar visuais e outros elementos de relatório.
O departamento de Vendas tem muitos conjuntos de dados diferentes com
tamanhos variados. Por motivos de segurança, você não tem permissão para
importar cópias locais dos dados para seus relatórios, portanto, a importação
direta de dados não é mais uma opção. Assim, você precisa criar uma conexão
direta com a fonte de dados do departamento de Vendas. A seção a seguir
descreve como garantir que esses requisitos da empresa sejam satisfeitos
quando você estiver importando dados para o Power BI.

No entanto, às vezes pode haver requisitos de segurança em relação aos dados


que tornam impossível importar diretamente uma cópia. Ou os conjuntos de
dados podem ser simplesmente muito grandes e levaria muito tempo para
carregá-los no Power BI e você quer evitar a criação de um gargalo de
desempenho. O Power BI resolve esses problemas usando o modo de
armazenamento DirectQuery, que permite consultar os dados diretamente na
fonte de dados e não importar uma cópia para o Power BI. O DirectQuery é útil
porque garante que você esteja sempre exibindo a versão mais recente dos
dados.

Os três tipos diferentes de modos de armazenamento que podem ser


escolhidos:

 Importação
 DirectQuery
 Duplo (composto)

Você pode acessar os modos de armazenamento alternando para a


exibição Modelo, selecionando uma tabela de dados e, no painel Propriedades
resultante, selecionando qual modo da lista suspensa Modo de
armazenamento você deseja usar, conforme mostrado no visual a seguir.

Vamos examinar mais de perto os diferentes tipos de Modos de


Armazenamento.

Modo de importação

O modo de Importação permite que você crie uma cópia local do Power BI de
seus conjuntos de dados provenientes da sua fonte de dados. Você pode usar
todos os recursos de serviço do Power BI com esse modo de armazenamento,
incluindo P e R e Insights Rápidos. As atualizações de dados podem ser
agendadas ou sob demanda. O modo de Importação é o padrão para a criação
de relatórios do Power BI.

Modo DirectQuery

A opção DirectQuery é útil quando você não deseja salvar cópias locais de seus
dados, pois seus dados não serão armazenados em cache. Em vez disso, você
pode consultar as tabelas específicas que serão necessárias usando consultas
nativas do Power BI e os dados necessários serão recuperados da fonte de
dados subjacente. Essencialmente, você está criando uma conexão direta com a
fonte de dados. O uso desse modelo garante que você sempre veja os dados
mais atualizados e que todos os requisitos de segurança sejam satisfeitos. Além
disso, esse modo é adequado para quando você tem grandes conjuntos de
dados para efetuar pull. Em vez de reduzir o desempenho, tendo que carregar
grandes quantidades de dados no Power BI, você pode usar o DirectQuery para
criar uma conexão com a fonte, resolvendo problemas de latência de dados
também.
Duplo (modo composto)

No modo Duplo, você pode identificar alguns dados a serem importados


diretamente e outros dados que devem ser consultados. Qualquer tabela que é
colocada em seu relatório é um produto dos modos de Importação e
DirectQuery. O uso do modo Duplo permite que Power BI escolha a forma mais
eficiente na recuperação de dados.

Para obter mais informações sobre Modos de Armazenamento, consulte


Modos de Armazenamento.
Obter dados do Azure Analysis
Services
O Azure Analysis Services é um produto do Azure que permite a ingestão de
dados de várias fontes de dados, a criação de relações entre os dados e a
criação de cálculos com os dados. Os cálculos são criados usando o DAX (Data
Analysis Expressions). O Azure Analysis Services é semelhante à tecnologia de
modelagem e armazenamento de dados no Power BI.

Para retomar o cenário, a Tailwind Traders usa o Azure Analysis Services para
armazenar dados de projeção financeira. Você foi solicitado a comparar esses
dados com os dados de vendas reais em um banco de dados diferente. A
obtenção de dados de cubos do Azure Analysis Services é semelhante a
obtenção de dados do SQL Server, pois você pode:

 Autenticar-se no servidor.
 Escolher o cubo que você deseja usar.
 Selecionar as tabelas que você precisa.

As diferenças notáveis entre os cubos do Azure Analysis Services e o SQL Server


são:

 Os cubos do Analysis Services têm cálculos já existentes no cubo, que


serão discutidos mais detalhadamente mais tarde.
 Se você não precisar de uma tabela inteira, poderá consultar os dados
diretamente. Em vez de usar a T-SQL (Transact-SQL) para consultar os
dados, como você faria no SQL Server, você pode usar MDX (expressões
MDX) ou DAX (Data Analysis Expressions).

Conectar-se a dados no Azure Analysis Services  

Conforme mencionado anteriormente, você usa o recurso Obter Dados no


Power BI Desktop. Ao selecionar Analysis Services, você será solicitado a
fornecer o endereço do servidor e o nome do banco de dados com duas
opções: Importar e Conectar em tempo real.
Conectar em tempo real é uma nova opção no Azure Analysis Services. O
Azure Analysis Services usa o modelo de tabela e o DAX para criar cálculos,
semelhante ao Power BI. Esses modelos são compatíveis entre si. O uso da
opção Conectar em tempo real ajuda a manter os dados e os cálculos de DAX
em seu local original, sem a necessidade de importá-los para o Power BI. O
Azure Analysis Services pode ter um agendamento de atualização rápida, o que
significa que, quando os dados forem atualizados no serviço, os relatórios do
Power BI serão imediatamente atualizados, sem a necessidade de iniciar um
agendamento de atualização do Power BI. Esse processo pode melhorar a
pontualidade dos dados em seu relatório.

Assim como um banco de dados relacional, você pode escolher as tabelas que
deseja usar. Se você quiser consultar diretamente o modelo do Azure Analysis
Services, poderá usar DAX ou MDX.

Provavelmente, você importará os dados diretamente para Power BI. Uma


alternativa aceitável é importar todos os outros dados desejados (de Excel, SQL
Server e assim por diante) para o modelo do Azure Analysis Services e, em
seguida, usar uma conexão em tempo real. Ao usar essa abordagem, a
modelagem de dados e as medidas de DAX são todas executadas em um único
lugar e essa é uma forma muito mais simples e fácil de dar manutenção em sua
solução.

Para obter mais informações sobre como conectar o Power BI ao Azure Analysis
Services, consulte a documentação
Corrigir problemas de desempenho
Ocasionalmente, as organizações precisarão resolver problemas de
desempenho ao executar relatórios. O Power BI fornece a ferramenta
Performance Analyzer para ajudar a corrigir problemas e simplificar o processo.

Considere o cenário em que você está criando relatórios para a equipe de


Vendas da sua organização. Você importou dados, que estão em várias tabelas
dentro do banco de dados SQL da equipe de Vendas, criando uma conexão de
dados com o banco de dado por meio de DirectQuery. Ao criar visuais e filtros
preliminares, você percebe que algumas tabelas são consultadas mais
rapidamente do que outras e alguns filtros estão demorando mais para serem
processados em comparação com outros.

Otimizar o desempenho no Power Query

O desempenho no Power Query depende do desempenho no nível da fonte de


dados. A variedade de fontes de dados que Power Query oferece é muito ampla
e as técnicas de ajuste de desempenho para cada fonte também são amplas.
Por exemplo, se você extrair dados de um Microsoft SQL Server, deverá seguir
as diretrizes de ajuste de desempenho desse produto. As boas técnicas de
ajuste de desempenho do SQL Server incluem criação de índice, atualizações de
hardware, ajuste do plano de execução e compactação de dados. Esses tópicos
estão além do escopo aqui e são abordados apenas como um exemplo para
criar familiaridade com sua fonte de dados e colher os benefícios ao usar o
Power BI e o Power Query.

O Power Query aproveita o bom desempenho na fonte de dados por meio de


uma técnica chamada dobragem de consultas.

Dobragem de consultas

A dobragem de consultas no Editor do Power Query ajuda a aumentar o


desempenho de seus relatórios do Power BI. A dobragem de consultas é o
processo pelo qual as transformações e edições feitas no Editor do Power Query
são controladas simultaneamente como consultas nativas ou como instruções
SQL Select simples, enquanto você está ativamente fazendo transformações. O
motivo para implementar esse processo é garantir que essas transformações
ocorram no servidor da fonte de dados original e não sobrecarreguem os
recursos de computação do Power BI.
Você pode usar o Power Query para carregar dados no Power BI. Ao usar o
Editor do Power Query, você pode fazer mais transformações em seus dados,
como renomear ou excluir colunas e acrescentar, analisar, filtrar ou agrupar os
dados.

Considere um cenário em que você renomeou algumas colunas nos dados de


Vendas e mesclou uma coluna de cidade e estado no formato "cidade estado".
Enquanto isso, o recurso de dobragem de consultas rastreia essas alterações em
consultas nativas. Então, quando você carrega os dados, as transformações
ocorrem independentemente na fonte original e isso garante que o
desempenho seja otimizado no Power BI.

Os benefícios do dobragem de consultas incluem:

 Mais eficiência nas atualizações de dados e nas atualizações


incrementais. Quando você importa tabelas de dados usando a
dobragem de consultas, o Power BI tem maior capacidade de alocar
recursos e atualizar os dados mais rapidamente porque não precisa
executar cada transformação localmente.

 Compatibilidade automática com os modos de armazenamento


DirectQuery e Duplo. Todas as fontes de dados dos modos de
armazenamento DirectQuery e Duplo devem ter as capacidades de
processamento do servidor de back-end para criar uma conexão
direta, o que significa que a dobragem de consultas é uma
funcionalidade automática que você pode usar. Se todas as
transformações puderem ser reduzidas a uma única
instrução Select, a dobragem de consultas poderá ocorrer.

O cenário a seguir mostra a dobragem de consultas em ação. Nesse cenário,


você aplica um conjunto de consultas a várias tabelas. Depois que você adiciona
uma nova fonte de dados usando o Power Query e é direcionado para o Editor
do Power Query, você acessa o painel Configurações de Consulta e clica com
o botão direito do mouse na última etapa aplicada, conforme mostrado na
figura a seguir.
Se a opção Exibir Consulta Nativa não estiver disponível (não exibida em
negrito), essa dobragem de consultas não será possível nessa etapa, e você terá
que trabalhar de trás para frente na área Etapas Aplicadas até chegar à etapa
em que Exibir Consulta Nativa estará disponível (exibida em negrito). Esse
processo revelará a consulta nativa usada para transformar o conjunto de
dados.

As consultas nativas não são possíveis para as seguintes transformações:

 Adição de uma coluna de índice


 Mesclar e acrescentar colunas de tabelas diferentes com duas fontes
diferentes
 Alteração do tipo de dados de uma coluna

Uma boa diretriz a ser lembrada é que, se você puder converter uma
transformação em uma instrução SQL Select que inclua operadores e cláusulas
como GROUP BY, SORT BY, WHERE, UNION ALL e JOIN, você poderá usar a
dobragem de consultas.

Embora a dobragem de consultas seja uma opção para otimizar o desempenho


ao recuperar, importar e preparar dados, outra opção é o diagnóstico de
consulta.
Diagnóstico de consulta  

Outra ferramenta que você pode usar para estudar o desempenho da consulta é
o diagnóstico de consulta. Esse recurso permite que você determine quais
gargalos (se houver) existem durante o carregamento e a transformação dos
dados, durante a atualização dos dados no Power Query, durante a execução de
instruções SQL no Editor de Consultas e assim por diante.

Para acessar o diagnóstico de consulta no Editor do Power Query,


acesse Ferramentas na faixa de opções da Página Inicial. Quando estiver pronto
para começar a transformar os dados ou fazer outras edições no Editor do
Power Query, selecione Iniciar Diagnóstico na guia Diagnóstico de Sessão.
Quando tiver terminado, selecione Parar Diagnóstico.

A seleção de Diagnosticar Etapa mostra o período de tempo necessário para


executar essa etapa, conforme mostrado na imagem a seguir. Essa seleção pode
informar se uma etapa demora mais para ser concluída do que outras, o que
funciona como um ponto de partida para uma investigação mais aprofundada.

Essa ferramenta é útil quando você deseja analisar o desempenho no lado do


Power Query para tarefas como o carregamento de conjuntos de dados, a
execução de atualizações de dados ou a execução de outras tarefas de
transformação.

Outras técnicas para otimizar o desempenho  

Outras maneiras de otimizar o desempenho de consulta no Power BI incluem:

 Processar o máximo de dados possível na fonte de dados


original. O Power Query e o Editor do Power Query permitem
processar os dados; no entanto, a capacidade de processamento
necessária para concluir essa tarefa pode reduzir o desempenho em
outras áreas de seus relatórios. Em geral, uma boa prática é
processar o máximo possível na fonte de dados nativa.

 Use consultas SQL nativas. Ao usar o DirectQuery para bancos de


dados SQL, como o caso do nosso cenário, não efetue pull de
dados de procedimentos armazenados ou de CTEs (Expressões de
Tabela Comum).

 Separe data e hora, se combinadas. Se qualquer uma das tabelas


tiver colunas que combinem data e hora, separe-as em colunas
distintas antes de importá-las para o Power BI. Essa abordagem
aumentará as capacidades de compactação.

Para obter mais informações, consulte Diretrizes sobre a Dobragem de


Consultas e Dobragem de Consultas.
Resolver erros de importação de
dados
Concluído100 XP

 3 minutos

Ao importar dados para o Power BI, você pode encontrar erros resultantes de
fatores como:

 Importações do Power BI provenientes de várias fontes de dados.


 Cada fonte de dados pode ter dezenas (e, às vezes, centenas) de
mensagens de erro diferentes.
 Outros componentes podem causar erros, como discos rígidos, redes,
serviços de software e sistemas operacionais.
 Frequentemente os dados podem não estar em conformidade com
nenhum esquema específico.

As seções a seguir abrangem algumas das mensagens de erro mais comuns que
podem ser encontradas no Power BI.

O tempo limite da consulta expirou

Os sistemas de fonte de dados relacionais geralmente têm muitas pessoas que


usam os mesmos dados simultaneamente no mesmo banco de dados. Alguns
sistemas relacionais e seus administradores buscam limitar o monopólio de
todos os recursos de hardware por um usuário definindo um tempo limite de
consulta. Esses tempos limite podem ser configurados para qualquer intervalo
de tempo, de cinco segundos a até 30 minutos ou mais.

Por exemplo, se estiver efetuando pull de dados no SQL Server da sua


organização, você poderá ver o erro mostrado na figura a seguir.

Erro de Consulta do Power BI: O tempo limite expirou

Esse erro indica que você efetuou pull de muitos dados, de acordo com as
políticas da sua organização. Os administradores incorporam essa política para
evitar a lentidão de um aplicativo ou conjunto de aplicativos diferentes que
também possam usar esse banco de dados.
Você pode resolver esse erro efetuando pull de menos colunas ou linhas em
uma única tabela. Embora você esteja escrevendo instruções SQL, pode ser uma
prática comum incluir agrupamentos e agregações. Você também pode unir
várias tabelas em uma única instrução SQL. Além disso, você pode executar
subconsultas complicadas e consultas aninhadas em uma única instrução. Essas
complexidades são adicionadas aos requisitos de processamento de consultas
do sistema relacional e podem prolongar muito o tempo de implementação.

Se você precisar das linhas, das colunas e da complexidade, considere obter


pequenas partes de dados e, em seguida, juntá-las novamente usando o Power
Query. Por exemplo, você pode combinar metade das colunas em uma consulta
e a outra metade em uma consulta diferente. O Power Query pode mesclar
essas duas consultas novamente depois que você terminar.

Não foi possível localizar nenhum dado formatado como uma tabela

Ocasionalmente, você pode encontrar o erro "Não foi possível localizar nenhum
dado formatado como uma tabela" ao importar dados do Microsoft Excel.
Felizmente, esse erro é auto-explicativo. O Power BI espera encontrar dados
formatados como uma tabela do Excel. O evento de erro informa a resolução.
Execute a etapas a seguir para resolver o problema:

1. Abra sua pasta de trabalho do Excel e realce os dados que você


deseja importar.

2. Pressione o atalho de teclado CTRL-T. A primeira linha


provavelmente será o cabeçalho das colunas.

3. Verifique se os cabeçalhos de coluna refletem como você deseja


nomear suas colunas. Em seguida, tente importar os dados do Excel
novamente. Desta vez, isso deverá funcionar.

Não foi possível localizar o arquivo

Ao importar dados de um arquivo, você pode receber o erro "Não foi possível
localizar o arquivo".
Normalmente, esse erro é causado pela mudança de local do arquivo ou pela
alteração das permissões do arquivo. Se a causa for a primeira, você precisará
localizar o arquivo e alterar as configurações de origem.

1. Abra o Power Query selecionando o botão Transformar Dados no


Power BI.

2. Realce a consulta que está criando o erro.

3. À esquerda, em Configurações de Consulta, selecione o ícone de


engrenagem ao lado de Origem.

4. Altere o local do arquivo para o novo local.  

Erros de tipo de dados

Às vezes, quando você importa dados para o Power BI, as colunas aparecem em
branco. Essa situação ocorre devido a um erro na interpretação do tipo de
dados no Power BI. A resolução para esse erro é exclusiva da fonte de dados.
Por exemplo, se você estiver importando dados do SQL Server e vir colunas em
branco, poderá tentar converter para o tipo de dados correto na consulta.

Em vez de usar esta consulta:

SELECT CustomerPostalCode FROM Sales.Customers

Use esta consulta:

SELECT CAST(CustomerPostalCode as varchar(10)) FROM Sales.Customers

Ao especificar o tipo correto na fonte de dados, você elimina muitos desses


erros comuns de fonte de dados.

Você pode encontrar diferentes tipos de erros no Power BI, que são causados
por diversos sistemas de fonte de dados nos quais os dados residem. Se você
encontrar um erro que não foi discutido nas seções anteriores, pesquise a
mensagem de erro na documentação da Microsoft para encontrar a resolução
necessária.
Laboratório – Preparar dados no
Power BI Desktop

Acessar seu ambiente

Antes de iniciar este laboratório (a menos que você esteja partindo de um


laboratório anterior), selecione Iniciar laboratório acima.

Você entrou automaticamente no seu ambiente de laboratório como data-


ai\student.

Agora você pode iniciar seu trabalho neste laboratório.

O tempo estimado para a conclusão do laboratório é de 45 minutos.

Neste laboratório, você começará o desenvolvimento de uma solução do Power


BI Desktop para a empresa Adventure Works. Ela envolve a conexão com os
dados de origem, a visualização dos dados e o uso de técnicas de visualização
de dados para entender as características e a qualidade dos dados de origem.

Neste laboratório, você aprenderá a:

 Abrir o Power BI Desktop


 Definir opções do Power BI Desktop

 Conectar-se a dados de origem

 Visualizar dados de origem

 Usar técnicas de visualização de dados para entender melhor os


dados

História do laboratório

Este laboratório é um dos muitos em uma série de laboratórios que foi


projetada como uma história completa da preparação de dados à publicação
como relatórios e dashboards. Você pode concluir os laboratórios em qualquer
ordem. No entanto, se você pretende trabalhar em vários laboratórios, como os
dez primeiros, sugerimos que você os faça na seguinte ordem:

1. Preparar dados no Power BI Desktop << Você está aqui. Este é o


laboratório do módulo atual.

2. Carregar dados no Power BI Desktop

3. Modelar dados no Power BI Desktop, parte 1

4. Modelar dados no Power BI Desktop, parte 2

5. Criar cálculos DAX no Power BI Desktop, parte 1

6. Criar cálculos DAX no Power BI Desktop, parte 2

7. Criar um relatório no Power BI Desktop, parte 1

8. Criar um relatório no Power BI Desktop, parte 2

9. Criar um painel de Power BI

10. Executar a análise de dados no Power BI Desktop

11. Criar um relatório paginado do Power BI


Exercício 1: Preparar dados

Neste exercício, você criará oito consultas do Power BI Desktop. Seis consultas
obterão dados do SQL Server e duas, de arquivos CSV.

Tarefa 1: Salvar o arquivo do Power BI Desktop

Nesta tarefa, primeiro você salvará o arquivo do Power BI Desktop.

1. Para abrir o Power BI Desktop, na barra de tarefas, selecione o


atalho do Microsoft Power BI Desktop.

2. Para fechar a janela de introdução, no canto superior esquerdo da


janela, selecione X.

3. Para salvar o arquivo, selecione a guia de faixa de


opções Arquivo para abrir o modo de exibição Backstage.

4. Selecione Salvar.

5. Na janela Salvar como, procure a pasta D:\DA100\MySolution.

6. Na caixa Nome do Arquivo, insira Análise de Vendas.

7. Selecione Salvar.

Tarefa 2: Definir opções do Power BI Desktop

Nesta tarefa, você definirá opções do Power BI Desktop.


1. No Power BI Desktop, selecione a guia de faixa de
opções Arquivo para abrir o modo de exibição Backstage.

2. À esquerda, selecione Opções e Configurações e clique


em Opções.

3. Na janela Opções, à esquerda, no grupo Arquivo Atual,


selecione Carregamento de Dados.

As configurações de Carregamento de Dados para o arquivo atual


permitem definir opções que determinam comportamentos padrão
durante a modelagem.

4. No grupo Relações, desmarque as duas opções selecionadas.

Embora essas duas opções possam ser úteis ao desenvolver um


modelo de dados, elas foram desabilitadas para compatibilidade
com a experiência do laboratório. Ao criar relações no Laboratório
03A, você aprenderá por que está adicionando cada uma delas.

5. Selecione OK.

6. Salve o arquivo do Power BI Desktop.

Tarefa 3: Obter dados do SQL Server

Nesta tarefa, você criará consultas com base em tabelas do SQL Server.

1. Na guia de faixa de opções Página Inicial, no grupo Dados,


selecione SQL Server.

2. Na janela Banco de Dados SQL Server, na caixa Servidor,


insira localhost.
Nos laboratórios, você se conectará ao banco de dados do SQL
Server usando localhost. No entanto, essa não é uma prática
recomendada ao criar suas próprias soluções. Isso porque as fontes
de dados de gateway não conseguem resolver localhost.

3. Selecione OK.

4. Observe que a autenticação padrão é Usar minhas credenciais


atuais.

5. Selecione Conectar.

6. Quando o aviso sobre o suporte à criptografia for exibido,


selecione OK.

7. Na janela Navegador, à esquerda, expanda o banco de


dados AdventureWorksDW2020.

O banco de dados AdventureWorksDW2020 é baseado no banco


de dados de exemplo AdventureWorksDW2017. Ele foi
modificado para ficar compatível com os objetivos de aprendizado
dos laboratórios do curso.

8. Selecione, mas não marque a tabela DimEmployee.

9. No painel direito, observe uma visualização da tabela.

A visualização permite que você determine as colunas e uma


amostra de linhas.

10. Para criar consultas, selecione as seis seguintes tabelas:

o DimEmployee
o DimEmployeeSalesTerritory
o DimProduct
o DimReseller
o DimSalesTerritory
o FactResellerSales

11. Para aplicar transformações aos dados das tabelas selecionadas,


escolha Transformar Dados.

Você não transformará os dados neste laboratório. Os objetivos


deste laboratório são explorar e criar o perfil dos dados na
janela Editor do Power Query.

Tarefa 4: Visualizar consultas do SQL Server

Nesta tarefa, você visualizará os dados das consultas do SQL Server. Primeiro,
você entenderá informações relevantes sobre os dados. Você também usará as
ferramentas de qualidade de coluna, distribuição de coluna e perfil de coluna
para ter compreensão sobre os dados e avaliar a qualidade dos dados.

1. Na janela Editor do Power Query, à esquerda, observe o


painel Consultas.

O painel Consultas contém uma consulta para cada tabela


selecionada.

2. Selecione a primeira consulta DimEmployee.

A tabela DimEmployee armazena uma linha para cada funcionário.


Um subconjunto das linhas representa os vendedores, que serão
relevantes para o modelo que você desenvolverá.

3. Na parte inferior esquerda, na barra de status, observe as


estatísticas da tabela: a tabela tem 33 colunas e 296 linhas.
4. No painel de visualização de dados, role horizontalmente para
examinar todas as colunas.

5. Observe que as últimas cinco colunas contêm links


de Tabela ou Valor.

Essas cinco colunas representam relações com outras tabelas no


banco de dados. Elas podem ser usadas para unir tabelas. Você
unirá tabelas no Laboratório 03A.

6. Para avaliar a qualidade da coluna, na guia de faixa de


opções Exibir, no grupo Visualização de Dados,
selecione Qualidade da Coluna.

A qualidade da coluna permite que você determine facilmente o


percentual de valores válidos, com erro ou vazios.

7. Para a coluna Posição (sexta coluna, do final para o início), observe


que 94% das linhas estão vazias (nulas).

8. Para avaliar a distribuição da coluna, na guia de faixa de


opções Exibir, no grupo Visualização de Dados,
selecione Distribuição da Coluna.
9. Examine a coluna Posição novamente e observe que há quatro
valores distintos e um valor exclusivo.

10. Examine a distribuição de coluna para a


coluna EmployeeKey (primeira): há 296 valores distintos e 296
valores exclusivos.

Quando as contagens distintas e exclusivas são as mesmas, isso


significa que a coluna contém valores exclusivos. Ao modelar, é
importante que algumas tabelas contenham colunas exclusivas. Use
essas colunas exclusivas para criar relações um-para-muitos, o que
você fará no laboratório Modelar dados no Power BI Desktop,
parte 1.

11. No painel Consultas, selecione a


consulta DimEmployeeSalesTerritory.

A tabela DimEmployeeSalesTerritory armazena uma linha para


cada funcionário e para as regiões do território de vendas que eles
gerenciam. A tabela é compatível com a relação de várias regiões
com um único funcionário. Alguns funcionários gerenciam uma,
duas ou possivelmente mais regiões. Ao modelar esses dados, você
precisará definir uma relação muitos para muitos, o que fará no
laboratório Modelar dados no Power BI Desktop, parte 2.

12. No painel Consultas, selecione a consulta DimProduct.

A tabela DimProduct contém uma linha por produto vendido pela


empresa.

13. Role horizontalmente para revelar as últimas colunas.

14. Observe a coluna DimProductSubcategory.

Ao adicionar transformações a essa consulta no


laboratório Carregar dados no Power BI Desktop, você usará a
coluna DimProductSubcategory para unir tabelas.

15. No painel Consultas, selecione a consulta DimReseller.

A tabela DimReseller contém uma linha por revendedor. Os


revendedores vendem, distribuem ou agregam valor aos produtos
da Adventure Works.

16. Para ver os valores da coluna, na guia de faixa de opções Exibir, no


grupo Visualização de Dados, selecione Perfil da Coluna.
17. Selecione o cabeçalho de coluna Businesstype.

18. Observe que um novo painel é aberto abaixo do painel de


visualização de dados.

19. Examine as estatísticas da coluna e a distribuição de valor.

20. Observe o problema de qualidade dos dados: há dois rótulos para


warehouse (Warehouse e Ware House, com a grafia incorreta).

21. Passe o mouse sobre a barra Ware House e observe que há cinco


linhas com esse valor.

Você aplicará uma transformação para rotular novamente essas


cinco linhas no laboratório Carregar dados no Power BI Desktop.

22. No painel Consultas, selecione a consulta DimSalesTerritory.

A tabela DimSalesTerritory contém uma linha por região de


vendas, incluindo a Matriz Corporativa (sede). As regiões são
atribuídas a um país e os países são atribuídos a grupos. No
laboratório Modelar dados no Power BI Desktop, parte 1, você
criará uma hierarquia para dar suporte à análise no nível de região,
país ou grupo.

23. No painel Consultas, selecione a consulta FactResellerSales.

A tabela FactResellerSales contém uma linha por linha de pedido


de venda. Um pedido de venda contém um ou mais itens de linha.

24. Examine a qualidade da coluna TotalProductCost e observe que


8% das linhas estão vazias.

Os valores de TotalProductCost ausentes são um problema de


qualidade de dados. Para resolver o problema no
laboratório Carregar dados no Power BI Desktop, você aplicará
transformações para preencher os valores ausentes usando o custo
padrão do produto, que está armazenado na tabela DimProduct.

Tarefa 5: Obter dados de um arquivo CSV

Nesta tarefa, você criará uma consulta com base em um arquivo CSV.

1. Para adicionar uma nova consulta, na janela do Editor do Power


Query, na guia de faixa de opções Página Inicial, no grupo Nova
Consulta, escolha a seta para baixo Nova Fonte e
selecione Texto/CSV.

2. Na janela Abrir, procure a pasta D:\DA100\Resources e selecione


o arquivo ResellerSalesTargets.csv.

3. Selecione Abrir.

4. Na janela ResellerSalesTargets.csv, examine a visualização de


dados.

5. Selecione OK.

6. No painel Consultas, observe a adição da


consulta ResellerSalesTargets.

O arquivo CSV ResellerSalesTargets contém uma linha por


vendedor, por ano. Cada linha registra 12 metas de vendas mensais
(expressas em milhares). O ano comercial da empresa Adventure
Works começa em 1º de julho.

7. Observe que nenhuma coluna contém valores vazios. Quando não


há uma meta de vendas mensal, um caractere de hífen é
armazenado em seu lugar.

8. Examine os ícones de cada cabeçalho de coluna à esquerda do


nome da coluna.

Os ícones representam o tipo de dados da coluna. 123 é número


inteiro e ABC é texto.

Você aplicará muitas transformações para obter um resultado


formatado diferente consistindo em apenas três
colunas: Date, EmployeeKey e TargetAmount no
laboratório Carregar dados no Power BI Desktop.

Tarefa 6: Obter dados adicionais de um arquivo CSV

Nesta tarefa, você criará uma consulta adicional com base em um arquivo CSV
diferente.

Use as etapas da tarefa anterior para criar uma consulta baseada no


arquivo D:\DA100\Resources\ColorFormats.csv.
O arquivo CSV ColorFormats contém uma linha por cor de produto. Cada linha
registra os códigos hexadecimais para formatar cores de tela de fundo e de
fonte. Você integrará esses dados aos dados da consulta DimProduct no
laboratório Carregar dados no Power BI Desktop.

Tarefa 7: Conclusão

Nesta tarefa, você concluirá o laboratório.

1. Na guia de faixa de opções Exibir, no grupo Visualização de


Dados, desmarque as três opções de visualização de dados:

o Qualidade da coluna
o Distribuição de colunas
o Perfil da coluna

2. Para salvar o arquivo do Power BI Desktop, na exibição de


Backstage Arquivo, selecione Salvar.
3. Quando precisar aplicar as consultas, selecione Aplicar Mais Tarde.

A aplicação das consultas carregará os dados no modelo de dados.


Você não está pronto para fazer isso, pois há muitas transformações
que devem ser aplicadas primeiro.

4. Se você pretende iniciar o próximo laboratório, pode manter o


Power BI Desktop aberto.

Você aplicará várias transformações às consultas e aplicará as consultas para


carregá-las no modelo de dados no laboratório Carregar dados no Power BI
Desktop.
Resumo
Neste módulo, você aprendeu como fazer pull de dados de diversas fontes de
dados para colocá-los no Power BI. Você pode efetuar pull de dados de
arquivos, bancos de dados relacionais, cubos, aplicativos baseados em nuvem,
sites e muito mais. A recuperação de dados de diferentes fontes requer o
tratamento de cada fonte de dados de maneira distinta. Por exemplo, os dados
do Microsoft Excel devem ser extraídos de uma tabela do Excel. Os bancos de
dados relacionais geralmente têm tempos limite de consulta. Você pode se
conectar a cubos com Conectar em tempo real, que permite que você veja as
alterações de dados em tempo real.

É importante selecionar o modo de armazenamento correto para seus dados.


Você precisa que os visuais interajam rapidamente, mas não se preocupa com a
possibilidade de atualizar os dados quando a fonte de dados subjacente for
alterada? Nesse caso, selecione Importar para importar dados para o Power BI.
Se você preferir ver as atualizações dos dados assim que elas ocorrerem, ao
custo do desempenho da interatividade, escolha a Consulta Direta para seus
dados nesse caso.

Além disso, você aprendeu como resolver problemas de desempenho e erros de


importação de dados. Você aprendeu que o Power BI oferece ferramentas para
identificar problemas de desempenho que possam existir. Os erros de
importação de dados podem ser alarmantes a princípio, mas você pode ver que
a resolução é facilmente implementada.

Você também pode gostar