Artigo desenvolvido juntamente com a @gislaine.souza! 😀
Por acaso você já se perguntou “Porque seguir boas práticas no desenvolvimento de um projeto?”.
Se você ainda tem dúvidas sobre esse assunto, vem conosco para receber algumas dicas sobre Boas Práticas (com foco no Power Query). 😊
Primeiramente vamos relembrar:
Após realizar a conexão com a fonte de dados que você irá trabalhar lembre-se de não carregar os dados antes de transformá-los (seguindo as etapas do processo de ETL):
Agora que chegamos na página do Power Query, vamos fazer um tour por suas abas e falar um pouquinho sobre as que mais utilizamos durante o tratamento de dados 🙂
Página Inicial: contém informações sobre fontes de dados, parâmetros, editor avançado, colunas, linhas...
Transformar: contém informações sobre tabelas, colunas, textos, colunas numéricas, data…
Adicionar Colunas: é possível adicionar coluna de exemplo, personalizada, condicional, etc. Além de colunas de data e hora
Exibição: é possível adicionar aba de visualização de dados, como por exemplo se tiver algum erro, espaços em branco ou a qualidade da coluna...
Agora que já conhecemos um pouco mais sobre as abas, vamos apresentar tópicos muito importantes para as boas práticas dentro do Power Query!
-Organizando tabelas em pastas:
No canto esquerdo da tela existem as consultas que foram adicionadas. A princípio elas ficam soltas na página e é preferível separá-las em 4 pastas para uma boa organização: Fatos, Dimensões, Auxiliares e Parâmetros.
Para isso, basta clicar com o botão direito do mouse num espaço vazio > Novo Grupo > Renomeie e clique em “OK”. Basta arrastar cada consulta para sua respectiva pasta.
-Parâmetros:
Aproveitando que citamos o Parâmetro acima, vamos falar um pouquinho sobre esta funcionalidade que tanto nos ajuda na hora de trocar o caminho da fonte de dados.
Geralmente trabalhamos com mais de uma tabela e quando por algum motivo o caminho do arquivo é alterado, ao invés de realizar a troca de um por um, basta ir até o parâmetro, realizar essa troca e ver a mágica acontecer.
Na página inicial, procure por “Gerenciar Parâmetros” > Novo Parâmetro > Dê um nome para seu parâmetro > Informe o tipo (texto, data...) > Em Valor Atual informe o caminho do arquivo e clique em “OK”.
Para adicionar o parâmetro como fonte do arquivo:
Ao lado direito da página em Etapas Aplicadas clique em “Fonte”. Na barra de fórmulas você vai encontrar o caminho do arquivo. Basta excluir este caminho e deixar somente o nome do arquivo. No lugar coloque o nome do parâmetro que foi criado na etapa anterior e coloque um "&" para juntar as informações. Por exemplo: Caminho original:
Caminho com parâmetro:
-Comentar as etapas:
Comentar as etapas do que foi feito é muito importante, pois futuramente se o código precisar de manutenção é mais fácil entender tudo que foi feito, incluindo as regras de negócio. Como comentar as etapas:
Como saber se a etapa está comentada? É simples, ela fica com esse ícone ao lado:
Sabe onde você também consegue ver os comentários feitos? No código, como mostra o exemplo abaixo:
Os comentários ficam com essa “//” e você consegue comentar direto no código também. -Renomear as etapas: Quando renomeamos as etapas isso facilita muito na identificação de cada uma, a renomeação pode ser um resumo breve do que a etapa está fazendo:
E isso ajuda bastante a deixar o código mais limpo também, olha só:
A etapa que foi renomeada fica sem essa #, o que ajuda muito na leitura e no entendimento do código 🙂 -Desativar Carga:
Geralmente algumas tabelas não são usadas no modelo e mesmo assim nós as deixamos sendo carregadas a cada atualização. Para evitar esse carregamento desnecessário basta desativá-la.
Clique com o botão direito do mouse em cima da tabela que deseja desabilitar e desmarque a opção “Habilitar Carga”. Veja como é simples:
-dCalendario:
Vocês conhecem a tabela Calendário e sabem para que ela é utilizada dentro de um relatório?
A tabela Calendário, mais conhecida como dCalendario é uma tabela dimensão e a usamos para relacionar as datas com as tabelas fatos.
Ela pode ser criada via DAX e Power Query mas a forma mais prática será através da segunda opção, para obter um maior desempenho no Power BI.
Dentro do Power Query é possível criar uma tabela Calendário tanto usando botões quanto escrevendo o código através do Editor Avançado (localizado na Página Inicial). Usando diretamente o código é possível diminuir etapas, enquanto com os botões a cada clique uma nova etapa será criada. Abaixo há exemplos: Com código:
Com botões do Power Query:
-Redução de etapas:
As etapas do Power Query são onde se concentram todas as transformações feitas na tabela durante o tratamento dos dados.
Essas etapas podem ser encontradas no canto direito do Power Query, como mostra o exemplo abaixo:
E qual a importância de diminuir essas etapas? Bom, como as etapas vão sendo adicionadas conforme vamos alterando algo na tabela muitas vezes podem ter etapas repetidas:
Ou seja, quanto maior for a quantidade de etapas mais a performance do relatório vai ser comprometida, então sempre que for possível fazer transformações em uma mesma etapa é preferível que sejam feitas.
Por exemplo, a renomeação de colunas:
Nesse caso, é possível renomear as colunas direto no código. Assim, todas as tabelas que forem renomeadas ficam somente em uma etapa! 😀
-Tipagem de colunas:
Esse tópico também é muito importante no Power Query, pois essa classificação de valores ajuda a garantir um conjunto de dados mais estruturado. Quando o tipo não está definido na coluna irá aparecer o seguinte ícone:
Ou seja, o Power BI não entende qual o tipo do dado presente na coluna.
Por exemplo, o Power BI pode entender que uma certa coluna contém dados de texto mesmo se forem números, e se precisarmos utilizar esses dados em uma medida DAX ela não vai funcionar. Por isso é muito importante saber identificar e escolher a tipagem certa para cada coluna.
E essa alteração também pode ser feita em uma etapa só:
Na aba “Transformar” apresentada no começo deste artigo você encontra a opção “Detectar Tipo de Dados”, é só selecionar todas as tabelas e clicar nesta opção. Mas lembre-se: é importante verificar se os tipos foram detectados corretamente!⚠️ -Remover colunas não utilizadas:
Muitas vezes não utilizamos todas as colunas que carregamos no relatório, então elas podem ser removidas, isso ajudará na performance do relatório, diminuindo o tempo de atualização.
E como eu consigo identificar essas colunas? indo de tabela em tabela?
Temos uma dica muito boa para você: Existe uma ferramenta externa chamada Measure Killer, ela está disponível na Microsoft Store. Nela aparecerá todas as colunas e medidas que foram carregadas e não estão sendo utilizadas, assim a identificação dessas colunas fica bem mais rápida e prática! 😉 -Desativar a atualização de tabelas inseridas manualmente:
No Power Query temos a opção de inserir dados manualmente, normalmente esses dados são dados fixos, ou seja: dados que não precisam de atualização.
Nesses casos a opção de atualização pode ser desativada:
Isso ajuda bastante na performance, na verdade todos esses pontos apresentados acima além de fazerem parte das boas práticas também garantem um bom desempenho a longo prazo! 🙂 Agora que vocês conheceram um pouquinho mais sobre as boas práticas no Power Query, lembrem-se de aplicá-las para que seus dados estejam bem estruturados, facilitando assim as próximas etapas de desenvolvimento dentro do Power BI, como a etapa de modelagem e a construção visual do seu relatório. 😀 Material de apoio: https://learn.microsoft.com/pt-br/power-bi/guidance/model-date-tables Tipo de dados no Power Query - Power Query | Microsoft Learn
O que é o Power Query? - Power Query | Microsoft Learn
https://learn.microsoft.com/pt-br/power-query/power-query-query-parameters
Excelente meninas, arrasaram! 😍