Um profissional que trabalha na área de dados vai ouvir muito o termo “granularidade”. Compreender este conceito é fundamental para entender e interpretar os seus dados, assim como, identificar se a análise será macro, micro ou vice- versa, além de questionar:
Que tipos de insights é possível gerar com estes dados? Até que grau dos dados é possível gerar análise? Que tipo de dados serão necessários para solucionar determinado problema? A granularidade se refere ao nível de detalhamento dos dados, e a forma como os dados estão sumarizados, o detalhamento dos dados condiz com a granularidade que pode ser maior ou menor, vamos de exemplo básico.
Imagina um produtor que vende as suas maçãs em toneladas, você não consegue fazer uma análise detalhada dessas maçãs devido ao nível de granularidade ser muito alto. Agora vamos pensar em uma pessoa que vá até um supermercado comprar maçãs, essa pessoa consegue fazer a seleção do produto, consegue identificar a qualidade do mesmo e escolher o que melhor lhe atende. Isso ocorre pelo devido fato das maçãs estar em um nível de granularidade baixo e, com isso, é possível fazer uma análise mais detalhada das mesmas.
Figura 1: Exemplo 1
Fonte: Imagem criada pela autora
Quanto menor for a granularidade, maior são os níveis de detalhes dos dados. Com isso, você consegue fazer uma análise mais precisa, porém, requer um espaço maior de armazenamento no repositório de dados e por se tratar de um volume maior de dados o tempo de resposta das consultas geradas é mais lento. Já quanto maior a granularidade, menor são os níveis de detalhes dos dados. Com isso, você gera uma análise mais macro, requer um espaço menor de armazenamento no repositório de dados e o tempo de respostas as consultas é mais performático. Veja abaixo uma imagem que ilustra a granularidade e o detalhamento dos dados. Figura 2: Granularidade
Fonte: Imagem criada pela autora
Para compreender ainda mais o termo granularidade, segue mais uma analogia.
Você precisa comprar um tênis, com isso, realiza uma pesquisa no Google e como resultado aparecem diversas pesquisas de forma abrangente e não é exatamente este o resultado desejado, sendo assim, para obter uma pesquisa mais detalhada do produto, você precisa refazer a pesquisa considerando outras informações, como por exemplo: marca, tamanho ou até mesmo a cor. Perceba, que você está detalhando o produto considerando diversos atributos para obter exatamente um resultado específico. Portanto, você saiu de uma pesquisa macro para uma pesquisa micro com mais detalhes.
Figura 3: Exemplo 2- Tênis Feminino
Fonte: Google
Figura 4: Exemplo 2- Tênis Feminino Olympikus
Fonte: Google
Figura 5: Exemplo 2 - Tênis Feminino Olympikus número 35
Fonte: Google
Figura 6: Exemplo 2 - Tênis Feminino Olympikus, número 35, cor preta
Fonte: Google
Para definir como deseja que os dados sejam dispostos, considerando o nível de detalhamento dos dados, a forma como pretende organizá-los e depositá-los em um repositório de dados, é necessário sempre se questionar que tipo de problema de negócio deseja resolver, por exemplo:
Quando está atuando em um projeto pode ocorrer do cliente solicitar uma análise de suas vendas por hora, porque ele tem interesse em identificar quais(al) os horários de maior venda para que consequentemente venha tomar decisões. Com isso, temos que perguntar ao cliente se o atributo hora é uma informação que está disponível na base de dados, para que a análise seja criada conforme solicitado.
Outro exemplo, os dados são detalhados até o nível de hora, mas o relatório é uma análise para o CEO que quer ver comparativos entre um mês e outro, o ano atual vs o anterior. Para esse relatório é possível então deixar o dado agregado ao nível de data deixado, reduzindo o volume de dados e deixar ele no nível de hora somente para os relatórios onde essa informação é importante.
Figura 7: Exemplo 3 – Faturamento e Qtd Vendas por Ano
Fonte: Imagem criada pela autora
Figura 8: Exemplo 3 – Faturamento e Qtd Vendas por Mês
Fonte: Imagem criada pela autora
Figura 9: Exemplo 3 – Faturamento por Hora
Fonte: Imagem criada pela autora Por isso é importante entender sobre a granularidade dos dados até mesmo para responder ao cliente se será possível criar a análise da forma que ele está solicitando. De nada adianta o cliente demandar um tipo de análise se os dados não estão disponíveis e granulados na medida certa para criar um dashboard de análises de negócio, que auxiliará nas tomadas de decisões de forma rápida a assertiva, atendendo a expectativa do usuário final. Por tudo isso, perceba que a granularidade é um conceito essencial no mundo de dados e sua compreensão é importantíssimo para um projeto de sucesso.
Conceito importantíssimo, Obrigada por compartilhar conhecimento