top of page
Posts do fórum
Rafael Vasconcellos
31 de mar. de 2023
In Big Data
A evolução do armazenamento de dados. A evolução do armazenamento de dados teve início com dispositivos como cartões perfurados, fitas magnéticas e discos magnéticos. Com o tempo, os discos rígidos foram desenvolvidos, permitindo que grandes quantidades de dados fossem armazenadas em um único dispositivo.
Conforme o armazenamento de dados foi se tornando mais popular, foram criadas soluções mais eficientes para gerenciar e acessar esses dados, como dispositivos de armazenamento em disco, sistemas de armazenamento em rede e soluções de armazenamento em nuvem. Além dessas soluções de armazenamento, também foram desenvolvidas modelagens de dados e arquiteturas de armazenamento, de acordo com o tipo de dados, volume, complexidade e necessidades de acesso. Modelagem de dados:
A modelagem de dados é um processo fundamental para garantir que os dados de uma organização ou sistema estejam estruturados e organizados de forma apropriada para atender às necessidades de negócios. A modelagem de dados inclui a identificação das entidades que representam objetos ou conceitos importantes, os atributos dessas entidades e as relações entre elas. Dados estruturados são dados organizados em uma estrutura bem definida, como tabelas com linhas e colunas. Por exemplo, em uma tabela de clientes, cada linha representa um cliente e as colunas representam as informações relevantes sobre o cliente, como nome, endereço, telefone, e-mail, entre outras. As relações entre as tabelas são definidas por chaves estrangeiras e são facilmente processadas por sistemas de gerenciamento de banco de dados relacionais, como MySQL, Oracle ou SQL Server. Dados não estruturados são dados que não possuem uma estrutura formal e definida, como texto, imagens, vídeos e áudio. Esses dados são difíceis de processar com os métodos tradicionais de gerenciamento de banco de dados relacionais, pois não possuem uma estrutura organizada ou esquema definido. Exemplos de dados não estruturados incluem arquivos de texto, postagens em redes sociais, e-mails, imagens de satélite e vídeos. Dados semiestruturados são dados que possuem uma estrutura parcialmente definida, mas não se encaixam perfeitamente na estrutura rígida de um banco de dados relacional. Esses dados podem ser representados em formato XML, JSON ou YAML. Por exemplo, um documento XML pode ter tags e atributos definidos, mas também pode conter texto livre que não se encaixa em uma estrutura definida. Dados semiestruturados são comuns em aplicações web e em sistemas de big data, que trabalham com dados de diversas fontes e formatos. As principais arquiteturas:
As principais arquiteturas de armazenamento de dados são o Data Warehouse e o Data Lake, cada uma com sua abordagem específica. O Data Warehouse é uma arquitetura projetada para armazenar grandes volumes de dados históricos de várias fontes. Os dados são altamente estruturados, limpos e organizados de acordo com um esquema bem definido. Essa arquitetura é ideal para empresas que precisam analisar dados de forma consistente e confiável. Já o Data Lake é uma arquitetura de armazenamento de dados que permite armazenar grandes volumes de dados não estruturados ou semiestruturados, em seu formato original. Os dados são armazenados em um único repositório centralizado, o que permite o acesso rápido e eficiente aos dados para análise. Essa arquitetura é ideal para empresas que precisam armazenar e acessar dados brutos de várias fontes e desejam uma maior flexibilidade na forma como esses dados são analisados. Quais ferramentas mais utilizadas? Data Warehouse:
SQL Server: é um sistema de gerenciamento de banco de dados relacional da Microsoft, que oferece recursos de Data Warehousing, incluindo o SQL Server Analysis Services (SSAS) para análise e o SQL Server Integration Services (SSIS) para ETL. Azure Synapse Analytics: é um serviço de análise de big data e data warehousing que integra o SQL Server e o Azure Data Lake Storage para permitir a análise de dados em escala. Data Lake: Azure Data Lake Storage: é um serviço de armazenamento de dados em nuvem escalável e seguro da Microsoft que permite armazenar e analisar grandes volumes de dados não estruturados ou semiestruturados. Azure Data Lake Analytics: é um serviço de análise de big data em nuvem que permite processar grandes volumes de dados no Azure Data Lake Storage usando linguagens como U-SQL e R. Azure HDInsight: é um serviço gerenciado de big data na nuvem que suporta várias ferramentas de código aberto, como Hadoop, Spark, Hive e Kafka, para processar e analisar grandes volumes de dados em escala. Prós e contras do Data Warehouse (DW) e do Data Lake: Data Warehouse: Prós: Organização estruturada de dados, o que permite consultas mais rápidas e eficientes; Dados de alta qualidade e confiabilidade; Possibilidade de criar visões consolidadas de dados para a organização; Adequado para análises históricas e relatórios de negócios. Contras: Requer modelagem de dados prévia e rigorosa, o que pode limitar a flexibilidade em termos de tipos de dados e mudanças de requisitos; Custos elevados em termos de infraestrutura e manutenção; Dificuldades para lidar com grandes volumes de dados não estruturados ou semiestruturados. Data Lake: Prós: Grande flexibilidade em relação a tipos e formatos de dados, permitindo o armazenamento de grandes volumes de dados de diferentes fontes; Permite a experimentação e exploração de dados, sem a necessidade de uma modelagem prévia; Baixo custo em relação à infraestrutura, utilizando armazenamento em nuvem ou em servidores de baixo custo. Contras: Baixa confiabilidade dos dados, devido à falta de estrutura e controle sobre a qualidade dos dados; Dificuldades em termos de organização e gestão de dados, o que pode dificultar a criação de relatórios e análises; Dificuldades para lidar com grandes volumes de dados estruturados, que podem exigir a criação de estruturas adicionais de processamento. Qual eu devo escolher? Em resumo, o Data Warehouse é mais adequado para organizações que precisam de dados confiáveis e de alta qualidade para análises de negócios, enquanto o Data Lake é mais adequado para organizações que precisam lidar com grandes volumes de dados diversos e desejam ter flexibilidade na exploração desses dados. Fonte:
Microsoft – “O que é Data Warehouse? “
( https://azure.microsoft.com/pt-br/resources/cloud-computing-dictionary/what-is-a-data-warehouse/ )
Microsoft – “O que é Data Lake?”
( https://azure.microsoft.com/pt-br/resources/cloud-computing-dictionary/what-is-a-data-lake/ ) Facopp – “Museu de Tecnologia”
(http://sites.unoeste.br/museu/ )
0
0
17
Rafael Vasconcellos
30 de mar. de 2023
In Big Data
Para começar a falar sobre "Data-Driven", é importante entender o conceito de cultura e o que é Indústria 4.0. A Indústria 4.0 é um conceito que surgiu com a quarta revolução industrial, caracterizada por uma série de inovações tecnológicas, como inteligência artificial, robótica, internet das coisas (IoT), veículos autônomos, impressão 3D, nanotecnologia e armazenamento de energia. O objetivo desse conceito é desenvolver sistemas inteligentes e conectados, capazes de se comunicar entre si de forma autônoma e permitir o monitoramento para análise, melhoria de processos e redução de custos. Na sociologia, cultura pode ser entendida como o conjunto de valores, normas e práticas que orientam o comportamento humano em uma determinada sociedade. Por sua vez na tecnologia, a cultura Data-Driven é uma abordagem que se concentra na coleta, análise e interpretação de dados para orientar a tomada de decisão. Essa cultura é vista como uma resposta à Quarta Revolução Industrial, na qual as empresas contam com equipes de especialistas que tomam decisões baseadas em dados confiáveis coletados de diversas fontes. Essa abordagem permite que a equipe desenvolva estratégias de atuação eficazes, o que leva a uma instituição orientada a dados e altamente eficiente, lembrando que independente de setores, a cultura Data-Driven pode ser implementada de maneira gradual em todos os setores de uma organização, em 2006 já dizia o matemático britânico Clive Humby “Data is the new oil” e desde então empresas de diferentes tamanhos vem buscando armazenar e interpretar a maior quantidade de dados possíveis.
Quais as vantagens de uma empresa implementar a cultura Data-driven? A cultura data-driven oferece diversas formas de análise de dados, tais como análise preditiva, descritiva, prescritiva e diagnóstica, que podem ser utilizadas em conjunto ou individualmente, dependendo do objetivo e estratégia da empresa. As vantagens de utilizar dados na tomada de decisões são muitas, incluindo a otimização de processos, a segmentação e fidelização de clientes, a diferenciação da empresa em relação à concorrência, a identificação de tendências e a melhoria da experiência do cliente. Além disso, a análise de dados pode ajudar a reduzir custos e tempo, permitindo uma melhor compreensão do uso dos recursos da empresa e a gestão mais eficiente do tempo gasto nas tarefas diárias. Em suma, o uso da cultura data-driven pode levar a uma maior competitividade no mercado para qualquer tipo de negócio. É caro implementar essa cultura, quais são as etapas de implementação e quem já deu certo seguindo esse conceito tão atual? Pode ser que ao começar a implementar você vai precisar desembolsar um certo recurso, além de entender que é algo contínuo, mas isso pode variar dependendo da empresa e da sua estrutura organizacional, mas geralmente envolvem as etapas a seguir: 1- Definir objetivos claros: é importante ter uma visão clara de onde a empresa quer chegar com a implementação da cultura Data-Driven, definindo metas e objetivos específicos que deverão ser perseguidos por todos. 2- Identificar fontes de dados: para implementar uma cultura Data-Driven, é necessário identificar quais dados são relevantes para o negócio, quais os indicadores, como eles serão coletados, armazenados e organizados. 3- Criar um time de especialistas em dados: E aqui você tem duas opções, ou você tira recursos e tempo para montar uma equipe ou escolhe a Dataside como parceira e a gente te entrega esse time e te acompanha durante toda a sua caminhada pelos dados. 4- Implementar ferramentas e tecnologias: para coletar, armazenar e analisar dados, é importante ter as ferramentas e tecnologias adequadas, como softwares de análise de dados, banco de dados e outras soluções tecnológicas. 5- Garantir a segurança dos dados: é importante garantir que as informações coletadas sejam seguras, aqui na Dataside temos uma grande preocupação com ataques de hackers e vazamentos de informação, e para que isso não aconteça é preciso que os dados estejam em conformidade com as boas práticas de proteção de dados e privacidade, sempre mantendo a equipe atualizada. 6- Capacitar os colaboradores: para que a cultura Data-Driven seja eficaz, para que todos possam entender e utilizar os dados de forma adequada, incentivar com cursos e workshops é um bom exemplo de capacitação. 7- Monitorar e avaliar os resultados: é necessário monitorar e avaliar constantemente os resultados obtidos com a cultura Data-Driven, ajustes e melhorias devem ser contínuos buscando sempre a excelência. A Netflix é um ótimo exemplo de sucesso da cultura data driven. A empresa utiliza a coleta e análise de dados dos clientes para gerar maior engajamento e produzir conteúdo que atenda às preferências do público. Além disso, a plataforma possui um sistema inteligente e automatizado de recomendações para agradar aos usuários.
Em resumo, a cultura data driven é um conceito muito valioso para empresas que desejam se manter competitivas no mercado atual. Ela pode fornecer insights e ajudar a otimizar processos, melhorar a experiência do cliente, criar produtos inovadores e reduzir custos.
No entanto, a implementação dessa cultura pode apresentar desafios, como a necessidade de mudanças culturais e a preocupação com a segurança dos dados. É importante que as empresas estejam preparadas para enfrentar esses desafios e contar com profissionais capacitados para conduzir o processo de transformação digital de forma segura e eficiente. Para isso pode contar com a Dataside e começar a colher os benefícios da cultura data driven e se destacar em um mercado cada vez mais competitivo e desafiador. Fonte: Hubspot - “ Cultura Data Driven”
( https://br.hubspot.com/blog/marketing/cultura-data-driven )
Rockcontent - “Conheça os 4 tipos de análise de dados e como fazê-los”
( https://rockcontent.com/br/blog/tipos-de-analise-de-dados )
FIA – “ Indústria 4.0”
( https://fia.com.br/blog/industria-4-0/ )
1
0
51
Rafael Vasconcellos
29 de mar. de 2023
In Big Data
Big Data é um termo que se refere principalmente à coleta, análise e interpretação de grandes quantidades de dados, que podem ser utilizados para melhorar a eficiência e eficácia das operações de uma organização. O conceito pode ser aplicado em diversas áreas e abaixo estão alguns exemplos de como ele pode ter um impacto significativo: Negócios: O Big Data permite que as empresas tomem decisões informadas com base em dados em tempo real. Isso ajuda as organizações a melhorar seus processos, aumentar a produtividade e desenvolver novos produtos e serviços personalizados para seus clientes. Um exemplo é o Grupo Pão de Açúcar, que por meio da disponibilização de programas de recompensas para os clientes de suas lojas, consegue identificar os produtos preferidos de seus consumidores e gerar ofertas personalizadas. Isso aumenta a fidelização dos clientes e fornece dados preciosos para o estoque e logística, reduzindo gastos com desperdício e transporte de itens que não são consumidos em larga escala. Ciência: Atualmente, cientistas e médicos podem analisar grandes quantidades de dados para descobrir novas curas e tratamentos para doenças, além de melhorar a precisão dos diagnósticos. Por exemplo, um sistema de Big Data na saúde pode avaliar centenas de dados de pacientes e encontrar um padrão de diagnóstico, o que agiliza o atendimento de outros indivíduos com o mesmo perfil.
Governo: O Big Data está ajudando governos a tomar ações mais assertivas em áreas como saúde pública, segurança pública e planejamento urbano. Por exemplo, o agrupamento de processos com decisões similares tomadas em última instância pode ajudar os juízes a tomar decisões mais igualitárias. Tecnologia: Aqui o Big Data impulsiona o desenvolvimento de novas tecnologias e transforma a forma como as organizações tomam decisões. Por exemplo, ele pode ser usado para o desenvolvimento de novos produtos, arquiteturas e métodos de aquisição de dados.
Conceitos fundamentais do Big Data: 1- Volume: Refere-se a grandes quantidades de dados que são coletados em tempo real, incluindo dados estruturados (como números e tabelas) e não estruturados (como texto, áudio e vídeo). 2- Velocidade: É coletado em alta velocidade e em tempo real, o que requer sistemas e tecnologias capazes de processar e analisar os dados em tempo hábil. 3- Variedade: É variado e diverso, incluindo dados de diferentes fontes, como sensores, redes sociais, dispositivos móveis, entre outros. Isso significa que os dados podem ser estruturados ou não estruturados, e que eles podem estar em diferentes formatos. 4- Veracidade: Deve ser preciso e confiável, e os dados coletados devem ser validados para garantir que sejam precisos e livres de erros. 5- Valor: Deve fornecer valor e insights significativos para as empresas e organizações que o utilizam. Os dados devem ser usados para tomar decisões informadas e melhorar a eficiência e eficácia das operações. 6- Variabilidade: Refere-se à capacidade de lidar com dados que mudam constantemente em termos de estrutura, significado ou forma. Isso requer sistemas flexíveis que possam lidar com a natureza dinâmica dos dados. Hoje em dia, muitos especialistas estão adicionando 5 ou 6 V's além das quatro primeiras citadas. Acredita-se que essa evolução natural seja necessária para descrever melhor o conceito de Big Data e atender aos desafios atuais. Obviamente, nem tudo é perfeito. Além do custo operacional para implementar o conceito, o Big Data levanta dúvidas quanto à privacidade e segurança na coleta e uso dos dados. Portanto, é muito importante utilizar as melhores práticas e tecnologias disponíveis para mitigar os potenciais danos.
Abaixo seguem algumas das principais ferramentas para cada visão do Big Data, sendo que algumas podem ser utilizadas para mais de uma: 1- Volume: Para lidar com grandes volumes de dados, é comum usar tecnologias de armazenamento em nuvem, bancos de dados NoSQL, como o Apache Cassandra, e sistemas de arquivos distribuídos, como o Hadoop Distributed File System (HDFS). 2- Velocidade: Para lidar com a velocidade em que os dados são gerados, é comum usar sistemas de processamento em tempo real, como o Apache Kafka, o Microsoft Azure Stream Analytics e o Microsoft Azure Event Hubs. 3- Variedade: Para lidar com a variedade de dados, é comum usar tecnologias de análise de dados. Azure Databricks é um serviço de analise de Big Data rápido, fácil e colaborativo baseado no Apache Spark sendo capaz de trabalhar com diferentes tipos de dados e formatos. 4- Veracidade: Para garantir a veracidade dos dados, é comum usar tecnologias de limpeza e validação de dados, como o Microsoft Azure Data Factory , o IBM InfoSphere DataStage e o Microsoft Azure Purview. 5- Valor: Para obter valor e insights significativos dos dados, é comum usar tecnologias de análise de dados, como a mineração de dados, análise preditiva, aprendizado de máquina e inteligência artificial, bem como ferramentas de visualização de dados, como o Tableau, o Power BI e o Qlik. 6- Variabilidade: Para lidar com a variabilidade dos dados, é comum usar tecnologias de integração de dados, como o Microsoft Azure Data Factory, o Azure CosmoDB e o MongoDB.
Adianto que implementar o conceito de Big Data em uma empresa não é tarefa fácil. É um investimento que requer tempo, mudanças culturais na organização e mão de obra qualificada, além de recursos para investir em tecnologia. Embora seja uma tarefa desafiadora, empresas de diversos segmentos e tamanhos que investiram em Big Data já estão colhendo frutos e tomando decisões mais assertivas com base nos dados, aumentando a eficiência e melhorando a produtividade. Existem várias maneiras de implementar o Big Data em uma empresa, incluindo o uso de ferramentas gratuitas e serviços em nuvem que eliminam a necessidade de hardware próprio e permitem uma maior escalabilidade. É possível começar pequeno, em um setor específico, e depois expandir para toda a organização. No entanto, a falta de mão de obra qualificada pode ser um problema. Empresas de consultoria, como a Dataside, podem ajudar no processo de arquitetura e desenvolvimento de projetos. O setor de mercado em que a implementação do Big Data é mais ou menos benéfica varia de acordo com cada organização, mas há oportunidades para gerar valor em todas as áreas, incluindo varejo, saúde, finanças, imobiliário, energia e outros setores. Em resumo, qualquer setor pode se beneficiar do uso de Big Data, desde que a empresa tenha um objetivo claro em mente, profissionais qualificados e as ferramentas e tecnologias adequadas para coletar, analisar e interpretar os dados relevantes. O importante é que a empresa entenda que o uso de Big Data pode trazer vantagens competitivas significativas, desde que seja feito de maneira estratégica e consciente.
Fonte:
DSA: Como Iniciar um Projeto de Big Data Analytics?
( https://blog.dsacademy.com.br/como-iniciar-um-projeto-de-big-data-analytics/ )
Canaltech: Entenda o que é Big Data e como ele está mudando o mundo ( https://canaltech.com.br/big-data/o-que-e-big-data-e-como-ele-esta-mudando-o-mundo/ )
DSA: Big Data Fundamental 3.0
( https://www.datascienceacademy.com.br/course/big-data-fundamentos-3 )
1
0
31
Rafael Vasconcellos
Mais ações
bottom of page