Luca Caruso • 11 jun 2019 • Microsoft Power BI
O Business Intelligence é uma solução de análise de negócios que, permite você visualizar dados e compartilhar insights em toda a Organização, ou inseri-los em seu Aplicativo ou Site. Conecte-se a centenas de Fontes de Informações e dê muito mais vida aos seus Dados com Dashboards Fantásticos e Esclarecedores e Relatórios com muita Objetividade.
Muito se fala sobre o termo ETL, quando o assunto envolve temas de Big Data, Estatística, Business Intelligence, Banco de Dados e diversos outros tópicos em geral. Cientistas de dados estão buscando aprender cada vez mais sobre a leitura de dados vindos de diferentes origens para enfim se adaptarem às demandas específicas de profissionais de negócios de diversas áreas. Mas afinal, como tudo isso se explica?
DEFINIÇÃO
A definição da sigla ETL vem das palavras Extract, Transform, Load (Extrair, Transformar e Carregar). Tais palavras não fazem parte desta sigla por coincidência, uma vez que elas denominam as seguintes etapas, respectivamente:
• Extrair (Extract) informações provenientes de diversas fontes dados ou de ou arquivos em diferentes formatos;
• Transformar (Transform) os dados extraídos para um formato desejado, para assim atender a uma necessidade padronizada de negócio;
• Carregamento (Load) desses dados traduzidos para um Data Warehouse, pronto e disponível para consultas, relatórios e práticas de Data Mining.
Por exemplo, um vasto arquivo de texto (.txt) que necessite ser lido e interpretado em forma de gráficos visuais, precisa, antes, passar por um processo de ETL. Uma ferramenta programática de Business Intelligence provavelmente identificará as características do arquivo extraído e transformará seus dados em outro formato, sem comprometer a qualidade dos mesmos. Por fim, são disponibilizados para consultas (Queries) e manipulação por um usuário em um repositório de dados.
Geralmente a prática ETL é encontrada em Bancos de Dados do Tipo Relacional, pois uma vez que exista a padronização de dados de origens diferentes, há também a necessidade de interligação entre as tabelas de dados que passaram por uma ETL.
Isso as permitirá um melhor relacionamento e aumentará a qualidade das consultas realizadas.
Na ferramenta Microsoft® Power BI, é notável a presença de uma ETL muito bem consolidada e extensa, com alto nível de interpretação de fontes de dados das mais diferentes origens.
Clicando na opção “Obter Dados” no painel superior, o software solicita a escolha de tipo de fonte solicitada, online ou offline. Dentre elas:
• Por arquivos: Excel, CSV, TXT, PDF, JSON, PDF, Pastas do SharePoint e de máquina;
• Por base de dados: SQL e MySQL Server, Oracle Database, PostgreSQL Database, SAP Hana, Google BitQuery, etc.;
• Por Power BI Datasets;
• Por ferramentas Azure;
• Por Serviços online diversos: KPI’s de Facebook, MailChimp, Google e Adobe Analytics, GitHub, Zendesk, Dynamics, etc.;
Abaixo, criamos um exemplo interativo de relatório do Microsoft® Power BI onde é possível não só as etapas de como a tal ferramenta extrai, transforma e carrega dados de fontes diferentes para dados facilmente visualizáveis em gráficos, como também mostra a composição das diferentes fontes que fornecem tabelas para análise nele.
Clique no link abaixo e tenha um bom aprendizado!