Mateus Pereira • 16 mai 2023 • Microsoft Power BI
No Power BI nós sempre teremos o desafio de decidir a melhor maneira de se conectar aos dados pois dependendo do método escolhido, não seremos capazes de trabalhar com eles da maneira mais eficiente possível. Existem diversos meios de se conectar a uma fonte de dados, cada um com uma finalidade diferente e com benefícios específicos. Neste artigo iremos entender como funcionam os métodos Import e Direct Query de conexão.
Para começarmos, é importante nos atentar a relevância que nós temos aos métodos de conexão de dados, o Power BI oferece um tratamento específico para cada meio que utilizarmos ao carregar a nossa de fonte dados. Portanto, o que são basicamente os métodos Import e Direct Query de conexão?
O método Import é basicamente a forma clássica de conexão que temos no Power BI, alguns o chamam de importação de dados e outros o chamam de atualização agendada, porém ambas denominações são válidas. A partir dessa opção, nós temos o carregamento total da nossa fonte de dados, isso significa que o espaço que o projeto possuir a partir da carga dos dados irá consumir espaço de memória e disco da nossa máquina. Na importação, nós literalmente realizamos uma “cópia” dos dados da fonte original para o Power BI, nesse caso se estivermos carregando uma base que contém 5 mil linhas de conteúdo, serão 5 mil linhas de dados ocupados.
Ele é válido para quando realizamos a publicação no serviço do Power BI, assim que a publicação é feita toda a ocupação de armazenamento é transferida até a nuvem. A grande vantagem por trás deste método é o ganho de performance que nós conseguimos, pois a partir da conexão total com a nossa base de dados, o Power BI disponibiliza todos os recursos para o tratamento dos dados sem nenhuma interferência. Sua desvantagem se encontra justamente no tamanho dos arquivos para as contas Free e Pro, operando com um total de 1GB para os conjuntos de dados, só é possível de se trabalhar com maiores conjuntos a partir da conta Premium, onde temos a capacidade de 100GB.
Já o método seguinte, conhecido por Direct Query nós estabelecemos uma conexão direta com a nossa fonte de dados, porém esta não irá apresentar todos os dados assim como no método Import, serão apresentados somente os metadados das tabelas, que são basicamente as informações de nomes, cabeçalhos de colunas, relacionamentos etc. E como não há importação dos dados através dessa opção, o arquivo do Power BI não armazena espaço na memória.
O Power BI funcionará como uma interface de visualização, pois as informações serão apresentadas diretamente até ele, o Power Pivot ficará desabilitado por não haver armazenamento da fonte de dados. A grande vantagem deste método está na capacidade de suportar dados de grande escala, sem limitação de tamanho pois devido a conexão direta das informações, não precisamos nos preocupar com o tamanho, a outra vantagem é que também podemos usar dados instantaneamente de modelos pré-construídos de algumas fontes.
Por outro lado, o Direct Query também possui suas limitações assim como no Import. Sua performance é inferior ao do primeiro método pois todos os recursos de processamento vão para a fonte de dados, o que significa que o seu desempenho dependerá unicamente da fonte. A outra limitação está no fato de que devemos realizar o ajuste de desempenho diretamente na base dos dados, pois a sua conexão é mais lenta.
Agora que nos aprofundamos com rigor através de ambos os métodos e entendemos um pouco mais sobre suas particularidades, provavelmente você se pergunta: “mas qual destes métodos é o melhor e quando devemos optar entre usar um ou outro?” Lembra quando mencionamos que essa não é uma decisão fácil, o motivo está pelo fato de termos que escolher a opção que melhor se adequa ao tratamento dos nossos dados. E por isso, iremos entender quando podemos utilizar entre uma forma de conexão ou outra, para que tudo fique mais claro.
Nós usamos o método do Import quando: queremos ganhar agilidade e desempenho no tratamento dos dados, visto sua disparidade em relação ao segundo método, este se destaca quando buscamos conexões rápidas, sem interferências durante as consultas e com todos os recursos do Power BI disponíveis para o desenvolvimento
Já no método Direct Query nós usamos quando: não estamos trabalhando com arquiteturas Microsoft, pois se tivermos uma arquitetura de solução baseada em Microsoft, eventualmente iremos recorrer ao SSAS para aproveitarmos o processamento analítico. Em sumo, utilizamos também quando queremos trabalhar com dados grandes e extensos, como o Big Data.
Varia muito entre as necessidades o uso de cada um dos métodos, e essa tarefa de saber qual deles utilizar sempre irá refletir sobre as informações que temos. Basta olharmos atentamente para a nossa base, que iremos entender qual tipo de conexão é a mais favorável e quando devemos optar por outras. Por meio deste artigo, estudamos com profundidade a respeito dos métodos Import e Direct Query, contudo existem outras formas que podem servir de solução para as suas próximas conexões, nos artigos seguintes iremos explorar um pouco mais a respeito delas.