Explorando Dataflows en Power BI
Hola #Datalover
Hoy iniciaremos nuestro recorrido en el conocimiento de generar flujos de datos o ‘dataflows’ desde el Servicio de Power BI. Esta funcionalidad es muy buena para procesos de ETL; sin embargo, me he topado con muchos usuarios de Power BI que no conocen mucho del tema, ni como se utiliza, es por ello que decidí encaminarlos en el conocimiento y aprendizaje, así que ¡manos a la obra!
¿Qué es Dataflow?
Hoy en día tenemos el gran desafío de convertir grandes volúmenes de datos en información y, para ello, llevamos a cabo todo un proceso de extracción de datos, transformación y limpieza o más conocido como ETL’s, ello con el fin de que nuestros datos estén listos para el análisis. En Power BI Desktop contamos con Power Query, herramienta que nos permite realizar dichos procesos de ETL; sin embargo, a medida que el volumen de datos va incrementando también lo hace el desafío de procesarlos y, para ello llegó, Dataflow.
Pero entonces, ¿qué es Dataflow?
Dataflow es una colección de entidades o tablas que se crean y administran en las áreas de trabajo en el servicio de Power BI, permitiendo agregar y editar dichas entidades. Dicho de una manera más sencilla, es como tener a Power Query ejecutándose en la nube, independientemente del conjunto de datos y el informe de Power BI, además de almacenar los datos en CDM (Common Data Model) dentro del almacenamiento de Azure Data Lake.
Una vez que se ha creado el dataflow, nos podemos conectar a él mediante Power BI Desktop, para crear conjuntos de datos, informes, paneles y aplicaciones que se basan en estos datos integrados y de esa manera generar información.
¿Cuándo debemos recurrir a Dataflow?
- Cuando necesitemos crear un proceso de lógica reutilizable, es decir que pueda ser utilizado por varios conjuntos de datos, sin necesidad de volver a realizarlo.
- Para centralizar una sola fuente de datos, permitiendo que los diferentes usuarios se conecten a los mismos flujos y concentren la misma información, así como poder asignar definiciones estándar del Negocio, lo que le permite crear Tablas ordenadas, que pueden incluso funcionar con otros servicios y productos en Power Platform.
- Si desea trabajar con grandes volúmenes de datos.
Conectores
Dataflow actualmente tiene 49 tipos de conexión, sin embargo Microsoft integra nuevos conectores de forma regular, a medida que se van actualizando las funcionalidades y características propias de Dataflow.
Consideraciones y Limitaciones en ‘Dataflow’
Así es, no todo es color de rosa, actualmente existen algunas limitaciones en esta funcionalidad y ello, incluso, dependerá del tipo de licencia con el que se cuenta:
- El Dataflow, solo puede ser modificado por el propietario, es decir, por el usuario que creó el Flujo de Dato
- Los Dataflows no están disponibles en My workspaces, eso quiere decir que si o sí necesitas contar con una licencia para hacer uso de esta funcionalidad.
- Las actualizaciones incrementales están disponibles con la capacidad Premium.
- Los servicios de AutoML y Cognitive están disponibles para capacidad Premium.
- La creación de entidades calculadas o entidades vinculadas están disponibles para capacidad Premium.
Para mayor información o detalle, los invito a leer el siguiente post de Microsoft: Limitaciones y Consideraciones en Dataflows
Bien, hasta aquí mi recorrido del día de hoy, ya hemos podido conocer que es un Dataflow en Power BI y nos estaremos reencontrando en un próximo artículo para aprender a crearlos y utilizarlos, sin más que decir, ¡Hasta la próxima!
¿Buscas soluciones para tus datos? Cuéntanos cómo podemos ayudarte aquí, o conversemos por info@kaitsconsulting.com. Da el primer paso para conectar con tu información de una manera eficaz y te ayudaremos a lograr resultados asombrosos.
Sobre la autora:
July Torres es Ingeniera de sistemas y consultor BI en Kaits Consulting.