¿Qué es Pentaho ETL?
Pentaho ETL, o más propiamente Pentaho Data Integration PDI,
antes llamado Kettle, es un módulo de una poderosa suite de
soluciones Data Warehouse e Inteligencia de Negocios llamada
Pentaho (Community Edition). Este módulo ofrece herramientas
de fácil comprensión y manipulación que permiten extraer la
información de las fuentes de datos corporativas,
acondicionarlas, transformarlas y cargarlas en la base de
datos destino, ya sea un data vault, una base de
datos stage, un datamart, o propiamente un
data warehouse. Las herramientas Pentaho están escritas
en lenguaje Java, lo que permite emplearlas y montarlas en
prácticamente cualquier sistema operativo moderno, lo que
resulta muy atractivo a empresas que quieren tener
soluciones poderosas a un bajo costo.
¿Por qué el ETL es importante?
Los procesos ETL son parte fundamental del diseño,
construcción y operación diaria de una solución data
warehouse de inteligencia de negocios. Dado que sirven para
ajustar y centralizar información de diferentes fuentes,
formatos para toma de decisiones, es de vital importancia
centrar la atención en este proceso, para tener certidumbre
de los datos resultado. En este aspecto, el modo gráfico e
intuitivo de las herramientas Pentaho permiten “dibujar”
tales procesos, lo que facilita su comprensión, depuración,
modificación y mantenimiento por el personal de desarrollo,
haciendo esta tarea mucho mas fácil y clara. Adicionalmente,
independientemente que uno esté interesado en implementar
una solución de inteligencia de negocios, las herramientas
ETL permiten migrar datos de una fuente de datos a otra, ya
sea con miras de actualización de versiones o de cambio de
plataforma.
Objetivo:
En nuestro curso ETL con Pentaho lograrás los siguiente objetivos:
-
El alumno aprenderá el uso de las herramientas constitutivas del Pentaho Data Integration.
-
Cargarás, de manera 100% práctica un Datamart pequeño, que bien puede diseñarse a los intereses del auditorio, con información proveniente de los datos de producción del cliente.
Duración:
21 horas
CONTENIDO (RESUMIDO)
Capítulo 1. Introducción al Pentaho Data Integration.
Capítulo 2. Diseñando Soluciones Pentaho Data Integration.
Capítulo 3. Distribuyendo soluciones de Pentaho Data
Integration.