Pentaho Data Integration – PDI Spoon im Webbrowser

Auf dem Pentaho Community Meeting 2016 in Antwerpen hat Hiromu Hota von der Hitachi America Ltd. kürzlich seine Portierung der Spoon-Oberfläche auf einen Webbrowser vorgestellt. Ein gewaltiger Schritt in der technischen Weiterentwicklung der PDI-Entwicklungsumgebung, und was man bisher hört, klingt sehr vielversprechend! Das Projekt liegt aktuell in GitHub zwar erst in einer sehr frühen Version (0.0.0.3) weiterlesen…

Pentaho Data Integration – PDI Tutorial 4: Jobs und Transformationen

In den vorangegangen How To’s haben wir bereits eigene Transformationen angelegt. Neben Transformationen können im Menü der Pentaho Data Integration Suite aber auch sogenannte Jobs neu angelegt und mit einzelnen Verarbeitungsschritten befüllt werden. Was ist also der Unterschied zwischen einem Job und einer Transformation, und wann setzen wir besser das eine, wann das andere Steuerelement ein? Transformationen weiterlesen…

Pentaho Data Integration – PDI Tutorial 2: Daten filtern und sortieren

In unserem zweiten PDI How To wollen wir die ersten Manipulationen an einem vorhandenen Datenstrom durchführen. Fast immer wird es in unseren späteren Transformationen notwendig sein, dass wir aus den uns vorgegebenen Daten eine relevante Teilmenge ausfiltern möchten, dass wir Datenfelder hinzufügen oder entfernen müssen oder Datenwerte dynamisch verändern wollen. Der Kettle PDI Designer bringt zu diesem Zweck eine weiterlesen…

Pentaho Data Integration – PDI Tutorial 1: TXT zu XML

This article is also available in english In diesem Tutorial bauen wir eine erste einfache Transformation in Kettle, in der Daten aus einer kommaseparierten Textdatei in eine XML-Ausgabe gewandelt werden. Als Datenquelle liegen beispielsweise folgende Datensätze aus einer Filmsammlung als Textdatei vor: Als ersten Schritt starten wir Spoon, öffnen über das File-Menü eine neue Transformation und weiterlesen…

Pentaho Data Integration – PDI Tutorial 1 – TXT to XML

Diesen Beitrag gibt es auch auf deutsch Within this tutorial we are going to set up our first simple Kettle transformation, in which incoming data from a comma-seperated text file will be transformed into an XML output file. Our text file data source looks, for example, like the following record set from our movie collection: At first weiterlesen…

Pentaho Data Integration – PDI auf Mac OS X installieren

Diese Anleitung gilt für Mac OS X El Capitan (10.11.13), Java JDK 8u73 und Pentaho Data Integration Customer Edition PDI CE 6.0.1.0 Da ich es auch für andere Zwecke (wie zum Beispiel das Android Studio) noch benötigen werde, installiere ich in dieser Anleitung direkt das komplette Java Development Kit von Oracle auf meinem Mac. Download weiterlesen…