Hitachi Vantara

Das Unternehmen Hitachi vermeldet, dass die drei Bereiche Hitachi Data Systems, Hitachi Insight Group und Pentaho unter dem neuen Namen Hitachi Vantara zusammengefasst und vermarktet werden. Auszüge aus der zugehörigen Pressemitteilung vom 19. September 2017: “With Pentaho Data Integration and analytics software, Vantara gives organizations the power to capture and use data efficiently […] to weiterlesen…

PDI Update Version 7.1 erschienen

Von Pentaho ist in diesen Tagen die neue Version 7.1 des PDI-Frameworks erschienen. Wichtigste Neuerungen betreffen die einfachere Integration von Apache Spark-Umgebungen, was im speziellen für Big Data Projekte interessant sein sollte, sowie die verbesserte Zusammenarbeit mit Microsoft Azure Cloud Solutions, insbesondere HDInsight, Azure SQL und Azure SQL Server auf virtuellen Maschinen. Weiterhin gibt es weiterlesen…

Pentaho Data Integration – PDI Spoon im Webbrowser

Auf dem Pentaho Community Meeting 2016 in Antwerpen hat Hiromu Hota von der Hitachi America Ltd. kürzlich seine Portierung der Spoon-Oberfläche auf einen Webbrowser vorgestellt. Ein gewaltiger Schritt in der technischen Weiterentwicklung der PDI-Entwicklungsumgebung, und was man bisher hört, klingt sehr vielversprechend! Das Projekt liegt aktuell in GitHub zwar erst in einer sehr frühen Version (0.0.0.3) weiterlesen…

Pentaho Data Integration – PDI Tutorial 4: Jobs und Transformationen

In den vorangegangen How To’s haben wir bereits eigene Transformationen angelegt. Neben Transformationen können im Menü der Pentaho Data Integration Suite aber auch sogenannte Jobs neu angelegt und mit einzelnen Verarbeitungsschritten befüllt werden. Was ist also der Unterschied zwischen einem Job und einer Transformation, und wann setzen wir besser das eine, wann das andere Steuerelement ein? Transformationen weiterlesen…

Pentaho Data Integration – PDI Tutorial 3: Data Grid und Java Script

Im vorangegangenen How To haben wir die eingehenden und zu verarbeitenden Daten noch aus einer einfachen Textdatei geladen. In produktiven Systemen wäre diese Vorgehensweise wohl häufig nicht praktikabel. Daher tritt hier meist anstelle des “File Input”-Schrittes ein “Table Input”-Schritt auf, mit dem die eingehenden Daten direkt von einer unterliegenden Datenbank dynamisch geladen und verarbeitet werden weiterlesen…

Pentaho Data Integration – PDI Tutorial 2: Daten filtern und sortieren

In unserem zweiten PDI How To wollen wir die ersten Manipulationen an einem vorhandenen Datenstrom durchführen. Fast immer wird es in unseren späteren Transformationen notwendig sein, dass wir aus den uns vorgegebenen Daten eine relevante Teilmenge ausfiltern möchten, dass wir Datenfelder hinzufügen oder entfernen müssen oder Datenwerte dynamisch verändern wollen. Der Kettle PDI Designer bringt zu diesem Zweck eine weiterlesen…

Pentaho Data Integration – PDI Tutorial 1: TXT zu XML

This article is also available in english In diesem Tutorial bauen wir eine erste einfache Transformation in Kettle, in der Daten aus einer kommaseparierten Textdatei in eine XML-Ausgabe gewandelt werden. Als Datenquelle liegen beispielsweise folgende Datensätze aus einer Filmsammlung als Textdatei vor: Als ersten Schritt starten wir Spoon, öffnen über das File-Menü eine neue Transformation und weiterlesen…

Pentaho Data Integration – PDI Tutorial 1 – TXT to XML

Diesen Beitrag gibt es auch auf deutsch Within this tutorial we are going to set up our first simple Kettle transformation, in which incoming data from a comma-seperated text file will be transformed into an XML output file. Our text file data source looks, for example, like the following record set from our movie collection: At first weiterlesen…

Pentaho Data Integration – PDI auf Mac OS X installieren

Diese Anleitung gilt für Mac OS X El Capitan (10.11.13), Java JDK 8u73 und Pentaho Data Integration Customer Edition PDI CE 6.0.1.0 Da ich es auch für andere Zwecke (wie zum Beispiel das Android Studio) noch benötigen werde, installiere ich in dieser Anleitung direkt das komplette Java Development Kit von Oracle auf meinem Mac. Download weiterlesen…

Glossar und Linkliste

Raspberry Pi ARM: Prozessor-Architektur mit eingeschränktem Befehlssatz (RISC), bevorzugt in Mobiltelefonen und sonstigen eingebetteten Systemen verwendet Raspbian (Linux-Distribution, basierend auf Debian, für den Raspberry Pi): www.raspbian.org Die Raspberry Pi Foundation: www.raspberrypi.org Deutsches Raspberry Pi Forum: www.forum-raspberrypi.de Kodi Media-Center: www.kodi.tv XBMC (Vorgänger von Kodi): www.xbmc.org OSMC (Nachfolger von Kodi): https://osmc.tv Data Integration PDI (Pentaho Data Integration): weiterlesen…