Pentaho: Offene, flexible BI- und Big-Data-Plattform

0

Pentaho, die intelligente Business Intelligence Plattform zeichnet sich durch hohe Flexibilität, einen modularen Aufbau und eine offene Architektur aus. Daraus resultiert, dass sie sich durch die große Anzahl von Schnittstellen problemlos in die IT-Landschaft eines Unternehmens integrieren lässt. Mit Pentaho steht dem Management eine umfassende Plattform für die Datenintegration, Geschäftsanalysen sowie die Datenvisualisierung zur Verfügung.

Pentaho: Vom Open Source Projekt zum professionellen BI Tool

Seit 2004 wurde Pentaho als Sammlung von Business Intelligence Software entwickelt und 2007 von Infoworld zu einem der zehn wichtigsten Open Source Projekte im Businessbereich gewählt. Neben diesen gibt es auch kostenpflichtige Varianten, die zusätzliche Funktionalitäten und einen professionellen Support bieten. 2015 wurde Pentaho von Hitachi Data Systems aufgekauft.

Es stehen verschiedene Werkezeuge für die unterschiedlichen Bereiche der Business Intelligence zur Verfügung. Für die Themen Big Data, Datenintegration, eingebettete Analysen und Business Analytics werden innovative Instrumente angeboten, um den Unternehmen die Bewältigung der wachsenden Datenflut zu erleichtern. Pentaho ist einer der größten Anbieter für Open Source BI Lösungen. Dabei wird ein breites Spektrum hinsichtlich der Anforderungen, die an BI Tools gestellt werden, abgedeckt. Die kommerzielle Version hat die Unzulänglichkeiten der Open Source Version überwunden und bietet darüber hinaus einen leistungsfähigen Support.

Mit Pentaho schneller von Big-Data-Technologien profitieren

Es werden verschiedene Analyse Tools für Big Data auf der Plattform angeboten. Unternehmen können damit zunächst die Daten extrahieren und für die weitere Verarbeitung vorbereiten. Anschließend werden die Datensätze kombiniert und mit der Visualisierung der Auswertungsergebnisse die Basis dafür geschaffen, dass BI-Analysen erstellt werden können. Es ist gelungen, Business Analytics Tools zu entwickeln, mit denen aus strukturierten aber auch aus unstrukturierten Datenquellen Einblicke in Big Data ermöglich werden. Dabei ist es unerheblich, wie die Analyseanforderungen aussehen und die Bereitstellungsumgebung beschaffen ist.

Dies sind die wichtigsten Module der BI-Software:

  • Business-Analyse-Plattform
  • Datenintegrationsmodul
  • Reporting- und Visualisierungsmodul

Datenanalysen für Big Data

Mit der eng integrierten Plattform für Datenintegration und Geschäftsanalysen wird die Wertschöpfung aus Big Data wesentlich beschleunigt. Dabei wird das komplette Analysespektrum abgedeckt. Am Anfang stehen der Datenzugriff und die Datenintegration. Aber auch die Datenvisualisierung und die darauf aufbauenden vorausschauenden Analysen werden durchgeführt. Somit kann Big-Data-Blending nutzeroptimiert direkt an der Quelle erfolgen. Außerdem können die BI-Analysen direkt gestreamt werden. Es kann ein extrem breites Spektrum an Datenquellen genutzt werden, wobei die Wissensgenerierung aus jeder Quelle optimiert wird. Die Architektur von Pentaho ist offen und basiert auf Standards. Dadurch ist es mit wenig Aufwand möglich, die Anwendungen in bestehende IT-Strukturen zu integrieren.

Auch die Datenvisualisierung und die darauf aufbauenden vorausschauenden Analysen werden durchgeführt(#02)

Auch die Datenvisualisierung und die darauf aufbauenden vorausschauenden Analysen werden durchgeführt(#02)

Datenermittlung und Datenvisualisierung

Die User können Datenbestände über mehrere Dimensionen visualisieren und analysieren und auf dieser Grundlage dann Reports im Self-Service erstellen. Dadurch wird ein hohes Maß an Unabhängigkeit von der IT-Abteilung erreicht und die Flexibilität des Unternehmens entscheidend verbessert. Es ist möglich, interaktive Analysen durchzuführen, Eigenschaften hervorzuheben oder Lasso-Filterungen zu generieren. Dabei steht den Nutzern eine Bibliothek zur Verfügung, aus welcher die interaktiven Visualisierungen ausgewählt werden können. Das In-Memory-Caching sorgt auch bei großen Datenbeständen für sehr schnelle Analysen. Jeder Mitarbeiter kann eigenständig Berichte erstellen und sich dabei der übersichtlich formatierten Unternehmensberichte bedienen. Maßgeschneiderte Dashboards bieten innovative Möglichkeiten der Datenauswertung.

Perfekte Datenverarbeitung bei hohem Datenvolumen

Mit Pentaho wird die Entwicklungszeit für Big-Data-Anwendungen verkürzt und die Cluster-Leistungen optimiert. Ein wesentlicher Vorteil ist die Konnektivität des Systems mit den wichtigsten Hadoop-, NoSQL- sowie BI-Analysedatenbanken. Ein visueller Editor sorgt dafür, dass Entwicklungszyklen schneller ablaufen. Es ist außerdem möglich, nicht-strukturierte Datenquellen problemlos zu integrieren. Dank der Multi-Threading Engine erfolgt die Datenintegration in kürzester Zeit. Aufträge können durch die Cluster-Unterstützung aufgeteilt und dann unabhängig voneinander bearbeitet werden. Mit Pentaho sind Unternehmen bestens gerüstet, um Massendaten aus strukturierten und unstrukturierten Quellen zu bearbeiten und daraus in kurzer Zeit handlungsrelevante Entscheidungsgrundlagen zu gewinnen.

Hohe Flexibilität durch adaptive Big-Data-Layer

Ein adaptiver Big-Data-Layer beschleunigt den Zugriff auf die Speicher. Der Datenzugriff erfolgt einmalig und dann kann ortsunabhängig mit dem Datenbestand gearbeitet und alle gewünschten Analysen durchgeführt werden. Es werden die aktuellen Hadoop-Distributionen unterstützt und einfache Plug-ins für NoSQL-Datenbanken zur Verfügung gestellt. Zusätzlich können Verbindungen hergestellt werden zu spezialisierten Datenspeichern wie Amazon Redshift. Mit Pentaho ist das Unternehmen allgemein auf alle Änderungen im Big-Data-Umfeld vorbereitet und wird nicht von neuen Entwicklungen überrollt, sondern kann im Gegenteil sofort von ihnen profitieren.

Pentaho ermöglicht eine umfassende Datenintegration

Unternehmen stehen vor der Aufgabe, die Vielzahl an Datensätzen aus unterschiedlichsten Quellen zu integrieren, um ein möglichst genaues Bild vom Geschäftsgeschehen zu erhalten. Dabei müssen auch die Beziehungen zu Kunden, zu Konkurrenten und zur Gesellschaft insgesamt berücksichtigt werden. Um diese Anforderungen zu erfüllen, müssen möglichst alle relevanten Datenquellen in die Betrachtung einbezogen werden.

Das ist in der Praxis eine der größten Hürden auf dem Weg zu Industrie 4.0 oder dem Internet of Things. Pentaho bietet praktikable Lösungen und begleitet Unternehmen auf dem Weg hin zur optimalen Datenintegration. Visuelle Tools ermöglichen auch Usern, die nicht über vertiefte IT-Kenntnisse verfügen, Analysen durchzuführen. Auf diese Weise kommt es zu einer stärkeren Durchdringung der Unternehmen mit den innovativen BI-Technologien.

Drag & Drop-Entwicklung mit visuellem Editor

Es werden visuelle Tools für die Entwickler bereitgestellt und damit der Programmierungsaufwand minimiert. Mit dem grafischen ETL-Tool wird es möglich, alle Big-Data-Quellen in vertrauter Umgebung zu verarbeiten. Es gibt außerdem auch in diesem Bereich bereits eine Bibliothek mit Komponenten, die sowohl den Zugriff als auch das Weiterverarbeiten aus den unterschiedlichsten Quellen erleichtern. Über eine visuelle Schnittstellen können Bilder und Videodateien analysiert werden. Dynamische Umwandlungen sowie integrierte Debugger für Tests und Feinabstimmungen runden die Möglichkeiten ab.

Big-Data-Integration ohne Programmierung

Die Tools von Pentaho sind intuitiv, sodass der erforderliche Zeitaufwand zur Bereitstellung von Big-Data-Analyselösungen drastisch verringert wird. Es ist nicht mehr nötig, umständlich SQL-Codes zu schreiben oder MapReduce-Java-Funktionen zu erstellen. Des Weiteren überzeugt die umfassende Konnektivität zu allen Datentypen und Datenbanken. Ein paralleles Verarbeitungsmodul optimiert die Leistungsfähigkeit und Unternehmensskalierbarkeit. Insgesamt wird es erheblich vereinfacht, einen konsistenten, hochwertigen Datenbestand zu generieren, mit dem sofort gearbeitet und umfassende Analysen durchgeführt werden können.

Flexibler Support aller Big-Data-Datenquellen

Pentaho ermöglicht einen einfachen Zugriff auf Hadoop-Distributionen, NoSQL-Datenbanken sowie andere Big Data-Stores. Unternehmen können somit flexibel im Big-Data-Umfeld agieren und werden von Änderungen nicht unerwartet getroffen oder überfordert. Ergebnis sind Reports, die sowohl nutzer- als auch maschinengenerierte Datenbestände berücksichtigen. Dazu gehören beispielsweise Webinhalte, Dokumente, Datensätze aus den Social Media sowie Protokolldateien. Außerdem werden parallele Massenladeprogramme unterstützt, sodass die Performance wesentlich erhöht wird.

Pentaho ermöglicht einen einfachen Zugriff auf Hadoop-Distributionen, NoSQL-Datenbanken sowie andere Big Data-Stores(#04)

Pentaho ermöglicht einen einfachen Zugriff auf Hadoop-Distributionen, NoSQL-Datenbanken sowie andere Big Data-Stores(#04)

Perfekter Mix aus Self-Service und IT-Steuerung

Die Software ist für den Einsatz im Self-Service geeignet und erfordert keine vertieften Programmierungskenntnisse. Die Geschäftsanwender werden mit dem nötigen IT-Support versorgt, sodass die praktische Umsetzung aller Anwendungen problemlos möglich wird. Das IT-Team skaliert und steuert die Analysen entweder direkt im Unternehmen oder unternehmensextern. Ein robuster On-Demand-Orchestrierungsprozess vereinfacht die Bereitstellung der Datensätze.

Business Analytics

Der Ansatz von Pentaho ist modern, einfach und interaktiv. Geschäftsanwender können deshalb auf alle Datenmengen und -typen ohne Einschränkung zugreifen und diese für die Datenanalyse und das Data-Blending nutzen. Anwender können die Datenbestände über mehrere Dimensionen hinweg problemlos analysieren, ohne auf die Unterstützung der IT-Abteilung angewiesen zu sein. Datenanalyse kann also unmittelbar dort stattfinden, wo die Fragestellungen der Analysen auftreten und relevant sind. Von Standardberichten bis zu prognostischen Modellierungen reicht das Spektrum der Möglichkeiten. Außerdem ist das Design für eine mobile Nutzung konzipiert worden und erlaubt es den Anwendern, orts- und zeitflexibel zu arbeiten.

Interaktive visuelle Analysemöglichkeiten

Geschäftsanwender sind besonders von der Möglichkeit, jederzeit und überall selbst auf Datensätze zuzugreifen und diese zu analysieren und anschließend zu visualisieren, überzeugt. Mit den interaktiven, visuellen Analysen wird ein vertieftes Verständnis erreicht. Die interaktiven Analysemöglichkeiten sind in einer Bibliothek zusammengestellt worden. Anwender können auf Geo-Mapping, Verteilungsdiagramme und weitere Möglichkeiten zugreifen. Mit Visualisierungs-Plug-ins sind außerdem spezielle, erweiterte Visualisierungen möglich. Die mobile Anwendbarkeit sowie die enorme Analysegeschwindigkeit sind weitere Vorteile.

Mit den interaktiven, visuellen Analysen wird ein vertieftes Verständnis erreicht(#01)

Mit den interaktiven, visuellen Analysen wird ein vertieftes Verständnis erreicht(#01)

Innovative Möglichkeiten der Erstellung von Dashboards

Mit Pentaho können interaktive und grafische Dashboards ohne Vorkenntnisse erstellt werden. Hier werden Leistungsindikatoren anschaulich dargestellt. Eine intuitive Benutzeroberfläche führt dazu, dass die Leistung des Unternehmens mit diesem Instrument gesteigert werden kann. Es stehen Filterfunktionen, eine Drilldown-Funktion sowie eine einfache Navigation zur Verfügung. Auch maßgeschneiderte, benutzerdefinierte Dashboards für Unternehmen sind möglich. Die Geschäftsanalysen können einfach in andere Anwendungen integriert werden.

Möglichkeit der Berichterstellung im Self-Service

Mit dem interaktiven Self-Service Reporting können die Mitarbeiter in den Fachabteilungen ganz einfach Berichte selbst erstellen und auch Fragestellungen, die ungewöhnlich und spontan sind, verfolgen. Daraus ergeben sich oft völlig unerwartete Erkenntnisse, die direkt für die Weiterentwicklung des Unternehmens genutzt werden. Es sind selbstverständlich auch unternehmensweite, professionell formatierte Berichte möglich. Für Poweruser steht ein umfassender grafischer Editor zur Verfügung. Die Ausgabe ist in den gängigen Formaten HTML, Excel, CSV und PDF sowie RTF möglich und das In-Memory-Caching sorgt für blitzschnelle Ergebnisse.

Optimierte Verwaltungs- und Administrationsfunktionen

Optimierte Verwaltungs- und Administrationsfunktionen(#03)

Optimierte Verwaltungs- und Administrationsfunktionen(#03)

Es gibt ein Tool-Set, mit dem die Verwaltung und Administration erleichtert wird. Damit werden sowohl die Analysesicherheit als auch die Versionsverwaltung perfektioniert. Sicherung und Wiederherstellung sowie ein hohes Maß an Verlässlichkeit werden von den Geschäftsanwendern besonders geschätzt. Auch eine unternehmensweite Integration der Daten inklusive Neustart und Rollback wird möglich. Die Leistungsüberwachung und das Auditing sind mit einer integrierten Berichterstellung verknüpft.

Wie können die Pentaho Analytics eingebunden werden?

Die Pentaho-Lösung, die in der Cloud bereitgestellt wurde, ist speziell dafür konzipiert worden, dass eine Einbettung in Portale, Anwendungen und Prozesse des Unternehmens möglich wird. Die offene Architektur ist perfekt geeignet für unternehmensindividuelle Erweiterungen.

Die Software bietet ein breites Spektrum an BI-Analysen und darüber hinaus eine optimale Datenintegration. Der Datenzugriff und die Integration aus jeder Datenquelle werden erheblich erleichtert. Ein professioneller Support reduziert den Aufwand, der für die Implementierung und Wartung der Software notwendig ist. Die übersichtliche Dashboard-Gestaltung ist die Grundvoraussetzung der Eignung für die User in den Fachabteilungen, die nicht über vertiefte IT-Kenntnisse verfügen. Alle Ergebnisse des Data-Mining werden in verständlicher, übersichtlicher Form dargestellt und können unmittelbar als Entscheidungsbasis herangezogen werden.

Wie können Erweiterungen des Systems vorgenommen werden?

Der modulare Aufbau ermöglicht die Anpassung an Unternehmensspezifika und den Austausch von Komponenten. Außerdem erleichtern die offene Architektur und offene Standards die Erweiterbarkeit. Damit ist die Plattform sehr flexibel und passt sich auch veränderten Anforderungen in der Zukunft an. Die Webdienst-Benutzeroberflächen sind modern und vollständig auf Java aufgebaut sowie auf Industriestandards abgestimmt. Dadurch erfolgt eine einfache Integration in jede Webanwendung.

Ein weiterer Vorteil ist Einbindung in Sicherheitsframeworks des Unternehmens. Open APIs erlauben die Erweiterung um Grafiken und Diagramme von Drittanbietern. Alle BI-Analysen können auch in mobile Anwendungen integriert werden. Damit auf dynamisch veränderte Kundenanforderungen adäquat reagiert werden kann, können Produkt-Roadmaps, Quellcodes und Komponenten eingesehen werden.

Unternehmensindividuelle Visualisierung

Jedes Unternehmen bestimmt die Art der Visualisierung in hohem Maße eigenständig. Alle Visualisierungen sind anpassbar, interaktiv und stellen die Benutzererfahrung beim Design der Oberflächen in den Fokus. Für spezielle Szenarien können professionelle Visualisierungen, Reports und Dashboards entwickelt werden. Die Dashboards sind passend zur Marke konfigurierbar. Serviceteams arbeiten mit den Unternehmen zusammen, damit diese alle Kennzahlen nach Wunsch darstellen können.

Mit Pentaho kann die Komplexität von Big-Data reduziert werden

Die Möglichkeiten, die Big-Data den Unternehmen eröffnet, sind fasziniert und vielfältig. Auf der anderen Seite ist damit auch ein nie gekanntes Ausmaß an Komplexität verbunden, mit dem viele Unternehmen (noch) überfordert sind. Damit die Potentiale einer datenbasierten Unternehmensführung genutzt werden können, sind geeignete IT-Lösungen gefragt. Ein vereinfachter, skalierbarer Datenintegrationsansatz kann erheblich dazu beitragen, die Komplexität zu reduzieren und den Unternehmen eine Möglichkeit bieten, die Datenflut nicht nur zu bewältigen, sondern auch produktiv zu nutzen.

Es sind nur wenige Transformationen nötig, um eine Vielzahl von Prozessen der Datenaufnahme und -vorbereitung durchzuführen. Auf diese Weise können in kürzester Zeit analysefähige Datenbestände erzeugt werden. Aus jeder beliebigen Datenquelle können sichere Datensätze generiert werden. Zu diesem Zweck wird Hadoop eingesetzt, um Datensätze aufzubereiten. Die Datensätze werden mit einem Mausklick modelliert und gleichzeitig den Anwendern umgehend zur Verfügung gestellt. Hadoop wird dadurch zu einem Multisource-Hub für alle unternehmensrelevanten Informationen. Daten können damit gestreamt und miteinander kombiniert werden. Anschließend erfolgt eine automatische Veröffentlichung in einer Analysedatenbank. Jetzt hat der User alle Optionen: Es können Datenbestände ermittelt, Berichte erstellt und Dashboards gestaltet werden. Schließlich kann auch eine professionelle Visualisierung durchgeführt und als Basis für die Datenanalyse verwendet werden.

Der Datenintegrationsprozess kann im Self-Service erfolgen und anschließend wird mit den Self-Service-Analysefunktionen weitergearbeitet. Es ist somit möglich, dass an jeder Stelle im Unternehmen, wo eine Datenanalyse zur Klärung von Problemen hilfreich erscheint, diese auch direkt von den „Mitarbeitern vor Ort“ durchgeführt wird.

Es können Datenbestände ermittelt, Berichte erstellt und Dashboards gestaltet werden(#05)

Es können Datenbestände ermittelt, Berichte erstellt und Dashboards gestaltet werden(#05)

Pentaho spart Datenkosten und maximiert Analyseleistungen

Wenig genutzte Datensätze und Transformations-Workloads können nach Hadoop ausgelagert werden und auf diese Weise wird die Belastung des Data-Warehouse verringert. Die Big-Data-Integration erfolgt ohne Programmierung und erlaubt den Zugriff auf alle Datenquellen. Außerdem wird eine sehr hohe Verarbeitungsqualität gewährleistet. Die Unternehmen können ihre Daten sofort nutzen und sehr schnell und kostengünstig Berichte oder Dashboards erstellen, Daten ermitteln und prognostische Analysen durchführen.

Die Zukunftsfähigkeit erstreckt sich auch auf Anwendungen im Zusammenhang mit einer Realisierung des Internet of Things. Dort müssen Sensor-, Netzwerkdaten und M2M-(Maschine-zu-Maschine)Daten in die Analysen einbezogen werden. Diese Datenarten stellen die Unternehmen vor ganz neue Herausforderungen im Hinblick auf das Datenvolumen, die Datenvielfalt und die prognostische Modellierung. Mit Pentaho wird es jedoch möglich, auch diese Datenarten zu integrieren und sogar mit den konventionellen IT-Strukturen zu verknüpfen. Es stehen außerdem innovative Tools bereit, die maschinelles Lernen und Data-Mining unterstützen.


Bildnachweis: © Shutterstock-Titelbild: LIPING, #01: ESB Professional, #02: MicroOne, #03: Ditty_about_summer, #04: vectorfusionart, #05: zmicier kavabata

Über 

Marius Beilhammer, Jahrgang 1969, studierte Journalismus in Bamberg. Er schreibt bereits viele Jahre für technische Fachmagazine, außerdem als freier Autor zu verschiedensten Markt- und Businessthemen. Als fränkische Frohnatur findet er bei seiner Arbeit stets die Balance zwischen Leichtigkeit und umfassendem Know-how durch seine ausgeprägte Affinität zur Technik.

Leave A Reply