Die Stackable Data Platform (SDP) Release 25.7 bietet Big Data-Architekturen mit Open Source-Technologie auf Kubernetes-Basis. Das Unternehmen bietet eine Alternative zu teuren Hyperscaler-Lösungen und setzt auf Datensouveränität, wie auf der IT Press Tour gezeigt. The Stackable Data Platform (SDP) Release 25.7 offers Big Data architectures with open source technology on a Kubernetes basis. The company provides an alternative to expensive hyperscaler solutions and focuses on data sovereignty, as demonstrated at the IT Press Tour.
Nominiert für die »WOMEN OF THE YEAR«-Awards 2025! Kategorie: IT – CxO
Vote for Carolina: https://www.fit-kongress.de/award Link anklicken/ zur Abstimmung/ jetzt starten /Women in IT/ CxO/ Carolina Heyder
Nominated for the „WOMEN OF THE YEAR“ Awards 2025! Category: IT – CxO
Vote for Carolina: https://www.fit-kongress.de/award Click the link / to vote / start now / Women in IT / CxO / Carolina Heyder
Sönke Liebau, Geschäftsführer und Chief Product Officer der  Stackable GmbH aus Wedel in Schleswig-Holstein, stellte sein Unternehmen aus der 63. IT Press Tour in Amsterdam vor. Stackable sind Software Devs, die beim Umgang mit Big Data unterstützen. Hervorgegangen 2020 aus der Open Source Community, genauer gesagt der Hadoop Community, setzt Stackable auf Transparenz: Der Quellcode der Plattform ist frei zugänglich. Stackable setzt auf Zusammenarbeit statt Wettbewerb und hilft, Unternehmen bei ihrer Datenanalysearchitektur unterstützen zu können.

Durch die Beschleunigung der Netzwerke können Daten schneller bewegt werden und aus Data Lakes sind Data Lakehouses geworden. Hadoop war schwer zu installieren. Cloudera und Hortonworks machten es einfacher. In den letzten Jahren ist der Einsatz von Hadoop zurückgegangen. IBM hat sein Angebot eingestellt und Cloudera und Hortonworks haben fusioniert, dann aber die Community Edition eingestellt und die Preise für die kommerzielle Version verfünffacht.

Viele Kunden haben nach Alternativen gesucht: Liebau startete eine Self Help Group, die DB war ein Mitglied und lud zu einem Workshop. Auf der Suche nach einem Hadoop Nachfolger wurde Stackable geboren, direkt vor der Pandemie.

IONOS beteiligte sich an Stackable im Oktober 2021 und erwarb mit 25,1 Prozent eine Sperrminorität. Ein weiterer Investor ist Sebastian Amtage, der CEO von Stackable sowie Gründer und Managing Partner von b.telligent.

Die Stackable Plattform bietet Open Source Infrastruktur as Code auf der Basis von Kubernetes. Es läuft On-Premises, Cloud oder hybrid. Das Team umfasst 20 Leute in Deutschland und international. Zu den Kunden zählen u.a. IONOS, HUK, Pro7, das britische Verteidigungsministerium und Danske Bank.

„Es gibt noch viele Unternehmen, die Kubernetes nicht nutzen, aber alle haben Interesse“, berichtet Liebau. Stackable bietet Support und hat zufriedene Kunden. „Wir nehmen unsere Kunden auf eine Reise mit und antworten auf Support-Anfragen binnen Stunden.“

Stackable arbeitet mit Consultants, die die Kunden beraten. Stackable setzt auf organisches Wachstum uns sucht keine Investoren oder Venture Capitalists. Partner sind u.a SVA, Suse, b.telligent und Red Hat.

Datensouveränität ist ein Kernargument in diesen unsicheren Zeiten, verbunden mit Open Source. Die Hyperscaler haben ihre Preise erhöht und es droht Lock-In. Stackable eröffnet einen Weg aus der Cloud.

Data Apps einfach verwenden

Stackable bietet  eine abgestimmte Auswahl beliebter Open Source Data Apps wie Apache Kafka, Apache Druid, Trino und Apache Spark. Alles 100 Prozent Open Source, modular und flexibel, auch als Managed Service in der IONOS Cloud. Das Lizenzmodell beruht auf der Anzahl der Nodes auf Vertrauensbasis. Im Kern handelt es sich um eine Datenplattform.

Sämtliche Data Apps arbeiten nahtlos zusammen und können im Handumdrehen hinzugefügt oder entfernt werden. Basierend auf Kubernetes läuft die Plattform überall – im eigenen Datencenter, hybrid oder in der Cloud. Die Plattform unterstützt einzigartige und unternehmensweite Datenarchitekturen. Die Plattform unterstützt z. B. moderne Data Warehouses, Data Lakes, Event Streaming, Machine Learning oder Data Meshes.

Stackable Data Platform Overview

Cloud-native Kubernetes-Operatoren

Stackable Module sind reguläre Kubernetes-Operatoren entwickelt mit der Programmiersprache Rust.

Stackable Operator für Apache Kafka

Der Stackable Operator für Apache Kafka ermöglicht das automatisierte Ausrollen und Verwalten von Apache Kafka in Kubernetes Clustern. Er unterstützt die Stackable Autorisierung und Überwachung.

Stackable Operator für Apache Druid

Der Stackable Operator für Apache Druid verwaltet Apache Druid Cluster. Apache Druid ist eine Echtzeit-Datenbank zur Unterstützung moderner Analyseanwendungen.

Stackable Operator für Apache Spark

Der Stackable Operator für Apache Spark ermöglicht, einen Spark Cluster auf Kubernetes zu steuern. Er bietet auch die Möglichkeit, Spark-Aufträge auf dem Cluster zu starten.

Stackable Operator für Apache Superset

Der Stackable Operator für Apache Superset verwaltet Apache Superset, eine moderne Plattform zur Datenexploration und -visualisierung. Mit Stackable wird Superset für die Zusammenarbeit mit Trino und Apache Druid konfiguriert.

Stackable Operator für Trino

Der Stackable Operator für Trino bietet vorkonfigurierten Zugriff auf Apache HDFS oder einen beliebigen S3-kompatiblen Cloud-Speicher. Trino erlaubt föderierte Abfragen aus einer Vielzahl von Datenquellen.

Stackable Operator für Apache Airflow

Der Stackable Operator für Apache Airflow verwaltet Apache Airflow Cluster. Airflow ist eine Workflow Engine, die das programmatische Erstellen, Ausführen und Überwachen von Daten-Pipelines erlaubt und Dein Ersatz, wenn Du Apache Oozie verwendest.

Stackable Operator für Apache NiFi

Der Stackable Operator für Apache NiFi ermöglicht das automatisierte Ausrollen und Verwalten von Apache NiFi. NiFi unterstützt leistungsstarke und skalierbare Datenflüsse.

Stackable Operator für OPA (OpenPolicyAgent)

Der Stackable Operator für OPA (OpenPolicyAgent) verwaltet OPA-Server. Mit OPA können flexibel Regeln und Richtlinien für den Daten-Zugriff „as Code“ definiert werden.

Stackable Operator für Apache HBase

Der Stackable Operator für Apche HBase verwaltet Apache HBase Cluster. HBase ist ein verteilter, skalierbarer Big-Data-Speicher.

Stackable Operator für Apache Hadoop HDFS

Der Stackable Operator für Apache Hadoop HDFS verwaltet Apache HDFS-Cluster. HDFS ist ein verteiltes Dateisystem, das den Zugriff auf Daten mit hohem Durchsatz ermöglicht.

Stackable Operator für Apache Hive

Der Stackable Operator für Apache Hive verwaltet Apache Hive. Derzeit unterstützt es den Hive Metastore. Die Data-Warehouse-Software Apache Hive erleichtert das Lesen, Schreiben und Verwalten großer Datensätze, die sich in einem verteilten Speicher befinden, mit SQL.

Stackable Operator für Apache ZooKeeper

Der Stackable Operator für Apache ZooKeeper ermöglicht das automatisierte Ausrollen und Verwalten von Apache ZooKeeper-Ensembles. Apache Zookeeper wird von vielen Big-Data-Produkten als äußerst zuverlässiger Koordinator verteilter Systeme eingesetzt.

Stackable Data Platform 25.7 enthält viele neue Features und hilft dabei, moderne, offene und unternehmensgerechte Datenarchitekturen schneller denn je zu entwerfen und umzusetzen.

Neu sind die experimentelle Unterstützung für Airflow 3.0.1 mit einer neuen React-Benutzeroberfläche, Spark Connect für interaktive Data-Science-Workflows direkt aus Notebooks, wieder hinzugefügte Iceberg-Unterstützung und neue OPA-Autorisierung für NiFi 2.4.0 sowie Trino 476 mit integrierten KI-Funktionen zur Verwendung mit einem LLM Deiner Wahl, z. B. Ollama, OpenAI oder Anthropic. In Kombination mit der OCI-first-Bereitstellung auf oci.stackable.tech, der erweiterten Unterstützung für Kubernetes 1.30 – 1.33 und OpenShift 4.16 – 4.18 sowie über 230 CVE-Korrekturen macht SDP 25.7 Deine Datenplattform intelligenter, sicherer und einfacher zu betreiben.

Neue Plattformfunktionen

  • Allgemeine Verbesserungen
    • Aus dem Quellcode erstellte Produkte tragen nun Versionssuffixe (z.B. 3.9.3-stackable25.7.0).
    • Breaking: Listener-Operator für konsistenten externen Zugriff und Metriken wurde in allen Produkten integriert.
    • Automatische Erkennung von Cluster-Domänen, wodurch die manuelle DNS-Einrichtung entfällt.
  • Sicherheit
    • Neue TrustStore-Ressource zum Abrufen von Trust-Root-Zertifikaten über SecretClass.
    • Formatspezifische Anmerkungen zum Anpassen von Secret-Dateinamen.
  • Überwachung:
    • Alle Operatoren geben jetzt OpenTelemetry-Protokolle und -Traces aus.
    • Einheitliche CLI-Argumente, Umgebungsvariablen und Helm-Werte zum Konfigurieren von Exportern.
  • Autorisierung
    • Experimentelle Unterstützung zum Abrufen von Benutzergruppen aus Microsoft Entra im OPA-Backend.
  • Betrieb
    • Operator-Helm-Charts enthalten jetzt RBAC-Patch-Berechtigungen für events.k8s.io/events, wodurch Ereignisaggregationen wie „Fehler ist 10 Mal in 5 Minuten aufgetreten“ möglich sind.

Plattformverbesserungen

  • Sicherheit und Schwachstellen
    • 230 CVEs wurden in Stackable-Produktimages behoben, darunter 3 kritische und 97 schwerwiegende Probleme.
  • Systemdiagnose
    • Die interne Systemdiagnose wird nun alle 30 Minuten statt jede Minute ausgegeben.
  • Apache Spark
    • Unterstützung für Spark Connect (experimentell).
  • NiFi
    • Unterstützung für rollierende Upgrades zwischen NiFi 2-Versionen.
    • Wiederherstellung der Iceberg-Unterstützung in NiFi 2.4.0.
    • Autorisierungsunterstützung mit dem Open Policy Agent (OPA)
  • ZooKeeper
    • Native Unterstützung für Prometheus-Metriken.
    • Metrik-Endpunkt über integrierten Anbieter hinzugefügt; Backports von 3.9.4 in das unterstützte 3.9.3-Image.
Sönke Liebau, CEO and Chief Product Officer of Stackable GmbH from Wedel in Schleswig-Holstein, presented his company at the 63rd IT Press Tour in Amsterdam. Stackable consists of software developers who support Big Data handling. Emerging from the open source community in 2020, specifically the Hadoop community, Stackable emphasizes transparency: The platform’s source code is freely accessible. Stackable focuses on collaboration rather than competition and helps support companies with their data analysis architecture.

Through network acceleration, data can be moved faster, and data lakes have become data lakehouses. Hadoop was difficult to install. Cloudera and Hortonworks made it easier. In recent years, Hadoop usage has declined. IBM discontinued its offering, and Cloudera and Hortonworks merged, then discontinued the Community Edition and increased prices for the commercial version fivefold.

Many customers have searched for alternatives: Liebau started a self-help group, with Deutsche Bank as a member who invited them to a workshop. In the search for a Hadoop successor, Stackable was born, right before the pandemic.

IONOS invested in Stackable in October 2021 and acquired a blocking minority with 25.1 percent. Another investor is Sebastian Amtage, who is CEO of Stackable as well as founder and managing partner of b.telligent.

The Stackable platform offers open source Infrastructure as Code based on Kubernetes. It runs on-premises, in the cloud, or hybrid. The team comprises 20 people in Germany and internationally. Customers include IONOS, HUK, Pro7, the British Ministry of Defense, and Danske Bank.

„There are still many companies that don’t use Kubernetes, but everyone is interested,“ reports Liebau. Stackable provides support and has satisfied customers. „We take our customers on a journey and respond to support requests within hours.“

Stackable works with consultants who advise customers. Stackable focuses on organic growth and is not seeking investors or venture capitalists. Partners include SVA, SUSE, b.telligent, and Red Hat.

Data sovereignty is a core argument in these uncertain times, combined with open source. Hyperscalers have increased their prices and lock-in threatens. Stackable opens a path out of the cloud.

Easy-to-Use Data Apps

Stackable offers a curated selection of popular open source data apps like Apache Kafka, Apache Druid, Trino, and Apache Spark. Everything is 100 percent open source, modular and flexible, also available as a managed service in the IONOS Cloud. The licensing model is based on the number of nodes on a trust basis. At its core, it’s a data platform.

All data apps work seamlessly together and can be added or removed in no time. Based on Kubernetes, the platform runs everywhere — in your own data center, hybrid, or in the cloud. The platform supports unique and enterprise-wide data architectures. The platform supports, for example, modern data warehouses, data lakes, event streaming, machine learning, or data meshes.

Stackable Data Platform Overview

Cloud-native Kubernetes Operators

Stackable modules are regular Kubernetes operators developed with the Rust programming language.

Stackable Operator for Apache Kafka

The Stackable Operator for Apache Kafka enables automated deployment and management of Apache Kafka in Kubernetes clusters. It supports Stackable authorization and monitoring.

Stackable Operator for Apache Druid

The Stackable Operator for Apache Druid manages Apache Druid clusters. Apache Druid is a real-time database for supporting modern analytics applications.

Stackable Operator for Apache Spark

The Stackable Operator for Apache Spark enables controlling a Spark cluster on Kubernetes. It also provides the ability to start Spark jobs on the cluster.

Stackable Operator for Apache Superset

The Stackable Operator for Apache Superset manages Apache Superset, a modern platform for data exploration and visualization. With Stackable, Superset is configured for collaboration with Trino and Apache Druid.

Stackable Operator for Trino

The Stackable Operator for Trino provides preconfigured access to Apache HDFS or any S3-compatible cloud storage. Trino allows federated queries from a variety of data sources.

Stackable Operator for Apache Airflow

The Stackable Operator for Apache Airflow manages Apache Airflow clusters. Airflow is a workflow engine that allows programmatic creation, execution, and monitoring of data pipelines and is your replacement if you’re using Apache Oozie.

Stackable Operator for Apache NiFi

The Stackable Operator for Apache NiFi enables automated deployment and management of Apache NiFi. NiFi supports powerful and scalable data flows.

Stackable Operator for OPA (OpenPolicyAgent)

The Stackable Operator for OPA (OpenPolicyAgent) manages OPA servers. With OPA, you can flexibly define rules and policies for data access „as code.“

Stackable Operator for Apache HBase

The Stackable Operator for Apache HBase manages Apache HBase clusters. HBase is a distributed, scalable big data store.

Stackable Operator for Apache Hadoop HDFS

The Stackable Operator for Apache Hadoop HDFS manages Apache HDFS clusters. HDFS is a distributed file system that enables high-throughput access to data.

Stackable Operator for Apache Hive

The Stackable Operator for Apache Hive manages Apache Hive. Currently, it supports the Hive Metastore. The data warehouse software Apache Hive facilitates reading, writing, and managing large datasets residing in distributed storage using SQL.

Stackable Operator for Apache ZooKeeper

The Stackable Operator for Apache ZooKeeper enables automated deployment and management of Apache ZooKeeper ensembles. Apache ZooKeeper is used by many big data products as an extremely reliable coordinator for distributed systems.

Stackable Data Platform 25.7 contains many new features and helps design and implement modern, open, and enterprise-ready data architectures faster than ever.

New features include experimental support for Airflow 3.0.1 with a new React user interface, Spark Connect for interactive data science workflows directly from notebooks, re-added Iceberg support and new OPA authorization for NiFi 2.4.0, as well as Trino 476 with integrated AI functions for use with an LLM of your choice, such as Ollama, OpenAI, or Anthropic. Combined with OCI-first deployment on oci.stackable.tech, extended support for Kubernetes 1.30 — 1.33 and OpenShift 4.16 — 4.18, plus over 230 CVE fixes, SDP 25.7 makes your data platform smarter, more secure, and easier to operate.

New Platform Features

General Improvements

Products built from source code now carry version suffixes (e.g., 3.9.3-stackable25.7.0).

Breaking: Listener operator for consistent external access and metrics has been integrated into all products.

Automatic detection of cluster domains, eliminating the need for manual DNS setup.

Security

New TrustStore resource for retrieving trust root certificates via SecretClass.

Format-specific annotations for customizing secret file names.

Monitoring:

All operators now output OpenTelemetry logs and traces.

Unified CLI arguments, environment variables, and Helm values for configuring exporters.

Authorization

Experimental support for retrieving user groups from Microsoft Entra in the OPA backend.

Operations

Operator Helm charts now include RBAC patch permissions for events.k8s.io/events, enabling event aggregations like „error occurred 10 times in 5 minutes.“

Platform Improvements

Security and Vulnerabilities

230 CVEs have been fixed in Stackable product images, including 3 critical and 97 severe issues.

System Diagnostics

Internal system diagnostics are now output every 30 minutes instead of every minute.

Apache Spark

Support for Spark Connect (experimental).

NiFi

Support for rolling upgrades between NiFi 2 versions.

Restoration of Iceberg support in NiFi 2.4.0.

Authorization support with Open Policy Agent (OPA).

ZooKeeper

Native support for Prometheus metrics.

Metric endpoint added via integrated provider; backports from 3.9.4 to the supported 3.9.3 image.

Der neue Senior Director Partner Sales bei NetApp, Henning Rahe, erklärt im SSCG-Podcast mit Carolina Heyder, wie das Mittelstandsgeschäft gemeinsam mit Partnern gestärkt werden soll. NetApp’s new Senior Director Partner Sales, Henning Rahe, explains in the SSCG Podcast with Carolina Heyder how the company plans to strengthen its midmarket business with partners.

Von Jakob Jung

Dr. Jakob Jung ist Chefredakteur Security Storage und Channel Germany. Er ist seit mehr als 20 Jahren im IT-Journalismus tätig. Zu seinen beruflichen Stationen gehören Computer Reseller News, Heise Resale, Informationweek, Techtarget (Storage und Datacenter) sowie ChannelBiz. Darüber hinaus ist er für zahlreiche IT-Publikationen freiberuflich tätig, darunter Computerwoche, Channelpartner, IT-Business, Storage-Insider und ZDnet. Seine Themenschwerpunkte sind Channel, Storage, Security, Datacenter, ERP und CRM. Dr. Jakob Jung is Editor-in-Chief of Security Storage and Channel Germany. He has been working in IT journalism for more than 20 years. His career includes Computer Reseller News, Heise Resale, Informationweek, Techtarget (storage and data center) and ChannelBiz. He also freelances for numerous IT publications, including Computerwoche, Channelpartner, IT-Business, Storage-Insider and ZDnet. His main topics are channel, storage, security, data center, ERP and CRM. Kontakt – Contact via Mail: jakob.jung@security-storage-und-channel-germany.de

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

WordPress Cookie Hinweis von Real Cookie Banner