Das Marktforschungsinstitut Gartner hat die Lösungen von VAST Data unter die Lupe genommen und das Unternehmen als „Challenger“ in einem Magic Quadrant eingestuft.

VAST Data wird im „Gartner Magic Quadrant for Distributed File Systems and Object Storage“, (Published 19 October 2022) als „Challenger“ eingestuft. In dieser Studie hat Gartner 19 Produkte für Datei- und Object-Storage anhand von 10 kritischen Fähigkeiten für sieben Anwendungsfälle untersucht, die besonders wichtig bei führenden Unternehmen von Infrastructure & Operations (I&O) sind.

 

Hier die vollständige Bewertung von Gartner:

 

VAST Data ist ein Herausforderer in diesem Magic Quadrant. VAST Data ist ein einheitliches verteiltes Dateisystem und eine Objektspeicher-Appliance, die für groß angelegte Multiprotokoll-Rechenzentrumsbereitstellungen konzipiert ist. Die zustandslosen Front-End-Protokollknoten und die persistenten JBOF-Speicherknoten von VAST sind über NVMe-over-Fabric-Protokolle (NVMe-oF) verbunden, um Algorithmen mit höherer Skalierbarkeit, geringerer Latenz und globaler Effizienz zu ermöglichen.

 

Eine Shared-Everything-Architekturplattform nutzt Speicher der Speicherklasse, um Latenz, Ausfallsicherheit und Durchsatz zu verbessern, sowie QLC-Flash-Medien (Quad-Level Cell). Das Unternehmen war bisher hauptsächlich in Nordamerika tätig. In den letzten 12 Monaten hat VAST Data Replikation, NFS4.1, SMB3, Benutzerquoten, unveränderliche Snapshots, Multiprotokoll und S3-Versionierung hinzugefügt. VAST Data eignet sich am besten für KI/Machine Learning (ML), Finanzanalysen, Biowissenschaften und andere große, leistungsempfindliche Workloads.

 

Stärken

 

Architektur: Die Shared-Everything-Plattformarchitektur von VAST ist für Endanwender attraktiv, die ihre Datei- und Objektbereitstellungen im Umfang von mehreren Petabyte modernisieren und konsolidieren möchten.

 

Effizienz im großen Maßstab: Die Architektur von VAST ist darauf ausgelegt, Hochleistungsspeicher mit geringer Latenz in großem Umfang zu liefern und gleichzeitig kostengünstigen QLC-Flash zu nutzen, um die Gesamtkosten der All-Flash-Plattform zu senken.

 

Kundenerfahrung: VAST-Endbenutzer heben den guten Support und Kundendienst vor und nach dem Kauf sowie die schnelle Reaktion des Anbieters auf Anfragen zu Produktverbesserungen und Fehlerbehebungen hervor.

 

Schwächen

 

Globale Abdeckung: Die Markenbekanntheit und die globale Reichweite von VAST sind begrenzt, und die Zahl der Kunden ist im Vergleich zu den Marktführern geringer.

 

Edge: VAST ist nicht ideal für Kunden mit kleineren Bereitstellungsgrößen und kleinen Kapazitätserweiterungen für extrem kostengünstige Allzweck-Dateisysteme.

Unternehmensfunktionen: Dem VAST-Produkt fehlen bestimmte Unternehmensfunktionen wie geodistributives Erasure Coding, Ransomware-Erkennung, synchrone Replikation und Public Cloud-Integration.

 

Kommentar

 

Andy Pernsteiner, Field CTO bei VAST Data, beschreibt vor diesem Hintergrund fünf wichtige Unterscheidungsmerkmale von VAST für den Einsatz bei schnellen und umfangreichen Data Analytics:

 

  1. All-Flash Performance

 

VAST verfügt über eine einheitliche Datenplattform, die den schnellen All-Flash-Zugriff auf alle Daten für Unternehmen jeder Art ermöglicht. Die Plattform präsentiert sich Anwendungen und Benutzern sowohl als Object-Speicher und als ein skalierbares NAS-System. Strukturierte und unstrukturierte Daten können aus einer Vielzahl von Anwendungen und Quellen in ein einziges gemeinsames Repository zur Analyse und Verarbeitung zusammengeführt werden. Als eine All-Flash-Plattform erbringt VAST eine extrem gute Leistung, unabhängig davon, ob das Zugriffsmuster sequentiell oder zufällig organisiert ist. Die Plattform kommt auch mit großen Datenmengen zurecht, die gleichzeitig von mehreren Anwendungen eingespeist werden.

 

  1. Datenzugang mit mehreren Protokollen

 

Die Object-Schnittstelle (S3) von VAST ermöglicht die Integration mit Analyse-Tools für Big Data wie zum Beispiel MapReduce, HIVE und Spark. Außerdem unterstützt sie verteilte Abfrage-Engines (zum Beispiel Dremio, Trino, Presto) und GPU-beschleunigte Data Warehouses (zum Beispiel SQream). Da VAST den Namespace mit Standards wie NFSv3 und NFSv4 darstellen kann, unterstützt das System auch traditionelle Analyseanwendungen und Datenbanken wie zum Beispiel SAS Grid, Postgres und KDB. Teradata, Splunk, ElasticSearch und Vertica können entweder über S3 oder NFS integriert werden.

 

Da VAST auch das Windows SMB-Protokoll für File Sharing unterstützt, können Analysten und andere Benutzer außerdem problemlos auf Berichte und Ausgabedaten von ihren Workstations zugreifen. Dafür muss keine Kopie auf ein separates Speichersystem verschoben werden, oder man muss keine speziellen Tools oder Kenntnisse erwerben, wie dies bei der Interaktion mit HDFS-basierten Systemen erforderlich ist.

 

Dies bedeutet, dass VAST für eine Vielzahl von Anwendungen geeignet ist, darunter:

  • Legacy-Analyseanwendungen im Stil eines Data Warehouse;
  • die Zwischenschicht der Datenverarbeitung innerhalb eines Data Lake;
  • ETL (Extract, Transform, Load) und ELT (Extract, Load, Transform);
  • Ad-hoc-Analysen mit Tools wie zum Beispiel Presto, Trino, Impala und Dremio; und
  • aktuelle AI/ML-Tools.

 

  1. Direkte Speicherunterstützung per GPU

 

VAST bietet einen innovativen Ansatz für AI/ML/DL (Artificial Intelligence/Machine Learning/Deep Learning) durch Steigerung der GPU-Aktivität und -Effizienz. Mit der zunehmenden Verbreitung von GPUs bei AI und Analytics, ist es wichtig sicherzustellen, dass GPUs nicht nur schnell mit großen Datenmengen bedient werden können, sondern diese Daten auch so effizient wie möglich verarbeiten. Mit der Verwendung von GPU-Direktspeicher können Daten, die von VAST kommen, direkt von der Netzwerkkarte des GPU-Servers in die GPU-Memory gelangen. Mit anderen Worten, die Daten können das System Memory und den CPU-Komplex umgehen. Dies führt zu einer höheren Bandbreite sowie zu einer Vermeidung des GPU-Overheads für die I/O-Prozesse.

 

Das Endergebnis besteht in einer erhöhten Effizienz und der Möglichkeit, mehr Analysen und Abfragen auf einer geringeren Anzahl von GPUs durchzuführen.

 

  1. Höchste Datenreduzierung

 

VAST bietet höchste Datenreduzierung durch seinen Similarity-based Data Algorithm. Für strukturierte oder halbstrukturierte Daten in komma- oder tabulatorgetrennten Wertformaten stellt VAST eine Datenreduktion zwischen 3:1 und 4:1 ohne Kompromisse bei der Performance zur Verfügung. Die eingelesenen Daten verbrauchen weniger Kapazität im Vergleich zu anderen Plattformen. Selbst wenn die Daten vorkomprimiert wurden, wie es bei Formaten wie zum Beispiel Parquet der Fall ist, bieten wir zusätzliche Einsparungen von 1,45:1. Das mag nicht viel erscheinen, aber eine Reduzierung des Speicherverbrauchs um 45 Prozent ist in den heutigen kostenbewussten Umgebungen ein besonderer Faktor.

 

  1. Eine moderne Architektur für moderne Workloads

 

VAST verwendet einen Ansatz für Disaggregated Shared Everything (DASE) bei der Speicherarchitektur. Dieser einzigartige und hoch skalierbare Ansatz ermöglicht es den Kunden, die Speicherkapazität unabhängig von der Speicher-Performance zu skalieren. Sie müssen kein festes Verhältnis zwischen Kapazität und Performance mehr einhalten und können das System an die sich im Laufe der Zeit ändernden Anforderungen anpassen.

 

Die Performance eines VAST-Systems wird nicht durch die Speichermedien eingeschränkt, die zu 100 Prozent aus NVME-Flash bestehen. Stattdessen wird die Performance durch den Compute Layer bestimmt, der diesen Speicher adressiert und den Client-Anwendungen zur Verfügung steht. Weil wir Compute von Storage getrennt haben, können Kunden die Performance linear skalieren, indem sie einfach mehr CPUs hinzufügen. Sie können dies auch auf eine Weise durchführen, bei der jeder Anwendung ihre eigene dedizierte Speicherschicht zugewiesen wird.

 

Da die Plattform stateless ist, bedeutet dies auch, dass Kunden ihre Nutzung nach Bedarf ändern können. An einem bestimmten Tag haben sie vielleicht 10 dieser Knoten im Batch Pool, aber an manchen anderen Tagen möchten sie vielleicht einige davon im Data Science Pool haben. Die Anwender klicken dann einfach auf die Benutzeroberfläche oder eröffnen einen API-Call und wechseln auf diese Weise auf die alternative Methode ohne Unterbrechung für Benutzer oder Anwendungen. Da dies auf der stateless Server-Schicht geschieht, müssen keine Daten verschoben werden.

Von Jakob Jung

Dr. Jakob Jung ist Chefredakteur Security Storage und Channel Germany. Er ist seit mehr als 20 Jahren im IT-Journalismus tätig. Zu seinen beruflichen Stationen gehören Computer Reseller News, Heise Resale, Informationweek, Techtarget (Storage und Datacenter) sowie ChannelBiz. Darüber hinaus ist er für zahlreiche IT-Publikationen freiberuflich tätig, darunter Computerwoche, Channelpartner, IT-Business, Storage-Insider und ZDnet. Seine Themenschwerpunkte sind Channel, Storage, Security, Datacenter, ERP und CRM. Dr. Jakob Jung is Editor-in-Chief of Security Storage and Channel Germany. He has been working in IT journalism for more than 20 years. His career includes Computer Reseller News, Heise Resale, Informationweek, Techtarget (storage and data center) and ChannelBiz. He also freelances for numerous IT publications, including Computerwoche, Channelpartner, IT-Business, Storage-Insider and ZDnet. His main topics are channel, storage, security, data center, ERP and CRM. Kontakt – Contact via Mail: jakob.jung@security-storage-und-channel-germany.de

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

WordPress Cookie Hinweis von Real Cookie Banner