Menschen, Maschinen und Anwendungen generieren Daten in einem immer höheren Tempo. Der Großteil dieser Daten aber ist unstrukturiert - und schraubt die Anforderungen an Speichersysteme deutlich nach oben.
Unstrukturierte Daten sind Informationen, die sich nicht in Tabellen oder Datenbanken quetschen lassen – seien es Daten von Sensoren, hochaufgelöste Bilder oder Videos von Überwachungskameras. Aber auch Forschungsdaten, E-Mails, Audio-Files und die vielen Dokumente, man im digitalen Arbeitsalltag erstellt, zählen dazu. Die Menge solcher Daten wächst rasant, und zwar viel schneller als die der strukturierten Daten.
„Es reicht längst nicht mehr aus, ein paar File-Server einzusetzen, um die steigende Flut unstrukturierter Daten zu bewältigen – liegt der Anteil dieser Daten bereits heute schon bei rund 80 Prozent. Unternehmen sollten daher auf moderne Speichersysteme setzen, die mit diesen Datenvolumina mitwachsen und somit auch den Leistungs-Anforderungen von KI- und Analytics-Anwendungen entsprechen“, erklärt Stefan Trondl, General Manager, Dell Technologies Österreich. Um der Datenflut in Zukunft gerecht zu werden, müssen file- und objektbasierte Storage-Systeme laut Dell künftig insbesondere folgende Leistungen erbringen:
Skalierbarkeit
Einzelne Storage-Systeme sind für die großen Mengen unstrukturierter Daten, die Unternehmen auffangen und speichern müssen, in der Regel ungeeignet. Schließlich sollen alle Informationen in einem Data Lake zusammengeführt werden, um durch Analysen geschäftsfördernde Erkenntnisse aus ihnen zu ziehen. Dabei bewegt man sich schnell im Petabyte-Bereich, sodass die Storage-Systeme und -Plattformen extrem gut skalieren müssen. Sind die Daten über mehrere Einzelsysteme verteilt, fällt es schwer, Zusammenhänge zu erkennen und tatsächlich einen Nutzen aus den Datenbanken zu ziehen.
Performance
Durch die aktive Arbeit mit Informationen steigen die Performance-Anforderungen an die Storage-Systeme. Sie müssen große Datenmengen schnell bereitstellen, und das oft mit sehr niedriger Latenz. Vor allem bei Echtzeitanalysen sind die garantiert kurzen Antwortzeiten entscheidend, weil schon kleinste Verzögerungen beispielsweise eine Fertigung aus dem Tritt bringen und zu Produktionsausfällen führen können. Aber auch nicht zeitkritische Analysen haben oft überraschend hohe Performance-Anforderungen, weil die Datenmengen so umfangreich sind und das Laden mehrerer Gigabyte keine langen Wartezeiten verursachen soll. Moderne Storage-Systeme setzen deshalb oft auf einen Mix aus Flash-Speichern und Festplatten, um jede Anwendung mit der gewünschten Performance zu bedienen und gleichzeitig kosteneffizient zu skalieren.
Protokollunterstützung
Offene Schnittstellen und eine breite Protokollunterstützung über SMB und NFS hinaus erleichtern es, Informationen aus mehreren Quellen in einem Data Lake zu vereinen und für verschiedene Anwendungen bereitzustellen. Unterstützen Storage-Systeme die spezifischen Protokolle nicht, nach denen eine Anwendung verlangt, müssen die Daten auf anderen Systemen vorgehalten werden, was die Speicherkosten und den Aufwand erhöht. Zudem kann die redundante Datenhaltung schnell zu einem inkonsistenten Bestand führen. Mit Storage-Systemen, die Protokolle und Schnittstellen für viele Anwendungsfälle unterstützen, bleiben Unternehmen flexibel und tun sich auch mit der Cloud-Anbindung leicht. So können sie Informationen bei spezialisierten Cloud-Services auswerten, außer Haus sichern oder bei begrenzten On-Premises-Kapazitäten einfach auslagern.
Intelligenz
Moderne Speicher sind keine simplen Datenlager, sondern benötigen intelligente Systeme, um die Nutzung der Daten zu analysieren. So müssen Daten beispielsweise vorausschauend auf spezifische Speicherklassen verteilt werden, die den Anforderungen des jeweiligen Anwendungsfalls entsprechen. Darüber hinaus verteilen smarte Funktionen die Daten optimal über die Nodes in einem Cluster und helfen, Kapazitäts- und Leistungsengpässe frühzeitig zu erkennen und zu beseitigen. Sie überwachen alle Komponenten in den Storage-Systemen und warnen, wenn beispielsweise ein Laufwerk auszufallen droht, sodass Unternehmen es rechtzeitig austauschen und Downtimes verhindern können.
(Titelbild: iStock)