The rise of distributed applications and cloud computing has created a demand for scalable, high-performance key-value storage systems. This paper presents a performance evaluation of three prominent NoSQL key-value stores: Redis, Aerospike, and Dragonfly, using the Yahoo! Cloud Serving Benchmark (YCSB) framework. We conducted extensive experiments across three distinct workload patterns (read-heavy, write-heavy), and balanced while systematically varying client concurrency from 1 to 32 clients. Our evaluation methodology captures both latency, throughput, and memory characteristics under realistic operational conditions, providing insights into the performance trade-offs and scalability behaviour of each system
- Paper-ID: 2510.08863
- Titel: Comparative Performance Analysis of Modern NoSQL Data Technologies: Redis, Aerospike, and Dragonfly
- Autoren: Deep Bodra (Harrisburg University of Science and Technology), Sushil Khairnar (Virginia Tech)
- Klassifizierung: cs.DB cs.DC
- Veröffentlichtes Journal: Journal of Research, Innovation and Technologies, Volume IV, Issue 2(8), 2025
- Paper-Link: https://doi.org/10.57017/jorit.v4.2(8).05
Mit dem Aufstieg verteilter Anwendungen und Cloud-Computing wächst die Nachfrage nach skalierbaren, hochleistungsfähigen Schlüssel-Wert-Speichersystemen kontinuierlich. Diese Arbeit führt eine Leistungsbewertung von drei führenden NoSQL-Schlüssel-Wert-Speichersystemen durch – Redis, Aerospike und Dragonfly – unter Verwendung des Yahoo! Cloud Serving Benchmark (YCSB)-Frameworks. Die Untersuchung umfasst umfangreiche Experimente unter drei verschiedenen Arbeitslastmustern (lese-intensiv, schreib-intensiv und ausgewogen) und variiert systematisch die Anzahl der Client-Verbindungen von 1 bis 32. Die Bewertungsmethodik erfasst Latenz-, Durchsatz- und Speichercharakteristiken unter realistischen Betriebsbedingungen und bietet tiefe Einblicke in die Leistungskompromisse und Skalierbarkeitsverhalten jedes Systems.
- Herausforderungen moderner Anwendungsanforderungen: Die moderne digitale Umgebung beinhaltet massive Datenerstellung und -nutzung. Die rapide Expansion von Webanwendungen, mobiler Technologie und IoT-Geräten stellt neue Anforderungen an Datenbanksysteme.
- Einschränkungen traditioneller Datenbanken: Obwohl traditionelle relationale Datenbankmanagementsysteme leistungsstark sind, haben sie Schwierigkeiten, die Leistungs- und Skalierbarkeitsanforderungen moderner Anwendungen zu erfüllen, insbesondere solche, die Antwortzeiten im Submillisekundenbereich und die Verarbeitung von Millionen von Operationen pro Sekunde erfordern.
- Aufstieg von NoSQL-Datenbanken: NoSQL-Datenbanken, insbesondere Schlüssel-Wert-Speicher, überwinden diese Herausforderungen durch Betonung von Leistung und Skalierbarkeit.
- Praktischer Wert: Bietet praktische Orientierung für Systemarchitekten bei der Auswahl geeigneter Schlüssel-Wert-Speicherlösungen.
- Akademischer Wert: Schließt die Lücke bei systematischen Vergleichsbewertungen von Redis-, Aerospike- und Dragonfly-Systemen.
- Technischer Wert: Offenbart Leistungscharakteristiken verschiedener Systeme durch systematische Bewertung unter verschiedenen Arbeitslastmustern und Parallelitätsstufen.
Obwohl diese Systeme weit verbreitet sind, fehlt es an umfassenden Vergleichsstudien, die ihre Leistungscharakteristiken unter verschiedenen Arbeitslastmustern und Parallelitätsstufen systematisch bewerten.
- Umfassender Leistungsvergleich: Bietet vollständige Vergleichsanalysen einschließlich Latenz- und Durchsatzmetriken.
- Speicherverbrauchsanalyse: Tiefgehende Analyse der Speichernutzungsmuster und Effizienz aller drei Systeme.
- Bewertung mehrerer Arbeitslasten: Systematische Bewertung unter lese-intensiven, schreib-intensiven und ausgewogenen Arbeitslasten.
- Skalierbarkeitsanalyse: Offenbart Skalierungseigenschaften durch Tests mit 1-32 parallelen Clients.
- Praktische Orientierung: Bietet konkrete Anleitung für Systemarchitekten bei der Auswahl geeigneter Schlüssel-Wert-Speicherlösungen.
Redis:
- Open-Source-Speicher für In-Memory-Datenstrukturen, entwickelt 2009
- Single-Thread-Architektur, eliminiert komplexe Sperrmechanismen, begrenzt aber die Skalierbarkeit auf Multi-Core-Systemen
- Unterstützt verschiedene Datenstrukturen: Strings, Hashes, Listen, Sets, Sorted Sets usw.
- Implementiert Persistierung durch periodische Snapshots oder Append-Only-Dateien
Aerospike:
- Verteilte NoSQL-Datenbank, gegründet 2009
- Hybrid-Memory-Architektur: DRAM speichert Indizes, SSD speichert Daten
- Shared-Nothing-Architektur, jeder Knoten arbeitet unabhängig
- Bietet starke Konsistenz und automatisches Failover
Dragonfly:
- 2022 eingeführter In-Memory-Datenspeicher als direkter Redis-Ersatz
- Multi-Thread-, Shared-Nothing-Architektur, nutzt mehrere CPU-Kerne
- Protokollkompatibilität mit Redis
- Implementiert komplexe Speicherverwaltung und Lock-freie Datenstrukturen
Hardware-Umgebung:
- System: Mac OS mit Apple M3 Pro Chip
- Konfiguration: 12 Kerne, 36GB RAM, macOS Sequoia
- Bereitstellung: Docker-Container für konsistente und isolierte Umgebung
Benchmark-Framework:
- Yahoo! Cloud Serving Benchmark (YCSB)
- Zweiphasiger Ansatz: Ladephase füllt Ausgangsdaten, Ausführungsphase führt Benchmark-Operationen durch
- Parallelitätsstufen: 1, 2, 4, 8, 16, 32 Clients
- Schlüsselauswahlverteilung: Zipfian-Verteilung, simuliert realistisches nicht-uniformes Zugriffsmuster
Lese-intensive Arbeitslast:
- 95% Lesevorgänge, 5% Aktualisierungsvorgänge
- 1KB Daten pro Datensatz (10 Felder, je 100 Bytes)
- Laden von 1.474.560 Datensätzen
- Simuliert Cache-Szenarien, Content-Delivery-Systeme usw.
Ausgewogene Arbeitslast:
- 50% Lesevorgänge, 50% Aktualisierungsvorgänge
- Gleiche 1KB-Datensatzstruktur
- Repräsentiert Zugriffsmuster von Social-Media-Plattformen, kollaborativen Anwendungen usw.
Schreib-intensive Arbeitslast:
- 10% Lesevorgänge, 90% Einfügungsvorgänge
- Zeitreihendaten, 64 Felder, je 8 Zeichen pro Feld
- Ausführungsphase führt 2.949.120 Einfügungsvorgänge durch
- Simuliert IoT-Anwendungen, Überwachungssysteme und andere Szenarien mit hohem Datendurchsatz
Aerospike zeigt optimale Leistung:
- P99-Latenz: 436ms (einzelner Client) bis 2.979ms (32 Clients)
- Durchsatz: 3.348 ops/s bis 32.592 ops/s
- Leistungsvorteil resultiert aus Hybrid-Memory-Architektur und Shared-Nothing-Design
Redis zeigt mittlere Leistung:
- P99-Latenz: 862ms bis 4.447ms
- Durchsatz: 1.656 bis 17.158 ops/s
- Single-Thread-Architektur wird zum Leistungsengpass bei hoher Parallelität
Dragonfly zeigt höchste Latenz:
- P99-Latenz: 1.137ms bis 4.883ms
- Durchsatz: 1.371 bis 16.328 ops/s
- Multi-Thread-Koordinationsoverhead negiert Vorteile paralleler Verarbeitung
Leistungshierarchie bleibt konsistent:
- Aerospike: P99-Latenz 441ms-2.409ms, Durchsatz 3.372-33.741 ops/s
- Redis: P99-Latenz 874ms-4.017ms, Durchsatz 1.664-17.004 ops/s
- Dragonfly: P99-Latenz 1.187ms-4.631ms, Durchsatz 1.278-16.497 ops/s
Alle Systeme zeigen optimale Leistung:
- Aerospike: P99-Latenz 410ms-2.233ms, Durchsatz 3.562-34.896 ops/s
- Redis: P99-Latenz 808ms-3.547ms, Durchsatz 1.757-17.170 ops/s
- Dragonfly: P99-Latenz 1.124ms-3.859ms, Durchsatz 1.331-16.925 ops/s
| System | Vor Ausführung (MB) | Nach Ausführung (MB) | Wachstumsfaktor |
|---|
| Redis | 36,32 | 2610 | 72x |
| Aerospike | 232,1 | 772,3 | 3,3x |
| Dragonfly | 58,98 | 2350 | 40x |
Wichtige Erkenntnisse:
- Aerospike zeigt höchste Speichereffizienz dank Hybrid-Speichermodell
- Redis hat höchsten Speicher-Overhead, reflektiert Einschränkungen von Single-Node-In-Memory-Speicherung
- Dragonfly liegt dazwischen, Multi-Thread-Koordinierungsstrukturen verursachen zusätzlichen Overhead
Durchsatz-Skalierungseigenschaften:
- Aerospike: Nahezu lineare Skalierung, 9-10x Verbesserung
- Redis: 10-11x Verbesserung, aber signifikanteres Latenzwachstum
- Dragonfly: 12-13x Verbesserung, aber niedrigere Baseline-Leistung
Das Paper zitiert mehrere relevante Forschungsarbeiten:
- Benchmark-Frameworks: Cooper et al. (2010) YCSB-Framework bildet Grundlage für Cloud-Service-Systembenchmarking
- NoSQL-Vergleichsstudien: Anthony & Raos empirischer Vergleich von Schlüssel-Wert-Speichern
- Systemspezifische Forschung: Volmingers (2021) Aerospike-Forschung, Charans et al. Redis-Analyse
- Neueste Entwicklungen: Mohans et al. (2024) NoSQL-Bewertung für OLAP-Arbeitslasten
- Aerospike führt umfassend: Zeigt optimale Leistung unter allen Arbeitslasten und Parallelitätsstufen mit bester Durchsatz-Skalierbarkeit und relativ niedriger Latenz.
- Redis ist stabil und zuverlässig: Zeigt konsistente und vorhersagbare Leistung unter allen Arbeitslastmustern, wird aber durch Single-Thread-Architektur begrenzt.
- Dragonfly: Potenzial und Herausforderungen: Trotz moderner Gestaltung zeigt schlechte Latenzleistung, offenbart aber Potenzial in schreib-intensiven Szenarien.
- Arbeitslast hat signifikanten Einfluss: Alle Datenbanken zeigen beste Leistung unter schreib-intensiven Bedingungen.
- Maximale Leistungsanforderungen: Wählen Sie Aerospike
- Operative Einfachheit Priorität: Redis erfüllt Anforderungen ausreichend
- Redis-Kompatibilität erforderlich: Dragonfly ist interessante Option, erfordert aber sorgfältige Bewertung für latenzempfindliche Anwendungen
- Single-Machine-Testumgebung: Alle Tests auf einzelnem Rechner durchgeführt, kann verteilte Systemvorteile nicht vollständig demonstrieren
- Begrenzte Netzwerkbedingungen: Berücksichtigt nicht Netzwerkverzögerung und Partitionierungseffekte auf Leistung
- Einzelne Datenverteilung: Verwendet nur Zipfian-Verteilung, reale Anwendungen können andere Muster aufweisen
- Fehlende Cluster-Modi: Testet keine echten verteilten Bereitstellungsszenarien
- Produktionsumgebungstests: Systemleistung unter echten Produktionsbedingungen bewerten
- Verteilte Szenarien: Echte verteilte Skalierbarkeit im Cluster-Modus testen
- Konsistenzmodellforschung: CAP-Theorem-Auswirkungen auf Systemdesign
- Fehlertoleranz-Mechanismen: Bewertung von Fehlertoleranz während Knotenfehler
- Rechenzentrum-übergreifende Replikation: Datenkonsistenz und Replikationsverzögerung bei Netzwerkpartitionierung
- Rigorose Methodik: Verwendet Standard-YCSB-Framework für faire Vergleiche
- Umfassende Experimente: Deckt mehrere Arbeitslasten und Parallelitätsstufen ab
- Tiefgehende Analyse: Bietet nicht nur Leistungsdaten, sondern analysiert auch architektonische Ursachen
- Hoher praktischer Wert: Bietet klare Orientierung für praktische Systemauswahl
- Klare Darstellung: Gut strukturiert, technische Beschreibungen präzise
- Umgebungsbeschränkungen: Single-Machine-Docker-Umgebung kann verteilte Systemvorteile nicht vollständig demonstrieren
- Einzelne Konfiguration: Testet nicht Auswirkungen verschiedener Konfigurationsparameter auf Leistung
- Persistierung fehlt: Bewertet Persistierungsmechanismus-Auswirkungen auf Leistung nicht detailliert
- Kostenanalyse fehlt: Berücksichtigt Hardware-Kosten und Betriebskomplexität nicht
- Langzeitstabilität: Fehlen von Stabilitätstests über längere Laufzeiten
- Akademischer Wert: Bietet systematische Methodik für NoSQL-Datenbankleistungsforschung
- Praktischer Wert: Bietet Referenz für Industrieauswahl geeigneter Schlüssel-Wert-Speichersysteme
- Methodologischer Beitrag: Demonstriert systematische Vergleichsmethodik für NoSQL-Systeme
- Reproduzierbarkeit: Detaillierte Experimentbeschreibung ermöglicht Reproduktion und Erweiterung
- Systemauswahl: Bietet Referenz für Projekte, die Schlüssel-Wert-Speichersysteme auswählen müssen
- Leistungsoptimierung: Bietet Benchmarks für Leistungsoptimierung bestehender Systeme
- Architekturdesign: Bietet Grundlage für Architekturdesign großer verteilter Systeme
- Akademische Forschung: Bietet Basisdaten und Methodenreferenz für verwandte Forschung
Das Paper zitiert mehrere wichtige Referenzen, einschließlich:
- Cooper, B.F. et al. (2010). Benchmarking cloud serving systems with YCSB
- Anthony, A., & Rao, Y. N. M. Memcached, Redis, and Aerospike Key-Value Stores Empirical Comparison
- Mohan, R. K. et al. (2024). Evaluating NoSQL Databases for OLAP Workloads
- Sowie offizielle Dokumentationen und technische Ressourcen der Datenbanksysteme
Dieses Paper leistet einen wertvollen Beitrag zum Bereich der NoSQL-Datenbankleistungsbewertung. Durch systematisches Experimentdesign und tiefgehende Analyse bietet es wichtige Referenzen zum Verständnis von Leistungscharakteristiken moderner Schlüssel-Wert-Speichersysteme und zur Auswahl geeigneter Technologielösungen.