2025-11-19T05:43:14.227603

torchsom: The Reference PyTorch Library for Self-Organizing Maps

Berthier, Shokry, Moreaud et al.

This paper introduces torchsom, an open-source Python library that provides a reference implementation of the Self-Organizing Map (SOM) in PyTorch. This package offers three main features: (i) dimensionality reduction, (ii) clustering, and (iii) friendly data visualization. It relies on a PyTorch backend, enabling (i) fast and efficient training of SOMs through GPU acceleration, and (ii) easy and scalable integrations with PyTorch ecosystem. Moreover, torchsom follows the scikit-learn API for ease of use and extensibility. The library is released under the Apache 2.0 license with 90% test coverage, and its source code and documentation are available at https://github.com/michelin/TorchSOM.

academic

torchsom: Die Referenz-PyTorch-Bibliothek für Self-Organizing Maps

Grundinformationen

Paper-ID: 2510.11147
Titel: torchsom: The Reference PyTorch Library for Self-Organizing Maps
Autoren: Louis Berthier, Ahmed Shokry, Maxime Moreaud, Guillaume Ramelet, Eric Moulines
Klassifizierung: stat.ML cs.LG
Veröffentlichungsdatum: 13. Oktober 2025
Paper-Link: https://arxiv.org/abs/2510.11147

Zusammenfassung

Dieser Artikel stellt torchsom vor, eine quelloffene Python-Bibliothek basierend auf PyTorch, die eine Referenzimplementierung für Self-Organizing Maps (SOM) bereitstellt. Die Bibliothek bietet drei Hauptfunktionen: (1) Dimensionsreduktion, (2) Clustering, (3) benutzerfreundliche Datenvisualisierung. Durch das PyTorch-Backend ermöglicht die Bibliothek (1) schnelles und effizientes SOM-Training durch GPU-Beschleunigung, (2) nahtlose und erweiterbare Integration mit dem PyTorch-Ökosystem. Darüber hinaus folgt torchsom dem scikit-learn-API-Design und ist einfach zu verwenden und zu erweitern. Die Bibliothek wird unter der Apache-2.0-Lizenz veröffentlicht und verfügt über eine Testabdeckung von 90%.

Forschungshintergrund und Motivation

Problemdefinition

Obwohl Self-Organizing Maps (SOM) als wertvolle und dauerhafte Maschinenlern-Technik weiterhin eine wichtige Rolle in der modernen Datenanalyse spielen, weisen bestehende Python-SOM-Implementierungen erhebliche Mängel auf:

Veraltete technische Architektur: Fehlende GPU-Beschleunigungsunterstützung
Unzureichende Ökosystem-Integration: Schwierige Integration mit modernen Deep-Learning-Frameworks
Schlechte Benutzererfahrung: Fehlende benutzerfreundliche APIs und Visualisierungsfunktionen
Wartungsprobleme: Bestehende Bibliotheken werden unzureichend gepflegt, Dokumentation ist unvollständig

Forschungsrelevanz

SOM hat breite Anwendungswerte in mehreren Bereichen:

Energieindustrie: Systemüberwachung und -steuerung
Biomedizin: Genexpressionsanalyse, medizinische Bildverarbeitung
IoT-Systeme: Anomalieerkennung und Mustererkennung
Chemische und Umweltanwendungen: Schadstoffanalyse und Umweltüberwachung
Geschäftsfälle: Marktsegmentierung und Kundenanalyse

Einschränkungen bestehender Methoden

Durch vergleichende Analyse bestehender Python-SOM-Bibliotheken (MiniSom, SimpSOM, SOMPY, somoclu, som-pbc) wurden folgende Probleme identifiziert:

Leistungsbeschränkungen: Die meisten basieren auf NumPy und ermangeln CUDA-Beschleunigung
Unvollständige Funktionalität: Fehlende integrierte Clustering- und erweiterte Visualisierungsfunktionen
Unzureichende Software-Engineering-Praktiken: Niedrige Testabdeckung, unvollständige Dokumentation
Schlechte Erweiterbarkeit: Niedriger Modularisierungsgrad, schwierig zu kustomisieren und zu erweitern

Kernbeiträge

Erste umfassende PyTorch-basierte SOM-Bibliothek: Bietet vollständige SOM-Implementierung mit GPU-Beschleunigung und Integration moderner Deep-Learning-Workflows
Standardisiertes API-Design: Folgt dem scikit-learn-API-Stil und bietet konsistente Benutzererfahrung
Umfangreiche Visualisierungswerkzeuge: Bietet 9 Klassen von Visualisierungsfunktionen mit Unterstützung für rechteckige und hexagonale Topologien
Integrierte Clustering-Funktionalität: Integriert K-means-, GMM- und HDBSCAN-Clustering-Algorithmen
Hochwertige Software-Engineering: 90% Testabdeckung, vollständige Dokumentation, modulares Design

Methodische Details

Aufgabendefinition

torchsom zielt darauf ab, eine moderne SOM-Implementierung bereitzustellen, die unterstützt:

Eingabe: Hochdimensionale Datensätze X ∈ R^(N×k), wobei N die Anzahl der Stichproben und k die Merkmalsdimension ist
Ausgabe: Trainiertes SOM-Netzwerk, niedrigdimensionale Mappingdarstellung, Clustering-Ergebnisse
Einschränkungen: Beibehaltung der Topologiestruktur, Minimierung von Quantisierungs- und Topologiefehlern

Modellarchitektur

1. Kernmodul (torchsom.core)

Implementiert Kernfunktionalität des klassischen SOM-Algorithmus:

fit(): Unterstützt automatische GPU-beschleunigte Modelltraining
cluster(): Clustering-Funktionalität
build_map(): Generiert Mapping geeignet für Visualisierung
collect_sample(): Identifiziert optimale Stichproben unter Verwendung von Topologie- und latenten Raumdistanzen

2. Utility-Modul (torchsom.utils)

Bietet grundlegende Komponenten für SOM-Parametrisierung und Training:

Abklingfunktionen: Lernrate und Nachbarschaftsbreiten-Planung
Distanzmetriken: Euklidisch, Kosinus, Manhattan, Tschebyscheff-Distanz
Nachbarschaftskerne: Gaußsch, mexikanischer Hut, Blasen-, Dreieckskerne
Clustering-Methoden: K-means, GMM, HDBSCAN

3. Visualisierungsmodul (torchsom.visualization)

Bietet 9 Klassen umfassender Visualisierungsfunktionen:

U-matrix: Mapping-Topologie und Clusterstruktur
Hit maps: Neuronenaktivierungsmuster
Component planes: Merkmalsebenenanalyse
Classification/metric maps: Zielstatistiken
Score/rank maps: Qualitätsbewertung
Training curves: Konvergenzüberwachung
Clustering maps: Clustering-Qualitätsindikatoren

Technische Innovationspunkte

1. PyTorch-Integrationsvorteil

# Gewichtsaktualisierungsgleichung
w_ij(t+1) = w_ij(t) + α(t) · h_ij(t) · (x - w_ij(t))

Wobei:

α(t): Lernrate
h_ij(t): Nachbarschaftsfunktion
x: Eingabe-Merkmalsvektor

2. Effiziente Batch-Processing-Implementierung

Durch PyTorch-Tensoroperationen und GPU-Parallelberechnung wird Batch-Verarbeitung implementiert, was die Trainingseffizienz erheblich verbessert.

3. Mehrere Nachbarschaftsfunktionen

Unterstützt vier Nachbarschaftsfunktionen:

Gaußscher Kern: h^Gaussian_ij(t) = exp(-d²_ij / (2σ(t)²))
Mexikanischer Hut-Kern: Bietet komplexere Nachbarschaftsbeziehungen
Blasen-Kern: Stufenfunktionsform
Dreieck-Kern: Lineare Abnahme

4. Adaptive Scheduling-Strategien

Implementiert mehrere Parameterabklingstrategien:

Inverse Abnahme: α(t+1) = α(t) · γ/(γ + t)
Lineare Abnahme: α(t+1) = α(t) · (1 - t/T)
Asymptotische Abnahme: Für exponentielle Konvergenz

Experimentelle Einrichtung

Datensätze

Verwendung von scikit-learn's make_blobs() zur Generierung synthetischer Datensätze:

Stichprobenumfang: {240, 4000, 16000}
Merkmalsdimension: {4, 50, 300}
Netzgröße: 25×15 (klein), 90×70 (groß)

Bewertungsmetriken

Quantisierungsfehler (QE): QE = (1/N) Σ ||x_i - w_BMU(x_i)||₂
Topologiefehler (TE): Misst den Grad der Beibehaltung von Nachbarschaftsbeziehungen
Laufzeit: Einschließlich Initialisierungs- und Trainingszeit

Vergleichsmethoden

MiniSom (CPU): Am weitesten verbreitete SOM-Bibliothek
torchsom (CPU): CPU-Versionsimplementierung
torchsom (GPU): GPU-beschleunigte Version

Implementierungsdetails

PCA-Initialisierung
Rechteckige Topologie
100 Trainingsiterationen
Gaußsche Nachbarschaftsfunktion
Euklidische Distanz

Experimentelle Ergebnisse

Hauptergebnisse

Leistungsvergleich (25×15 Netzwerk)

Datensatz	MiniSom(CPU)	torchsom(CPU)	torchsom(GPU)
QE	0,15-5,43	0,23-5,21	0,23-5,21
TE-Verbesserung	Baseline	34-81%↓	34-81%↓
Geschwindigkeitssteigerung	Baseline	77-99%↑	77-99%↑

Wichtigste Erkenntnisse

Topologie-Beibehaltungsvorteil: TE um 34-81% gegenüber MiniSom reduziert
Recheneffizienzsteigerung: Trainingszeit von Tausenden Sekunden auf Dutzende Sekunden reduziert
Vergleichbare Quantisierungsqualität: Erreichung vergleichbarer QE auf allen Datensätzen
Skalierbarkeit: GPU-Version zeigt beste Leistung bei hochdimensionalen großen Datensätzen

Ablationsstudien

Experimente validieren den Beitrag jeder Komponente:

Batch-Processing-Optimierung: Signifikante Trainingsgeschwindigkeitssteigerung
GPU-Beschleunigung: Bietet Größenordnungsleistungssteigerung bei großen Datenmengen
PyTorch-Backend: Ermöglicht bessere Speicherverwaltung und Parallelberechnung

Fallstudien

Durch Visualisierungsanalyse der Wine- und Boston-Immobilien-Datensätze wird gezeigt:

Klare Clustering-Grenzen: U-matrix zeigt effektiv Clusterstruktur
Angemessenes Feature-Mapping: Component planes reflektieren Merkmalsverteilung
Gute Klassifizierungsleistung: Classification maps zeigen klare Entscheidungsgrenzen

Merkmal	torchsom	MiniSom	SimpSOM	SOMPY	somoclu
Framework	PyTorch	NumPy	NumPy	NumPy	C++
GPU-Unterstützung	CUDA	✗	CuPY	✗	CUDA
API-Design	scikit-learn	Benutzerdefiniert	Benutzerdefiniert	MATLAB	Benutzerdefiniert
Visualisierung	Erweitert	✗	Mittel	Mittel	Grundlegend
Clustering	✓	✗	✗	✗	✗

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

torchsom bietet die erste umfassende PyTorch-basierte SOM-Implementierung
Signifikante Verbesserung der Topologie-Beibehaltung und Recheneffizienz bei Beibehaltung vergleichbarer Quantisierungsqualität
Umfangreiche Visualisierungswerkzeuge füllen wichtige Lücken bestehender SOM-Bibliotheken
Standardisiertes API-Design fördert Integration mit modernen ML-Workflows

Einschränkungen

GPU-Abhängigkeit: Optimale Leistung erfordert CUDA-Unterstützung
Speicheranforderungen: Große Datensätze können erhebliche GPU-Speichermengen erfordern
Hyperparameter-Empfindlichkeit: Erfordert weiterhin sorgfältige Abstimmung
Anwendungsspezifische Anpassung: Bestimmte domänenspezifische Anforderungen können zusätzliche Kustomisierung erfordern

Zukünftige Richtungen

Algorithmus-Erweiterungen: Unterstützung für weitere SOM-Varianten (z.B. Growing SOM)
Verteiltes Training: Unterstützung für Multi-GPU und verteilte Berechnung
Automatische Hyperparameter-Optimierung: Integration von Hyperparameter-Optimierungsfunktionen
Domänenspezifische Spezialisierung: Optimierung für spezifische Anwendungsbereiche

Tiefgreifende Bewertung

Stärken

Technische Innovativität: Erste tiefe Integration von SOM mit modernen Deep-Learning-Frameworks
Hohe Engineering-Qualität: 90% Testabdeckung, vollständige Dokumentation, modulares Design
Starker praktischer Wert: Signifikante Leistungssteigerung und umfangreiche Funktionalität
Gute Reproduzierbarkeit: Quelloffene Implementierung, detaillierte experimentelle Einrichtung

Mängel

Begrenzte theoretische Beiträge: Hauptsächlich Engineering-Implementierung, begrenzte algorithmische Innovationen
Begrenzte Evaluierungsreichweite: Hauptsächlich auf synthetischen Daten getestet, weniger echte Anwendungsfälle
Unvollständige Vergleiche: Nicht detaillierter Vergleich mit allen bestehenden SOM-Bibliotheken
Unzureichende Skalierungsprüfung: Leistung bei extrem großen Datenmengen erfordert weitere Verifikation

Auswirkungen

Feldbeitrag: Bietet moderne Werkzeugplattform für SOM-Forschung
Praktischer Wert: Senkt technische Hürden für SOM-Anwendungen
Ökosystem-Auswirkungen: Fördert Fusion traditioneller ML-Algorithmen mit modernen Frameworks
Gemeinschaftswert: Quelloffene Beiträge unterstützen Verbreitung und Entwicklung von SOM-Technologie

Anwendungsszenarien

Explorative Datenanalyse: Visualisierung und Verständnis hochdimensionaler Daten
Anomalieerkennung: Industrielle Überwachung und Qualitätskontrolle
Cluster-Analyse: Kundensegmentierung, Marktanalyse
Feature-Learning: Als Vorverarbeitungsschritt in Deep-Learning-Pipelines
Bildung und Forschung: Lehr- und Forschungsplattform für SOM-Algorithmen

Literaturverzeichnis

Kohonen, T. (1982). Self-organized formation of topologically correct feature maps
Kohonen, T. (1990). The self-organizing map
Vettigli, G. (2018). MiniSom: Minimalistic implementation of Self Organizing Maps
Pedregosa, F. et al. (2011). Scikit-learn: Machine Learning in Python

Gesamtbewertung: Dies ist ein hochqualitatives Software-Engineering-Paper, das die Benutzerfreundlichkeit und Leistung von SOM durch moderne Implementierung erheblich verbessert. Obwohl algorithmische Innovationen begrenzt sind, ist sein Engineering-Wert und praktische Bedeutung nicht zu unterschätzen und bietet ein ausgezeichnetes Beispiel für die Anwendung traditioneller Maschinenlern-Algorithmen in modernen Rechenumgebungen.