2025-11-25T13:49:17.496621

PHast -- Perfect Hashing made fast

Beling, Sanders

Perfect hash functions give unique "names" to arbitrary keys requiring only a few bits per key. This is an essential building block in applications like static hash tables, databases, or bioinformatics. This paper introduces the PHast approach that combines the fastest available queries, very fast construction, and good space consumption (below 2 bits per key). PHast improves bucket-placement which first hashes each key k to a bucket, and then looks for the bucket seed s such that a placement function maps pairs (s,k) in a collision-free way. PHast can use small-range hash functions with linear mapping, fixed-width encoding of seeds, and parallel construction. This is achieved using small overlapping slices of allowed values and bumping to handle unsuccessful seed assignment. A variant we called PHast+ uses additive placement, which enables bit-parallel seed searching, speeding up the construction by an order of magnitude.

academic

PHast -- Perfect Hashing made fast

Informations de base

ID de l'article: 2504.17918
Titre: PHast -- Perfect Hashing made fast
Auteurs: Piotr Beling (Université de Łódź, Pologne), Peter Sanders (Institut de technologie de Karlsruhe, Allemagne)
Classification: cs.DS cs.DB cs.PF
Date de publication: 22 octobre 2025 (version arXiv)
Lien de l'article: https://arxiv.org/abs/2504.17918

Résumé

Les fonctions de hachage parfait attribuent des « noms » uniques à des clés arbitraires en utilisant seulement quelques bits par clé. C'est un élément essentiel dans des applications telles que les tables de hachage statiques, les bases de données ou la bioinformatique. Cet article introduit l'approche PHast qui combine les requêtes les plus rapides disponibles, une construction très rapide et une consommation d'espace raisonnable (inférieure à 2 bits par clé). PHast améliore le placement des seaux qui hache d'abord chaque clé k dans un seau, puis recherche la graine du seau s de sorte qu'une fonction de placement mappe les paires (s,k) de manière sans collision. PHast peut utiliser des fonctions de hachage à petite plage avec mappage linéaire, codage de largeur fixe des graines et construction parallèle. Ceci est réalisé en utilisant de petites tranches chevauchantes de valeurs autorisées et un mécanisme de « bumping » pour gérer l'assignation infructueuse de graines. Une variante appelée PHast+ utilise le placement additif, qui permet la recherche de graines en parallèle au niveau des bits, accélérant la construction d'un ordre de magnitude.

Contexte et motivation de la recherche

Définition du problème

Une fonction de hachage parfait (PHF) est une fonction injective qui mappe un ensemble de clés {k₁, ..., kₙ} vers {0, ..., m-1}. Lorsque m = n, on parle de fonction de hachage parfait minimal (MPHF). C'est un élément essentiel dans les applications telles que les bases de données, l'indexation de texte et la bioinformatique.

Motivation de la recherche

Défi d'optimisation multi-objectifs: La conception d'une MPHF fait face à un problème d'optimisation multi-objectifs impliquant la consommation d'espace, le temps de construction et le temps de requête
Limite théorique inférieure: La limite théorique inférieure d'une MPHF est log₂ e ≈ 1,44 bits par clé
Besoins pratiques: En pratique, les PHF sont couramment utilisées pour accélérer les structures de données statiques, ce qui rend les requêtes rapides essentielles

Limitations des méthodes existantes

Méthodes de placement de seaux: CHD, FCH, PTHash, PHOBIC, etc. nécessitent des fonctions d'allocation de seaux non linéaires ou un codage de graines de longueur variable, affectant la vitesse des requêtes
Méthodes de division récursive: Bien que très efficaces en espace, elles ont des temps de requête plus lents et nécessitent le décodage d'informations de navigation de longueur variable
Méthodes d'empreinte digitale: Nécessitent au moins e bits par clé et les requêtes nécessitent des opérations de rang sur des vecteurs de bits
Surcharge de construction parallèle: Les constructions parallèles existantes nécessitent des étapes de requête supplémentaires pour récupérer les valeurs de décalage

Contributions principales

Mappage linéaire des seaux: Évite l'allocation non linéaire des seaux grâce au mappage linéaire vers de petites tranches chevauchantes, permettant une construction multi-thread cache-friendly
Mécanisme de bumping: Permet l'utilisation de fonctions de hachage à petite plage et de codage de graines de largeur fixe, évitant les recherches locales complexes
Assignation heuristique de graines: Réduit la consommation d'espace en sélectionnant les graines qui occupent le moins de valeurs de fonction
Variante PHast+: Utilise une fonction de placement additif pour permettre la recherche de graines en parallèle au niveau des bits, accélérant la construction d'un ordre de magnitude
Évaluation expérimentale complète: Comparaison détaillée des performances avec les méthodes existantes

Explication détaillée de la méthode

Définition de la tâche

Étant donné un ensemble de n clés, construire une fonction de hachage parfait f telle que:

f soit injective (sans collision)
Le temps de requête soit aussi rapide que possible
Le temps de construction soit raisonnable
La consommation d'espace soit faible (objectif < 2 bits par clé)

Architecture de l'algorithme principal

Fonction Map-or-Bump

PHast est basé sur la méthode « map-or-bump », qui mappe n clés vers {0, 1, ..., m-1}:

f(k) = {
  ⌊αh(k)⌋ + p(s, h(k))  si s > 0
  fallback_for_bumped(k)  sinon
}

Où:

h(k) est une fonction de hachage u-bit (u = 64)
s = seeds⌊βh(k)⌋ est la graine
α, β sont des facteurs d'échelle
p(s, h(k)) est la fonction de placement

Composants techniques clés

Allocation linéaire des seaux:
- Indice du seau: ⌊B/2ᵘ · cᵢ⌋
- Valeur de début de tranche: ⌊(m-L+1)/2ᵘ · cᵢ⌋
- Valeur de sortie: ⌊(m-L+1)/2ᵘ · cᵢ⌋ + p(s, cᵢ)
Assignation de graines par fenêtre:
- Utilise une fenêtre glissante de taille W = 256
- Gestion des seaux non ensemencés par file de priorité
- Fonction de priorité: ℓ(s) - 1024b (s est la taille du seau, b est l'indice du seau)
Mécanisme de bumping:
- Les seaux pour lesquels aucune graine ne peut être trouvée sont marqués comme « bumped » (valeur de graine = 0)
- Environ 1% des seaux sont « bumped », avec un impact minimal sur le temps de requête attendu

Optimisation PHast+

PHast+ utilise une fonction de placement additif pour une construction rapide:

p(s, c) = c mod L + s - 1        // Formule 3.2
p(s, c) = (c + δs) mod L         // Formule 3.3

Recherche de graines en parallèle au niveau des bits:

Test simultané de 64 graines consécutives pour la faisabilité
Détection rapide des collisions par opérations bit à bit
Accélération de la construction d'environ 10 fois

Construction parallèle

Parallélisation sans communication:
- Le tableau de graines est divisé en t blocs et t-1 espaces
- Les threads calculent en parallèle les graines dans les blocs
- Taille des espaces: ⌈LB/(m-L+1)⌉ seaux
Conception cache-friendly:
- Traitement des seaux dans l'ordre des indices
- Utilisation d'un tampon circulaire pour représenter la bitmap d'occupation
- Modèle d'accès mémoire séquentiel

Configuration expérimentale

Environnement expérimental

Matériel: AMD Ryzen 5600G @3.9GHz (6 cœurs 12 threads)
Cache: 384KB/3MB/16MB L1/L2/L3
Compilateur: Rust 1.84.1, GCC 12.2.0
Nombre de threads: 12 threads (tests multi-thread)

Ensembles de données

Clés entières aléatoires: 5×10⁷ et 5×10⁸ entiers 64-bit aléatoires
Clés chaînes aléatoires: Chaînes aléatoires de longueur 10-50 octets
Fonction de hachage: GxHash (hachage SIMD haute performance)

Méthodes de comparaison

Placement de seaux: PTHash, PHOBIC, PtrHash
Division récursive: SIMDRecSplit, Bipartite ShockHash
Méthodes d'empreinte digitale: FiPS, FMPH, FMPHGO
Récupération de fonction statique: SicHash

Métriques d'évaluation

Consommation d'espace: bits par clé
Temps de requête: nanosecondes par requête
Temps de construction: nanosecondes par clé
Accélération parallèle: performance mono-thread vs multi-thread

Résultats expérimentaux

Performance principale

Performance des requêtes (5×10⁷ clés)

PHast: 9-22 ns/requête, espace 1,82-2,33 bits/clé
PHast+: 10-15 ns/requête, espace 1,84-2,24 bits/clé
PtrHash: 14-17 ns/requête, espace 2,12-2,99 bits/clé
PTHash: 40-54 ns/requête, espace 2,11-3,19 bits/clé

Performance de construction (5×10⁷ clés, mono-thread)

PHast+: 61-140 ns/clé (configuration la plus rapide)
PHast: 133-5322 ns/clé (dépendant de la taille de graine)
PtrHash: 75-192 ns/clé
FMPH: 40-57 ns/clé (mais espace plus grand)

Accélération parallèle

PHast: 8,5-9,6× accélération (allocation de graines hautement parallélisable)
PHast+: 4,1-5,4× accélération
PtrHash: 3,6-5,1× accélération

Résultats d'optimisation des paramètres

Configuration optimale (minimisation d'espace)

Taille de graine S	PHast λ	Espace (bits/clé)	PHast+ λ	Espace (bits/clé)
8	4,7	1,91	5,35	2,09
10	6,05	1,85	6,35	1,90
12	7,35	1,81	7,4	1,82

Expériences d'ablation

Sélection heuristique de graines: Après suppression, l'espace passe de 1,92 à 2,39 bits/clé
Taille de fenêtre: À W=1, l'espace augmente à 2,20 bits/clé, W>256 n'apporte pas d'amélioration significative
Limite de tranche: La suppression de la limite de tranche augmente significativement la consommation d'espace
Ordre de traitement des seaux: Le traitement par taille décroissante (comme CHD) entraîne une consommation d'espace plus importante

Travaux connexes

Évolution des méthodes de placement de seaux

CHD: Allocation linéaire de seaux mais construction lente, nécessite un codage de graines de longueur variable
FCH/PTHash: Allocation non linéaire simple de seaux, atténue partiellement les problèmes
PHOBIC: Fonction d'allocation de seaux optimale, mais requêtes plus lentes
PtrHash: Variante PHOBIC optimisée pour les requêtes, utilisant la recherche locale

Autres catégories de méthodes

Méthodes d'empreinte digitale: Construction rapide mais espace plus grand, requêtes nécessitant des opérations de rang
Division récursive: Espace proche de la limite théorique mais requêtes lentes
Récupération de fonction statique: Nécessite un sondage multi-position complexe

Unicité de PHast

PHast évite le codage de longueur variable et la recherche locale complexe grâce au mécanisme de bumping, tout en conservant la simplicité de l'allocation linéaire de seaux.

Conclusion et discussion

Conclusions principales

Performance des requêtes: PHast réalise un temps de requête proche de l'optimal théorique
Efficacité de construction: PHast+ offre une vitesse de construction extrêmement rapide
Efficacité d'espace: Réalise une bonne consommation d'espace tout en maintenant des requêtes rapides
Compatibilité parallèle: Construction parallèle sans surcharge de requête supplémentaire

Limitations

Espace vs méthodes récursives: Toujours pas aussi proche de la limite théorique que les méthodes de division récursive
Grands ensembles de données: Pour 5×10⁸ clés, l'accès mémoire devient un goulot d'étranglement
Ajustement des paramètres: Nécessite de sélectionner les paramètres appropriés selon le scénario d'application

Directions futures

Construction en mémoire externe: Implémenter l'algorithme en mémoire externe décrit à la section 6
Requêtes par lot: Supporter les optimisations de requêtes par lot similaires à PtrHash
Accélération GPU: Explorer les possibilités de parallélisation GPU
Extension k-perfect: Supporter les cas où k clés peuvent être mappées à la même valeur

Évaluation approfondie

Avantages

Innovation technique

Philosophie de conception simplifiée: Évite les mécanismes complexes grâce au bumping, incarnant le principe « moins c'est plus »
Mappage linéaire: Restaure la simplicité de l'allocation linéaire de seaux tout en résolvant ses problèmes
Optimisation en parallèle au niveau des bits: La recherche de graines en parallèle au niveau des bits de PHast+ est une innovation d'ingénierie importante
Conception cache-friendly: Le traitement séquentiel et la conception du tampon circulaire considèrent les caractéristiques des CPU modernes

Suffisance expérimentale

Comparaison complète: Comparaison détaillée des performances couvrant toutes les principales méthodes existantes
Évaluation multidimensionnelle: Analyse des compromis entre espace, temps de requête et temps de construction
Étude des paramètres: Expériences détaillées d'ajustement des paramètres et d'ablation
Reproductibilité: Implémentation open-source et configuration expérimentale détaillée

Insuffisances

Limitations de la méthode

Surcharge d'espace: Écart d'environ 0,4 bits/clé par rapport aux méthodes récursives
Sensibilité aux paramètres: Nécessite d'ajuster plusieurs paramètres selon le nombre de clés et la taille de graine
Analyse théorique: Manque de preuve théorique rigoureuse de la complexité spatiale

Insuffisances expérimentales

Ensembles de données uniques: Utilise principalement des données aléatoires, manque de tests sur des données d'applications réelles
Hiérarchie mémoire: Analyse insuffisante de l'impact des différents niveaux de cache
Stabilité à long terme: Pas de test de performance d'utilisation à long terme à grande échelle

Évaluation de l'impact

Contribution académique

Valeur théorique: Démontre que les méthodes simples peuvent être compétitives grâce à l'optimisation d'ingénierie
Méthodologie: Fournit une perspective « simplifier plutôt que complexifier » pour la conception de structures de données
Établissement de références: Établit de nouveaux repères pour la performance des requêtes de hachage parfait

Valeur pratique

Application directe: Peut être utilisé dans les bases de données, moteurs de recherche et autres scénarios nécessitant des requêtes rapides
Référence d'ingénierie: La conception cache-friendly et la parallélisation peuvent être appliquées à d'autres structures de données
Contribution open-source: L'implémentation Rust fournit un outil de haute qualité à la communauté

Scénarios d'application

Applications idéales

Tables de hachage statiques: Scénarios où l'ensemble de clés est fixe et les requêtes sont fréquentes
Index de base de données: Systèmes de base de données nécessitant une recherche rapide de clés-valeurs
Bioinformatique: Applications telles que l'indexation de k-mer nécessitant un grand nombre de requêtes
Systèmes de cache: Caches mémoire nécessitant une réponse de requête extrêmement rapide

Conditions de limitation

Mémoire suffisante: Nécessite suffisamment de mémoire pour stocker la structure de données complète
Données statiques: Ne convient pas aux scénarios avec mises à jour fréquentes
Requêtes intensives: Convient aux applications où la fréquence des requêtes est bien supérieure à celle de la construction

Références

Travaux connexes clés

PHOBIC: Hermann et al. « Perfect hashing with optimized bucket sizes and interleaved coding »
PtrHash: Groot Koerkamp « PtrHash: Minimal Perfect Hashing at RAM Throughput »
PTHash: Pibiri & Trani « PTHash: Revisiting FCH minimal perfect hashing »
SIMDRecSplit: Bez et al. « High performance construction of RecSplit based minimal perfect hash functions »

Fondements théoriques

Fredman & Komlós: Limite théorique inférieure des fonctions de hachage parfait
Belazzougui et al.: Travaux fondateurs sur les méthodes de placement de seaux

L'article PHast démontre que dans le domaine de l'ingénierie algorithmique, grâce à une compréhension approfondie de la nature du problème et des caractéristiques du matériel moderne, les méthodes simples, après optimisation minutieuse, peuvent atteindre ou même surpasser les performances des méthodes complexes. Cela fournit un aperçu important pour la conception de structures de données: parfois, la clé pour résoudre un problème n'est pas d'ajouter de la complexité, mais de trouver la bonne direction de simplification.