Pseudo-random number generators (PRNGs) are essential in a wide range of applications, from cryptography to statistical simulations and optimization algorithms. While uniform randomness is crucial for security-critical areas like cryptography, many domains, such as simulated annealing and CMOS-based Ising Machines, benefit from controlled or non-uniform randomness to enhance solution exploration and optimize performance. This paper presents a hardware PRNG that can simultaneously generate multiple uncorrelated sequences with programmable statistics tailored to specific application needs. Designed in 65nm process, the PRNG occupies an area of approximately 0.0013mm^2 and has an energy consumption of 0.57pJ/bit. Simulations confirm the PRNG's effectiveness in modulating the statistical distribution while demonstrating high-quality randomness properties.
論文ID : 2501.00193タイトル : A Pseudo-random Number Generator for Multi-Sequence Generation with Programmable Statistics著者 : Jianan Wu, Ahmet Yusuf Salim, Eslam Elmitwalli, Selçuk Köse, Zeljko Ignjatovic (ロチェスター大学)分類 : cs.CR cs.IT math.ITプロセス技術 : 65nm CMOS技術論文リンク : https://arxiv.org/abs/2501.00193 疑似乱数生成器(PRNG)は、暗号学から統計シミュレーション、最適化アルゴリズムに至るまで、幅広い応用において重要である。均一な乱数性は暗号学などのセキュリティクリティカルな領域に不可欠であるが、シミュレーテッドアニーリングやCMOSベースのイジングマシンなどの多くの分野では、制御された非均一な乱数性がソリューション探索と最適化性能を向上させるために有益である。本論文は、複数の無相関シーケンスを同時に生成でき、特定のアプリケーション要件に合わせてカスタマイズされたプログラム可能な統計特性を備えたハードウェアPRNGを提案する。65nm技術で設計され、PRNGは約0.0013mm²の面積を占有し、0.57pJ/bitの消費電力を実現する。シミュレーションにより、統計分布の変調におけるPRNGの有効性が確認され、同時に高品質の乱数特性が実証された。
従来のPRNGは主に均一分布の乱数シーケンス生成に焦点を当てているが、多くの実用的なアプリケーションでは特定の統計特性を持つ非均一な乱数シーケンスが必要である:
アプリケーション要件の多様化 : シミュレーテッドアニーリング、CMOSベースのイジングマシンなどのアプリケーションは、性能最適化のために制御可能な非均一な乱数性を必要とするマルチシーケンス要件 : 多くのアプリケーションは複数の無相関な乱数シーケンスを同時に生成する必要があるハードウェア実装の課題 : 既存のPRNGはハードウェアレベルで統計特性の柔軟な制御を実現することが困難である性能最適化 : 制御された乱数性はソリューション空間の探索を強化し、アルゴリズム性能を向上させることができるアプリケーション適応 : 異なるアプリケーションは乱数性に対して異なる統計要件を持つため、プログラム可能なソリューションが必要であるハードウェア効率 : ハードウェア実装されたPRNGは消費電力と面積の観点で利点を有する統計分布の固定 : 従来のPRNGは主に均一分布を生成し、柔軟性に欠けるマルチシーケンスのオーバーヘッド : 複数のシーケンスを生成するには複数の独立したハードウェアが必要であり、コストが増加する実時間制御の困難さ : 既存のソリューションは実行時の統計特性調整を実現することが困難であるプログラム可能な統計特性を備えたハードウェアPRNGアーキテクチャを提案 し、出力シーケンスの統計分布をリアルタイムで制御できるマルチシーケンス生成スキームを設計 し、共有LFSRと閾値コントローラを通じて効率的なマルチシーケンス出力を実現するコンパクトなハードウェア設計を実装 し、65nm技術下で面積わずか0.0013mm²、消費電力0.57pJ/bitを実現する動的閾値制御メカニズムを提供 し、時変統計特性をサポートし、シミュレーテッドアニーリングなどのアプリケーションに適用可能であるシーケンス品質を検証 し、自己相関と相互相関分析を通じて良好な乱数性を確認する以下の機能を持つハードウェアPRNGシステムを設計する:
入力 : クロック信号、閾値制御パラメータ出力 : プログラム可能な統計特性を持つ複数の1ビット疑似乱数シーケンス制約 : 低消費電力、小面積、高品質乱数性、シーケンス間の低相関性システムは3つのコアモジュールで構成される:
線形フィードバックシフトレジスタ(LFSR) 32ビットLFSRは十分に長い周期(2³²-1)を保証する 特性多項式はフィードバック構造を定義する: P ( x ) = x n + a n − 1 x n − 1 + . . . + a 1 x + 1 P(x) = x^n + a_{n-1}x^{n-1} + ... + a_1x + 1 P ( x ) = x n + a n − 1 x n − 1 + ... + a 1 x + 1 異なるタップの組み合わせを選択することで、複数のm ビット均一分布シーケンスを生成する 閾値コントローラ m ビット閾値信号を出力し、最終シーケンスの統計特性を制御する 静的および動的閾値調整をサポートする 動的コントローラはカウンタに基づいて時変閾値を実装する デジタルコンパレータ m ビットコンパレータはLFSR出力と閾値を比較する 出力確率の理論式: P ( 1 ) = 2 m − 1 − T h r e s h o l d 2 m P(1) = \frac{2^m - 1 - Threshold}{2^m} P ( 1 ) = 2 m 2 m − 1 − T h res h o l d 異なる間隔のLFSRタップを選択することでシーケンスの無相関性を保証する 各シーケンスの追加にはコンパレータと対応するXORゲートの追加のみが必要である 共有LFSRと閾値コントローラはハードウェア効率を向上させる 生成可能な無相関m ビットシーケンス数: C ( n − 1 , k − 1 ) / m C(n-1, k-1)/m C ( n − 1 , k − 1 ) / m (ここでkは各XOR操作のタップ数) 革新点 : 閾値変調を通じて統計分布の正確な制御を実現する実装原理 : 均一分布のm ビットシーケンスを調整可能な閾値と比較し、出力確率を制御する利点 : リアルタイム調整、ハードウェア再設計不要動的閾値コントローラの実装:
- カウンタが増分閾値を提供する
- ロジック回路がカウンタの開始/停止を制御する
- シミュレーテッドアニーリングなど時変乱数性が必要なアプリケーションをサポートする
リソース共有 : 複数のシーケンスが同一のLFSRと閾値コントローラを共有するタップ選択戦略 : 異なるシーケンス間の低相関性を保証するスケーラビリティ : ハードウェアオーバーヘッドを線形に増加させるだけでより多くのシーケンスをサポートできる技術 : 65nm CMOS技術設計ツール : Cadence Virtuoso ADELFSR構成 : 32ビット、長周期を保証コンパレータ : 8ビット、精度と消費電力のバランスクロック周波数 : 2GHz統計特性制御精度 : 理論値と実測値の比較乱数性品質 :
自己相関分析(非ゼロラグ) 相互相関分析(異なるシーケンス間) ハードウェア性能 :
固定閾値テスト : 異なる閾値下での統計分布を検証する動的閾値テスト : 時変統計特性を検証するマルチシーケンス相関テスト : シーケンス間の独立性を検証する面積 : 261.5μm × 21.2μm = 0.0013mm²消費電力 : 1.14mW @ 2GHzエネルギー効率 : 0.57pJ/bit実験により閾値と出力確率の関係が検証された:
閾値27: '1'の出力確率が高い 閾値127: '1'の出力確率が中程度 閾値227: '1'の出力確率が低い 実測結果は理論式P ( 1 ) = 2 m − 1 − T h r e s h o l d 2 m P(1) = \frac{2^m - 1 - Threshold}{2^m} P ( 1 ) = 2 m 2 m − 1 − T h res h o l d と高度に一致する 動的閾値制御下の累積カウント表現は二次トレンドを示す:
N C C ( t ) = − 1.5396 + 2.4658 t N + 0.00551 t N 2 NCC(t) = -1.5396 + 2.4658t_N + 0.00551t_N^2 NCC ( t ) = − 1.5396 + 2.4658 t N + 0.00551 t N 2
成長率は線形に減少する:
d N C C d t N = − 3.0792 t N + 2.4658 \frac{dNCC}{dt_N} = -3.0792t_N + 2.4658 d t N d NCC = − 3.0792 t N + 2.4658
異なるシーケンス間の最大相互相関値はほぼゼロに近い シーケンス間の良好な独立性を示す タップ選択戦略の有効性を検証する 非ゼロラグ下の最大自己相関値はほぼゼロに近い シーケンスが強い乱数性を持つことを示す 明らかな周期性または繰り返しパターンがない 動的閾値制御は2段階の動作を示す:
閾値増加段階 : '1'の出力確率が徐々に低下し、累積カウントが二次増加する閾値飽和段階 : 最大閾値に達した後、'1'を出力しなくなり、累積カウントが安定する線形合同法(LCG) : シンプルだが周期が比較的短い線形フィードバックシフトレジスタ(LFSR) : ハードウェアに適しており周期が長いセルオートマトン(CA) : 並列性が良いが複雑性が高いカオスPRNG : 非線形特性が良いが実装が複雑である統計プログラム可能性 : 従来の方法と比較して、本論文は実行時統計制御を実現するマルチシーケンス効率 : リソース共有を通じてハードウェアオーバーヘッドを大幅に削減するアプリケーション適応性 : 特に非均一な乱数性が必要なアプリケーションに適しているプログラム可能な統計特性を備えたハードウェアPRNGを成功裏に実装 し、出力分布を正確に制御できるマルチシーケンス生成の有効性を検証 し、シーケンス間で良好な独立性を維持する優れたハードウェア性能を達成 し、面積と消費電力の両方が先進的なレベルにある乱数性品質を確認 し、高品質PRNGの要件を満たす閾値分解能の制限 : 8ビット閾値コントローラは統計調整の細かさを制限するシーケンス数の制約 : 生成可能な無相関シーケンス数はLFSRビット数とタップ選択に制限されるアプリケーション領域固有 : 主に非均一な乱数性が必要な特定のアプリケーションを対象とする閾値分解能の向上 : 閾値コントローラのビット数を増加させ、より細かい統計制御を実現するシーケンス容量の拡張 : タップ選択アルゴリズムを最適化し、より多くの無相関シーケンスをサポートするより多くの分布の統合 : ガウス分布など他の一般的な確率分布をサポートするアプリケーション検証 : 実際のイジングマシンとシミュレーテッドアニーリングシステムで性能を検証する技術的革新性が強い : ハードウェアレベルで統計プログラム可能なPRNGを初めて実現する実用価値が高い : 量子計算シミュレーションなどの新興アプリケーション要件に直接対応する設計が優雅 : シンプルな閾値比較を通じて複雑な統計制御を実現する検証が充分 : 理論分析からハードウェア実装まで完全な検証がある性能が優異 : 面積と消費電力の指標が先進的なレベルに達している理論分析の深さ : タップ選択に関する理論分析をより深く進めることができるアプリケーション検証 : 実際のアプリケーションシステムでの性能検証が不足している比較範囲 : 他のプログラム可能なPRNG方案との比較が十分ではないスケーラビリティ分析 : 大規模マルチシーケンスシナリオの分析が不十分である学術的貢献 : プログラム可能な乱数生成分野に新しいハードウェアソリューションを提供する産業価値 : 量子計算シミュレーション、最適化アルゴリズムなどの新興分野で重要な応用前景を有する技術推進 : 設計方法は制御可能な乱数性が必要な他のシステムに推進できるCMOSイジングマシン : 時変乱数性が必要な量子計算シミュレーションシミュレーテッドアニーリングアルゴリズム : 乱数性を動的に調整する必要がある最適化アルゴリズムモンテカルロシミュレーション : 特定の分布が必要な統計シミュレーションニューラルネットワーク訓練 : 制御可能なノイズが必要なランダム化訓練本論文は6篇の主要な参考文献を引用しており、PRNG理論基礎、ハードウェア実装方法、および対象アプリケーション分野をカバーしており、研究に堅実な理論と応用基礎を提供する。
総合評価 : これは高品質なハードウェア設計論文であり、革新的なプログラム可能な統計PRNG アーキテクチャを提案し、理論設計、ハードウェア実装、性能検証の面でかなり完全である。本研究は新興アプリケーション要件に対応し、重要な学術価値と実用的意義を有し、関連分野の発展に有益な貢献をしている。