Energy-Efficient Sampling Using Stochastic Magnetic Tunnel Junctions
Alder, Kajale, Tunsiricharoengul et al.
(Pseudo)random sampling, a costly yet widely used method in (probabilistic) machine learning and Markov Chain Monte Carlo algorithms, remains unfeasible on a truly large scale due to unmet computational requirements. We introduce an energy-efficient algorithm for uniform Float16 sampling, utilizing a room-temperature stochastic magnetic tunnel junction device to generate truly random floating-point numbers. By avoiding expensive symbolic computation and mapping physical phenomena directly to the statistical properties of the floating-point format and uniform distribution, our approach achieves a higher level of energy efficiency than the state-of-the-art Mersenne-Twister algorithm by a minimum factor of 9721 and an improvement factor of 5649 compared to the more energy-efficient PCG algorithm. Building on this sampling technique and hardware framework, we decompose arbitrary distributions into many non-overlapping approximative uniform distributions along with convolution and prior-likelihood operations, which allows us to sample from any 1D distribution without closed-form solutions. We provide measurements of the potential accumulated approximation errors, demonstrating the effectiveness of our method.
academic
Энергоэффективная выборка с использованием стохастических магнитных туннельных переходов
(Псевдо)случайная выборка является широко используемым, но дорогостоящим методом в вероятностном машинном обучении и алгоритмах цепей Маркова Монте-Карло, остаётся неосуществимой в действительно крупномасштабных приложениях из-за неудовлетворённых вычислительных требований. В данной работе представлен энергоэффективный алгоритм, использующий стохастические магнитные туннельные переходы при комнатной температуре для генерации истинно случайных чисел с плавающей точкой Float16 при равномерной выборке. Путём избежания дорогостоящих символических вычислений и прямого отображения физических явлений на формат с плавающей точкой и статистические свойства равномерного распределения, метод достигает как минимум 9721-кратного повышения энергоэффективности по сравнению с передовым алгоритмом Mersenne-Twister и 5649-кратного улучшения по сравнению с более энергоэффективным алгоритмом PCG. На основе этого метода выборки и аппаратной архитектуры авторы разлагают произвольное распределение на несколько неперекрывающихся приблизительно равномерных распределений, комбинируя свёртку и операции «априор-правдоподобие», что позволяет осуществлять выборку из произвольных одномерных распределений без закрытого решения.
Энергетический кризис: Широкое применение искусственного интеллекта приводит к значительному энергопотреблению, экономическим затратам и выбросам CO₂, что не только увеличивает стоимость продукции, но и препятствует усилиям по борьбе с изменением климата
Узкие места вероятностного машинного обучения: Традиционное глубокое обучение лишено способности к квантификации неопределённости, тогда как вероятностное машинное обучение, хотя и предоставляет теоретическую базу, остаётся неосуществимым в крупномасштабных приложениях из-за высокого энергопотребления
Вычислительная стоимость генерации случайных чисел: Выборка методом цепей Маркова Монте-Карло (MCMC) является ядром вероятностного машинного обучения, однако её огромные вычислительные и энергетические требования делают её непригодной для крупномасштабного развёртывания
Существующие генераторы псевдослучайных чисел сталкиваются с тремя ключевыми ограничениями в приложениях машинного обучения:
Несоответствие формата: Невозможность прямого получения результатов в формате с плавающей точкой, критически важном для машинного обучения
Недостаточная гибкость: Отсутствие способности генерировать произвольные распределения
Функциональные ограничения: Невозможность прямой обработки произведений распределений правдоподобия, распространённых в вероятностном машинном обучении
Инновационный аппаратный дизайн: Предложено устройство со стохастическим переключением магнитного туннельного перехода (s-MTJ) высокой энергоэффективности, способное генерировать образцы распределения Бернулли с параметром p, управляемым смещением тока
Решение в закрытой форме: Предложено решение в закрытой форме для применения распределения Бернулли к набору параметров битовых позиций формата с плавающей точкой, обеспечивающее выборку распределения без символических вычислений с повышением энергоэффективности в 5649 раз по сравнению с существующими генераторами случайных чисел при конфигурации Float16
Структура выборки произвольного распределения: Предложено использование смешанной модели равномерного распределения для представления произвольного одномерного распределения, реализующее выборку произвольного одномерного распределения с использованием эффективной аппаратной поддержки равномерной выборки, введены операции свёртки и преобразования «априор-правдоподобие» для обучения и выборки распределений без закрытого решения
Прямое физическое отображение: Прямое отображение физических случайных явлений на статистические свойства формата с плавающей точкой, избегая затрат на преобразование формата
Истинная случайность: Использование тепловых шумов для генерации истинной случайности, а не псевдослучайности
Параллельная архитектура: Разработана как неловко параллельная структура, способная генерировать образцы каждые 1 мкс
Непараметрический метод: Обработка произвольных распределений без закрытого решения
Междисциплинарная инновация: Успешное объединение спинтроники и машинного обучения, демонстрирующее потенциал совместного проектирования аппаратного обеспечения и алгоритмов
Практическая ценность: Решение практической проблемы энергопотребления, стоящей перед вероятностным машинным обучением, с перспективой содействия крупномасштабному развёртыванию
Теоретическая полнота: Предоставление полной теоретической базы от физики устройства до применения алгоритма
Достаточные эксперименты: Включение физического моделирования, статистической проверки и комплексной оценки нижестоящих задач
Статья цитирует 76 связанных работ, охватывающих несколько областей, включая спинтронику, генерацию случайных чисел, вероятностное машинное обучение и методы MCMC, предоставляя прочную теоретическую базу для междисциплинарных исследований.
Общая оценка: Это статья с важным инновационным значением в междисциплинарных исследованиях, успешно применившая спинтронные устройства к решению практических проблем в машинном обучении. Хотя она по-прежнему сталкивается с проблемами в инженерной реализации, её теоретический вклад и потенциальное влияние заслуживают внимания. Методология статьи обладает универсальностью и открывает новое направление исследований для аппаратного ускорения вероятностных вычислений.