2025-11-21T05:31:15.786305

Advancing Intoxication Detection: A Smartwatch-Based Approach

Segura, Vergés, Ky et al.
Excess alcohol consumption leads to serious health risks and severe consequences for both individuals and their communities. To advocate for healthier drinking habits, we introduce a groundbreaking mobile smartwatch application approach to just-in-time interventions for intoxication warnings. In this work, we have created a dataset gathering TAC, accelerometer, gyroscope, and heart rate data from the participants during a period of three weeks. This is the first study to combine accelerometer, gyroscope, and heart rate smartwatch data collected over an extended monitoring period to classify intoxication levels. Previous research had used limited smartphone motion data and conventional machine learning (ML) algorithms to classify heavy drinking episodes; in this work, we use smartwatch data and perform a thorough evaluation of different state-of-the-art classifiers such as the Transformer, Bidirectional Long Short-Term Memory (bi-LSTM), Gated Recurrent Unit (GRU), One-Dimensional Convolutional Neural Networks (1D-CNN), and Hyperdimensional Computing (HDC). We have compared performance metrics for the algorithms and assessed their efficiency on resource-constrained environments like mobile hardware. The HDC model achieved the best balance between accuracy and efficiency, demonstrating its practicality for smartwatch-based applications.
academic

Продвижение обнаружения интоксикации: подход на основе смарт-часов

Основная информация

  • ID статьи: 2510.09916
  • Название: Advancing Intoxication Detection: A Smartwatch-Based Approach
  • Авторы: Manuel E. Segura, Pere Vergés, Richard Ky, Ramesh Arangott, Angela Kristine Garcia, Thang Dinh Trong, Makoto Hyodo, Alexandru Nicolau, Tony Givargis, Sergio Gago-Masague
  • Учреждения: University of California Irvine, Asahi Group Holdings Ltd.
  • Классификация: cs.LG (Машинное обучение)
  • Дата публикации: 10 октября 2024 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2510.09916

Аннотация

Чрезмерное потребление алкоголя представляет серьезные риски для здоровья, имеющие значительные последствия для отдельных лиц и общества. Для содействия более здоровым привычкам потребления алкоголя в данном исследовании представлен инновационный подход мобильного приложения для смарт-часов, предназначенный для немедленного вмешательства при предупреждении об опьянении. Исследовательская группа создала набор данных, содержащий трансдермальную концентрацию алкоголя (TAC), данные акселерометра, гироскопа и частоты сердечных сокращений, собранные в течение трех недель. Это первое исследование, объединяющее данные смарт-часов акселерометра, гироскопа и частоты сердечных сокращений для долгосрочного мониторинга с целью классификации степени опьянения. В исследовании использованы данные смарт-часов для проведения комплексной оценки множества передовых классификаторов, включая Transformer, двунаправленные LSTM, GRU, одномерные CNN и гиперразмерные вычисления (HDC). Модель HDC достигла оптимального баланса между точностью и эффективностью, продемонстрировав практическую применимость в приложениях для смарт-часов.

Исследовательский контекст и мотивация

Важность проблемы

  1. Проблемы общественного здравоохранения: Потребление алкоголя приводит к более чем 200 заболеваниям, травмам и состояниям здоровья; в 2023 году злоупотребление алкоголем составило 6% глобальной смертности, при этом почти 14% смертей произошло в возрастной группе 20-39 лет
  2. Ограничения традиционных методов обнаружения: Традиционные методы, такие как анализ крови, мочи, слюны и алкотестеры, являются инвазивными и ограничивают их применимость в повседневных сценариях
  3. Потребность в поведенческом вмешательстве: Требуется неинвазивное решение, способное способствовать изменению поведения, предотвращать чрезмерное потребление алкоголя или опасную деятельность, такую как вождение в нетрезвом виде

Исследовательская мотивация

  • Разработка системы своевременного адаптивного вмешательства (JITAI), обеспечивающей персонализированное вмешательство в реальном времени, когда TAC на запястье пользователя превышает 35 мкг/л (эквивалент BAC 0,05%)
  • Использование многодатчиковых данных смарт-часов (акселерометр, гироскоп, частота сердечных сокращений) для долгосрочного мониторинга в реальных условиях
  • Обеспечение более глубокого понимания физиологического и поведенческого состояния пользователя по сравнению с традиционными методами

Основные вклады

  1. Оригинальный набор данных: Создан первый долгосрочный набор данных для обнаружения опьянения, объединяющий данные смарт-часов акселерометра, гироскопа и частоты сердечных сокращений, включающий данные 30 участников за три недели
  2. Сравнительная оценка нескольких моделей: Проведена комплексная оценка семи передовых моделей машинного обучения, включая SVM, LightGBM, bi-LSTM, GRU, Transformer, 1D-CNN и HDC
  3. Разработка мобильного приложения: Разработана полная система приложения смарт-часов и мобильного телефона, поддерживающая локальный вывод и немедленное вмешательство
  4. Баланс эффективности и точности: Модель HDC достигла оптимального баланса между точностью и эффективностью, подходящего для развертывания на устройствах с ограниченными ресурсами
  5. Проверка в реальных условиях: Проведено тестирование производительности на реальном устройстве Samsung Galaxy S20 с использованием PyTorch Executorch

Подробное описание методологии

Определение задачи

Входные данные: Данные датчиков смарт-часов (акселерометр по осям x, y, z; гироскоп по осям x, y, z; частота сердечных сокращений) Выходные данные: Результат бинарной классификации (опьянение/трезвость) с пороговым значением TAC 35 мкг/л Ограничения: Модель должна работать в реальном времени на устройствах с ограниченными ресурсами

Сбор и предварительная обработка данных

  1. Конфигурация оборудования:
    • Apple Watch Series 8: сбор данных акселерометра, гироскопа, частоты сердечных сокращений и геолокации
    • Браслет BACtrack Skyn: измерение значений TAC каждые 30 минут
    • Алкотестер BACtrack C8: измерение значений BAC
  2. Предварительная обработка данных:
    • Исходная частота дискретизации: 50 Гц
    • Применение низкочастотной фильтрации после анализа в частотной области, понижение дискретизации до 40 Гц
    • Разделение данных на окна по 20 секунд
    • Отбор 14 действительных участников (TAC превышает 35 мкг/л)

Архитектуры моделей

1. Машина опорных векторов (SVM)

  • Использование ядра радиальной базисной функции
  • Включение извлечения признаков нейронной сетью: слой развертывания + dropout 0,1 + линейный слой (128 измерений) + активация ReLU

2. LightGBM

  • Скорость обучения: 0,1
  • Количество узлов листа: 32, максимальная глубина: 4, количество оценок: 5
  • Параметры регуляризации α и λ: 0,5

3. Двунаправленная LSTM (bi-LSTM)

  • 4 слоя, по 128 скрытых единиц на слой
  • Двунаправленная архитектура, коэффициент dropout: 0,1
  • Механизм внимания + полносвязный слой

4. Управляемый рекуррентный блок (GRU)

  • Один слой, 64 скрытые единицы, коэффициент dropout: 0,1
  • Механизм внимания + полносвязный слой + активация sigmoid

5. Transformer

  • 2 слоя кодировщика, размерность встраивания: 128
  • Позиционное кодирование + dropout для предотвращения переобучения

6. Одномерная CNN (1D-CNN)

  • 3 сверточных слоя, по 32 фильтра на слой
  • Размеры ядра: 3, 5, 7 соответственно

7. Гиперразмерные вычисления (HDC)

  • Использование кодирования ключ-значение и алгоритма RefineHD
  • Размерность гипервектора: 3000

Технические инновации

  1. Слияние многодатчиковых данных: Первое применение комбинации данных акселерометра, гироскопа и частоты сердечных сокращений для обнаружения опьянения
  2. Долгосрочный мониторинг: В отличие от предыдущих исследований с краткосрочными данными, данное исследование проводило непрерывный мониторинг в течение трех недель
  3. Оптимизация периферийных вычислений: Специальная оптимизация с учетом вычислительных и энергетических ограничений мобильных устройств
  4. Проверка практичности: Верификация фактической развертываемости модели на реальных устройствах Android

Экспериментальная установка

Набор данных

  • Участники: 30 участников (возраст 21-55 лет), окончательно отобрано 14 действительных участников
  • Период мониторинга: 3 недели непрерывного мониторинга
  • Объем данных: Несколько "сеансов" для каждого участника, каждый сеанс содержит данные датчиков продолжительностью более 1 минуты

Дизайн эксперимента

  1. Кластеризация пользователей: Использование k-means для разделения пользователей на три категории уровней TAC: высокий, средний, низкий
  2. Разделение данных:
    • Тестовый набор: по одному пользователю из каждой категории (пользователи 16, 25, 26)
    • Набор обучения и валидации: оставшиеся 11 пользователей с трехкратной перекрестной валидацией

Метрики оценки

  • ROC-AUC: площадь под кривой рабочих характеристик приемника
  • PR-AUC: площадь под кривой точность-полнота
  • Точность: общая точность, точность при трезвости, точность при опьянении
  • F1-мера: гармоническое среднее точности и полноты

Тестирование производительности оборудования

  • Устройство: Samsung Galaxy S20 (Snapdragon 865, 8 ГБ ОЗУ)
  • Фреймворк: PyTorch Executorch
  • Тестирование: 100 итераций вывода, измерение времени, памяти и энергопотребления

Результаты экспериментов

Основные результаты

МодельROC-AUCТочностьТочность при трезвостиТочность при опьяненииF1-мера
1D-CNN0,74876,1%84,6%61,6%0,655
HDC0,74476,1%82,9%64,4%0,665
bi-LSTM0,71736,9%0%100%0,539
GRU0,68442,6%15,9%88,1%0,531
LightGBM0,74636,9%0%100%0,539
SVM0,25663,1%100%0%0,000
Transformer0,52936,9%0%100%0,539

Результаты производительности оборудования

МодельВремя вывода (с)Использование памяти (МБ)Энергопотребление (Вт)Размер модели (МБ)
1D-CNN0,012152,30,3150,035
HDC0,08423280,48136,7
SVM0,003483,50,207-
Transformer0,328590,10,599-

Ключевые выводы

  1. Оптимальная сбалансированная производительность: Модели HDC и 1D-CNN продемонстрировали лучшую сбалансированную производительность, способную одновременно точно идентифицировать состояния трезвости и опьянения
  2. Преимущества эффективности: Модель 1D-CNN сохраняет высокую точность при минимальном размере модели (0,035 МБ) и быстрой скорости вывода
  3. Возможность развертывания: Все протестированные модели могут завершить вывод в течение 20-секундного окна, удовлетворяя требованиям приложений реального времени

Связанные работы

Традиционные методы обнаружения

  • Инвазивные методы: Анализ крови, мочи, слюны, газовая хроматография
  • Дыхательное тестирование: Измерение объемного отношения этанола в альвеолярном воздухе
  • Трансдермальные датчики: Использование электрохимических или ферментативных принципов для измерения алкоголя через кожу

Методы машинного обучения

  • Физиологические сигналы: Измерение PPG и ECG, температура лица, биоимпеданс
  • Датчики движения: Показания движения смартфонов и носимых устройств
  • Традиционное МО: Применение случайных лесов, SVM, CNN и других методов на данных акселерометра

Преимущества данного исследования

По сравнению с существующими исследованиями, данная работа впервые:

  1. Объединяет несколько датчиков смарт-часов для долгосрочного мониторинга
  2. Проверяет производительность модели в реальных условиях
  3. Учитывает вычислительные и энергетические ограничения мобильных устройств

Заключение и обсуждение

Основные выводы

  1. Техническая осуществимость: Данные датчиков смарт-часов могут эффективно использоваться для обнаружения опьянения; модели HDC и 1D-CNN достигли практически применимого уровня точности
  2. Проверка практичности: Модели могут работать в реальном времени на коммерческих смартфонах, удовлетворяя требованиям приложений JITAI
  3. Оптимизация баланса: Модель HDC достигла оптимального баланса между точностью и эффективностью

Ограничения

  1. Ограничение размера выборки: Только 14 участников с действительными данными, что может повлиять на способность модели к обобщению
  2. Индивидуальные различия: Существуют значительные различия в толерантности к алкоголю и физиологических реакциях между пользователями
  3. Факторы окружающей среды: Различные помехи в реальных условиях могут повлиять на точность обнаружения
  4. Совместимость моделей: Некоторые модели (bi-LSTM, GRU) не могут быть успешно экспортированы в фреймворк Executorch

Будущие направления

  1. Расширение набора данных: Увеличение количества разнообразных групп пользователей и продление периода мониторинга
  2. Персонализированные модели: Рассмотрение персонализированных моделей с учетом профилей пользователей и демографических переменных
  3. Оптимизированная реализация: Использование языка C и векторизованных операций для повышения эффективности
  4. Защита конфиденциальности: Решение проблем конфиденциальности и безопасности данных
  5. Кросс-доменные приложения: Расширение на другие проблемы поведенческого здоровья

Глубокая оценка

Сильные стороны

  1. Высокая инновационность: Первое применение многодатчиковых данных смарт-часов для долгосрочного мониторинга опьянения, имеющее важное академическое и практическое значение
  2. Строгий дизайн эксперимента: Исследование, одобренное IRB, с тщательным отбором участников и этической проверкой
  3. Комплексная оценка: Систематическое сравнение семи различных типов моделей машинного обучения
  4. Практическая ориентация: Внимание не только к точности, но и к возможности развертывания модели на мобильных устройствах
  5. Полная система: Разработка комплексного решения от сбора данных до развертывания приложения

Недостатки

  1. Ограничение размера данных: Небольшое количество действительных участников (14 человек) может повлиять на статистическую значимость результатов и способность к обобщению
  2. Недостаточная инженерия признаков: Относительно простая инженерия признаков для данных датчиков, которая может не полностью раскрыть потенциал данных
  3. Отсутствие сравнительных эталонов: Отсутствие прямого сравнения с существующими коммерческими методами обнаружения опьянения
  4. Непроверенная долгосрочная стабильность: Отсутствие оценки стабильности производительности модели при длительном использовании

Влияние

  1. Академический вклад: Предоставляет новое направление исследований для применения смарт-часов в области мониторинга здоровья
  2. Практическая ценность: Имеет потенциал для разработки в реальный потребительский продукт, оказывающий положительное влияние на общественное здравоохранение
  3. Технологический прогресс: Способствует развитию технологий периферийного ИИ и мобильного мониторинга здоровья

Применимые сценарии

  1. Личное управление здоровьем: Помощь пользователям в мониторинге и контроле привычек потребления алкоголя
  2. Общественная безопасность: Предотвращение опасного поведения, такого как вождение в нетрезвом виде
  3. Медицинская поддержка: Вспомогательное средство при лечении и реабилитации алкогольной зависимости
  4. Корпоративные приложения: Мониторинг безопасности на рабочем месте

Библиография

В статье цитируется 38 связанных источников, охватывающих важные исследования в области технологий обнаружения алкоголя, методов машинного обучения, приложений мобильного здравоохранения и других областей.


Общая оценка: Это исследовательская работа с важной практической ценностью, которая вносит пионерский вклад в область обнаружения опьянения с помощью смарт-часов. Несмотря на возможности улучшения в масштабе данных и оптимизации моделей, его полная системная конструкция и проверка фактического развертывания создают прочную основу для последующих исследований в этой области.