Данное исследование оспаривает распространённое предположение в обработке сигналов: что базовые данные численно подчиняются гауссову распределению. Хотя это предположение обычно обосновывается ссылкой на центральную предельную теорему (ЦПТ), ЦПТ применима только к суммам независимых одинаково распределённых случайных величин. Однако многие линейные операции в обработке сигналов принимают форму взвешенных сумм, что делает распределение случайных величин неодинаковым. В данной работе специально изучается операция фильтра с конечной импульсной характеристикой (КИХ), проверяется выходной сигнал КИХ-фильтра при наличии равномерно распределённого шума квантования. Доказано, что выходная неопределённость не может предполагаться гауссовой, однако в зависимости от области применения гауссова оценка может остаться полезной.
Данное исследование направлено на решение фундаментального теоретического предположения в обработке сигналов: действительно ли распределение неопределённости выхода КИХ-фильтра соответствует гауссову распределению?
Исследование закономерностей распространения неопределённости квантования в КИХ-фильтре, конкретный анализ истинных характеристик распределения выхода при входном сигнале, представляющем собой равномерно распределённый шум квантования.
i-й образец входного сигнала моделируется как равномерно распределённая случайная величина:
Функция плотности вероятности:
\frac{1}{\delta} & \text{если } |x_i - \mu_i| < \frac{\delta}{2} \\ 0 & \text{в противном случае} \end{cases}$$ #### Моделирование выхода КИХ-фильтра Выход КИХ-фильтра представляется как взвешенная сумма: $$Y_n = \sum_{i=0}^{N} b_i X_{n-i}$$ Математическое ожидание и дисперсия выхода соответственно: $$\mu = \sum_{i=0}^{N} b_i \mu_{i-n}$$ $$\sigma^2 = \sum_{i=0}^{N} b_i^2 \frac{\delta^2}{12}$$ #### Вывод точного распределения На основе замкнутого решения Kamgar-Parsi и др., функция плотности вероятности выхода: $$f_{Y_n}(y_n) = \frac{(-1)^{N+1}}{N! \tilde{b}} \sum_{s_0=\pm1} \cdots \sum_{s_N=\pm1} \tilde{s} \times (y_n - \mu - S)^N \times \Theta(y_n - \mu - S)$$ где: - $\tilde{b} = \prod_{i=0}^{N} b_i \delta$ - $\tilde{s} = \prod_{i=0}^{N} s_i$ - $S = \sum_{i=0}^{N} s_i b_i \frac{\delta}{2}$ - $\Theta(t)$ — функция Хевисайда ### Технические инновации 1. **Приближение по основным коэффициентам**: поскольку полный расчёт невозможен для фильтров высокого порядка, предложено использовать только основные коэффициенты, превышающие 5% от максимального коэффициента 2. **Структура сравнения распределений**: использование расстояния Йенсена-Шеннона для количественного сравнения различий между истинным и теоретическим распределениями 3. **Методы статистической проверки**: применение критерия D'Agostino & Pearson для верификации негауссовости ## Экспериментальная установка ### Набор данных - **Источник данных**: набор данных EEGBCI из Physionet - **Конфигурация**: система ЭЭГ с 64 электродами, частота дискретизации 160 Гц, амплитудное разрешение 1 мкВ - **Задача**: задача моторного воображения (воображение сжатия кулаков левой и правой рукой) - **Масштаб моделирования**: 5000 повторных моделирований, генерирующих 75 735 различных распределений выхода ### Параметры фильтра - **Тип**: полосовой КИХ-фильтр - **Полоса частот**: 7-35 Гц (соответствует му и бета диапазонам моторного воображения) - **Параметры**: - Нижняя граничная частота: 7 Гц, ширина переходной полосы 2 Гц - Верхняя граничная частота: 35 Гц, ширина переходной полосы 8,75 Гц - Оконная функция: окно Хэмминга - Длина фильтра: 265 отсчётов (1,656 секунды) ### Показатели оценки 1. **Расстояние Йенсена-Шеннона**: количественная оценка различий между распределениями 2. **Критерий D'Agostino & Pearson**: проверка нормальности 3. **Анализ эксцесса**: оценка характеристик формы распределения 4. **Доля данных в пределах стандартного отклонения**: сравнение концентрации распределений ### Моделирование шума квантования Добавление равномерно распределённого шума квантования: $U(-0.5\text{ мкВ}, 0.5\text{ мкВ})$ ## Результаты экспериментов ### Основные результаты #### Верификация негауссовости - **Статистическая значимость**: 99,7% выходных распределений отвергают нулевую гипотезу о гауссовом распределении при p<0,05 - **Характеристики эксцесса**: все выходные распределения являются плосковершинными (platykurtic) с средним избыточным эксцессом -0,2924 #### Сравнение подгонки распределений - **Распределение взвешенной суммы vs гауссово распределение**: - Среднее расстояние Йенсена-Шеннона с теоретическим распределением взвешенной суммы: 0,03184 - Среднее расстояние Йенсена-Шеннона с гауссовым распределением: 0,03661 - Распределение взвешенной суммы явно ближе к истинному выходному распределению #### Анализ характеристик распределения - **Гауссово распределение**: 38,29% значений попадают в диапазон среднее±0,5 стандартного отклонения - **Фактический выход**: 36,81% значений попадают в диапазон среднее±0,5 стандартного отклонения - **Распределение взвешенной суммы**: 37,00% значений попадают в диапазон среднее±0,5 стандартного отклонения ### Эффективность приближения по основным коэффициентам Используя только 19 основных коэффициентов (из 265), успешно аппроксимировано полное теоретическое распределение, что доказывает осуществимость метода упрощения расчётов. ### Анализ конкретных случаев На рисунке 2 представлены 9 типичных случаев, охватывающих различные электроды (C3, C4, Cz), различные временные точки и различные попытки, последовательно показывающие: 1. Фактическое распределение явно отклоняется от гауссова предположения 2. Теоретическое распределение взвешенной суммы хорошо подгоняет реальные данные 3. Расстояние Йенсена-Шеннона количественно подтверждает это наблюдение ## Связанные работы ### Расширение центральной предельной теоремы для взвешенных сумм В статье цитируются исследования Cuzick (1995), Weber (2006), Avena & da Costa (2024) и др. о условиях ЦПТ для взвешенных сумм, но указывается, что эти анализы ещё не применены к КИХ-фильтрам. ### Применение фильтрации в обработке сигналов ЭЭГ - **Исследования моторного воображения**: работы McFarland и др. (2000), ter Horst и др. (2013), Yu и др. (2022) установили связь между му/бета диапазонами и моторным воображением - **Системы ИМК**: система BCI2000 Schalk и др. (2004) обеспечивает стандартную платформу для сбора данных ЭЭГ ### Теория распространения неопределённости На основе теории распределения взвешенных равномерных случайных величин Kamgar-Parsi и др. (1995), впервые применённой в области цифровой обработки сигналов. ## Выводы и обсуждение ### Основные выводы 1. **Теоретический прорыв**: распределение неопределённости выхода КИХ-фильтра действительно не является гауссовым, а представляет собой плосковершинное распределение с определённой формой 2. **Практическая ценность**: хотя оно и не гауссово, в некоторых приложениях гауссова аппроксимация остаётся приемлемой и требует оценки для конкретного применения 3. **Оптимизация расчётов**: метод основных коэффициентов обеспечивает практический путь упрощения расчётов ### Ограничения 1. **Специфичная модель шума**: исследование рассматривает только равномерно распределённый шум квантования 2. **Ограничение на линейные системы**: анализ применим только к линейным КИХ-фильтрам 3. **Оценка применимости**: требуется оценка приемлемости гауссова приближения для конкретного применения ### Направления будущих исследований 1. **Расширение на другие модели шума**: исследование входной неопределённости других типов распределений 2. **Анализ нелинейных систем**: расширение на БИХ-фильтры и нелинейные системы 3. **Оптимизация вычислений в реальном времени**: разработка более эффективных алгоритмов распространения неопределённости в режиме реального времени ## Глубокая оценка ### Преимущества #### Теоретические вклады 1. **Строгий математический анализ**: впервые предоставлена строгая математическая база для распространения неопределённости в КИХ-фильтрах 2. **Практический метод расчёта**: метод приближения по основным коэффициентам решает проблему вычислительной сложности 3. **Полная экспериментальная верификация**: крупномасштабное моделирование обеспечивает убедительную эмпирическую поддержку #### Методологические преимущества 1. **Строгость статистической проверки**: использование множества статистических методов для верификации надёжности выводов 2. **Верификация на реальных данных**: верификация на стандартном наборе данных ЭЭГ повышает достоверность результатов 3. **Количественный анализ**: расстояние Йенсена-Шеннона обеспечивает объективный стандарт сравнения распределений #### Практическая ценность 1. **Руководство для инженеров**: предоставляет важное теоретическое уточнение для инженеров, работающих с обработкой сигналов 2. **Вычислительная осуществимость**: предложенный приближённый метод имеет практическую ценность применения ### Недостатки #### Теоретические ограничения 1. **Единственная модель шума**: рассматривается только равномерное распределение, в то время как реальный шум может быть более сложным 2. **Линейное предположение**: не рассматривается влияние нелинейных этапов обработки 3. **Предположение независимости**: предполагается независимость входных образцов, что может не соответствовать некоторым практическим ситуациям #### Экспериментальный дизайн 1. **Ограничение области применения**: верификация проведена только на данных ЭЭГ, отсутствует верификация на других типах сигналов 2. **Единственный тип фильтра**: тестирован только один конкретный тип конфигурации КИХ-фильтра 3. **Отсутствие сравнительных эталонов**: не проведено сравнение с другими методами распространения неопределённости #### Практические соображения 1. **Вычислительная сложность**: хотя предложен приближённый метод, для сверхбольших систем могут возникнуть трудности 2. **Выбор параметров**: пороговое значение 5% для основных коэффициентов не имеет теоретического обоснования 3. **Применение в реальном времени**: не обсуждается осуществимость применения в системах реального времени ### Влияние #### Академический вклад 1. **Ценность теоретического уточнения**: уточнение давно существующего ошибочного предположения имеет важное академическое значение 2. **Междисциплинарное влияние**: имеет значение для обработки сигналов, статистики, метрологии и других областей 3. **Методологическая инновация**: метод приближения по основным коэффициентам может вдохновить анализ других сложных систем #### Практическая ценность 1. **Руководство для инженерных приложений**: предоставляет более точную теоретическую основу для проектирования фильтров и анализа неопределённости 2. **Справочный материал для стандартизации**: может влиять на разработку и пересмотр соответствующих технических стандартов 3. **Образовательная ценность**: предоставляет важное теоретическое дополнение к образованию в области обработки сигналов #### Воспроизводимость 1. **Использование открытых инструментов**: основано на открытых инструментах, таких как MNE, что облегчает воспроизведение 2. **Открытые наборы данных**: использование открытого стандартного набора данных повышает воспроизводимость 3. **Подробное описание методов**: предоставлены достаточные детали реализации ### Области применения #### Области прямого применения 1. **Обработка биомедицинских сигналов**: фильтрация биосигналов, таких как ЭЭГ, ЭКГ 2. **Системы связи**: фильтрация каналов и выравнивание в цифровых системах связи 3. **Обработка аудио**: подавление шума и частотная селекция в обработке аудиосигналов #### Потенциал расширенного применения 1. **Системы управления**: анализ неопределённости фильтрующих элементов в системах обратной связи 2. **Обработка изображений**: распространение неопределённости при фильтрации цифровых изображений 3. **Сети датчиков**: управление неопределённостью при слиянии данных распределённых датчиков #### Ценность теоретических исследований 1. **Теория случайных процессов**: предоставляет новое понимание поведения случайных процессов в линейных системах 2. **Теория измерительной неопределённости**: дополняет теорию распространения неопределённости в измерительной науке 3. **Численный анализ**: служит справочным материалом для анализа распространения ошибок в численных расчётах ## Библиография В статье цитируются 12 важных источников, охватывающих теорию распределения взвешенных сумм, обработку сигналов ЭЭГ, методы статистической проверки и другие ключевые области, обеспечивая прочную теоретическую основу для исследования. Особо следует отметить пионерскую работу Kamgar-Parsi и др. 1995 года, которая заложила теоретическую основу для данного исследования. --- **Общая оценка**: Это высококачественная исследовательская работа с важной теоретической ценностью и практическим значением. Она не только исправляет распространённое заблуждение в области обработки сигналов, но и предоставляет практические решения. Хотя исследование имеет определённые ограничения в масштабе и экспериментальном дизайне, его основной вклад достаточно значителен и оказывает позитивное влияние на развитие соответствующих областей.