2025-11-16T15:10:11.983649

A note on generalized tensor CUR approximation for tensor pairs and tensor triplets based on the tubal product

Ahmadi-Asl, Rezaeian
In this note, we briefly present a generalized tensor CUR (GTCUR) approximation for tensor pairs (X,Y) and tensor triplets (X,Y,Z) based on the tubal product (t-product). We use the tensor Discrete Empirical Interpolation Method (TDEIM) to do these extensions. We show how the TDEIM can be utilized to generalize the classical tensor CUR (TCUR) approximation, which acts only on a single tensor, to jointly compute the TCUR of two and three tensors. This approach can be used to sample relevant lateral/horizontal slices of one data tensor relative to one or two other data tensors. For some special cases, the Generalized TCUR (GTCUR) approximation is reduced to the classical TCUR for both tensor pairs and tensor triplets in a similar fashion as shown for the matrices.
academic

Заметка об обобщенной тензорной CUR-аппроксимации для пар тензоров и троек тензоров на основе трубчатого произведения

Основная информация

  • ID статьи: 2305.00754
  • Название: A note on generalized tensor CUR approximation for tensor pairs and tensor triplets based on the tubal product
  • Авторы: Салман Ахмади-Асл (Университет Иннополис), Наим Резаеян (Российский университет дружбы народов)
  • Классификация: math.NA cs.NA
  • Дата публикации: препринт arXiv, май 2023 г. (последняя версия январь 2025 г.)
  • Ссылка на статью: https://arxiv.org/abs/2305.00754

Аннотация

В данной статье предложены методы обобщённой тензорной CUR (GTCUR) аппроксимации для пар тензоров (X,Y) и троек тензоров (X,Y,Z) на основе трубчатого произведения (t-product). Авторы используют метод дискретной эмпирической интерполяции тензоров (TDEIM) для реализации этих расширений, демонстрируя, как обобщить классическую тензорную CUR-аппроксимацию (TCUR), действующую на отдельный тензор, на совместное вычисление TCUR для двух или трёх тензоров. Метод может быть применён для выборки релевантных боковых/горизонтальных срезов одного тензора данных относительно одного или двух других тензоров данных.

Исследовательский контекст и мотивация

  1. Решаемая проблема: Классическое CUR-разложение может обрабатывать только отдельные матрицы или тензоры и не способно одновременно обрабатывать несколько связанных структур данных. В практических приложениях часто требуется одновременный анализ нескольких связанных тензорных данных и извлечение наиболее дискриминативных признаков одного набора данных относительно других.
  2. Значимость проблемы:
    • Реальные наборы данных обычно имеют многомерную структуру, требующую сохранения структуры тензора данных
    • В приложениях, таких как обнаружение подгрупп, восстановление данных с цветным шумом и канонический корреляционный анализ, требуется одновременная обработка нескольких тензоров
    • Традиционные методы не могут эффективно использовать общую информацию между несколькими тензорами
  3. Ограничения существующих методов:
    • Матричное CUR (MCUR) может обрабатывать только отдельные матрицы
    • Существующие методы тензорного разложения, такие как разложение Такера и CP-разложение, не обеспечивают оптимальную низкоранговую аппроксимацию при усечении
    • Отсутствует единая схема обработки нескольких тензоров
  4. Исследовательская мотивация: Вдохновлённые успешным применением обобщённого MCUR в матричном случае, авторы стремятся расширить эту идею на тензорный случай, используя благоприятные свойства тензорного SVD на основе t-произведения, и разработать методы GTCUR, способные одновременно обрабатывать несколько тензоров.

Основные вклады

  1. Предложен метод обобщённой тензорной CUR (GTCUR): Впервые расширена CUR-аппроксимация с одного тензора на случаи пар и троек тензоров
  2. Разработана стратегия выборки на основе TDEIM: Использован метод дискретной эмпирической интерполяции тензоров для выбора оптимальных боковых/горизонтальных срезов
  3. Установлена теоретическая связь: Доказано, что GTCUR в частных случаях может деградировать до классического TCUR, аналогично матричному случаю
  4. Предоставлены эффективные алгоритмы: Даны быстрые алгоритмы вычисления GTCUR, включая эффективную реализацию в частотной области
  5. Расширена теория тензорного разложения: Установлена полная теоретическая схема на основе обобщённого тензорного SVD (GTSVD) и ограниченного тензорного SVD (t-RSVD)

Подробное описание метода

Определение задачи

GTCUR для пары тензоров: Даны два тензора XRI1×I2×I3\mathbf{X} \in \mathbb{R}^{I_1 \times I_2 \times I_3} и YRI4×I2×I3\mathbf{Y} \in \mathbb{R}^{I_4 \times I_2 \times I_3}, найти аппроксимацию: XC1U1R1,YC2U2R2\mathbf{X} \approx \mathbf{C}_1 \ast \mathbf{U}_1 \ast \mathbf{R}_1, \quad \mathbf{Y} \approx \mathbf{C}_2 \ast \mathbf{U}_2 \ast \mathbf{R}_2

GTCUR для тройки тензоров: Даны три тензора XRI1×I2×I3\mathbf{X} \in \mathbb{R}^{I_1 \times I_2 \times I_3}, YRI1×I4×I3\mathbf{Y} \in \mathbb{R}^{I_1 \times I_4 \times I_3}, ZRI5×I2×I3\mathbf{Z} \in \mathbb{R}^{I_5 \times I_2 \times I_3}, найти соответствующие аппроксимации.

Архитектура модели

1. Базовые тензорные операции

Статья основана на ряде тензорных операций, определённых через трубчатое произведение (t-product):

  • t-произведение: C=XY=fold(circ(X)unfold(Y))\mathbf{C} = \mathbf{X} \ast \mathbf{Y} = \text{fold}(\text{circ}(\mathbf{X}) \cdot \text{unfold}(\mathbf{Y}))
  • Транспонирование тензора: Транспонирование всех фронтальных срезов и обратный порядок
  • Ортогональный тензор: Удовлетворяет XTX=XXT=I\mathbf{X}^T \ast \mathbf{X} = \mathbf{X} \ast \mathbf{X}^T = \mathbf{I}

2. Тензорное SVD (t-SVD)

XUSVT\mathbf{X} \approx \mathbf{U} \ast \mathbf{S} \ast \mathbf{V}^T где U\mathbf{U} и V\mathbf{V} — ортогональные тензоры, S\mathbf{S} — f-диагональный тензор.

3. Алгоритм TDEIM

Основная идея заключается в построении оператора тензорной интерполяционной проекции: P=U(STU)1ST\mathbf{P} = \mathbf{U} \ast (\mathbf{S}^T \ast \mathbf{U})^{-1} \ast \mathbf{S}^T

Процесс выборки:

  1. Выбрать первый срез с максимальной евклидовой нормой трубчатой структуры
  2. Итеративно выбирать индекс с максимальной нормой в срезах остатка
  3. Использовать оператор проекции для удаления влияния уже выбранных направлений

Технические инновации

  1. Единая схема обработки нескольких тензоров: Реализация совместного разложения нескольких тензоров через общие факторные матрицы
  2. Выбор индексов на основе GTSVD: Использование общих факторов, предоставляемых обобщённым тензорным SVD, для согласованной выборки срезов
  3. Эффективные вычисления в частотной области: Все операции могут выполняться параллельно в частотной области, что значительно повышает вычислительную эффективность
  4. Теоретические гарантии: Предоставлена верхняя граница ошибки XCURF2(η~p+η~q)i=1I3t>R(σti)2\|\mathbf{X}-\mathbf{C} \ast \mathbf{U} \ast \mathbf{R}\|_F^2 \leq (\tilde{\eta}_p + \tilde{\eta}_q)\sum_{i=1}^{I_3}\sum_{t>R}(\sigma_t^i)^2

Экспериментальная установка

Теоретическая верификация

Статья в основном предоставляет теоретический анализ и алгоритмическую схему, включая:

Метрики оценки

  • Теоретические верхние границы ошибки аппроксимации
  • Анализ вычислительной сложности
  • Контроль числа обусловленности

Методы сравнения

  • Классическое тензорное CUR (TCUR)
  • Методы выборки на основе leverage scores
  • Методы равномерной выборки

Детали реализации

  • Использование быстрого преобразования Фурье (FFT) для реализации t-произведения
  • Применение рандомизированного GTSVD для снижения вычислительной сложности
  • Предоставление описания алгоритма в стиле MATLAB

Результаты экспериментов

Основные результаты

Статья в основном предоставляет теоретические результаты:

  1. Теорема 1: Верхняя граница ошибки TCUR-аппроксимации при выборке TDEIM
  2. Теорема 3: Связь между GTCUR для пары тензоров и классическим TCUR
  3. Теорема 4: Анализ частных случаев GTCUR для тройки тензоров

Теоретические находки

  1. Когда Y=I\mathbf{Y} = \mathbf{I}, GTCUR деградирует до классического TCUR
  2. Для обратимого тензора Y\mathbf{Y} GTCUR эквивалентен TCUR для XY1\mathbf{X} \ast \mathbf{Y}^{-1}
  3. Число обусловленности контролируется η~p\tilde{\eta}_p и η~q\tilde{\eta}_q

Связанные работы

Основные направления исследований

  1. Матричное CUR-разложение: Классические работы Горейнова и др.
  2. Тензорное разложение: Разложение Такера, CP-разложение, tensor-train разложение
  3. Методы на основе t-произведения: Схема, открытая Килмером и др.
  4. Обобщённое SVD: GSVD и RSVD в матричном случае

Инновации данной работы

По сравнению с существующими работами, данная статья впервые:

  • Расширяет CUR-разложение на случай нескольких тензоров
  • Устанавливает полную теоретическую схему на основе t-произведения
  • Предоставляет эффективный алгоритм выборки TDEIM

Заключение и обсуждение

Основные выводы

  1. Успешно расширена CUR-аппроксимация с одного тензора на пары и тройки тензоров
  2. TDEIM предоставляет оптимальную стратегию выборки
  3. Теоретическая схема полная, включая анализ ошибок и связь частных случаев
  4. Алгоритм эффективен и может выполняться параллельно в частотной области

Ограничения

  1. Отсутствие численных экспериментов: Статья в основном теоретическая, без конкретной численной верификации
  2. Вычислительная сложность: Вычисление GTSVD остаётся вызовом для крупномасштабных тензоров
  3. Сценарии приложений: Отсутствует подробный анализ конкретных сценариев приложений
  4. Выбор параметров: Не обсуждается стратегия выбора параметра ранга R

Будущие направления

  1. Верификация метода в практических приложениях
  2. Разработка более эффективных рандомизированных алгоритмов
  3. Исследование адаптивных стратегий выбора параметров
  4. Расширение на случаи тензоров более высокого порядка

Глубокая оценка

Преимущества

  1. Значительный теоретический вклад: Впервые установлена полная теоретическая схема многотензорного CUR-разложения
  2. Новизна метода: Умелое использование общих факторов GTSVD для совместной обработки нескольких тензоров
  3. Эффективность алгоритма: Реализация на основе FFT обеспечивает вычислительную эффективность
  4. Строгость теории: Предоставлены полный анализ ошибок и гарантии сходимости
  5. Ясность изложения: Структура статьи чёткая, математические выводы строгие

Недостатки

  1. Отсутствие экспериментальной верификации: Как теоретическая заметка, статья лишена численных экспериментов для верификации практической эффективности метода
  2. Недостаточная мотивация приложений: Хотя упомянуты некоторые приложения, отсутствует глубокое обсуждение конкретных сценариев приложений
  3. Проблемы масштабируемости: Для очень крупномасштабных тензоров вычисление GTSVD остаётся узким местом
  4. Чувствительность параметров: Не обсуждается чувствительность метода к выбору параметров

Влияние

  1. Теоретическая ценность: Предоставляет новые теоретические инструменты для анализа нескольких тензоров
  2. Практический потенциал: Имеет перспективы применения в обработке изображений, анализе сигналов и других областях
  3. Воспроизводимость: Предоставлено подробное описание алгоритма, облегчающее реализацию
  4. Основание для дальнейших исследований: Создаёт основу для дальнейших исследований в смежных областях

Применимые сценарии

  1. Анализ мультимодальных данных: Сценарии, требующие одновременной обработки нескольких связанных тензорных данных
  2. Выбор признаков: Извлечение дискриминативных признаков одного набора данных относительно других
  3. Восстановление данных с шумом: Использование общей структуры нескольких тензоров для восстановления данных
  4. Снижение размерности: Снижение размерности при сохранении структуры тензора

Библиография

Статья цитирует 24 важных источника, включая:

  • Классические работы Горейнова и др. по CUR-разложению
  • Основополагающие исследования Килмера и др. по t-произведению
  • Последние работы Гидису и Хохстенбаха по матричному GMCUR
  • Соответствующую литературу по различным методам тензорного разложения

Общая оценка: Это высококачественная теоретическая статья, успешно расширяющая CUR-разложение на случай нескольких тензоров и устанавливающая полную теоретическую схему. Несмотря на отсутствие численных экспериментов, теоретический вклад значителен, и статья предоставляет новые инструменты для анализа нескольких тензоров. Основная ценность работы заключается в теоретических инновациях и методологическом вкладе, создавая прочную основу для последующих исследований практического применения.