2025-11-25T08:13:17.519450

Lifting Manifolds to Mitigate Pseudo-Alignment in LLM4TS

Zheng, Liang, Zhang et al.

Pseudo-Alignment is a pervasive challenge in many large language models for time series (LLM4TS) models, often causing them to underperform compared to linear models or randomly initialised backbones. However, there is limited discussion in the community for the reasons that pseudo-alignment occurs. In this work, we conduct a thorough investigation into the root causes of pseudo-alignment in LLM4TS and build a connection of pseudo-alignment to the cone effect in LLM. We demonstrate that pseudo-alignment arises from the interplay of cone effect within pretrained LLM components and the intrinsically low-dimensional manifold of time-series data. In addition, we also introduce \textit{\textbf{TimeSUP}}, a novel technique designed to mitigate this issue and improve forecast performance in existing LLM4TS approaches. TimeSUP addresses this by increasing the time series manifold to more closely match the intrinsic dimension of language embeddings, allowing the model to distinguish temporal signals clearly while still capturing shared structures across modalities. As a result, representations for time and language tokens remain distinct yet exhibit high cosine similarity, signifying that the model preserves each modality unique features while learning their commonalities in a unified embedding space. Empirically, TimeSUP consistently outperforms state-of-the-art LLM4TS methods and other lightweight baselines on long-term forecasting performance. Furthermore, it can be seamlessly integrated into four existing LLM4TS pipelines and delivers significant improvements in forecasting performance.

academic

マニフォルドの持ち上げによるLLM4TSの疑似アライメント緩和

基本情報

論文ID: 2510.12847
タイトル: Lifting Manifolds to Mitigate Pseudo-Alignment in LLM4TS
著者: Liangwei Nathan Zheng, Wenhao Liang, Wei Emma Zhang, Miao Xu, Olaf Maennel, Weitong Chen
分類: cs.LG（機械学習）
発表日: 2024年10月14日（arXivプレプリント）
論文リンク: https://arxiv.org/abs/2510.12847

要約

疑似アライメント（Pseudo-Alignment）は、時系列用大言語モデル（LLM4TS）の多くで普遍的な課題であり、これらのモデルの性能が線形モデルやランダムに初期化されたバックボーンネットワークより劣ることが多い。しかし、疑似アライメントが発生する原因についてのコミュニティでの議論は限定的である。本論文はLLM4TSにおける疑似アライメントの根本原因を深く調査し、疑似アライメントとLLMの円錐効果（cone effect）との関連性を確立する。研究により、疑似アライメントは事前学習されたLLMコンポーネント内の円錐効果と時系列データ固有の低次元マニフォルドの相互作用に由来することが示される。さらに、本論文ではTimeSUPを導入する。これは当該問題を緩和し、既存のLLM4TSメソッドの予測性能を向上させるために設計された新しい技術である。

研究背景と動機

問題定義

核心問題: LLM4TSモデルに普遍的に存在する疑似アライメント現象により、モデル性能が低下し、単純な線形モデルより劣ることさえある
現象の説明: 時系列と言語表現は一次統計量（平均値など）のレベルでは一見アライメントしているが、完全な分布は依然として異なっており、真の意味的アライメントの失敗とモダリティ固有の特徴の歪みを示唆している

研究の重要性

実用的価値: 時系列分析は医療診断、気象予報、交通流量、エネルギー負荷予測などの分野で重要な応用を持つ
理論的意義: 非言語領域におけるLLMの適応メカニズムを理解し、クロスモーダル学習の理論的基礎を提供する
技術的課題: 既存のLLM4TSメソッドは疑似アライメントメカニズムの起源に関する体系的な研究が不足している

既存手法の限界

疑似アライメントの根本原因に対する深い分析の欠如
LLMの豊富な知識を時系列予測に活用するための効果的なアーキテクチャ修正または訓練戦略の不在
既存手法は軽量ベースラインモデルより劣る性能を示すことが多い

核心的貢献

データマニフォルド次元の観点から疑似アライメント問題を初めて明らかにする。LLM4TSモデルに新しい洞察を提供し、包括的な実験を通じて低次元性が時系列に与える影響を実証する
TimeSUPメソッドを提案する。時系列用シンプルで効果的な大言語モデル再プログラミング手法であり、時系列データの固有次元を持ち上げることにより疑似アライメント問題を効果的に解決する
一貫した性能向上を実現する。TimeSUPは様々な長期予測データセット上で最先端のLLM4TSベースラインを継続的に上回り、他のLLM4TSメソッドへの適応が容易である

メソッドの詳細説明

タスク定義

本論文は長期時系列予測タスクに焦点を当てており、入力は履歴時系列データ、出力は将来の時間ステップの予測値である。核心的な課題は、事前学習されたLLMの言語知識を効果的に活用して時系列予測性能を向上させる方法である。

理論的基礎

時系列マニフォルド分析

PCA分析を通じて以下が発見された：

時系列トークン（パッチサイズ=16、ストライド=8）は21個の主成分で十分に表現可能
GPT-2言語トークンは712個（全768個）のコンポーネントを保持
時系列モダリティは言語モダリティより低次元のマニフォルド上に位置する

疑似アライメント理論分析

定理1: マニフォルド次元m→0およびn→0のとき、コサイン類似度は時系列と言語分布の平均値間の類似性にのみ収束する傾向があり、疑似アライメントを引き起こす。

数学的表現：

E[cos(x_ts, x_l)] = (μ_ts μ_l) / (√(||μ_ts|| + mσ_ts) √(||μ_l|| + nσ_l))

m≪nでありmσ_tsが無視可能な場合、円錐効果により、コサイン類似度は著しく増加し、方程式はμ_tsと言語分布全体の高い類似性に収束する。

TimeSUPアーキテクチャ

1. パッチ時系列埋め込み

入力系列長L、パッチサイズP、ストライドS
生成されるパッチ数：N = ⌈(P-L)/S⌉ + 1
共有言語埋め込み空間R^dへの線形マッピング

2. Top-K テキストプロトタイプ選択

語彙表の線形結合を通じて1000個のテキストプロトタイプを生成
非対称クロスアテンション使用して時系列パッチを最適に説明するTop-Kプロトタイプを検出
アテンション重み計算：A_k = TopK(Softmax(QK^T/√d))

3. 時系列マニフォルド強化器

2つの軽量MLPを設計：

M_c ∈ R^((K+1)×N)×n：トークン次元全体で動作
M_f ∈ R^(d×d)：特徴チャネル全体で動作

融合プロセス：

T* = M_f(M_c^T T_t)^T

ここでT_tは時系列-テキストペアの連結表現である。

効果検証

PCAプローブ実験を通じて、強化後の表現が時系列の固有マニフォルド次元を21から224に向上させることが証明された（GPT-2言語トークンの712次元と比較して）。これはデータマニフォルド次元を著しく増加させる。

実験設定

データセット

8つの広く採用されている長期予測ベンチマークデータセットを使用：

ETTシリーズ: ETTh1, ETTh2, ETTm1, ETTm2（電力変圧器温度データ）
Illness: 疾病データ（7次元、週次周波数）
Weather: 気象データ（21次元、10分周波数）
Traffic: 交通データ（862次元、時間周波数）
ECL: 電力消費データ（862次元、時間周波数）

評価指標

MSE: 平均二乗誤差
MAE: 平均絶対誤差

比較手法

LLM4TSメソッド: FSCA, CALF, S2IP, TimeLLM, UniTime, OFA 軽量ベースライン: TimeMixer, TimesNet, iTransformer

実装詳細

ハードウェア：4×RTX 4090 24GB および 4×A100 40GB
オプティマイザー：Adam
損失関数：平均二乗誤差
OFAの公式実装に基づく可視化分析

実験結果

主要結果

TimeSUPは80個のテスト構成中60回で最高性能を達成し、すべてのベースラインメソッドを著しく上回る：

代表的な結果：

ETTh1平均: MSE 0.412 vs 最良ベースライン0.426（3.3%改善）
ETTh2平均: MSE 0.353 vs 最良ベースライン0.355（0.6%改善）
Illness平均: MSE 1.885 vs 最良ベースライン2.056（8.3%改善）
Weather平均: MSE 0.231 vs 最良ベースライン0.233（0.9%改善）

層別分析実験

GPT-2の6層の段階的可視化分析により以下が発見された：

ベースラインモデル: コサイン類似度は第1層で1に近い値に急上昇し、その後の層で0.9以上を維持
TimeSUP: 第2層から始まり、時系列埋め込みが扇形に展開し言語マニフォルドにマッピングされ、コサイン類似度は段階的に上昇するが最終的に約0.6643で安定

適応性実験

TimeSUPは複数の既存LLM4TSメソッドにシームレスに統合可能：

S2IP+TimeSUP: ETTh1上でMSE 3%低下、MAE 2%低下
OFA+TimeSUP: MSE 4.8%低下、MAE 1.3%低下
平均改善: Illnessデータセット上でMSE平均11%低下、ETTh1上で2%低下

アブレーション実験

LayerNorm（LN）とマルチヘッドアテンション（MHA）の事前学習/微調整状態を制御することで以下が発見された：

LN-PT & MHA-PT: 最も深刻な疑似アライメントを生成
ランダムに初期化されたコンポーネント: 予測性能を著しく低下
LN-PF & MHA-RF: 性能低下が最大
LN-RT & MHA-PF: 性能低下が最小。ほとんどの言語知識がMHA層に保存されていることを示唆

結論と議論

主要な結論

疑似アライメントの根本原因: 疑似アライメントが円錐効果と時系列低次元マニフォルドの相互作用の複合効果であることを証明
効果的な解決策: TimeSUPは時系列マニフォルド次元を向上させることにより疑似アライメント問題を効果的に緩和
広範な適用性: 当該メソッドは「プラグアンドプレイ」モジュールとして複数のLLM4TSアーキテクチャに統合可能

限界

計算オーバーヘッド: TimeSUPは比較的軽量であるが、追加の次元向上はなお一定の計算コストをもたらす
ハイパーパラメータ感度: Top-K選択と圧縮トークン数などのハイパーパラメータは異なるデータセットに対して調整が必要
理論分析: 数学的証明は提供されているが、複雑な実際のシナリオに対する理論的カバレッジはなお限定的

今後の方向性

適応的次元向上: 最適なマニフォルド次元を自動的に決定できるメソッドの開発
マルチモーダル拡張: 当該思想を他のモダリティアライメント問題に拡張
効率最適化: より効率的なマニフォルド強化技術の研究

深層評価

利点

理論的貢献が顕著: マニフォルド次元の観点から疑似アライメント問題を初めて深く分析し、明確な数学的理論的支持を提供
メソッドがシンプルで効果的: TimeSUPの設計はシンプルだが効果は著しく、理解と実装が容易
実験が充分: 8つのデータセット上で10個のベースラインメソッドとの包括的な比較により、結果に説得力がある
可視化分析が深い: UMAPと段階的分析を通じてメソッドの動作メカニズムを明確に示す
広範な適用性: 当該メソッドが複数の既存アーキテクチャに統合可能であることを証明

不足

計算効率分析が不足: 追加の計算コストと訓練時間に関する詳細な分析が欠如
ハイパーパラメータ感度: 異なるデータセットは異なるハイパーパラメータ設定を必要とし、統一的な選択戦略が欠如
長期効果検証: 主に長期予測に焦点を当てており、短期予測と他の時系列タスクへの効果はさらなる検証が必要
理論的仮定: いくつかの数学的導出は理想化された仮定に基づいており、実際の応用での適用性は限定的である可能性がある

影響力

学術的価値: LLM4TS領域に重要な理論的洞察を提供し、後続の関連研究を刺激する可能性がある
実用的価値: プラグアンドプレイモジュールとして、強い実用的応用の可能性を持つ
再現性: 論文は詳細な実装詳細とパラメータ設定を提供し、再現を容易にする

適用シーン

長期時系列予測: 特にLLM知識の活用が必要な複雑な時系列予測タスクに適用
マルチモーダル学習: 当該思想は次元不一致が存在する他のクロスモーダル学習問題に拡張可能
事前学習モデル適応: 事前学習言語モデルを他の領域に適応させるための新しい思想を提供

参考文献

本論文は時系列予測、大言語モデル、マルチモーダル学習など複数の領域の重要な研究を含む35篇の関連文献を引用しており、研究に堅実な理論的基礎を提供している。

総合評価: これは質の高い論文であり、理論分析と実験検証の両面で十分である。論文はLLM4TS領域の重要な問題を特定し解決し、提案されたメソッドはシンプルで効果的であり、強い実用的価値と学術的意義を持つ。