2025-11-13T12:04:15.378418

Functional tensor train neural network for solving high-dimensional PDEs

Feng, Ng, Tang et al.

Discrete tensor train decomposition is widely employed to mitigate the curse of dimensionality in solving high-dimensional PDEs through traditional methods. However, the direct application of the tensor train method typically requires uniform grids of regular domains, which limits its application on non-uniform grids or irregular domains. To address the limitation, we develop a functional tensor train neural network (FTTNN) for solving high-dimensional PDEs, which can represent PDE solutions on non-uniform grids or irregular domains. An essential ingredient of our approach is to represent the PDE solutions by the functional tensor train format whose TT-core functions are approximated by neural networks. To give the functional tensor train representation, we propose and study functional tensor train rank and employ it into a physics-informed loss function for training. Because of tensor train representation, the resulting high-dimensional integral in the loss function can be computed via one-dimensional integrals by Gauss quadrature rules. Numerical examples including high-dimensional PDEs on regular or irregular domains are presented to demonstrate that the performance of the proposed FTTNN is better than that of Physics Informed Neural Networks (PINN).

academic

고차원 편미분방정식 해결을 위한 함수 텐서 트레인 신경망

기본 정보

논문 ID: 2510.13386
제목: 고차원 편미분방정식 해결을 위한 함수 텐서 트레인 신경망
저자: Yani Feng (홍콩대학교), Michael K. Ng (홍콩침례대학교), Kejun Tang (대만만대학교), Zhiwen Zhang (홍콩대학교)
분류: math.NA cs.NA
발표 시간: 2025년 10월 15일 (arXiv 사전인쇄본)
논문 링크: https://arxiv.org/abs/2510.13386

초록

이산 텐서 트레인 분해는 전통적 방법으로 고차원 편미분방정식을 풀 때 발생하는 차원의 저주(Curse of Dimensionality) 문제를 완화하기 위해 광범위하게 사용되고 있습니다. 그러나 텐서 트레인 방법의 직접적 적용은 일반적으로 정규 영역에서의 균일 격자를 요구하므로, 비균일 격자 또는 불규칙 영역에서의 적용이 제한됩니다. 이러한 한계를 해결하기 위해 본 논문은 고차원 편미분방정식을 풀기 위한 함수 텐서 트레인 신경망(FTTNN)을 개발했으며, 이 방법은 비균일 격자 또는 불규칙 영역에서의 편미분방정식 해를 표현할 수 있습니다. 이 방법의 핵심은 함수 텐서 트레인 형식을 통해 편미분방정식 해를 표현하는 것이며, 여기서 TT 핵 함수는 신경망으로 근사됩니다. 함수 텐서 트레인 표현을 제공하기 위해 본 논문은 함수 텐서 트레인 계수(rank) 개념을 제시하고 연구했으며, 이를 물리 정보 손실 함수의 훈련에 적용했습니다. 텐서 트레인 표현의 특성으로 인해, 손실 함수의 고차원 적분은 가우스 적분 규칙을 사용하여 일차원 적분을 계산함으로써 해결할 수 있습니다. 수치 실험은 제안된 FTTNN이 정규 또는 불규칙 영역에서의 고차원 편미분방정식 해결에서 물리 정보 신경망(PINN)보다 우수한 성능을 보임을 입증합니다.

연구 배경 및 동기

문제 배경

고차원 편미분방정식은 슈뢰딩거 고유값 문제, 유체역학, 열전도, 전자기학 및 양자역학 등 과학 및 공학 응용 분야에서 광범위하게 존재합니다. 전통적 수치 방법(유한 차분, 유한 요소, 스펙트럼 방법)은 저차원 문제에서는 우수한 성능을 보이지만, 고차원 문제에서는 심각한 차원의 저주(Curse of Dimensionality, CoD) 문제에 직면합니다.

기존 방법의 한계

텐서 방법의 한계:
- 이산 텐서 분해 방법(CP 분해, Tucker 분해, 텐서 트레인 분해)은 계산 복잡도를 감소시킬 수 있지만, 일반적으로 정규 영역에서의 균일 격자를 요구합니다
- 비균일 격자 또는 불규칙 영역에 적용하기 어렵습니다
신경망 방법의 한계:
- PINN, DGM, DRM 등의 방법은 고차원 적분 추정을 위해 샘플링 방법에 의존합니다
- 샘플링은 통계적 오차를 도입하여 신경망의 능력을 가릴 수 있습니다

연구 동기

불규칙 영역을 처리할 수 있으면서도 고차원 적분을 효율적으로 계산할 수 있는 방법을 개발하여, 텐서 분해의 저계수 구조 장점과 신경망의 함수 근사 능력을 결합합니다.

핵심 기여

함수 텐서 트레인 신경망(FTTNN) 제시: 이산 텐서 트레인 분해를 연속 영역으로 확장하여 비균일 격자 및 불규칙 영역에서의 고차원 편미분방정식을 처리할 수 있습니다
이론적 기초 구축:
- 함수 텐서 트레인 계수(Functional Tensor Train Rank) 정의
- 함수 텐서 트레인 분해의 수학적 표현 제공
- FTTNN의 근사 성질에 대한 이론적 분석 제공
효율적인 적분 계산: 텐서 트레인 구조를 활용하여 고차원 적분을 일차원 적분으로 분해하고, 가우스 적분 규칙을 통해 정확하게 계산하여 샘플링 오차를 회피합니다
우수한 수치 성능: 여러 고차원 편미분방정식 문제에서 FTTNN이 PINN 및 다른 방법에 비해 정확도 우위를 입증합니다

방법 상세 설명

작업 정의

다음 형식의 고차원 편미분방정식 경계값 문제를 해결합니다:

Lu(x) = f(x), ∀x ∈ Ω
Bu(x) = g(x), ∀x ∈ ∂Ω

여기서 Ω ⊂ Rᵈ는 유계 연결된 다각형 경계 영역이고, L은 편미분 연산자, B는 경계 연산자입니다.

핵심 이론 프레임워크

1. 함수 텐서 트레인 계수 정의

정의 2.4: 텐서 함수 u: Ω ⊂ Rᵈ → R이 주어졌을 때, 함수 텐서 트레인 계수는 다음과 같이 정의됩니다:

FTT-rank[u] := (r₀, r₁, ..., rₐ₋₁, rₐ)
rₖ = sup_{A∈S[u]} rank(Aₖ), k = 1, ..., d-1

여기서 Su는 u의 샘플 텐서 집합입니다.

2. 함수 텐서 트레인 분해

정리 2.6: u의 FTT-rank가 (r₀, r₁, ..., rₐ)이면, TT 핵 함수 uᵢ: Ωᵢ → R^{rᵢ₋₁×rᵢ}가 존재하여:

u(x) = Σ_{α₀=1}^{r₀} ... Σ_{αₐ=1}^{rₐ} u₁^{(α₀,α₁)}(x₁) u₂^{(α₁,α₂)}(x₂) ... uₐ^{(αₐ₋₁,αₐ)}(xₐ)

모델 아키텍처

FTTNN 구조

각 TT 핵 함수는 신경망으로 매개변수화됩니다:

u(x; θ) = u₁(x₁; θ₁)u₂(x₂; θ₂)...uₐ(xₐ; θₐ)

여기서 θ = {θ₁, ..., θₐ}는 모든 부분 네트워크의 훈련 가능한 매개변수입니다.

손실 함수

물리 정보 손실 함수를 채택합니다:

J(θ) = ∫_Ω (Lu(x; θ) - f(x))² dx + β ∫_{∂Ω} (Bu(x; θ) - g(x))² dx

기술적 혁신 포인트

1. 고차원 적분의 텐서 분해 계산

이차 타원 연산자 Lu(x; θ) = -c₁Δu(x; θ) + b(x)u(x; θ)에 대해, 잔차 손실은 다음과 같이 분해될 수 있습니다:

∫_Ω (Lu(x; θ) - f(x))² dx = I₁ + I₂ + I₃ + I₄ + I₅

각 항은 텐서 트레인 형식으로 표현되며, 일차원 적분을 계산하여 구합니다:

∫_Ω y₁yₐ dx = ∏ᵢ₌₁ᵈ ∫_{Ωᵢ} (uᵢ 관련 항) dxᵢ

2. 경계 조건 처리

네트워크 아키텍처를 통해 경계 조건을 직접 내장합니다:

uᵢ(xᵢ; θᵢ) := (xᵢ - aᵢ)(bᵢ - xᵢ)ûᵢ(xᵢ; θᵢ)

실험 설정

테스트 문제

함수 근사: 특이점을 가진 고차원 함수
불규칙 영역 푸아송 방정식: L자 영역에서의 3차원 문제
고차원 푸아송 방정식: 정규 영역에서 d=3,5,7차원 문제
고차원 헬름홀츠 방정식: 높은 파수 경우 포함
슈뢰딩거 고유값 문제: d=5,10차원 문제

평가 지표

상대 오차:

Relative error = ||u(x; θ) - u(x)||₂ / ||u(x)||₂

비교 방법

이산 텐서 트레인 분해(TTD)
물리 정보 신경망(PINN)
심층 리츠 방법(DRM)

구현 세부사항

네트워크 구조: 단일 은닉층 완전 연결 네트워크, 활성화 함수는 sine
최적화기: Adam(5000 에포크) + L-BFGS(1000 에포크)
적분 계산: 가우스-르장드르 적분 규칙
하드웨어: NVIDIA A100 GPU

실험 결과

주요 결과

1. 함수 근사(테스트 1)

방법	차원 d	계수 r	매개변수 수	상대 오차
TTD	4	2	360	4.1×10⁻¹
FTTNN	4	2	4332	4.9×10⁻²
TTD	6	3	5400	2.2×10⁻¹
FTTNN	6	3	7242	3.6×10⁻³

2. 고차원 푸아송 방정식(테스트 3)

차원 d	FTTNN	PINN
3	2.6×10⁻⁵	5.5×10⁻⁵
5	2.5×10⁻⁴	2.0×10⁻³
7	1.3×10⁻⁴	8.0×10⁻²

3. 고차원 헬름홀츠 방정식(테스트 4.1)

차원 d	FTTNN	PINN
3	8.0×10⁻⁵	4.0×10⁻⁵
5	1.3×10⁻⁴	1.5×10⁻²

주요 발견

차원 민감도: 차원이 증가함에 따라 FTTNN의 PINN 대비 우위가 더욱 명확해집니다
불규칙 영역 적응성: FTTNN은 L자 영역 등 불규칙 기하학을 성공적으로 처리합니다
높은 파수 안정성: 점진적 초기화 전략을 통해 k=25π의 고진동 문제를 처리합니다
고유값 정확도: 슈뢰딩거 고유값 문제에서 DRM을 능가합니다

결론 및 토론

주요 결론

FTTNN은 이산 텐서 트레인 분해를 연속 함수 공간으로 성공적으로 확장합니다
함수 텐서 트레인 계수는 이산 및 연속 표현 간의 이론적 연결을 구축합니다
텐서 구조는 고차원 적분의 효율적이고 정확한 계산을 실현합니다
수치 실험은 다양한 고차원 편미분방정식에서 방법의 우수한 성능을 입증합니다

한계

텐서 계수 선택: 적절한 FTT-rank를 결정하기 위해 사전 지식 또는 적응형 전략이 필요합니다
함수 형식 제한: 원본 함수 f(x)와 계수 b(x)는 텐서 트레인 표현이 필요합니다
초기화 민감도: 높은 파수 문제는 신중하게 설계된 초기화 전략이 필요합니다
이론적 분석: 근사 오차 경계의 타이트함이 개선될 여지가 있습니다

향후 방향

포커-플랑크 방정식: 더 복잡한 확률 편미분방정식으로 확장
자동 계수 선택: FTT-rank를 동적으로 조정하는 알고리즘 개발
더 일반적인 연산자: 비선형 및 시간 관련 편미분방정식 처리
병렬 계산: 텐서 구조의 천연 병렬성 활용

심층 평가

장점

견고한 이론적 기여:
- 함수 텐서 트레인 계수의 엄격한 정의
- 연속 텐서 분해의 완전한 이론 프레임워크
- 근사 성질의 수학적 증명
현저한 기술적 혁신:
- 고차원 적분의 텐서 분해 계산이 샘플링 오차를 회피합니다
- 불규칙 영역을 유연하게 처리하는 능력
- 텐서 방법의 저계수 장점 유지
충분한 실험 검증:
- 다양한 유형의 고차원 편미분방정식 포함
- 체계적인 절제 연구 및 비교 분석
- 저차원에서 고차원으로의 점진적 검증
두드러진 실용적 가치:
- 전통적 텐서 방법의 영역 제한 해결
- 고차원 과학 계산을 위한 새로운 도구 제공

부족한 점

계산 복잡도 분석 부족:
- PINN 등 방법과의 이론적 복잡도 비교 부재
- 텐서 분해의 계산 비용 분석 제한적
적용 범위 제한:
- 원본 함수의 텐서 분해 표현 요구
- 일반 비선형 편미분방정식으로의 확장성 미흡
매개변수 조정 지침 부족:
- FTT-rank 선택에 대한 체계적 지침 부재
- 네트워크 아키텍처 설계의 경험적 특성 강함
수렴성 분석:
- 훈련 과정의 수렴 보장 불충분
- 손실 함수 경관의 분석 필요

영향력 평가

학술적 영향:
- 텐서 분해와 신경망 결합의 새로운 패러다임 제시
- 더 많은 함수 텐서 분해 연구를 촉발할 가능성
응용 전망:
- 양자 화학, 재료 과학 등 고차원 문제에서 중요한 응용 가치
- 공학의 복잡한 기하학 편미분방정식 해결에 새로운 선택지 제공
방법 보편성:
- 프레임워크의 우수한 확장성
- 다른 유형의 고차원 수치 문제에 영감 제공

적용 시나리오

고차원 정규 편미분방정식: 차원 d≥5의 타원형, 포물선형 문제
불규칙 영역 문제: 복잡한 기하학 형태의 중저차원 편미분방정식
고유값 계산: 고차원 슈뢰딩거 연산자의 스펙트럼 문제
매개변수화 편미분방정식: 저계수 구조를 가진 매개변수 관련 문제

종합 평가: 이는 고차원 편미분방정식 수치 해결 분야에서 중요한 기여를 하는 논문입니다. 텐서 분해와 신경망의 장점을 교묘하게 결합하여 이론적 깊이와 실용적 가치를 모두 갖춘 FTTNN 방법을 제시했습니다. 일부 한계가 있지만, 그 혁신성과 효과성은 이를 해당 분야의 중요한 진전으로 만들며, 추가 발전과 응용의 가치가 있습니다.