Graph convolutional network (GCN)-based methods have shown strong performance in 3D human pose estimation by leveraging the natural graph structure of the human skeleton. However, their local receptive field limits their ability to capture long-range dependencies essential for handling occlusions and depth ambiguities. They also exhibit spectral bias, which prioritizes low-frequency components while struggling to model high-frequency details. In this paper, we introduce PoseKAN, an adaptive graph Kolmogorov-Arnold Network (KAN), framework that extends KANs to graph-based learning for 2D-to-3D pose lifting from a single image. Unlike GCNs that use fixed activation functions, KANs employ learnable functions on graph edges, allowing data-driven, adaptive feature transformations. This enhances the model's adaptability and expressiveness, making it more expressive in learning complex pose variations. Our model employs multi-hop feature aggregation, ensuring the body joints can leverage information from both local and distant neighbors, leading to improved spatial awareness. It also incorporates residual PoseKAN blocks for deeper feature refinement, and a global response normalization for improved feature selectivity and contrast. Extensive experiments on benchmark datasets demonstrate the competitive performance of our model against state-of-the-art methods.
- 논문 ID: 2511.08809
- 제목: Adaptive Graph Kolmogorov-Arnold Network for 3D Human Pose Estimation
- 저자: Abu Taib Mohammed Shahjahan and A. Ben Hamza (Concordia University, Montreal, Canada)
- 분류: cs.CV (컴퓨터 비전)
- 제출 시간: 2025년 11월 11일 arXiv 제출
- 논문 링크: https://arxiv.org/abs/2511.08809
- 코드 링크: https://github.com/shahjahan0275/PoseKAN
본 논문은 3D 인간 자세 추정 작업을 위해 PoseKAN이라는 자적응형 그래프 Kolmogorov-Arnold 네트워크 프레임워크를 제안합니다. 이 방법은 기존 그래프 합성곱 신경망(GCN)의 세 가지 핵심 제한을 해결합니다: 국소 수용 영역 제한, 스펙트럼 편향(spectral bias), 그리고 고정 활성화 함수의 표현 능력 부족. PoseKAN은 그래프 간선에서 고정 활성화 함수 대신 학습 가능한 함수 변환을 사용하고, 다중 홉 특징 집계 메커니즘을 결합하여 국소 및 원거리 관절 의존성을 효과적으로 모델링합니다. Human3.6M 및 MPI-INF-3DHP 벤치마크 데이터셋에 대한 실험은 이 방법이 최첨단 방법과 동등한 성능을 달성함을 보여줍니다.
3D 인간 자세 추정은 2D 이미지 또는 비디오에서 신체 관절의 3D 좌표를 추론하는 것을 목표로 하며, 인간의 움직임 이해에 매우 중요하지만 입력 데이터의 내재적 깊이 모호성과 폐색 문제로 인해 극도로 도전적입니다.
- 광범위한 응용: 인간-컴퓨터 상호작용, 동작 인식, 스포츠 분석, 의료 재활 등의 분야
- 기술적 도전: 단안 이미지의 깊이 정보 부재, 자체 폐색, 복잡한 자세 변화
GCN 방법의 세 가지 주요 한계:
- 국소 수용 영역 제한: 주로 1-홉 이웃 집계에 의존하여 원거리 관절 간의 장거리 의존성 포착이 어려움
- 스펙트럼 편향 문제: MLP를 핵심 구성 요소로 사용하기 때문에 저주파 성분을 학습하는 경향이 있으며 고주파 세부 사항(빠른 움직임, 정교한 관절 상호작용 등)을 포착하기 어려움
- 표현 능력 부족: 미리 정의된 고정 활성화 함수와 훈련 가능한 가중치 행렬을 사용하여 동적 적응성과 해석 가능성이 부족함
Kolmogorov-Arnold 표현 정리에서 영감을 받아, KAN 네트워크는 고정 활성화 함수를 학습 가능한 단변량 함수로 대체하여 더 강력한 함수 근사 능력과 해석 가능성을 제공합니다. 본 논문은 KAN을 그래프 학습 영역으로 확장하여 3D 자세 추정의 2D-to-3D 향상 작업에 특화시킵니다.
- PoseKAN 프레임워크 제안: Kolmogorov-Arnold 네트워크를 그래프 구조 데이터로 확장하여 3D 인간 자세 추정에 처음 적용하며, 학습 가능한 함수 기반 변환을 통해 모델의 적응성과 일반화 능력을 향상시킵니다.
- 다중 홉 특징 전파 메커니즘 설계: 국소 및 전역 특징 집계의 균형을 제어하는 스케일 매개변수 s를 도입하고, 전파 행렬 P = (1-s) + s²를 통해 1-홉 및 2-홉 이웃을 동시에 고려하여 폐색 및 깊이 모호성에 대한 견고성을 향상시킵니다.
- 혁신적 아키텍처 설계:
- 잔차 PoseKAN 블록을 통한 깊은 특징 정제
- 전역 응답 정규화(GRN)로 특징 선택성 및 대비도 향상
- GELU 비선형성 결합으로 표현 능력 강화
- 포괄적 실험 검증: Human3.6M 및 MPI-INF-3DHP 데이터셋에서 상세한 비교 실험 및 제거 연구를 수행하여 방법의 효과성을 입증합니다.
훈련 집합 D = {(xᵢ, yᵢ)}ᴺᵢ₌₁이 주어졌을 때:
- 입력: xᵢ ∈ ℝ² - 2D 관절 위치(기성 2D 자세 검출기에서 제공)
- 출력: yᵢ ∈ ℝ³ - 대응하는 실제 3D 관절 위치
- 목표: 회귀 모델 fω: X → Y의 매개변수 ω 학습
인간 골격은 그래프 G = (V, E, X)로 표현됩니다:
- V = {1,...,J} - J개의 노드(관절)
- E ⊆ V × V - 간선 집합
- X ∈ ℝᴶˣᶠ - 노드 특징 행렬
- A - 인접 행렬, Â = D⁻¹/²AD⁻¹/² - 정규화된 인접 행렬
KAN 계층의 핵심은 학습 가능한 활성화 함수로 정의됩니다:
ϕ(x) = wᵦb(x) + wₛspline(x)
여기서:
- b(x) = SiLU(x) = x/(1+e⁻ˣ) - sigmoid 선형 단위
- spline(x) = Σᵢ cᵢBᵢ(x) - B-스플라인 기저 함수의 가중 합
- wᵦ, wₛ, cᵢ - 학습 가능한 매개변수
본 논문에서 제안한 혁신적 스펙트럼 조절 필터:
hₛ(λ) = 1/((1+s)λ - sλ²)
여기서 s ∈ (0,1)은 스케일 매개변수로, 필터의 다양한 주파수 성분에 대한 감쇠 동작을 제어합니다. 이 필터는 자적응형 저역 통과 특성을 가집니다.
고정점 반복을 통해 해결:
H⁽ᵗ⁺¹⁾ = ((1-s)I + sÂ)ÂH⁽ᵗ⁾ + X
핵심 계층별 업데이트 공식:
H⁽ˡ⁺¹⁾ = KAN⁽ˡ⁾(((1-s) + s²)H⁽ˡ⁾ + X)
두 가지 작업으로 분해 가능:
특징 전파:
G⁽ˡ⁾ = PH⁽ˡ⁾ + X
여기서 P = (1-s) + s²는 전파 행렬로, 1-홉 및 2-홉 이웃 정보의 균형을 맞춥니다.
특징 임베딩:
H⁽ˡ⁺¹⁾ = KAN⁽ˡ⁾(G⁽ˡ⁾)
각 그래프 간선은 학습 가능한 단변량 함수와 연관됩니다.
- 초기 PoseKAN 계층: 2D 입력을 잠재 공간으로 매핑
- 4개의 잔차 PoseKAN 블록: 각 블록 포함
- 계층적 특징 학습을 위한 5개의 PoseKAN 계층
- 훈련 안정화를 위한 계층 정규화
- 추가 PoseKAN 계층 + GELU 비선형성
- 기울기 소실 방지를 위한 잔차 연결
- 전역 응답 정규화(GRN): 예측 전 특징 진폭 보정
- 종료 PoseKAN 계층: 3D 자세 공간으로 투영
혼합 손실 함수(탄성 네트 영감):
L = 1/N(1-α)Σᵢ||yᵢ - ŷᵢ||₂² + αΣᵢ||yᵢ - ŷᵢ||₁
여기서 α ∈ 0,1은 MSE와 MAE의 가중치 균형을 제어합니다.
- GCN: 고정 활성화 함수(예: ReLU)와 훈련 가능한 가중치 행렬 사용, 본질적으로 노드 수준의 선형 매핑
- PoseKAN: 간선에서 학습 가능한 단변량 함수 사용, 데이터 기반의 자적응형 특징 변환 제공, 더 강력한 표현 능력
전파 행렬 P = (1-s) + s²를 통해:
- 1-홉 및 2-홉 이웃 정보를 명시적으로 결합
- 매개변수 s로 국소 vs 전역 정보의 균형 조절 가능
- ² 명시적 계산 회피(오른쪽에서 왼쪽으로 곱셈 전략 사용)
KAN의 함수 기반 변환은 저주파 및 고주파 성분을 동시에 포착할 수 있습니다:
- 저주파: 매끄럽고 점진적인 관절 위치 변화(예: Walking, Eating)
- 고주파: 빠르고 급격한 움직임(예: Greeting의 갑작스러운 동작)
- 시간 복잡도: O(L||Â||₀F + LGF²)
- 첫 번째 항: 특징 전파(그래프 간선 수에 따라 결정)
- 두 번째 항: KAN 변환(G는 그리드 크기)
- 공간 복잡도: O(LJF + 2kGLF²)
k와 G가 일반적으로 작으므로 추가 오버헤드는 제어 가능합니다.
- 규모: 11명의 배우(남성 6명, 여성 5명), 15가지 실내 활동
- 수집: 50Hz, 4개의 동기화된 카메라
- 주석: 모션 캡처를 통한 정확한 3D 관절 좌표
- 분할:
- 훈련 집합: 5명의 배우(S1, S5, S6, S7, S8)
- 테스트 집합: 2명의 배우(S9, S11)
- 전처리: 정규화, 고관절을 근 관절로 영점 중심화
- 규모: 8명의 배우(남성 4명, 여성 4명), 8개의 활동 시퀀스
- 수집: 14개의 다양한 각도, 실내외 장면
- 특징: Human3.6M보다 더 다양하며, 기본 동작부터 동적 고강도 동작 포함
- 프로토콜 #1: MPJPE(평균 관절당 위치 오차) - 밀리미터 단위
- 프로토콜 #2: PA-MPJPE(Procrustes 정렬 후 MPJPE) - 오차
- PCK(정확한 키포인트 백분율): 정확한 키포인트 백분율
- AUC(곡선 아래 면적): 곡선 아래 면적
- GCN 시리즈: SemGCN, High-order GCN, CompGCN, Modulated GCN, Group GCN, MM-GCN, Flex-GCN
- 혼합 방법: GraphMLP(MLP와 GCN 결합)
- 기타: HOIF-Net, PoseGraphNet, WSGN 등
- 하드웨어: 단일 NVIDIA RTX A4500 GPU (20GB)
- 프레임워크: PyTorch
- 최적화기: AMSGrad
- 훈련 에포크: 30 에포크
- 학습률: 초기 0.001, 4 에포크마다 0.99 감쇠
- 배치 크기: 64
- 임베딩 차원: F = 240
- 주요 하이퍼매개변수: s = 0.2, α = 0.03(그리드 검색으로 결정)
- 정규화: 각 PoseKAN 계층 후 드롭아웃=0.2
- 스플라인 설정: 차수=3, 그리드 크기=5
전체 성능:
- PoseKAN: 46.7mm(최적)
- GraphMLP: 48.0mm(두 번째)
- Modulated GCN: 49.4mm
- 상대 오차 감소:
- vs GraphMLP: 2.7%
- vs Modulated GCN: 5.47%
- vs High-order GCN: 15.99%
주요 동작 성능(폐색 도전):
- Eating: 44.4mm(다른 방법보다 현저히 우수)
- Sitting: 54.6mm
- Smoking: 46.1mm
- 15개 동작 중 14개에서 Modulated GCN 능가
전체 성능:
- PoseKAN: 38.3mm(최적)
- GraphMLP: 38.4mm(상대 오차 감소 0.26%)
- Modulated GCN: 39.1mm(상대 오차 감소 2.04%)
- High-order GCN: 43.7mm(상대 오차 감소 12.35%)
우수 동작:
- 15개 동작 중 11개에서 GraphMLP 능가
- 15개 동작 중 13개에서 Modulated GCN 능가
- 특히 Greeting, Sitting, Smoking 등 폐색이 심한 장면에서 뛰어난 성능
Human3.6M에서 훈련, MPI-INF-3DHP에서 테스트:
- PCK: 86.0%(최고)
- AUC: 52.9%(두 번째, ICFNet의 54.3%에만 뒤짐)
- ICFNet 대비 PCK 상대 개선: 0.5%
- MPJPE: 33.51mm
- 상대 오차 감소:
- vs SemGCN: 19.62%
- vs High-order GCN: 14.29%
- vs GraphMLP: 2.01%
- PA-MPJPE: 28.01mm(최적)
| 구성 | MPJPE | PA-MPJPE |
|---|
| IRC 없음 | 34.44mm | 28.79mm |
| IRC 있음 | 33.51mm | 28.01mm |
| 개선 | 1.65% | 1.49% |
결론: IRC는 초기 특징을 보존하여 훈련을 안정화하고 정보 손실을 방지합니다.
- 차수 2: MPJPE=47.43mm, PA-MPJPE=38.86mm
- 차수 3: MPJPE=46.77mm, PA-MPJPE=38.36mm(최적)
- 차수 4: MPJPE=47.10mm, PA-MPJPE=38.59mm
결론: 차수 3이 최적의 균형을 달성하며, 더 높은 차수는 복잡도 증가 없이 이점이 없습니다.
- 크기 4: MPJPE=47.40mm, PA-MPJPE=38.91mm
- 크기 5: MPJPE=46.77mm, PA-MPJPE=38.36mm(최적)
- 크기 6: MPJPE=47.98mm, PA-MPJPE=39.11mm
결론: 그리드 크기 5는 충분한 함수 근사 능력을 제공합니다.
테스트 범위: s ∈ {0.1, 0.2, 0.3, 0.5, 0.7, 0.9}
- 최적값: s=0.2
- 작은 s는 국소 정보를 더 강조하면서 동시에 원거리 노드를 적절히 고려
- s가 너무 크거나 작으면 성능 저하
- 224: MPJPE=47.38mm
- 240: MPJPE=46.77mm(최적)
- 256: MPJPE=47.29mm
결론: 240차원은 과적합 없이 충분한 표현 능력을 제공합니다.
정성적 시각화(그림 2)는 다양한 동작 범주에서 PoseKAN의 예측을 보여줍니다:
- 예측된 3D 자세는 실제 값과 높은 정렬도를 보임
- 자체 폐색 장면(교차 팔, 앉은 자세 등)에서 GraphMLP보다 우수한 성능
- GraphMLP는 때때로 부자연스러운 관절 위치를 생성하는 반면, PoseKAN은 골격 구조 일관성 유지
- 정확한 관절 배치 및 자연스러운 사지 관절은 모델의 깊이 모호성 완화 능력을 검증합니다.
- 학습 가능한 함수의 명확한 우수성: 고정 활성화 함수와 비교하여 간선의 학습 가능한 함수는 더 강력한 적응성 제공
- 다중 홉 집계의 중요성: 폐색 및 복잡한 자세 처리에 현저한 개선
- 높은 매개변수 효율성: PoseKAN은 5.72M 매개변수로 GraphMLP의 9.49M보다 훨씬 낮음
- 강력한 크로스 데이터셋 일반화 능력: MPI-INF-3DHP에서의 성능은 우수한 일반화 능력을 입증
- 고주파 세부 사항에 민감: 빠른 움직임 세부 사항이 필요한 동작(예: Greeting)에서 명확한 우위
- 이미지에서 3D 관절 좌표로 직접 회귀
- 대표: Integral Human Pose Regression, Compositional Human Pose Regression
- 한계: 폐색에 취약, 정확도 낮음
- 첫 번째 단계: 2D 관절 위치 검출
- 두 번째 단계: 3D 공간으로 향상
- 대표: SimpleBaseline, LCN
- 우점: 모듈식 설계, 최적의 2D 검출기 선택 가능, 견고성 우수
- 본 논문은 이 범주에 속함
- SemGCN: 3D 자세 추정에 GCN을 처음 적용
- 한계: 1-홉 이웃 집계, 국소 수용 영역
- High-order GCN: 다중 홉 이웃으로 확장
- Modulated GCN: 인접 행렬 조절, 추가 간선 학습
- GroupGCN: 그룹 그래프 합성곱
- MM-GCN: 다중 홉 조절 GCN, 다중 홉 이웃 정보 융합
- GraphMLP: MLP와 GCN 결합, 전역 및 국소 골격 상호작용 활용
- 한계: 여전히 고정 활성화 함수 사용, 스펙트럼 편향 존재
- 이론적 기초: Kolmogorov-Arnold 표현 정리(모든 연속 다변량 함수는 단변량 함수의 유한 조합으로 표현 가능)
- KAN 네트워크: 고정 활성화를 학습 가능한 단변량 함수로 대체, 해석 가능성 및 적응성 향상
- KAGNN: 최근 KAN을 그래프 학습으로 확장(노드/그래프 분류, 링크 예측)
- 본 논문 혁신: 3D 자세 추정의 2D-to-3D 향상 작업에 KAN을 처음 적용
- vs 표준 GCN: 학습 가능한 함수 vs 고정 활성화, 다중 홉 집계 vs 1-홉
- vs 고차 GCN: 자적응형 함수 변환 vs 고정 고차 합성곱
- vs GraphMLP: 스펙트럼 편향 완화, 더 강력한 표현 능력
- vs KAGNN: 자세 추정에 특화된 설계, 스펙트럼 조절 필터 도입
- 방법의 효과성: PoseKAN은 Human3.6M 및 MPI-INF-3DHP 데이터셋에서 최첨단 방법과 동등하거나 초과하는 성능 달성
- 핵심 우위:
- 학습 가능한 함수는 더 강력한 적응성 및 표현 능력 제공
- 다중 홉 특징 집계는 장거리 의존성 효과적 포착
- 스펙트럼 편향 완화, 저주파 및 고주파 성분 동시 학습
- 실용성: 매개변수 효율성 높음(5.72M), 계산 오버헤드 제어 가능, 실제 응용에 적합
- 일반화 능력: 크로스 데이터셋 평가에서 우수한 성능, 우수한 일반화 능력 입증
- 해석 가능성 도전: GCN보다 더 해석 가능하지만, 각 학습 가능한 활성화 함수가 골격의 다양한 부분에 어떻게 적응하는지 시각화하기는 여전히 도전적
- 계산 비용: 학습 가능한 활성화는 각 계층의 계산 오버헤드 증가, 스플라인 기저 함수는 추가 메모리 필요
- 메모리 소비: 대규모 데이터셋 및 깊은 네트워크 훈련 시 메모리 요구사항 증가
- 최적화 공간: 계산 효율성, 해석 가능성 및 견고성 추가 개선 필요
- 단인 자세 제한: 현재 단인 자세만 처리, 다중 인물 장면으로 확장 미흡
- 2D 검출 의존성: 성능은 2D 자세 검출기 품질에 의존
- 정적 그래프 구조: 간선 가중치 학습에도 불구하고 토폴로지는 미리 정의됨
- 하이퍼매개변수 민감성: s, α 등 하이퍼매개변수는 신중한 조정 필요
- 다중 인물 자세 추정: 다중 인물 장면으로 확장, 인간 간 상호작용 처리
- 기타 그래프 학습 작업: 동작 인식, 이상 탐지 등
- 시간 시퀀스 모델링: 비디오 시퀀스의 시간 정보 결합
- 엔드-투-엔드 학습: 2D 검출 및 3D 향상 공동 최적화
- 자적응형 그래프 구조: 미리 정의된 토폴로지 대신 동적 그래프 학습
- 경량화 설계: 모바일 장치용 모델 압축
- 이론적 혁신: KAN을 3D 자세 추정의 그래프 학습에 처음 확장, 견고한 이론적 기초
- 기술적 혁신: 스펙트럼 조절 필터 설계 정교함, 다중 홉 집계 메커니즘 효과적
- 아키텍처 혁신: 잔차 PoseKAN 블록과 GRN의 조합 설계 합리적
- 데이터셋 다양성: Human3.6M(실내) + MPI-INF-3DHP(실내외)
- 비교 포괄성: 10개 이상의 최첨단 방법과 비교
- 제거 상세함: IRC, 스플라인 차수, 그리드 크기, 스케일 인자, 임베딩 차원 등
- 정성적 분석: 시각화 사례 비교 제공
- 성능 우위: 다양한 지표에서 SOTA 달성 또는 근접
- 일관성 우수: 크로스 데이터셋, 크로스 프로토콜 성능 안정적
- 통계적 유의성: 상대 오차 감소 폭 명확(최대 19.62%)
- 매개변수 효율성: 5.72M 매개변수로 GraphMLP의 9.49M 능가
- 구조 명확성: 논리 엄밀, 동기에서 방법에서 실험으로 단계적 진행
- 수학적 엄밀성: 공식 유도 완전, 기호 정의 명확
- 그래프 풍부성: 아키텍처 도표, 비교 표, 제거 그래프 완비
- 보충 자료: 상세한 부록 설명 제공
- 계산 오버헤드: 저자는 제어 가능하다고 주장하지만, 스플라인 계산 및 함수 학습은 실제로 복잡도 증가
- 메모리 요구사항: O(2kGLF²)의 메모리 복잡도는 대규모 응용에서 병목 가능성
- 단인 제한: 다중 인물 장면 미처리, 실제 응용 범위 제한
- 하이퍼매개변수 검색: s=0.2, α=0.03은 그리드 검색으로 결정되었으나 검색 범위 및 과정 미보고
- 통계 검증: 유의성 검증(t-검정 등) 부재
- 실패 사례: 모델 실패의 전형적 사례 및 원인 분석 미제시
- 해석 가능성: GCN보다 더 해석 가능하다고 주장하지만 구체적 함수 시각화 또는 분석 부재
- 주파수 분석: 스펙트럼 편향 완화 언급하나 정량적 주파수 분석 증거 부족
- 오차 분포: 다양한 관절, 다양한 동작의 오차 분포 패턴 분석 미흡
- 입력 일관성: 동일 2D 검출기 사용하나 검출기 오차가 결과에 미치는 영향 미보고
- 구현 세부사항: 기준선 방법은 다양한 훈련 전략 사용 가능, 공정한 비교에 영향
- 이론적 기여: KAN을 그래프 기반 자세 추정에 도입, 새로운 방향 개척
- 방법적 기여: 스펙트럼 조절 필터 및 다중 홉 집계 메커니즘은 기타 그래프 작업으로 이전 가능
- 실증적 기여: 표준 데이터셋에서 새로운 성능 기준 수립
- 성능 향상: 상대 개선 2-19%, 실제 응용에 의미 있음
- 매개변수 효율성: 5.72M 매개변수 적당, 배포 가능
- 한계: 단인 제한 및 계산 오버헤드는 실시간 응용 제한
- 코드 공개: GitHub 링크 제공, 복현 및 응용 용이
- 세부사항 충분: 하이퍼매개변수, 훈련 전략, 네트워크 구성 상세
- 코드 공개: 코드 공개 약속
- 데이터 표준: 공개 데이터셋 및 표준 프로토콜 사용
- 잠재적 문제: KAN 구현 세부사항(스플라인 계산)은 기술적 난제 가능
- 높은 정확도 요구 장면: 스포츠 분석, 의료 진단 등 정확도 요구 높은 응용
- 폐색 심각 장면: 다중 홉 집계 메커니즘이 폐색 상황에서 우위 명확
- 복잡 동작 분석: 고주파 세부 사항 포착 능력은 빠르고 복잡한 동작에 적합
- 오프라인 처리: 실시간성 요구 없으나 높은 정확도 필요한 장면
- 실시간 응용: 계산 오버헤드 상대적으로 높아 실시간 처리 부적합
- 다중 인물 장면: 현재 아키텍처는 다중 인물 상호작용 미고려
- 자원 제한 장치: 메모리 요구사항 높아 모바일 장치 부적합
- 대규모 배포: 훈련 및 추론 비용은 대규모 응용 제한 가능
- 비디오 시퀀스: 시간 시퀀스 모델링으로 확장 가능
- 기타 그래프 작업: 동작 인식, 인간 메시 재구성 등
- 다중모달 융합: RGB, 깊이, IMU 등 다중 소스 데이터 결합
- 전이 학습: 사전 훈련 모델을 기타 자세 추정 작업으로 이전
- Liu et al., 2025 - KAN: Kolmogorov-Arnold networks (ICLR 2025) - KAN 원본 제안
- Zhao et al., 2019 - SemGCN - GCN을 3D 자세 추정에 처음 적용
- Zou & Tang, 2021 - Modulated GCN - 인접 행렬 조절 방법
- Li et al., 2025 - GraphMLP - 최강 기준선 중 하나
- Bresson et al., 2025 - KAGNNs - 그래프 학습에서 KAN 응용
- Ionescu et al., 2013 - Human3.6M dataset - 표준 평가 데이터셋
- Martinez et al., 2017 - SimpleBaseline - 2D-to-3D 향상의 고전 방법
- 혁신성: 9/10
- 기술 품질: 8/10
- 실험 충분성: 8/10
- 작성 품질: 9/10
- 실용 가치: 7/10
- 종합 평가: 8.2/10
추천 지수: ★★★★☆ (강력 추천, 특히 그래프 신경망 및 3D 비전에 관심 있는 연구자)