2025-11-18T11:22:13.563574

TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design

Zhou, Kämpfe, Ni et al.
Compute-in-memory (CiM) emerges as a promising solution to solve hardware challenges in artificial intelligence (AI) and the Internet of Things (IoT), particularly addressing the "memory wall" issue. By utilizing nonvolatile memory (NVM) devices in a crossbar structure, CiM efficiently accelerates multiply-accumulate (MAC) computations, the crucial operations in neural networks and other AI models. Among various NVM devices, Ferroelectric FET (FeFET) is particularly appealing for ultra-low-power CiM arrays due to its CMOS compatibility, voltage-driven write/read mechanisms and high ION/IOFF ratio. Moreover, subthreshold-operated FeFETs, which operate at scaling voltages in the subthreshold region, can further minimize the power consumption of CiM array. However, subthreshold-FeFETs are susceptible to temperature drift, resulting in computation accuracy degradation. Existing solutions exhibit weak temperature resilience at larger array size and only support 1-bit. In this paper, we propose TReCiM, an ultra-low-power temperature-resilient multibit 2FeFET-1T CiM design that reliably performs MAC operations in the subthreshold-FeFET region with temperature ranging from 0 to 85 degrees Celcius at scale. We benchmark our design using NeuroSim framework in the context of VGG-8 neural network architecture running the CIFAR-10 dataset. Benchmarking results suggest that when considering temperature drift impact, our proposed TReCiM array achieves 91.31% accuracy, with 1.86% accuracy improvement compared to existing 1-bit 2T-1FeFET CiM array. Furthermore, our proposed design achieves 48.03 TOPS/W energy efficiency at system level, comparable to existing designs with smaller technology feature sizes.
academic

TReCiM: 저전력 및 온도 탄성 멀티비트 2FeFET-1T 컴퓨트-인-메모리 설계

기본 정보

  • 논문 ID: 2501.01052
  • 제목: TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design
  • 저자: Yifei Zhou, Thomas Kämpfe, Kai Ni, Hussam Amrouch, Cheng Zhuo, Xunzhao Yin
  • 분류: cs.ET (신흥 기술)
  • 발표 시간: 2025년 1월
  • 논문 링크: https://arxiv.org/abs/2501.01052

초록

컴퓨트-인-메모리(CiM)는 인공지능 및 사물인터넷 하드웨어 문제, 특히 "메모리 벽" 문제를 해결하기 위한 유망한 솔루션으로 주목받고 있습니다. 크로스바 어레이 구조에서 비휘발성 메모리(NVM) 장치를 사용함으로써 CiM은 신경망의 핵심 연산인 곱셈-누적(MAC) 연산을 효율적으로 가속화할 수 있습니다. 다양한 NVM 장치 중에서 철전기 전계 효과 트랜지스터(FeFET)는 CMOS 호환성, 전압 구동 쓰기/읽기 메커니즘, 높은 ION/IOFF 비율로 인해 초저전력 CiM 어레이에 특히 적합합니다. 서브임계 동작 영역의 FeFET은 전력 소비를 더욱 최소화할 수 있지만, 온도 드리프트에 의해 영향을 받아 계산 정확도가 저하됩니다. 본 논문은 TReCiM을 제안하며, 이는 0°C에서 85°C 온도 범위에서 안정적으로 MAC 연산을 수행할 수 있는 초저전력, 온도 탄성 멀티비트 2FeFET-1T CiM 설계입니다. NeuroSim 프레임워크를 사용하여 VGG-8 신경망 및 CIFAR-10 데이터셋에서의 벤치마크 결과는 온도 드리프트 영향을 고려할 때 TReCiM 어레이가 91.31%의 정확도를 달성하며, 기존 1비트 2T-1FeFET CiM 어레이보다 1.86% 향상됨을 보여줍니다. 또한 이 설계는 시스템 수준에서 48.03 TOPS/W의 에너지 효율을 달성하여 더 작은 공정 기술 노드의 기존 설계와 경쟁할 수 있습니다.

연구 배경 및 동기

문제 배경

  1. 메모리 벽 문제: 전통적인 폰 노이만 아키텍처는 처리 단위와 저장 단위 간의 빈번한 데이터 전송으로 인한 높은 전력 소비 및 성능 병목 현상에 직면
  2. 엣지 AI 요구사항: AI 및 IoT 애플리케이션은 대량의 MAC 연산을 필요로 하며 매우 높은 에너지 효율을 요구
  3. 기존 CiM의 한계: 컴퓨트-인-메모리 기술이 메모리 벽 문제를 해결할 수 있지만, 기존 설계는 온도 탄성 및 멀티비트 저장 측면에서 부족

연구 동기

  1. FeFET의 장점: FeFET은 CMOS 호환성, 낮은 누설 전류, 높은 ION/IOFF 비율 등의 장점을 가지며 초저전력 애플리케이션에 적합
  2. 서브임계 동작: 서브임계 영역에서의 동작은 전력 소비를 크게 줄일 수 있지만 온도 민감성 증가
  3. 기존 솔루션의 한계:
    • 기존 온도 탄성 설계는 대규모 어레이에서 성능 저하
    • 1비트 저장만 지원하여 저장 밀도 제한
    • 2T-1FeFET 설계는 추가 방전 시간 필요로 지연 증가

핵심 기여

  1. TReCiM 아키텍처 제안: 0°C-85°C 온도 범위를 지원하는 첫 번째 온도 탄성 멀티비트 2FeFET-1T CiM 설계
  2. 혁신적인 2FeFET 클램핑 구조: 상보 절대 온도(CTAT) 특성을 활용한 온도 보상 구현
  3. 멀티비트 저장 능력: FeFET의 멀티레벨 셀(MLC) 특성을 활용한 2비트 이상 저장 구현
  4. 시스템 수준 검증: NeuroSim 프레임워크 기반의 완전한 시스템 수준 평가 및 벤치마크
  5. 성능 향상: 기존 방안 대비 온도 탄성 측면에서 3배 향상, 에너지 효율 48.03 TOPS/W 달성

방법 상세 설명

작업 정의

넓은 온도 범위(0°C-85°C)에서 안정적으로 작동할 수 있는 초저전력 멀티비트 CiM 어레이를 설계하여 신경망 MAC 연산을 지원하면서 높은 정확도와 에너지 효율을 유지합니다.

모델 아키텍처

2FeFET-1T 셀 설계

![셀 구조](논문 그림 2 설명 기반)

핵심 구성 요소:

  • M1, M2: 클램핑 구조를 형성하는 두 개의 FeFET 장치
  • M3: 출력 제어로 작용하는 NMOS 트랜지스터
  • 제어 신호: WL1, WL2(워드선), DL(데이터선), BL(비트선), SL(소스선)

동작 원리:

  1. 쓰기 동작: WL1 및 WL2를 통해 서로 다른 전압(±4V)을 인가하여 FeFET 상태 설정
  2. 읽기 동작: WL 전압 제어를 통해 MAC 연산 구현
  3. 온도 보상: MOSFET의 CTAT 특성 및 피드백 메커니즘 활용

멀티비트 저장 구현

  • 상태 '0': M2는 VTH1 상태, M1은 VTH0 상태
  • 상태 '1': M1과 M2 모두 VTH1 상태(클램핑 구성)
  • 상태 '2' 이상: M1은 서로 다른 VTH 상태, M2는 오프

기술 혁신 포인트

1. 2FeFET 클램핑 구조

저장 상태 '1'일 때:
- M1과 M2가 분압기 형성
- 중간 노드 VS 전압이 안정적으로 클램핑됨
- 온도 드리프트 영향 크게 감소

2. CTAT 온도 보상 메커니즘

서브임계 영역 MOSFET 누설 전류 공식:

ID = I0 * exp(Vgs / (ξVT))
여기서 VT = kT/q

온도 피드백 메커니즘:

  • 온도 상승 → M1 누설 전류 증가 → VS 전압 상승 → M3 출력 전류 증가
  • 하지만 CTAT 특성으로 인해 전류 증가폭이 억제되어 출력 변동 감소

3. 어레이 수준 설계

  • 8행×다중열 구조: 병렬 MAC 연산 지원
  • 플래시 ADC: 전류 감지 증폭기를 사용하여 감지 지연 감소
  • 공유 ADC: 8열이 하나의 3비트 ADC를 공유하여 면적과 성능 균형

실험 설정

시뮬레이션 환경

  • SPICE 시뮬레이션: Intel FinFET 모델 및 Preisach FeFET 컴팩트 모델 사용
  • NeuroSim 프레임워크: 서브임계 FeFET 및 온도 효과 지원하도록 수정
  • 공정 노드: 45nm 기술 노드
  • 전원 전압: 서브임계 설계 Vdd=0.8V, 포화 설계 Vdd=1.0V

데이터셋

  • 신경망: VGG-8 아키텍처
  • 데이터셋: CIFAR-10
  • 네트워크 구조: 6개 합성곱 층 + 2개 완전 연결 층
  • 양자화: WAGE 모델을 사용한 하드웨어 양자화

평가 지표

  1. 온도 탄성: 노이즈 마진율(NMR) 및 최소 NMR 값
  2. 정확도: 신경망 추론 정확도
  3. 에너지 효율: TOPS/W (와트당 조 연산)
  4. 면적: 칩 면적 활용률
  5. 처리량: 연산 속도

비교 방법

  • 1FeFET-1R: 기본 단일 FeFET 설계
  • 2T-1FeFET: 기존 온도 탄성 설계
  • 기타 NVM: RRAM, PCM 등 기술

실험 결과

주요 결과

온도 탄성 검증

  • 1비트 TReCiM: NMRmin = 0.291 (0-85°C), NMRmin = 2.6 (20-85°C)
  • 온도 탄성 향상: 1FeFET-1R 설계 대비 3배 향상
  • 2T-1FeFET 대비: 1.06배 향상

신경망 성능

설계 방안정확도에너지 효율(TOPS/W)비트폭
TReCiM (1-bit)92.00%26.061
TReCiM (2-bit)91.31%48.032
2T-1FeFET~89.45%~21.01
1FeFET-1R (서브임계)<85%~15.01

절제 실험

공정 변동성 영향

  • 몬테카를로 시뮬레이션: 500회 실행, σVT = 54mV
  • 상태 '1': 100% 정확도, 변동성 3.89%만
  • 상태 '2': 변동성 20.8%
  • 상태 '3': 변동성 17.1%

온도 특성 분석

서로 다른 저장 상태의 온도 민감성:

  • 상태 '1': 온도 드리프트 무시할 수 있음(클램핑 효과)
  • 상태 '2': 최대 변동 32.9%
  • 상태 '3' 이상: VTH 감소에 따라 온도 민감성 감소

사례 분석

VGG-8 네트워크에서 가중치 분포:

  • 가중치 '0': 27.2%
  • 가중치 '1': 24.1%
  • 가중치 '2': 23.5%
  • 가중치 '3': 25.2%

종합 변동성은 13.9%이며, 최종 추론 정확도는 91.31%에 도달합니다.

관련 연구

CiM 기술 발전

  1. NVM 기술: ReRAM, PCM, FeFET 등의 CiM 응용
  2. 서브임계 컴퓨팅: 전력 소비 감소하지만 온도 민감성 증가
  3. 온도 탄성 설계: 기존 방안은 주로 TCAM 및 간단한 CiM 구조에 집중

FeFET 연구 현황

  1. 장치 모델링: NCFET, Preisach, 몬테카를로 등의 모델
  2. 회로 응용: 주로 메모리 및 간단한 계산 단위에 집중
  3. 온도 효과: FeFET 성능에 대한 온도 영향을 다루는 연구는 소수

본 논문의 장점

기존 연구와 비교하여 본 논문이 처음으로 구현한 것:

  • 멀티비트 저장의 온도 탄성 CiM 설계
  • 시스템 수준의 온도 효과 모델링 및 검증
  • 신경망 애플리케이션에서의 완전한 평가

결론 및 논의

주요 결론

  1. 기술 타당성: 2FeFET-1T 구조가 온도 탄성 및 멀티비트 저장을 성공적으로 구현
  2. 성능 우위: 저전력 유지하면서 온도 탄성 크게 향상
  3. 시스템 가치: 실제 신경망 애플리케이션에서 설계의 효과성 검증

한계

  1. 부분 상태 민감성: 저장 상태 '2' 이상에서도 일정 온도 민감성 존재
  2. 공정 의존성: 성능은 FeFET 장치의 공정 성숙도에 의존
  3. ADC 오버헤드: 멀티비트 설계는 더 높은 정확도 ADC 필요로 면적 및 전력 소비 증가
  4. 온도 범위: 0-85°C를 커버하지만 극한 온도에서는 성능 저하

향후 방향

  1. 장치 최적화: 온도 민감성 감소를 위한 FeFET 장치 특성 추가 최적화
  2. 회로 개선: 더 높은 비트폭 저장의 온도 탄성 설계 탐색
  3. 시스템 통합: 온칩 온도 센서와 결합하여 동적 보상 구현
  4. 응용 확대: 더 많은 AI 애플리케이션 시나리오에서 설계 효과 검증

심층 평가

장점

  1. 높은 혁신성: 멀티비트 온도 탄성 FeFET CiM 설계를 처음 제안하며 기술 경로 신규
  2. 견고한 이론: CTAT 특성 기반 온도 보상 메커니즘이 견고한 물리적 기초 보유
  3. 충분한 검증: 장치에서 시스템 수준까지의 완전한 검증 체인
  4. 실용적 가치: 실제 신경망 애플리케이션에서 설계 가치 입증
  5. 우수한 성능: 에너지 효율 및 정확도 모두 선진 수준 달성

부족한 점

  1. 제한된 온도 보상: 고위 저장 상태에 대해 온도 보상 효과 제한적
  2. 복잡성 증가: 2FeFET 구조가 단일 FeFET 대비 설계 복잡도 증가
  3. 공정 요구사항: FeFET 장치 일관성에 대한 높은 요구
  4. 확장성: 더 큰 어레이 규모에서의 성능 표현 추가 검증 필요

영향력

  1. 학술적 가치: 온도 탄성 CiM 설계에 새로운 기술 경로 제공
  2. 산업적 의의: 엣지 AI 칩 설계에 중요한 참고 가치
  3. 기술 추진: FeFET의 CiM 응용 기술 발전 추진

적용 시나리오

  1. 엣지 AI: 전력 민감 엣지 추론 애플리케이션
  2. IoT 장치: 온도 변화가 큰 사물인터넷 환경
  3. 모바일 컴퓨팅: 에너지 효율 요구가 극히 높은 모바일 장치
  4. 산업 제어: 넓은 온도 범위에서 작동해야 하는 산업용 애플리케이션

참고 문헌

논문은 42개의 관련 참고 문헌을 인용하며, CiM 기술, FeFET 장치, 온도 효과, 신경망 가속기 등 여러 분야를 포괄하여 연구에 견고한 이론적 기초를 제공합니다. 주요 참고 문헌에는 NeuroSim 프레임워크, FeFET 모델링, 관련 CiM 설계 연구가 포함됩니다.


종합 평가: 이는 온도 탄성 CiM 설계 분야에서 중요한 기여를 한 고품질 기술 논문입니다. 논문의 기술 경로가 명확하고 실험 검증이 충분하며, FeFET의 AI 가속기 응용 추진에 중요한 의의를 가집니다. 일부 측면에서 개선 여지가 있지만, 전체적으로 해당 분야의 중요한 진전을 나타냅니다.