2025-11-13T22:01:14.187429

When Lifetimes Liberate: A Type System for Arenas with Higher-Order Reachability Tracking

He, Jia, Bao et al.

Static resource management in languages remains challenging due to tensions among control, expressiveness, and flexibility. Region-based systems [Grossman et al . 2002; Tofte et al. 2001] offer bulk deallocation via lexically scoped regions, where all allocations follow a stack discipline. However, both regions and their resources are second-class, and neither can escape its scope nor be freely returned. Ownership and linear type systems, exemplified by Rust [Clarke et al. 2013], offer non-lexical lifetimes and robust static guarantees, but rely on invariants that limit higher-order patterns and expressive sharing. In this work, we propose a new type system that unifies these strengths. Our system treats all heap-allocated resources as first-class values, while allowing programmers to control lifetime and granularity through three allocation modes: (1) fresh allocation for individual, non-lexical references; (2) subsequent coallocation grouping resources collectively within shadow arenas; and (3) scoped allocation with lexically bounded lifetimes following stack discipline. Regardless of mode, all resources share a uniform type and have no distinction for generic abstractions, preserving the higher-order parametric nature of the language. Obtaining static safety in higher-order languages with flexible sharing is nontrivial. We address this by extending reachability types [Wei et al. 2024] to collectively track first-class resources, and by adopting flow-insensitive deallocation reasoning for selective stack discipline. These mechanisms yield Aq<: and {A}q<: atop, both formalized and proven type safe and memory safe in Rocq.

academic

Когда Lifetimes Освобождают: Система Типов для Арен с Отслеживанием Достижимости Высшего Порядка

Основная информация

ID статьи: 2509.04253
Название: When Lifetimes Liberate: A Type System for Arenas with Higher-Order Reachability Tracking
Авторы: Siyuan He, Songlin Jia, Yuyan Bao, Tiark Rompf (Purdue University, Augusta University)
Классификация: cs.PL (Языки программирования)
Дата публикации: 10 октября 2025 г. (arXiv v2)
Ссылка на статью: https://arxiv.org/abs/2509.04253

Аннотация

Статическое управление ресурсами в языках программирования остаётся сложной задачей, главным образом из-за напряжения между управляемостью, выразительностью и гибкостью. Системы на основе регионов обеспечивают массовое освобождение через лексически ограниченные регионы, но сами регионы и их ресурсы являются объектами второго класса, не могут выходить за пределы области видимости или свободно возвращаться. Системы владения и линейных типов, представленные Rust, обеспечивают нелексические времена жизни и сильные статические гарантии, но зависимые инварианты ограничивают паттерны высшего порядка и выразительное совместное использование.

В данной работе предложена новая система типов, объединяющая эти преимущества. Система рассматривает все выделенные в кучу ресурсы как объекты первого класса, одновременно позволяя программистам контролировать время жизни и гранулярность через три режима выделения: (1) свежее выделение для отдельных нелексических ссылок; (2) последующее совместное выделение, группирующее ресурсы в теневых аренах; (3) выделение в области видимости с лексически ограниченным временем жизни, следующее дисциплине стека. Независимо от режима, все ресурсы совместно используют единый тип, без различий в обобщённых абстракциях, сохраняя параметрическую способность языка высшего порядка.

Исследовательский контекст и мотивация

Определение проблемы

Основная проблема, которую решает это исследование, — это реализация безопасного, гибкого и управляемого управления ресурсами в языках функционального программирования высшего порядка. Традиционные подходы сталкиваются со следующими дилеммами:

Компромисс между выделением в стеке и куче: Значения в стеке имеют строгое лексическое время жизни, безопасны и эффективны, но по сути являются объектами второго класса; выделение в куче создаёт свободно циркулирующие объекты первого класса, но жертвует предсказуемым контролем освобождения.
Ограничения существующих систем:
- Системы на основе регионов (MLKit, Cyclone): обеспечивают массовое освобождение, но регионы и ресурсы — объекты второго класса
- Системы типов владения (Rust): обеспечивают нелексические времена жизни, но ограничивают паттерны высшего порядка и выразительное совместное использование
- Системы типов достижимости: поддерживают функции высшего порядка, но ограничены структурой телескопов, не могут обрабатывать циклические структуры хранения

Исследовательская мотивация

Авторы стремятся объединить преимущества различных стратегий управления ресурсами: безопасность дисциплины стека, выразительность языков высшего порядка и гибкость рассмотрения ресурсов как объектов первого класса.

Основные вклады

Унифицированная обработка ресурсов: Все ресурсы памяти являются объектами первого класса с единственным типом ссылки, абстрагируя выделение в стеке и куче, позволяя клиентскому коду оставаться обобщённым относительно конкретной модели хранения ссылок.
Гибкость управления: Ресурсы памяти могут быть нелексическими или лексическими под контролем пользователя, могут быть отдельными или коллективными, без различия типов.
Статические гарантии безопасности: Типы достижимости отслеживают поток ресурсов памяти и гарантируют их безопасное использование; пользователи могут применять выборочную дисциплину стека через нечувствительное к потоку рассуждение для гарантии предсказуемого освобождения и отсутствия ошибок использования после освобождения.
Выразительные возможности высшего порядка: Система поддерживает функции высшего порядка с изменяемым совместным использованием и циклическими структурами хранения, превосходя выразительность предыдущих систем типов достижимости.

Подробное описание методов

Основные концепции

1. Теневые арены (Shadow Arenas)

Теневые арены — ключевое нововведение системы со следующими характеристиками:

Неявная идентификация: Арены не имеют явных имён или конструкторов в поверхностном синтаксисе, идентифицируются неявно через ссылки

Три формы выделения:

val fr = new Ref(42)           // свежее выделение
val ar = new Ref(42) scoped    // выделение в области видимости  
val a1 = new Ref(42) at ar     // совместное выделение

2. Грубозернистое отслеживание достижимости

Система использует двумерную модель хранения, где каждая ссылка индексируется местоположением арены и внутренним смещением (ℓ, o):

Достижимость отслеживается грубозернисто на уровне арены ℓ
Все объекты в одной арене совместно используют один и тот же идентификатор достижимости
Устраняет ограничения телескопов, поддерживает произвольные графы объектов внутри арены

Проектирование системы типов

Исчисление A^q<:

Базовая система расширяет исчисление F^q<: включением:

Нелексические теневые арены: поддерживают выход ссылок за пределы их лексической области видимости
Синтаксис совместного выделения: ref t1 at t2 размещает новую ссылку в существующей арене
Унифицированный тип ссылки: все формы выделения совместно используют тип Ref[T]^q

Исчисление {A}^q<:

Расширяет A^q<: добавлением управления ресурсами области видимости:

Выделение в области видимости: ref t as x in b создаёт лексически ограниченную ссылку
Нечувствительное к потоку рассуждение: обеспечивает безопасное освобождение через динамическое отслеживание локальных местоположений
Массовое освобождение: автоматически освобождает всю арену при завершении области видимости

Технические инновации

Ослабление структуры телескопов: позволяет циклические структуры внутри и между аренами через грубозернистое отслеживание
Унифицированная абстракция типов: устраняет различие типов между ресурсами первого и второго класса
Выборочная дисциплина стека: обеспечивает предсказуемое освобождение при сохранении нечувствительного к потоку рассуждения

Экспериментальная установка

Формальная верификация

Механизированные доказательства: все формальные результаты механизированы в Rocq
Безопасность типов: доказаны теоремы о прогрессе и сохранении
Безопасность памяти: гарантирует отсутствие ошибок использования после освобождения

Тематические исследования

Статья проверяет выразительность системы через три тематических исследования:

Регистрация обратных вызовов: демонстрирует, как нелексические арены поддерживают паттерны событийного программирования
Универсальный комбинатор неподвижной точки: доказывает, что система преодолевает ограничения предыдущих типов достижимости
Циклические структуры хранения: демонстрирует безопасное построение и сборку мусора многопрыжковых циклов

Результаты экспериментов

Основные результаты

Доказательства безопасности типов

Теорема 4.1 (Прогресс): Если [∅ | Σ] φ ⊢ t : Q и Σ ok,
то t — значение или существуют t', σ' такие, что t | σ → t' | σ'

Теорема 4.2 (Сохранение): Если типизированный терм выполняет редукцию,
то существует расширенное окружение типов такое, что результат редукции остаётся типизированным

Повышение выразительности

Сравнение с существующими системами показывает, что данная система достигает пересечения следующих свойств:

✓ Дисциплина стека
✓ Выразительное совместное использование
✓ Ресурсы первого класса
✓ Функции высшего порядка

Это первая работа, реализующая все эти атрибуты в унифицированной системе.

Анализ случаев

Паттерн регистрации обратных вызовов

val makeHandler = {
  val rp = new Ref() // нелексический пул ресурсов
  (cb: Int => Unit) => {
    val h = new Ref(cb) at rp
    h // возврат обработчика
  }
}

Демонстрирует использование нелексических арен для управления временем жизни обратных вызовов.

Обработка циклических структур

{ // начало области видимости
  val a = new Ref() scoped
  val c1, c2, c3 = new Ref(f) at a
  c1 := x => { (!c2)(x) } // образование цикла
  c2 := x => { (!c3)(x) }
  c3 := x => { (!c1)(x) }
} // массовое освобождение {a, c1, c2, c3}

Демонстрирует безопасное построение и освобождение циклических структур ссылок.

Связанные работы

Системы регионов/арен

MLKit: неявное управление регионами в функциональном языке
Cyclone: явные регионы и типы существования в языке стиля C
Линейные регионы: комбинирование линейных типов и концепции регионов

Владение и линейные типы

Rust: уникальное владение и единственный путь изменяемого доступа
Pony: неявные регионы и дробные возможности
Vergio: владение в сочетании с явными регионами

Типы достижимости

F^q<:: система полиморфных типов достижимости
λ^◦: расширение с поддержкой самоциклов
Типы захвата: система безопасности эффектов в Scala

Заключение и обсуждение

Основные выводы

Статья успешно объединяет типы достижимости, управление ресурсами на основе арен и дисциплину стека, обеспечивая лёгкую и выразительную основу для безопасного управления ресурсами в языках высшего порядка.

Ограничения

Ограничения построения циклов: хотя циклические структуры поддерживаются, требуется минимум две ячейки
Расширения, чувствительные к потоку: явное освобождение всё ещё требует дополнительного расширения эффектов, чувствительного к потоку
Сложность реализации: двумерная модель хранения увеличивает сложность реализации во время выполнения

Направления будущих исследований

Оптимизация производительности: исследование эффективной реализации двумерной модели хранения
Расширения для параллелизма: расширение системы на параллельные настройки
Интеграция в практические языки: реализация системы в реальных языках программирования

Глубокая оценка

Преимущества

Значительный теоретический вклад: первое объединение дисциплины стека, выразительного совместного использования, ресурсов первого класса и функций высшего порядка в унифицированной системе
Выдающиеся технические инновации: теневые арены и грубозернистое отслеживание достижимости — важные инновации
Формальная строгость: полные механизированные доказательства повышают надёжность результатов
Повышение выразительности: преодоление ограничений структуры телескопов в предыдущих системах типов достижимости

Недостатки

Ограниченная практичность: ещё не реализовано в реальных языках, практическая ценность требует проверки
Недостаточное рассмотрение производительности: отсутствует анализ влияния двумерной модели хранения на производительность
Крутая кривая обучения: сложность системы может повлиять на принятие программистами

Влияние

Эта работа имеет важное значение в теории языков программирования, обеспечивая новую теоретическую основу для управления ресурсами и может повлиять на проектирование будущих языков программирования. Особенно для системного программирования, требующего точного управления ресурсами, этот метод открывает новые возможности.

Применимые сценарии

Системное программирование: низкоуровневые системы, требующие точного управления памятью
Встроенные системы: безопасное программирование в среде с ограниченными ресурсами
Функциональные языки: языки функционального программирования высшего порядка, требующие возможностей управления ресурсами
Параллельные системы: безопасное совместное использование ресурсов в многопоточной среде

Библиография

Статья ссылается на важные работы в области теории языков программирования, включая:

Grossman et al. 2002: система регионов Cyclone
Tofte et al. 2001: рассуждение о регионах MLKit
Wei et al. 2024: полиморфные типы достижимости
Clarke et al. 2013: типы владения Rust
Bao et al. 2021: теория основ типов достижимости