Ontologies have become essential in today's digital age as a way of organising the vast amount of readily available unstructured text. In providing formal structure to this information, ontologies have immense value and application across various domains, e.g., e-commerce, where countless product listings necessitate proper product organisation. However, the manual construction of these ontologies is a time-consuming, expensive and laborious process. In this paper, we harness the recent advancements in large language models (LLMs) to develop a fully-automated method of extracting product ontologies, in the form of meronymies, from raw review texts. We demonstrate that the ontologies produced by our method surpass an existing, BERT-based baseline when evaluating using an LLM-as-a-judge. Our investigation provides the groundwork for LLMs to be used more generally in (product or otherwise) ontology extraction.
- ID статьи: 2510.13839
- Название: Meronymic Ontology Extraction via Large Language Models
- Авторы: Dekai Zhang (Imperial College London), Simone Conia (Sapienza University of Rome), Antonio Rago (Imperial College London & King's College London)
- Классификация: cs.CL cs.AI
- Дата публикации: 11 октября 2025 г. (препринт arXiv)
- Ссылка на статью: https://arxiv.org/abs/2510.13839
В данной работе используются последние достижения в области больших языковых моделей (LLM) для разработки полностью автоматизированного метода извлечения онтологии продуктов (в форме отношений часть-целое) из исходного текста отзывов. Исследование показывает, что онтология, созданная предложенным методом, превосходит существующие методы на основе BERT при оценке с использованием LLM в качестве судьи. Данное исследование закладывает основу для более широкого применения LLM в задачах извлечения онтологии.
В эпоху цифровизации огромные объемы неструктурированных текстовых данных требуют организации и структурирования с помощью онтологий. В частности, в сфере электронной коммерции многочисленные списки продуктов нуждаются в надлежащей структуре организации продуктов. Отношения часть-целое (мероними́ческие отношения) имеют важное значение для нижестоящих задач, таких как агрегирование отзывов, анализ тональности и вопросно-ответные системы по продуктам.
- Высокая стоимость ручного построения: Ручное построение онтологии — это трудоемкий, дорогостоящий и обременительный процесс
- Недостаточность существующих автоматизированных методов: Предыдущие исследования в основном сосредоточены на извлечении таксономических отношений, а не отношений часть-целое
- Сложность оценки: Отсутствие стандартных эталонных наборов данных затрудняет эффективную оценку качества мероними́ческой онтологии
- Зависимость от ручной разметки: Существующие методы, такие как метод на основе BERT (Oksanen et al., 2021), по-прежнему требуют определенной степени ручной разметки
Данная работа направлена на использование мощных возможностей LLM для разработки полностью автоматизированного метода извлечения мероними́ческой онтологии и предложения новой системы оценки для проверки эффективности метода.
- Предложение полностью автоматизированного метода на основе LLM: Разработан полностью автоматизированный метод использования LLM для извлечения мероними́ческой онтологии, который может обобщаться на различные категории продуктов
- Инновационная система оценки: Предложен новый метод эмпирической оценки различных задач извлечения мероними́ческой онтологии с использованием LLM в качестве судьи (LLM-as-a-judge)
- Проверка повышения производительности: Экспериментально доказано, что метод на основе LLM значительно превосходит методы на основе BERT по релевантности
- Открытый исходный код: Предоставлен полный код реализации для содействия воспроизводимости исследования
Входные данные: Текст отзывов о продуктах
Выходные данные: Граф мероними́ческой онтологии, содержащий узлы концепций и отношения "часть-целое" между ними
Ограничения: Отношения должны быть значимыми отношениями часть-целое, концепции должны быть релевантны продукту
Предложенный метод включает четыре основных этапа конвейера:
- Метод: Использование микронастройки Mistral-7B-Instruct-v0.2
- Данные обучения: Набор данных SemEval-2014 Task 4 (1600 образцов)
- Постобработка: Использование разметки частей речи (POS) для фильтрации, сохранение только существительных, фактически встречающихся в отзывах
- Контроль выхода: Выбор 50 наиболее частых аспектов
- Модель встраивания: Микронастроенная модель FastText (обработка опечаток и сокращений)
- Алгоритм кластеризации: Кластеризация эквидистантных узлов (ENC) на основе косинусного сходства
- Преимущества: По сравнению с K-means дает более точные результаты кластеризации
- Выбор представителя: Выбор наиболее часто встречающегося термина в каждом синонимическом наборе в качестве представителя
- Определение релевантности: Использование подсказки LLM для определения того, должен ли термин быть включен в онтологию
- Критерии фильтрации: Релевантность, специфичность, иерархичность
- Обработка входных данных: Извлечение предложений, содержащих два аспекта из разных синонимических наборов
- Дизайн задачи: Вопрос с множественным выбором (аспект A является частью аспекта B / аспект B является частью аспекта A / не связаны)
- Обучение модели: Микронастройка модели Mistral на 1000 синтетических образцах с использованием дистилляции
- Сквозной конвейер на основе LLM: По сравнению с методом BERT достигнута более высокая степень автоматизации
- Ограничения структурированного выхода: Использование ограничений синтаксиса JSON для обеспечения согласованности формата выхода
- Многоэтапная оптимизация: Каждый этап оптимизирован для конкретной задачи, повышая общую производительность
- Смягчение галлюцинаций: Снижение проблемы галлюцинаций LLM посредством фильтрации POS и микронастройки
- Источник: Набор данных Amazon Reviews 2023
- Категории продуктов: 5 категорий (видеоигры, телевизоры, ожерелья/часы, блендеры)
- Масштаб данных: 100 000 отзывов на продукт (блендеры: 26 464)
- Ограничение обработки: Задачи LLM используют 1000 отзывов (с учетом времени обработки)
Критерии оценки терминов:
- Релевантность: Точно ли термин представляет часть или компонент продукта
- Специфичность: Имеет ли термин надлежащий уровень специфичности
- Ясность: Ясно ли термин передает намерение, избегая двусмысленности
- Соответствие продукту: Логически ли термин подходит для данного продукта
Критерии оценки отношений:
- Логическая иерархия: Представляет ли дочерний узел логическую часть или характеристику родительского узла
- Соответствие контексту: Является ли отношение разумным в категориях продуктов Amazon
- Ясность и специфичность: Избегает ли отношение двусмысленности и четко ли определяет отношение часть-целое
- Базовый метод: Метод на основе BERT (Oksanen et al., 2021)
- Метод оценки: Gemini 1.5 Flash в качестве судьи LLM
- Версии сравнения: Полная версия и сокращенная версия (с количеством терминов, равным базовому методу)
- Оборудование: NVIDIA GeForce RTX 4090 GPU
- Оптимизатор: Adam (скорость обучения 10⁻⁴)
- Техника микронастройки: LoRA (r=4, α=16)
- Количество эпох: 3, размер пакета 16
| Категория продукта | Предложенный метод (полный) | Предложенный метод (сокращенный) | Базовый метод BERT |
|---|
| Видеоигры | 4.00 | 4.18 | 3.92 |
| Телевизоры | 4.06 | 4.05 | 3.95 |
| Ожерелья | 4.50 | 4.57 | 3.86 |
| Часы | 4.13 | 4.37 | 4.10 |
| Блендеры | 4.36 | 4.40 | 3.31 |
| Категория продукта | Предложенный метод (полный) | Предложенный метод (сокращенный) | Базовый метод BERT |
|---|
| Видеоигры | 3.89 | 3.82 | 3.43 |
| Телевизоры | 3.99 | 4.56 | 3.21 |
| Ожерелья | 3.65 | 3.79 | 3.29 |
| Часы | 3.75 | 4.06 | 2.68 |
| Блендеры | 3.30 | 3.40 | 2.47 |
| Метод | Средний балл |
|---|
| Метод A1 (только подсказка) | 1.960 ± 0.006 |
| Метод A2 (подсказка + тональность) | 2.259 ± 0.002 |
| Метод A3 (микронастройка) | 2.662 ± 0.006 |
| Метод | Видеоигры | Телевизоры | Ожерелья | Часы | Блендеры |
|---|
| Полные отзывы | 3.811 | 4.155 | 3.397 | 3.570 | 3.080 |
| Выписки | 3.727 | 3.726 | 3.481 | 3.398 | 2.493 |
| Выписки + микронастройка | 3.893 | 3.987 | 3.646 | 3.747 | 3.303 |
| Этап | Среднее время (минуты) |
|---|
| Извлечение аспектов | 32.05 |
| Извлечение синонимических наборов | 0.78 |
| Извлечение концепций | 1.52 |
| Извлечение отношений | 4.53 |
| Итого | 38.89 |
| Этап | Среднее время (минуты) |
|---|
| Извлечение сущностей | 1.66 |
| Извлечение аспектов | 2.79 |
| Извлечение синонимов | 0.82 |
| Извлечение онтологии | 1.36 |
| Итого | 6.62 |
- Повышение качества: Метод на основе LLM значительно превосходит базовый метод BERT по качеству терминов и отношений
- Важность микронастройки: Микронастройка обеспечивает значительное повышение производительности по сравнению с методом чистой подсказки
- Вычислительные затраты: Метод на основе LLM имеет более высокое качество, но вычислительные затраты примерно в 6 раз выше, чем у метода BERT
- Выбор алгоритма кластеризации: ENC дает более точные синонимические наборы по сравнению с K-means
Традиционное обучение онтологии в основном зависит от методов глубокого обучения, но большинство работ сосредоточены на извлечении таксономических отношений, а не отношений часть-целое.
Недавние исследования начали изучать применение LLM в ключевых задачах обучения онтологии, таких как извлечение терминов и отношений, но в основном сосредоточены на таксономических отношениях.
Оценка качества онтологии всегда была сложной задачей из-за отсутствия стандартных эталонов. Предложенный в данной работе метод LLM-as-a-judge предоставляет новое решение этой проблемы.
- Метод на основе LLM значительно превосходит существующие методы BERT в задаче извлечения мероними́ческой онтологии
- Микронастройка и ограничения структурированного выхода являются ключевыми факторами повышения производительности
- LLM-as-a-judge предоставляет жизнеспособное решение для оценки качества онтологии
- Зависимость от оценки: Оценка в основном зависит от LLM-as-a-judge, отсутствует проверка пользовательским исследованием
- Вычислительные затраты: Вычислительные затраты значительно выше по сравнению с методом BERT
- Проблема галлюцинаций: LLM по-прежнему имеет проблемы с генерацией нерелевантных аспектов
- Отсутствие эталонов: В области онтологии продуктов отсутствуют стандартные эталонные наборы данных
- Построение стандартных эталонов: Создание стандартного эталонного набора данных для этой задачи
- Проверка пользовательским исследованием: Проверка практической полезности онтологии посредством пользовательского исследования
- Обобщение метода: Изучение применения метода к другим типам онтологий (например, таксономическим онтологиям)
- Смягчение галлюцинаций: Исследование методов интеграции нескольких LLM для снижения галлюцинаций отдельной модели
- Высокая инновационность: Первое систематическое применение LLM к извлечению мероними́ческой онтологии
- Полнота метода: Предоставляет полное сквозное решение конвейера
- Инновация в оценке: Предложена инновационная система оценки LLM-as-a-judge
- Полнота экспериментов: Включает подробные абляционные эксперименты и анализ эффективности
- Вклад в открытый исходный код: Предоставлена полная реализация с открытым исходным кодом
- Ограничения оценки: Чрезмерная зависимость от оценки LLM, отсутствие проверки человеческой оценкой
- Рассмотрение затрат: Значительное увеличение вычислительных затрат, но недостаточное обсуждение компромисса затрат и выгод
- Обобщаемость: Проверка только на 5 категориях продуктов, обобщаемость требует дальнейшей проверки
- Сравнение с эталонами: Сравнение с большим количеством существующих методов недостаточно полно
- Научная ценность: Предоставляет важный справочник для применения LLM в построении онтологии
- Практическая ценность: Имеет прямой потенциал применения в электронной коммерции и других областях
- Методологический вклад: Система оценки LLM-as-a-judge имеет широкую применимость
- Воспроизводимость: Предоставлены подробные детали реализации и открытый исходный код
- Платформы электронной коммерции: Классификация продуктов и системы рекомендаций
- Построение графов знаний: Автоматизированное построение онтологии
- Извлечение информации: Извлечение структурированных отношений из неструктурированного текста
- Анализ отзывов: Идентификация характеристик и компонентов продуктов
В данной работе цитируются важные работы в соответствующих областях, включая:
- Oksanen et al. (2021): Метод извлечения онтологии продуктов на основе BERT
- Devlin et al. (2019): Модель BERT
- Jiang et al. (2023): Модель Mistral
- Pontiki et al. (2014): Набор данных SemEval-2014 Task 4
Общая оценка: Это статья с важным вкладом в область извлечения мероними́ческой онтологии. Метод обладает высокой инновационностью, экспериментальный дизайн разумен, результаты убедительны. Хотя существуют некоторые ограничения в методах оценки и вычислительных затратах, работа предоставляет ценные идеи и инструменты для развития данной области.