Can Prompts Rewind Time for LLMs? Evaluating the Effectiveness of Prompted Knowledge Cutoffs
Gao, Zhang, Du et al.
Large Language Models (LLMs) are widely used for temporal prediction, but their reliance on pretraining data raises contamination concerns, as accurate predictions on pre-cutoff test data may reflect memorization rather than reasoning, leading to an overestimation of their generalization capability. With the recent emergence of prompting-based unlearning techniques, a natural question arises: Can LLMs be prompted to simulate an earlier knowledge cutoff? In this work, we investigate the capability of prompting to simulate earlier knowledge cutoff in LLMs. We construct three evaluation datasets to assess the extent to which LLMs can forget (1) direct factual knowledge, (2) semantic shifts, and (3) causally related knowledge. Results demonstrate that while prompt-based simulated knowledge cutoffs show effectiveness when directly queried with the information after that date, they struggle to induce forgetting when the forgotten content is not directly asked but causally related to the query. These findings highlight the need for more rigorous evaluation settings when applying LLMs for temporal prediction tasks. The full dataset and evaluation code are available at https://github.com/gxx27/time_unlearn.
academic
Могут ли подсказки повернуть время вспять для LLM? Оценка эффективности подсказанных сроков знаний
Большие языковые модели (LLM) широко применяются в задачах временного прогнозирования, однако их зависимость от данных предварительного обучения вызывает опасения по поводу загрязнения данных, поскольку точные предсказания на тестовых данных, предшествующих дате отсечки предварительного обучения, могут отражать запоминание, а не рассуждение, что приводит к переоценке способности к обобщению. С появлением методов забывания на основе подсказок возникает естественный вопрос: можно ли использовать подсказки, чтобы заставить LLM имитировать более ранние сроки знаний? Данное исследование изучает способность подсказок имитировать ранние сроки знаний и создает три набора данных для оценки для оценки степени забывания LLM (1) прямого фактического знания, (2) семантических изменений и (3) причинно-связанного знания. Результаты показывают, что хотя имитация сроков знаний на основе подсказок эффективна при прямых запросах информации после этой даты, она с трудом вызывает забывание, когда забываемое содержание не запрашивается напрямую, а причинно связано с запросом.
Основная проблема, которую решает данное исследование, — это влияние загрязнения данных на оценку задач временного прогнозирования LLM. Когда LLM используются для прогнозирования акций, прогнозирования событий и других задач временных рядов, модель может уже видеть тестовые данные на этапе предварительного обучения, что приводит к переоценке производительности прогнозирования.
Надежность оценки: Традиционные модели машинного обучения (например, случайные леса) обучаются с нуля, поэтому производительность тестирования надежна; однако LLM могут уже видеть данные в период тестирования, что приводит к несправедливому сравнению
Неправильная оценка способности к обобщению: "Прогнозы" на основе запоминания переоценивают истинную способность модели к обобщению
Риски практического применения: При развертывании в реальных сценариях производительность модели может быть намного ниже ожидаемой
Вдохновленные недавно появившимися методами контекстного забывания, авторы предлагают использовать инженерию подсказок для корректировки сроков знаний LLM, заставляя их "забыть" всю информацию после указанной даты, тем самым обеспечивая более справедливую оценку временного прогнозирования.
Входные данные: Пользовательский запрос + системная подсказка с имитируемым сроком знаний
Выходные данные: Ответ, соответствующий состоянию знаний на указанную дату отсечки
Ограничения: Модель должна "забыть" всю информацию после даты отсечки
You must answer this question using only knowledge that was publicly available before the year {unlearn_year}.
Specifically, your memory ends on December 31, {unlearn_year_minus_1}, and you have no access to anything that occurred in {unlearn_year} or afterward.
You may think step by step internally, but your memory ends on December 31, {unlearn_year_minus_1}.
You are strictly forbidden from referencing or reasoning about any information, event, or trend that emerged in {unlearn_year} or later.
Для подмножеств Factual и Counterfactual используется формат множественного выбора, где успешное забывание определяется как изменение исходного ответа модели.
Для подмножества Semantic используется семантическое сходство:
Success=cos(oa,ya)+cos(oa,yb)cos(oa,ya)>cos(ob,ya)+cos(ob,yb)cos(ob,ya)
где oa,ob — выходные данные до и после забывания соответственно, ya,yb — истинные ответы до и после отсечки.
Эффективность прямых запросов: Средний коэффициент успеха подмножества Factual составляет 82.5%, что указывает на относительную эффективность забывания на основе подсказок при прямых запросах фактов
Среднее семантическое забывание: Средний коэффициент успеха подмножества Semantic составляет 70.0%, что показывает, что модель может в определенной степени вернуться к историческому значению словарного запаса
Сложность причинного вывода: Подмножество Counterfactual показывает только 19.2% коэффициент успеха, выявляя важные ограничения забывания на основе подсказок
Преимущество моделей с рассуждением: Модели с улучшенным рассуждением (DeepSeek-R1: 71.2%, OpenAI o3: 50.6%) значительно превосходят обычные модели на подмножестве Counterfactual
Частичная эффективность: Забывание на основе подсказок показывает хорошие результаты при прямых запросах фактов, но имеет ограниченную эффективность в сценариях, требующих причинного вывода
Зависимость от рассуждений: Контрфактическое прогнозирование требует сильных способностей причинного вывода, простые ограничения подсказок недостаточны
Необходимость строгой оценки: Результаты исследования подчеркивают важность проведения строгой оценки при использовании LLM для задач временного прогнозирования
Важность проблемы: Решение ключевой проблемы в оценке временного прогнозирования LLM с важной практической ценностью
Новизна метода: Первое систематическое исследование применения забывания на основе подсказок к временному знанию, открывающее новое направление исследований
Полнота оценки: Разумное проектирование наборов данных трех измерений, комплексная оценка различных типов способности к забыванию
Строгость экспериментов:
Сравнение нескольких моделей для проверки надежности результатов
Подробные процессы построения и постобработки данных
Сравнение моделей с рассуждением обеспечивает глубокие insights
Открытие ресурсов: Предоставление полных наборов данных и кода оценки для содействия последующим исследованиям
Недостаточное понимание механизма забывания: Отсутствие глубокого анализа причин, по которым некоторые типы забывания более сложны
Ограниченная оптимизация подсказок: Тестирование только двух стратегий подсказок, возможно существование более эффективных проектов подсказок
Единственная метрика оценки: Основное полагание на коэффициент успеха, отсутствие тонкозернистой оценки степени забывания
Отсутствие проверки практического применения: Отсутствие проверки эффектов в реальных задачах временного прогнозирования
Отсутствие анализа вычислительных затрат: Отсутствие анализа преимуществ вычислительной эффективности забывания на основе подсказок по сравнению с традиционными методами
Академический вклад: Предоставление новой перспективы и эталона для исследований забывания LLM, ожидается стимулирование развития соответствующих исследований
Практическая ценность: Предоставление важной рамки оценки для промышленного применения LLM при временном прогнозировании
Методологическое значение: Подчеркивание важности учета временного фактора при оценке систем ИИ
Воспроизводимость: Полные открытые ресурсы обеспечивают воспроизводимость и масштабируемость исследований
Данная статья ссылается на важные работы в соответствующих областях машинного забывания, временного прогнозирования LLM и загрязнения данных, включая:
Bourtoule et al. (2019): Основополагающая работа в машинном забывании
Brown et al. (2020): GPT-3 и контекстное обучение
Pawelczyk et al. (2024): Методы контекстного забывания
Roberts et al. (2024): Продольное исследование загрязнения данных LLM
Общая оценка: Это высококачественная исследовательская статья, решающая важную проблему в приложениях LLM. Хотя эффективность при забывании причинного вывода ограничена, она предоставляет важную базовую работу и рамку оценки для этой области. Методология исследования строга, проектирование экспериментов разумно, и работа имеет важную ценность как для академического сообщества, так и для промышленности.