Heterogeneous RBCs via deep multi-agent reinforcement learning
Gabriele, Glielmo, Taboga
Current macroeconomic models with agent heterogeneity can be broadly divided into two main groups. Heterogeneous-agent general equilibrium (GE) models, such as those based on Heterogeneous Agents New Keynesian (HANK) or Krusell-Smith (KS) approaches, rely on GE and 'rational expectations', somewhat unrealistic assumptions that make the models very computationally cumbersome, which in turn limits the amount of heterogeneity that can be modelled. In contrast, agent-based models (ABMs) can flexibly encompass a large number of arbitrarily heterogeneous agents, but typically require the specification of explicit behavioural rules, which can lead to a lengthy trial-and-error model-development process. To address these limitations, we introduce MARL-BC, a framework that integrates deep multi-agent reinforcement learning (MARL) with Real Business Cycle (RBC) models. We demonstrate that MARL-BC can: (1) recover textbook RBC results when using a single agent; (2) recover the results of the mean-field KS model using a large number of identical agents; and (3) effectively simulate rich heterogeneity among agents, a hard task for traditional GE approaches. Our framework can be thought of as an ABM if used with a variety of heterogeneous interacting agents, and can reproduce GE results in limit cases. As such, it is a step towards a synthesis of these often opposed modelling paradigms.
academic
Modelli RBC eterogenei tramite apprendimento per rinforzo multi-agente profondo
I modelli macroeconomici contemporanei con eterogeneità degli agenti possono essere divisi in due categorie principali. I modelli di equilibrio generale (GE) con agenti eterogenei, come quelli basati su metodi HANK o Krusell-Smith (KS), si basano su ipotesi di equilibrio generale e "aspettative razionali", che non sono sufficientemente realistiche e rendono il modello computazionalmente complesso, limitando il grado di eterogeneità modellabile. Al contrario, i modelli basati su agenti (ABMs) possono includere in modo flessibile un gran numero di agenti arbitrariamente eterogenei, ma richiedono generalmente la specifica esplicita di regole comportamentali, portando a lunghi processi di sviluppo del modello per tentativi ed errori. Per affrontare queste limitazioni, il presente articolo introduce il framework MARL-BC, che combina l'apprendimento per rinforzo multi-agente profondo (MARL) con modelli di cicli economici reali (RBC).
La modellazione macroeconomica tradizionalmente si basa su modelli di equilibrio generale che utilizzano agenti rappresentativi, come i modelli RBC e neo-keynesiani. Tuttavia, una limitazione ben nota dei modelli con agenti rappresentativi è l'incapacità di considerare l'eterogeneità degli agenti.
Richiedono l'ipotesi di "aspettative razionali", ovvero gli agenti devono tracciare l'intera distribuzione di ricchezza o reddito come variabili di stato
Costi computazionali elevati, che limitano significativamente il grado di eterogeneità realizzabile
Generalmente possono realizzare solo eterogeneità "ex-post", ovvero tutti gli agenti iniziano identici e si differenziano solo a causa di shock casuali individuali
Modelli basati su agenti (ABMs):
Abbandonano completamente l'agente rappresentativo e l'ipotesi di aspettative razionali
Richiedono che il modellatore decida direttamente le regole comportamentali degli agenti
Difficile affrontare correttamente l'arbitrarietà nella specifica delle regole e determinare regole realistiche
L'apprendimento per rinforzo (RL), in particolare l'apprendimento per rinforzo multi-agente (MARL), offre nuovi metodi per modellare agenti eterogenei in macroeconomia. Il paradigma di apprendimento RL sembra offrire una sintesi naturale tra gli estremi di GE e ABM: gli agenti possono essere a razionalità limitata e diversificati, ma il loro comportamento emerge endogenamente da un processo di ottimizzazione principiato (apprendimento per massimizzare il premio).
Sviluppo del framework MARL-BC: un framework basato su MARL che estende il modello RBC classico, supportando più famiglie con ricca eterogeneità flessibile
Dimostrazione della fattibilità dell'addestramento: l'addestramento con algoritmi RL all'avanguardia (PPO, SAC, DDPG) è computazionalmente fattibile
Riproduzione dei risultati classici: quando si utilizza un singolo agente, è possibile recuperare i risultati RBC da manuale
Riproduzione del modello di campo medio: quando si utilizza un gran numero di agenti identici ex-ante, è possibile recuperare i risultati del modello di campo medio Krusell-Smith
Supporto per eterogeneità ricca: simulazione efficace di ricca eterogeneità tra agenti, un compito difficile per i metodi GE tradizionali
Il framework MARL-BC mira a estendere il modello RBC classico, supportando agenti famiglia eterogenei tramite apprendimento per rinforzo multi-agente, consentendo di:
Recuperare il modello RBC tradizionale nel caso di singolo agente
Recuperare il modello di campo medio Krusell-Smith nel caso di più agenti identici
Supportare la modellazione di agenti con eterogeneità arbitraria
Condivisione dei parametri: adotta il paradigma standard di condivisione dei parametri MARL, con una singola rete neurale che rappresenta tutti gli agenti, realizzando comportamenti diversi attraverso caratteristiche individuali nell'osservazione
Apprendenti indipendenti: addestramento di apprendenti indipendenti, ognuno accedendo solo a un insieme di informazioni parziale x_i_t, ottimizzando politiche di risposta migliore approssimata
Eterogeneità flessibile: supporta impostazioni di eterogeneità arbitraria della produttività del capitale e del lavoro
Framework unificato: può recuperare risultati GE nei casi limite e fungere da ABM nel caso generale
Prestazioni dell'algoritmo: SAC, TD3 e DDPG superano significativamente PPO in velocità di convergenza, con SAC come apprendente più stabile
Riproduzione RBC da manuale: nel caso di deprezzamento completo (δ=1), la famiglia RL apprende a recuperare la politica ottimale, convergendo al valore ottimale dopo circa 10^4 passi di addestramento
Riproduzione RBC tipico: nel caso di deprezzamento parziale (δ=0.025), le scelte di consumo e lavoro ottimali apprese sono coerenti con i risultati calcolati dal software Dynare
Funzioni di risposta all'impulso: riproduzione riuscita delle funzioni di risposta all'impulso standard, statisticamente coerenti con i risultati dei metodi tradizionali
Legge del movimento KS: emerge endogenamente una relazione completamente lineare (R² > 0.99), senza ipotesi a priori
Caratteristiche di distribuzione: il coefficiente di Gini converge a 0.18 dopo la convergenza, prossimo ai 0.25 calcolati nel KS originale
Propensione marginale al consumo: la curva appresa è piatta ad alta ricchezza e aumenta drasticamente a bassa ricchezza, coerente con i risultati chiave del documento KS originale
KS con rendimenti del capitale eterogenei: introducendo diverse produttività del capitale, il coefficiente di Gini può raggiungere 0.33 (eterogeneità lieve) e 0.61 (eterogeneità significativa)
RBC eterogeneo: in un'impostazione di griglia 3×3 con 9 agenti, diverse produttività portano a livelli di ricchezza sovrapposti ma distinti
Scalabilità: estensione riuscita a centinaia di agenti (massimo 529), con SAC che mantiene prestazioni stabili e elevate a tutte le scale
Lato economico: focus principalmente su RL a singolo agente, mostrando che può recuperare le funzioni di politica dei modelli GE con agenti rappresentativi
Lato informatica: esperimenti con RL multi-agente, mostrando che il metodo può produrre ricchi comportamenti economici emergenti, ma la maggior parte ignora i modelli fondamentali della macroeconomia
Questo lavoro: collega le due linee di ricerca, fornendo una base per connettere la ricerca tra le due discipline
Costo computazionale: l'addestramento accurato di agenti RL richiede costi computazionali considerevoli, con esecuzioni di addestramento multi-agente che richiedono ore
Dipendenza dall'hardware: richiede accelerazione GPU per ridurre significativamente l'onere computazionale
Complessità del modello: rispetto ai metodi tradizionali, richiede processi di addestramento e sintonizzazione più complessi
Implementazione vettorizzata GPU: realizzazione dello stile vettorizzato dell'ambiente MARL per sfruttare pienamente l'accelerazione GPU
Studio di problemi economici specifici: applicazione del framework allo studio di disuguaglianza economica, cambiamenti asimmetrici della produttività del lavoro e altri problemi economici specifici
Impatto degli strumenti AI: studio delle conseguenze economiche e finanziarie della diffusione di strumenti AI nei luoghi di lavoro
Il presente articolo cita 60 lavori correlati, coprendo importanti contributi in macroeconomia, apprendimento per rinforzo, sistemi multi-agente e altri campi, fornendo una base teorica solida per la ricerca interdisciplinare.