Heterogeneous RBCs via deep multi-agent reinforcement learning
Gabriele, Glielmo, Taboga
Current macroeconomic models with agent heterogeneity can be broadly divided into two main groups. Heterogeneous-agent general equilibrium (GE) models, such as those based on Heterogeneous Agents New Keynesian (HANK) or Krusell-Smith (KS) approaches, rely on GE and 'rational expectations', somewhat unrealistic assumptions that make the models very computationally cumbersome, which in turn limits the amount of heterogeneity that can be modelled. In contrast, agent-based models (ABMs) can flexibly encompass a large number of arbitrarily heterogeneous agents, but typically require the specification of explicit behavioural rules, which can lead to a lengthy trial-and-error model-development process. To address these limitations, we introduce MARL-BC, a framework that integrates deep multi-agent reinforcement learning (MARL) with Real Business Cycle (RBC) models. We demonstrate that MARL-BC can: (1) recover textbook RBC results when using a single agent; (2) recover the results of the mean-field KS model using a large number of identical agents; and (3) effectively simulate rich heterogeneity among agents, a hard task for traditional GE approaches. Our framework can be thought of as an ABM if used with a variety of heterogeneous interacting agents, and can reproduce GE results in limit cases. As such, it is a step towards a synthesis of these often opposed modelling paradigms.
academic
النماذج الاقتصادية غير المتجانسة عبر التعلم المعزز متعدد الوكلاء العميق
يمكن تقسيم نماذج الاقتصاد الكلي الحالية ذات عدم التجانس بين الوكلاء إلى فئتين رئيسيتين. نماذج التوازن العام غير المتجانسة (GE)، مثل النماذج المستندة إلى طرق HANK أو Krusell-Smith (KS)، تعتمد على افتراضات التوازن العام و"التوقعات العقلانية"، وهي افتراضات غير واقعية وتجعل النموذج معقداً حسابياً، مما يحد من درجة عدم التجانس القابل للنمذجة. في المقابل، نماذج القائمة على الوكلاء (ABMs) يمكنها أن تتضمن بمرونة عدداً كبيراً من الوكلاء غير المتجانسين بشكل تعسفي، لكنها عادة ما تتطلب تحديداً صريحاً للقواعد السلوكية، مما يؤدي إلى عملية طويلة من التطوير بالمحاولة والخطأ. لمعالجة هذه القيود، تقدم هذه الورقة إطار عمل MARL-BC، الذي يجمع بين التعلم المعزز متعدد الوكلاء العميق (MARL) ونماذج دورة الأعمال الحقيقية (RBC).
اعتمدت نمذجة الاقتصاد الكلي تقليدياً على استخدام نماذج التوازن العام مع وكيل تمثيلي، مثل نماذج RBC والنماذج الكينزية الجديدة. ومع ذلك، فإن أحد القيود المعروفة لنماذج الوكيل التمثيلي هو عدم القدرة على مراعاة عدم التجانس بين الوكلاء.
يوفر التعلم المعزز (RL)، وخاصة التعلم المعزز متعدد الوكلاء (MARL)، طريقة جديدة لنمذجة الوكلاء غير المتجانسين في الاقتصاد الكلي. يبدو أن نموذج التعلم بـ RL يوفر تركيباً طبيعياً بين الطرفين المتطرفين من GE و ABM: يمكن أن تكون الوكلاء محدودة العقلانية ومتنوعة، لكن سلوكهم ينشأ بشكل داخلي من عملية تحسين منهجية (تعلم تعظيم المكافآت).
مشاركة المعاملات: اعتماد نموذج مشاركة المعاملات القياسي في MARL، حيث تمثل شبكة عصبية واحدة جميع الوكلاء، مما يحقق سلوكاً مختلفاً من خلال الميزات الفردية في الملاحظات
المتعلمون المستقلون: تدريب متعلمين مستقلين، يصل كل منهم إلى مجموعة معلومات جزئية فقط x_i_t، مما يحسن سياسات الاستجابة التقريبية
عدم التجانس المرن: دعم إعدادات عدم التجانس التعسفية لإنتاجية رأس المال والعمل
إطار عمل موحد: يمكن استعادة نتائج GE في الحالات الحدية، والعمل كـ ABM في الحالات العامة
تستشهد هذه الورقة بـ 60 مرجعاً ذا صلة، تغطي أعمالاً مهمة في مجالات متعددة بما في ذلك الاقتصاد الكلي والتعلم المعزز والأنظمة متعددة الوكلاء، مما يوفر أساساً نظرياً متيناً للبحث متعدد التخصصات.