2025-11-24T21:52:17.543196

Instruction Set Migration at Warehouse Scale

Christopher, Crossan, Dobson et al.
Migrating codebases from one instruction set architecture (ISA) to another is a major engineering challenge. A recent example is the adoption of Arm (in addition to x86) across the major Cloud hyperscalers. Yet, this problem has seen limited attention by the academic community. Most work has focused on static and dynamic binary translation, and the traditional conventional wisdom has been that this is the primary challenge. In this paper, we show that this is no longer the case. Modern ISA migrations can often build on a robust open-source ecosystem, making it possible to recompile all relevant software from scratch. This introduces a new and multifaceted set of challenges, which are different from binary translation. By analyzing a large-scale migration from x86 to Arm at Google, spanning almost 40,000 code commits, we derive a taxonomy of tasks involved in ISA migration. We show how Google automated many of the steps involved, and demonstrate how AI can play a major role in automatically addressing these tasks. We identify tasks that remain challenging and highlight research challenges that warrant further attention.
academic

Befehlssatz-Migration im Warehouse-Maßstab

Grundlegende Informationen

  • Paper-ID: 2510.14928
  • Titel: Instruction Set Migration at Warehouse Scale
  • Autoren: Eric Christopher, Kevin Crossan, Wolff Dobson, Chris Kennelly, Drew Lewis, Kun Lin, Martin Maas, Parthasarathy Ranganathan, Emma Rapati, Brian Yang (Google, USA)
  • Klassifizierung: cs.SE (Softwaretechnik), cs.LG (Maschinelles Lernen)
  • Veröffentlichungsdatum: 16. Oktober 2025 (arXiv-Preprint)
  • Paper-Link: https://arxiv.org/abs/2510.14928

Zusammenfassung

Dieses Papier stellt traditionelle Ansichten zur Befehlssatz-Architektur-Migration (ISA-Migration) in Frage, indem es eine großflächige Migration von x86 zu Arm bei Google analysiert (mit etwa 40.000 Code-Commits). Die Forschung zeigt, dass die Hauptherausforderungen moderner ISA-Migration nicht mehr die Code-Übersetzung sind, sondern eine Reihe vielfältiger Engineeringaufgaben. Das Papier präsentiert eine Taxonomie von ISA-Migrationsaufgaben, demonstriert, wie Google viele Migrationsschritte automatisiert hat, und belegt die wichtige Rolle von KI bei der Automatisierung dieser Aufgaben.

Forschungshintergrund und Motivation

Problembeschreibung

  1. Kernproblem: Die Befehlssatz-Architektur-Migration großer Codebäume ist eine bedeutende Engineeringherausforderung, erhält aber begrenzte akademische Aufmerksamkeit
  2. Praktische Anforderung: Große Cloud-Anbieter (Amazon, Google, Microsoft) führen Arm-Architektur ein, um x86 zu ergänzen und benötigen systematische Migrationsmethodologien
  3. Einschränkungen traditioneller Ansichten: Frühere Forschung konzentrierte sich hauptsächlich auf statische und dynamische Binärübersetzung als Hauptherausforderung der ISA-Migration

Forschungsmotivation

  1. Verändertes technisches Umfeld: Moderne ISAs werden in vorgelagerten Compilern, Laufzeitbibliotheken und dem Linux-Kernel gut unterstützt, was Neukompilierung aus dem Quellcode ermöglicht
  2. Fehlende praktische Erfahrung: Mangel an systematischer Analyse der tatsächlich involvierten Aufgaben bei moderner ISA-Migration
  3. Automatisierungschancen: Moderne Softwareengineering-Tools und KI-Technologie bieten neue Möglichkeiten zur Automatisierung der Migration

Kernbeiträge

  1. Erste systematische Analyse: Bereitstellung der ersten detaillierten Zerlegung und Taxonomie von großflächigen ISA-Migrationsaufgaben basierend auf 38.156 echten Commits
  2. Umkehrung traditioneller Erkenntnisse: Nachweis, dass die Komplexität der ISA-Migration nicht in der Code-Übersetzung liegt, sondern hauptsächlich die Umschreibung von Build- und Konfigurationsdateien betrifft
  3. Automatisierungsrahmen: Demonstration der hochgradig automatisierbaren Natur vieler Migrationsaufgaben und Entwicklung des KI-gesteuerten Automatisierungstools CogniPort
  4. Praktische Anleitung: Identifikation noch herausfordernder Aufgaben und Bereitstellung von Orientierung für zukünftige Forschungsrichtungen

Detaillierte Methodologie

Aufgabendefinition

Die Kernaufgabe dieser Forschung ist: Migration einer Codebasis mit Milliarden Zeilen von x86-Architektur zu einer Multi-Architektur-Umgebung, die sowohl x86 als auch Arm unterstützt

Eingabe: Großflächige Codebasis mit einzelner Architektur (x86) Ausgabe: Codebasis mit Multi-Architektur-Unterstützung (x86+Arm) Einschränkungen: Beibehaltung von Leistungs-, Sicherheits- und Stabilitätsparität

Analysemethodologie-Architektur

1. Datenerfassung und Annotation

  • Datenquelle: 38.156 Arm-Migrations-bezogene Commits aus Googles zentralem Code-Repository
  • Automatische Klassifizierung: Verwendung des Gemini 2.5 Flash LLM für großflächige Commit-Analyse
  • Klassifizierungsprozess:
    1. Commit-Nachrichten und Code-Differenzen in das 1M-Token-Kontextfenster des LLM eingeben
    2. Jeweils 100 Commits pro Batch, Modell wählt 20 Kategorien
    3. Integration von 400×20 Kategorien zu 50, schließlich handwerklich verfeinert zu 16 Kategorien

2. Migrations-Lebenszyklusmodell

Definition eines fünfstufigen Migrationsprozesses:

  1. Testphase: Behebung von Tests und Builds, die auf der neuen ISA fehlschlagen
  2. Multi-Architektur-CI einrichten: Änderung von Blueprint-Dateien zur Vermeidung von Regressionstests
  3. Release-Konfiguration: Änderung von Blueprint-Dateien für standardmäßige Multi-Architektur-Release-Unterstützung
  4. Neue Binärdateien bereitstellen: Ausführung auf neuen ISA-Maschinen und Bewertung der Leistungsstabilität
  5. Vollständige Produktion: Ermöglichung der Planung von Produktionsaufträgen auf neuen ISA-Maschinen

Technische Innovationen

1. LLM-basierte großflächige Code-Analyse

  • Innovative Verwendung großer Sprachmodelle zur Analyse zehntausender Code-Commits
  • Etablierung einer systematischen Taxonomie von ISA-Migrationsaufgaben (17 Kategorien)

2. Mehrschichtiges Automatisierungsrahmenwerk

  • Large-Scale Changes (LSCs): Automatisierte großflächige Code-Änderungen durch das Rosie-Tool
  • CHAMP-System: Kontinuierliche Gesundheitsüberwachungsplattform, automatische Bewertung von Verhaltensunterschieden bei Arm-Build-Anwendungen
  • CogniPort KI-Agent: Dreischichtige verschachtelte Agent-Schleife, automatische Behebung von Build- und Testfehlern

3. KI-gesteuerte Reparaturagenten

CogniPort enthält drei verschachtelte Agent-Schleifen:

  • Orchestrator-Agent: Ruft Build-/Test-Reparaturagenten basierend auf Workspace-Status auf
  • Build-Reparatur-Agent: Versucht, Ziel zu bauen und Dateien zu ändern, bis erfolgreich
  • Test-Reparatur-Agent: Führt Tests aus und ändert Code, bis bestanden

Experimentelle Einrichtung

Datensatz-Charakteristiken

  • Umfang: 38.156 Commits, etwa 700K Zeilen Code-Änderungen
  • Zeitspanne: Mehrjähriger Migrationsprozess
  • Abdeckung: Repräsentativer Teilbestand von Milliarden Zeilen Code bei Google

Bewertungsmetriken

  1. Automatisierungsgrad: Anteil automatisch generierter Commits und Code-Zeilen pro Kategorie
  2. KI-Reparatur-Erfolgsquote: CogniPort-Erfolgsquote bei 245 Test-Commits
  3. Migrationsergebnis: Anwendungsqualifizierungsrate von 4,8% auf 59,6% erhöht, Rollback-Rate unter 1,8% kontrolliert

Experimentelle Methode

  1. Historische Commit-Analyse: Wiederherstellung historischer Commits und Bewertung der Reparaturfähigkeit des KI-Agenten
  2. Klassifizierungsgenauigkeitsvalidierung: Handwerkliche Überprüfung der Modellausgabe zur Gewährleistung der Klassifizierungsgenauigkeit
  3. Automatisierungseffekt-Bewertung: Statistik der Automatisierungsabdeckung von LSC- und CHAMP-Systemen

Experimentelle Ergebnisse

Hauptfeststellungen

1. Aufgabenverteilungsanalyse (Abbildung 1)

  • Build-Konfiguration dominiert: 84% der Commits betreffen Build-, Verpackungs- und CI/CD-Konfiguration (Kategorie 8)
  • Code-Änderungen minimal: Code-Anpassung und -Korrektur (Kategorien 1-5) machen nur 1% der Commits und weniger als 4% der Code-Zeilen aus
  • Test-Anpassung wichtig: Testbezogene Änderungen (Kategorien 6-7) nehmen erheblichen Platz ein

2. Zeitliche Evolutionsmuster (Abbildung 3)

  • Frühe Phase: Hauptsächlich Tool-Entwicklung und Test-Anpassung
  • Mittlere Phase: Anteil der Code-Anpassungs-Commits nimmt zu
  • Späte Phase: Fast ausschließlich Konfigurationsdateien und Support-Prozesse, schneller Anstieg der Commit-Anzahl

3. Automatisierungseffektivität

  • Gesamtautomatisierungsrate: 83,82% der Commits und 14,15% der Code-Zeilen automatisiert
  • LSC-generierte Commits: 31.984 Commits durch Rosie automatisch generiert
  • Anwendungsqualifizierungsrate-Verbesserung: Von 4,8% auf 59,6% erhöht
  • Niedrige Rollback-Rate: Rollback-Rate in der Endphase auf unter 0,8% reduziert

KI-Agent-Leistung (Abbildung 4)

CogniPort-Leistung bei 245 Test-Commits:

  • Gesamterfolgsquote: 30%
  • Beste Kategorien: Test-Reparatur, plattformspezifischer Bedingungscode, Datenrepräsentations-Reparatur
  • Schwierige Kategorien: Speichermodell, Test-Ausführungsumgebung, Leistungsoptimierung

Kategorien-Automatisierungspotential (Abbildung 5)

Von KI bewertete Automatisierungsschwierigkeit (1=einfach, 5=schwierig):

  • Hochgradig automatisierbar: Build-Konfigurationsdateien, Test-Ausführungsumgebung
  • Mittlere Schwierigkeit: Code- und Test-Anpassung (Kategorien 1-7)
  • Weiterhin manuelle Arbeit erforderlich: Komplexe Leistungsoptimierung, spezielle Service-Konfiguration

Verwandte Arbeiten

Traditionelle Methoden

  1. Binärübersetzung: Statische und dynamische Binärübersetzungstechniken, wie Rosetta-Systeme
  2. Automatische Code-Bearbeitung: Automatisierungsmethoden für Leistungsoptimierung, Sicherheitsprobleme und Fehlerkorrektur

Innovationen dieses Papiers

  1. Von Binärübersetzung zu Quellcode-Neukompilierung: Nutzung der reifen Unterstützung des modernen Open-Source-Ökosystems
  2. Systematische Aufgabenanalyse: Erste umfassende Taxonomie von ISA-Migrationsaufgaben
  3. KI-gesteuerte Automatisierung: Anwendung großer Sprachmodelle auf großflächige Code-Migration

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Umkehrung traditioneller Ansichten: Die Komplexität der ISA-Migration liegt nicht in der Code-Übersetzung, sondern in vielfältigen Engineeringaufgaben
  2. Hochgradig automatisierbar: Die meisten Migrationsaufgaben können durch moderne Tools automatisiert werden
  3. Wert von einmaligen Arbeiten: Viele Aufgaben können nach der ersten Multi-Architektur-Migration wiederverwendet werden
  4. Großes KI-Potenzial: Moderne KI kann viele verbleibende manuelle Aufgaben bewältigen

Einschränkungen

  1. Bewertungsmethodische Einschränkungen: Die KI-Agent-Bewertung könnte Informationslecks oder unvollständige Tests aufweisen
  2. Google-spezifische Umgebung: Schlussfolgerungen könnten nicht vollständig auf andere Organisationen übertragbar sein
  3. Arm-Spezifität: Forschung konzentriert sich auf x86-zu-Arm-Migration, andere ISA-Migrationen könnten unterschiedliche Herausforderungen haben

Zukünftige Richtungen

Noch schwierige Aufgaben

  1. ISA-spezifischer Vektorcode: Erfordert komplexe Leistungsoptimierungs-Suchräume
  2. Tiefe Leistungsoptimierung: Erfordert Algorithmus-Level-Umstrukturierung und Intrinsic-Funktionsnutzung
  3. Komplexe Grenzfälle: Erfordert Fachwissen über den Code hinaus
  4. Leistungsabstimmung: Erfordert Neugenerierung von Hyperparametern und Feedback-gesteuerten Optimierungskonfigurationsdateien

Forschungschancen

  1. Verbesserte KI-Agent-Fähigkeiten: Unterstützung stärkerer Agenten mit Dokumentensuche und Leistungsmessung
  2. Vektorisierungs-Automatisierung: Automatische Generierung hochperformanter ISA-spezifischer Vektorcodes
  3. Multi-Architektur-Toolchain: Weitere Verbesserung von Automatisierungs-Multi-Architektur-Support-Tools

Tiefgreifende Bewertung

Stärken

  1. Extrem hoher praktischer Wert: Basierend auf echter industrieller großflächiger Migrationserfahrung mit starker Orientierungskraft
  2. Methodologische Innovation: Erste systematische Analyse und Klassifizierung von ISA-Migrationsaufgaben, Etablierung des Grundrahmens des Feldes
  3. Großer Datenumfang: Analyse von 38.156 Commits ist in der Softwaretechnik-Forschung äußerst selten
  4. Technische Vorausschau: Demonstriert das tatsächliche Anwendungspotenzial von KI in großflächigen Softwareengineering-Aufgaben
  5. Kontraintuitive Ergebnisse: Stellt traditionelle Erkenntnisse im Feld in Frage, hat wichtigen akademischen Wert

Mängel

  1. Umgebungsspezifität: Forschung basiert auf Googles spezifischer Softwareumgebung, Verallgemeinerungsfähigkeit möglicherweise begrenzt
  2. Bewertungsmethodische Einschränkungen: KI-Agent-Bewertung könnte Verzerrungen aufweisen, benötigt strengere Benchmarks
  3. Fehlende Kostenanalyse: Mangel an quantitativer Analyse der Migrationskosten (Personal, Zeit, Ressourcen)
  4. Unzureichende Langzeit-Wartungsüberlegungen: Weniger Analyse der Langzeit-Wartungskosten von Multi-Architektur-Codebäumen

Auswirkungen

  1. Akademische Auswirkungen: Bietet neue Forschungsrichtungen für Softwaretechnik und Systemarchitektur
  2. Industrieller Wert: Bietet praktische Methodologie und Tool-Referenzen für andere Organisationen bei ISA-Migration
  3. Technologischer Antrieb: Fördert die Entwicklung von KI-Anwendungen in der Softwaretechnik
  4. Standardisierung: Könnte zum wichtigen Referenzstandard im ISA-Migrations-Feld werden

Anwendungsszenarien

  1. Große Technologieunternehmen: Organisationen mit großflächigen Codebäumen, die Architektur-Migration benötigen
  2. Cloud-Service-Anbieter: Benötigen Multi-Hardware-Architektur-Unterstützung zur Kosten- und Leistungsoptimierung
  3. Open-Source-Projekt-Betreuer: Große Open-Source-Projekte, die Architektur-Unterstützung erweitern müssen
  4. Forschungsinstitutionen: Forschungsteams, die Softwareengineering-Automatisierung und KI-Anwendungen untersuchen

Literaturverzeichnis

Das Papier zitiert 27 wichtige Literaturquellen, umfassend:

  • Binärübersetzungstechnologie (Altman et al., 2000; Gouicem et al., 2022)
  • Großflächige Softwaretechnik (Potvin & Levenberg, 2016; Winters et al., 2020)
  • Automatische Code-Reparatur (Bader et al., 2019; Lin et al., 2025)
  • Systemarchitektur (Verma et al., 2015; Corbett et al., 2012)

Zusammenfassung: Dies ist ein Papier mit wichtigem praktischem Wert und akademischem Gewicht, das erstmals systematisch die tatsächlichen Herausforderungen und Lösungen moderner großflächiger ISA-Migration analysiert. Das Papier stellt nicht nur traditionelle Ansichten in Frage, sondern demonstriert auch das enorme Potenzial von KI-Technologie in der Softwaretechnik und bietet wichtige Orientierung für die zukünftige Entwicklung des Feldes.