2025-11-24T21:52:17.543196

Instruction Set Migration at Warehouse Scale

Christopher, Crossan, Dobson et al.

Migrating codebases from one instruction set architecture (ISA) to another is a major engineering challenge. A recent example is the adoption of Arm (in addition to x86) across the major Cloud hyperscalers. Yet, this problem has seen limited attention by the academic community. Most work has focused on static and dynamic binary translation, and the traditional conventional wisdom has been that this is the primary challenge. In this paper, we show that this is no longer the case. Modern ISA migrations can often build on a robust open-source ecosystem, making it possible to recompile all relevant software from scratch. This introduces a new and multifaceted set of challenges, which are different from binary translation. By analyzing a large-scale migration from x86 to Arm at Google, spanning almost 40,000 code commits, we derive a taxonomy of tasks involved in ISA migration. We show how Google automated many of the steps involved, and demonstrate how AI can play a major role in automatically addressing these tasks. We identify tasks that remain challenging and highlight research challenges that warrant further attention.

academic

Befehlssatz-Migration im Warehouse-Maßstab

Grundlegende Informationen

Paper-ID: 2510.14928
Titel: Instruction Set Migration at Warehouse Scale
Autoren: Eric Christopher, Kevin Crossan, Wolff Dobson, Chris Kennelly, Drew Lewis, Kun Lin, Martin Maas, Parthasarathy Ranganathan, Emma Rapati, Brian Yang (Google, USA)
Klassifizierung: cs.SE (Softwaretechnik), cs.LG (Maschinelles Lernen)
Veröffentlichungsdatum: 16. Oktober 2025 (arXiv-Preprint)
Paper-Link: https://arxiv.org/abs/2510.14928

Zusammenfassung

Dieses Papier stellt traditionelle Ansichten zur Befehlssatz-Architektur-Migration (ISA-Migration) in Frage, indem es eine großflächige Migration von x86 zu Arm bei Google analysiert (mit etwa 40.000 Code-Commits). Die Forschung zeigt, dass die Hauptherausforderungen moderner ISA-Migration nicht mehr die Code-Übersetzung sind, sondern eine Reihe vielfältiger Engineeringaufgaben. Das Papier präsentiert eine Taxonomie von ISA-Migrationsaufgaben, demonstriert, wie Google viele Migrationsschritte automatisiert hat, und belegt die wichtige Rolle von KI bei der Automatisierung dieser Aufgaben.

Forschungshintergrund und Motivation

Problembeschreibung

Kernproblem: Die Befehlssatz-Architektur-Migration großer Codebäume ist eine bedeutende Engineeringherausforderung, erhält aber begrenzte akademische Aufmerksamkeit
Praktische Anforderung: Große Cloud-Anbieter (Amazon, Google, Microsoft) führen Arm-Architektur ein, um x86 zu ergänzen und benötigen systematische Migrationsmethodologien
Einschränkungen traditioneller Ansichten: Frühere Forschung konzentrierte sich hauptsächlich auf statische und dynamische Binärübersetzung als Hauptherausforderung der ISA-Migration

Forschungsmotivation

Verändertes technisches Umfeld: Moderne ISAs werden in vorgelagerten Compilern, Laufzeitbibliotheken und dem Linux-Kernel gut unterstützt, was Neukompilierung aus dem Quellcode ermöglicht
Fehlende praktische Erfahrung: Mangel an systematischer Analyse der tatsächlich involvierten Aufgaben bei moderner ISA-Migration
Automatisierungschancen: Moderne Softwareengineering-Tools und KI-Technologie bieten neue Möglichkeiten zur Automatisierung der Migration

Kernbeiträge

Erste systematische Analyse: Bereitstellung der ersten detaillierten Zerlegung und Taxonomie von großflächigen ISA-Migrationsaufgaben basierend auf 38.156 echten Commits
Umkehrung traditioneller Erkenntnisse: Nachweis, dass die Komplexität der ISA-Migration nicht in der Code-Übersetzung liegt, sondern hauptsächlich die Umschreibung von Build- und Konfigurationsdateien betrifft
Automatisierungsrahmen: Demonstration der hochgradig automatisierbaren Natur vieler Migrationsaufgaben und Entwicklung des KI-gesteuerten Automatisierungstools CogniPort
Praktische Anleitung: Identifikation noch herausfordernder Aufgaben und Bereitstellung von Orientierung für zukünftige Forschungsrichtungen

Detaillierte Methodologie

Aufgabendefinition

Die Kernaufgabe dieser Forschung ist: Migration einer Codebasis mit Milliarden Zeilen von x86-Architektur zu einer Multi-Architektur-Umgebung, die sowohl x86 als auch Arm unterstützt

Eingabe: Großflächige Codebasis mit einzelner Architektur (x86) Ausgabe: Codebasis mit Multi-Architektur-Unterstützung (x86+Arm) Einschränkungen: Beibehaltung von Leistungs-, Sicherheits- und Stabilitätsparität

Analysemethodologie-Architektur

1. Datenerfassung und Annotation

Datenquelle: 38.156 Arm-Migrations-bezogene Commits aus Googles zentralem Code-Repository
Automatische Klassifizierung: Verwendung des Gemini 2.5 Flash LLM für großflächige Commit-Analyse
Klassifizierungsprozess:
1. Commit-Nachrichten und Code-Differenzen in das 1M-Token-Kontextfenster des LLM eingeben
2. Jeweils 100 Commits pro Batch, Modell wählt 20 Kategorien
3. Integration von 400×20 Kategorien zu 50, schließlich handwerklich verfeinert zu 16 Kategorien

2. Migrations-Lebenszyklusmodell

Definition eines fünfstufigen Migrationsprozesses:

Testphase: Behebung von Tests und Builds, die auf der neuen ISA fehlschlagen
Multi-Architektur-CI einrichten: Änderung von Blueprint-Dateien zur Vermeidung von Regressionstests
Release-Konfiguration: Änderung von Blueprint-Dateien für standardmäßige Multi-Architektur-Release-Unterstützung
Neue Binärdateien bereitstellen: Ausführung auf neuen ISA-Maschinen und Bewertung der Leistungsstabilität
Vollständige Produktion: Ermöglichung der Planung von Produktionsaufträgen auf neuen ISA-Maschinen

Technische Innovationen

1. LLM-basierte großflächige Code-Analyse

Innovative Verwendung großer Sprachmodelle zur Analyse zehntausender Code-Commits
Etablierung einer systematischen Taxonomie von ISA-Migrationsaufgaben (17 Kategorien)

2. Mehrschichtiges Automatisierungsrahmenwerk

Large-Scale Changes (LSCs): Automatisierte großflächige Code-Änderungen durch das Rosie-Tool
CHAMP-System: Kontinuierliche Gesundheitsüberwachungsplattform, automatische Bewertung von Verhaltensunterschieden bei Arm-Build-Anwendungen
CogniPort KI-Agent: Dreischichtige verschachtelte Agent-Schleife, automatische Behebung von Build- und Testfehlern

3. KI-gesteuerte Reparaturagenten

CogniPort enthält drei verschachtelte Agent-Schleifen:

Orchestrator-Agent: Ruft Build-/Test-Reparaturagenten basierend auf Workspace-Status auf
Build-Reparatur-Agent: Versucht, Ziel zu bauen und Dateien zu ändern, bis erfolgreich
Test-Reparatur-Agent: Führt Tests aus und ändert Code, bis bestanden

Experimentelle Einrichtung

Datensatz-Charakteristiken

Umfang: 38.156 Commits, etwa 700K Zeilen Code-Änderungen
Zeitspanne: Mehrjähriger Migrationsprozess
Abdeckung: Repräsentativer Teilbestand von Milliarden Zeilen Code bei Google

Bewertungsmetriken

Automatisierungsgrad: Anteil automatisch generierter Commits und Code-Zeilen pro Kategorie
KI-Reparatur-Erfolgsquote: CogniPort-Erfolgsquote bei 245 Test-Commits
Migrationsergebnis: Anwendungsqualifizierungsrate von 4,8% auf 59,6% erhöht, Rollback-Rate unter 1,8% kontrolliert

Experimentelle Methode

Historische Commit-Analyse: Wiederherstellung historischer Commits und Bewertung der Reparaturfähigkeit des KI-Agenten
Klassifizierungsgenauigkeitsvalidierung: Handwerkliche Überprüfung der Modellausgabe zur Gewährleistung der Klassifizierungsgenauigkeit
Automatisierungseffekt-Bewertung: Statistik der Automatisierungsabdeckung von LSC- und CHAMP-Systemen

Experimentelle Ergebnisse

Hauptfeststellungen

1. Aufgabenverteilungsanalyse (Abbildung 1)

Build-Konfiguration dominiert: 84% der Commits betreffen Build-, Verpackungs- und CI/CD-Konfiguration (Kategorie 8)
Code-Änderungen minimal: Code-Anpassung und -Korrektur (Kategorien 1-5) machen nur 1% der Commits und weniger als 4% der Code-Zeilen aus
Test-Anpassung wichtig: Testbezogene Änderungen (Kategorien 6-7) nehmen erheblichen Platz ein

2. Zeitliche Evolutionsmuster (Abbildung 3)

Frühe Phase: Hauptsächlich Tool-Entwicklung und Test-Anpassung
Mittlere Phase: Anteil der Code-Anpassungs-Commits nimmt zu
Späte Phase: Fast ausschließlich Konfigurationsdateien und Support-Prozesse, schneller Anstieg der Commit-Anzahl

3. Automatisierungseffektivität

Gesamtautomatisierungsrate: 83,82% der Commits und 14,15% der Code-Zeilen automatisiert
LSC-generierte Commits: 31.984 Commits durch Rosie automatisch generiert
Anwendungsqualifizierungsrate-Verbesserung: Von 4,8% auf 59,6% erhöht
Niedrige Rollback-Rate: Rollback-Rate in der Endphase auf unter 0,8% reduziert

KI-Agent-Leistung (Abbildung 4)

CogniPort-Leistung bei 245 Test-Commits:

Gesamterfolgsquote: 30%
Beste Kategorien: Test-Reparatur, plattformspezifischer Bedingungscode, Datenrepräsentations-Reparatur
Schwierige Kategorien: Speichermodell, Test-Ausführungsumgebung, Leistungsoptimierung

Kategorien-Automatisierungspotential (Abbildung 5)

Von KI bewertete Automatisierungsschwierigkeit (1=einfach, 5=schwierig):

Hochgradig automatisierbar: Build-Konfigurationsdateien, Test-Ausführungsumgebung
Mittlere Schwierigkeit: Code- und Test-Anpassung (Kategorien 1-7)
Weiterhin manuelle Arbeit erforderlich: Komplexe Leistungsoptimierung, spezielle Service-Konfiguration

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Umkehrung traditioneller Ansichten: Die Komplexität der ISA-Migration liegt nicht in der Code-Übersetzung, sondern in vielfältigen Engineeringaufgaben
Hochgradig automatisierbar: Die meisten Migrationsaufgaben können durch moderne Tools automatisiert werden
Wert von einmaligen Arbeiten: Viele Aufgaben können nach der ersten Multi-Architektur-Migration wiederverwendet werden
Großes KI-Potenzial: Moderne KI kann viele verbleibende manuelle Aufgaben bewältigen

Einschränkungen

Bewertungsmethodische Einschränkungen: Die KI-Agent-Bewertung könnte Informationslecks oder unvollständige Tests aufweisen
Google-spezifische Umgebung: Schlussfolgerungen könnten nicht vollständig auf andere Organisationen übertragbar sein
Arm-Spezifität: Forschung konzentriert sich auf x86-zu-Arm-Migration, andere ISA-Migrationen könnten unterschiedliche Herausforderungen haben

Zukünftige Richtungen

Noch schwierige Aufgaben

ISA-spezifischer Vektorcode: Erfordert komplexe Leistungsoptimierungs-Suchräume
Tiefe Leistungsoptimierung: Erfordert Algorithmus-Level-Umstrukturierung und Intrinsic-Funktionsnutzung
Komplexe Grenzfälle: Erfordert Fachwissen über den Code hinaus
Leistungsabstimmung: Erfordert Neugenerierung von Hyperparametern und Feedback-gesteuerten Optimierungskonfigurationsdateien

Forschungschancen

Verbesserte KI-Agent-Fähigkeiten: Unterstützung stärkerer Agenten mit Dokumentensuche und Leistungsmessung
Vektorisierungs-Automatisierung: Automatische Generierung hochperformanter ISA-spezifischer Vektorcodes
Multi-Architektur-Toolchain: Weitere Verbesserung von Automatisierungs-Multi-Architektur-Support-Tools

Tiefgreifende Bewertung

Stärken

Extrem hoher praktischer Wert: Basierend auf echter industrieller großflächiger Migrationserfahrung mit starker Orientierungskraft
Methodologische Innovation: Erste systematische Analyse und Klassifizierung von ISA-Migrationsaufgaben, Etablierung des Grundrahmens des Feldes
Großer Datenumfang: Analyse von 38.156 Commits ist in der Softwaretechnik-Forschung äußerst selten
Technische Vorausschau: Demonstriert das tatsächliche Anwendungspotenzial von KI in großflächigen Softwareengineering-Aufgaben
Kontraintuitive Ergebnisse: Stellt traditionelle Erkenntnisse im Feld in Frage, hat wichtigen akademischen Wert

Mängel

Umgebungsspezifität: Forschung basiert auf Googles spezifischer Softwareumgebung, Verallgemeinerungsfähigkeit möglicherweise begrenzt
Bewertungsmethodische Einschränkungen: KI-Agent-Bewertung könnte Verzerrungen aufweisen, benötigt strengere Benchmarks
Fehlende Kostenanalyse: Mangel an quantitativer Analyse der Migrationskosten (Personal, Zeit, Ressourcen)
Unzureichende Langzeit-Wartungsüberlegungen: Weniger Analyse der Langzeit-Wartungskosten von Multi-Architektur-Codebäumen

Auswirkungen

Akademische Auswirkungen: Bietet neue Forschungsrichtungen für Softwaretechnik und Systemarchitektur
Industrieller Wert: Bietet praktische Methodologie und Tool-Referenzen für andere Organisationen bei ISA-Migration
Technologischer Antrieb: Fördert die Entwicklung von KI-Anwendungen in der Softwaretechnik
Standardisierung: Könnte zum wichtigen Referenzstandard im ISA-Migrations-Feld werden

Anwendungsszenarien

Große Technologieunternehmen: Organisationen mit großflächigen Codebäumen, die Architektur-Migration benötigen
Cloud-Service-Anbieter: Benötigen Multi-Hardware-Architektur-Unterstützung zur Kosten- und Leistungsoptimierung
Open-Source-Projekt-Betreuer: Große Open-Source-Projekte, die Architektur-Unterstützung erweitern müssen
Forschungsinstitutionen: Forschungsteams, die Softwareengineering-Automatisierung und KI-Anwendungen untersuchen

Literaturverzeichnis

Das Papier zitiert 27 wichtige Literaturquellen, umfassend:

Binärübersetzungstechnologie (Altman et al., 2000; Gouicem et al., 2022)
Großflächige Softwaretechnik (Potvin & Levenberg, 2016; Winters et al., 2020)
Automatische Code-Reparatur (Bader et al., 2019; Lin et al., 2025)
Systemarchitektur (Verma et al., 2015; Corbett et al., 2012)

Zusammenfassung: Dies ist ein Papier mit wichtigem praktischem Wert und akademischem Gewicht, das erstmals systematisch die tatsächlichen Herausforderungen und Lösungen moderner großflächiger ISA-Migration analysiert. Das Papier stellt nicht nur traditionelle Ansichten in Frage, sondern demonstriert auch das enorme Potenzial von KI-Technologie in der Softwaretechnik und bietet wichtige Orientierung für die zukünftige Entwicklung des Feldes.