2025-11-25T01:52:16.261661

Position: The Artificial Intelligence and Machine Learning Community Should Adopt a More Transparent and Regulated Peer Review Process

Yang
The rapid growth of submissions to top-tier Artificial Intelligence (AI) and Machine Learning (ML) conferences has prompted many venues to transition from closed to open review platforms. Some have fully embraced open peer reviews, allowing public visibility throughout the process, while others adopt hybrid approaches, such as releasing reviews only after final decisions or keeping reviews private despite using open peer review systems. In this work, we analyze the strengths and limitations of these models, highlighting the growing community interest in transparent peer review. To support this discussion, we examine insights from Paper Copilot, a website launched two years ago to aggregate and analyze AI / ML conference data while engaging a global audience. The site has attracted over 200,000 early-career researchers, particularly those aged 18-34 from 177 countries, many of whom are actively engaged in the peer review process. Drawing on our findings, this position paper advocates for a more transparent, open, and well-regulated peer review aiming to foster greater community involvement and propel advancements in the field.
academic

Posizione: La Comunità dell'Intelligenza Artificiale e dell'Apprendimento Automatico Dovrebbe Adottare un Processo di Revisione Paritaria Più Trasparente e Regolamentato

Informazioni Fondamentali

  • ID Articolo: 2502.00874
  • Titolo: Position: The Artificial Intelligence and Machine Learning Community Should Adopt a More Transparent and Regulated Peer Review Process
  • Autore: Jing Yang (University of Southern California, papercopilot.com)
  • Classificazione: cs.DL cs.AI cs.CV cs.CY
  • Data di Pubblicazione/Conferenza: Proceedings of the 42nd International Conference on Machine Learning, Vancouver, Canada. PMLR 267, 2025
  • Link Articolo: https://arxiv.org/abs/2502.00874

Riassunto

Con la rapida crescita del numero di articoli sottomessi alle principali conferenze di intelligenza artificiale (IA) e apprendimento automatico (ML), molte conferenze si sono trasferite da piattaforme di revisione chiuse a piattaforme di revisione aperte. Alcune conferenze hanno adottato completamente la revisione paritaria aperta, consentendo la visibilità pubblica dell'intero processo, mentre altre hanno adottato approcci ibridi, come la pubblicazione delle revisioni solo dopo la decisione finale o il mantenimento della riservatezza delle revisioni nonostante l'utilizzo di sistemi di revisione aperti. Questo articolo analizza i vantaggi e i limiti di questi modelli, evidenziando l'interesse crescente della comunità verso la revisione paritaria trasparente. Per supportare questa discussione, esaminiamo i dati di Paper Copilot, un sito web lanciato due anni fa per aggregare e analizzare i dati delle conferenze di IA/ML e attirare un pubblico globale. Il sito ha attratto più di 200.000 ricercatori in fase iniziale di carriera provenienti da 177 paesi, in particolare ricercatori di età compresa tra 18 e 34 anni, molti dei quali partecipano attivamente al processo di revisione paritaria. Sulla base dei nostri risultati, questo articolo di posizione sostiene una revisione paritaria più trasparente, aperta e normalizzata, al fine di promuovere una maggiore partecipazione della comunità e favorire il progresso nel campo.

Contesto di Ricerca e Motivazione

Definizione del Problema

Il problema centrale affrontato da questo articolo è l'insufficiente trasparenza e regolamentazione del processo di revisione paritaria nell'ambiente accademico dell'IA/ML. Nello specifico, include:

  1. L'esplosione del numero di articoli sottomessi alle principali conferenze di IA/ML (oltre 10.000), che sottopone le pratiche di revisione tradizionali a enormi pressioni in termini di equità, efficienza e mantenimento della qualità
  2. Diverse conferenze adottano diversi modelli di trasparenza della revisione (completamente aperto, parzialmente aperto, completamente chiuso), mancando di standard uniformi
  3. L'aumento della proporzione di revisori giovani e inesperti, che potrebbe influire sulla qualità della revisione
  4. L'uso di strumenti di IA nella revisione manca di regolamentazione, presentando rischi etici

Importanza

L'importanza di questo problema si manifesta in:

  1. Mantenimento dell'Integrità Accademica: Un processo di revisione trasparente aiuta a scoprire e prevenire la cattiva condotta accademica
  2. Promozione della Partecipazione della Comunità: La revisione aperta può aumentare il coinvolgimento e la collaborazione dei membri della comunità
  3. Miglioramento della Qualità della Revisione: La supervisione pubblica può migliorare l'obiettività e la costruttività della revisione
  4. Accelerazione della Diffusione della Conoscenza: Un processo di revisione trasparente facilita la rapida diffusione della conoscenza accademica

Limitazioni degli Approcci Esistenti

  1. Revisione Completamente Chiusa: Manca di meccanismi di supervisione e responsabilità, facilitando incoerenze e pregiudizi
  2. Revisione Parzialmente Aperta: Sebbene pubblichi le revisioni dopo la decisione, limita la partecipazione della comunità in tempo reale
  3. Revisione Completamente Aperta: Potrebbe portare i revisori a essere eccessivamente cauti, influenzando il feedback franco

Motivazione della Ricerca

L'autore ha raccolto una grande quantità di dati attraverso la piattaforma Paper Copilot, scoprendo che:

  • Oltre 200.000 utenti attivi provenienti da 177 paesi mostrano un forte interesse per la revisione trasparente
  • I giovani ricercatori di età compresa tra 18 e 34 anni costituiscono il principale gruppo di utenti
  • Le conferenze con revisione aperta ottengono un maggiore coinvolgimento della comunità

Contributi Principali

  1. Fornitura di Dati Statistici Aperti: Attraverso Paper Copilot fornisce visualizzazioni statistiche della distribuzione dei punteggi di revisione, cronologie di revisione, analisi di autori/istituzioni, ecc.
  2. Quantificazione delle Prove di Interesse della Comunità: Sulla base dei dati di partecipazione di due anni, fornisce prove quantitative dell'interesse crescente della comunità verso la trasparenza della revisione
  3. Analisi Critica: Analizza sistematicamente i vantaggi e gli svantaggi di vari modelli di revisione
  4. Raccomandazioni Politiche: Sostiene l'adozione di un processo di revisione paritaria più trasparente, aperto e normalizzato

Spiegazione Dettagliata della Metodologia

Metodologia di Raccolta Dati

Acquisizione Automatizzata dei Dati

  1. API Pubbliche e Web Scraper:
    • Acquisizione di punteggi, livelli di confidenza e opinioni di revisione da conferenze con revisione aperta come ICLR tramite OpenReview API
    • Distribuzione di scraper personalizzati per acquisire dati quotidianamente, creando archivi di serie temporali
    • Acquisizione di informazioni su autori e istituzioni dai siti ufficiali
  2. Invii della Comunità:
    • Raccolta di informazioni di revisione anonime da conferenze con revisione parzialmente aperta o chiusa tramite Google Forms
    • Raccolta di 3.876 risposte valide nell'ultimo anno

Flusso di Elaborazione dei Dati

  • Pipeline standardizzata di pulizia, fusione e archiviazione dei dati
  • Dataset open source
  • Interfaccia frontend interattiva per la visualizzazione

Quadro Analitico

Classificazione della Trasparenza della Revisione

  1. Completamente Aperto: Tutte le revisioni e discussioni sono visibili pubblicamente in tempo reale (ad es. ICLR)
  2. Parzialmente Aperto: Revisioni e discussioni sono pubblicate solo dopo la conclusione della fase decisionale (ad es. NeurIPS, CoRL)
  3. Completamente Chiuso: Revisioni e discussioni rimangono permanentemente private (ad es. ICML, CVPR)

Dimensioni di Analisi degli Utenti

  • Distribuzione per età e genere
  • Distribuzione geografica (177 paesi)
  • Analisi del tempo di partecipazione e dei tassi di clic
  • Prestazioni di ranking nei motori di ricerca

Configurazione Sperimentale

Dimensione del Dataset

  • Arco Temporale: 10 anni di dati disponibili
  • Copertura Conferenze: 24 conferenze, coprendo 9 sottocampi dell'IA/ML
  • Dati Utenti: Oltre 200.000 utenti attivi provenienti da 177 paesi
  • Statistiche del Sito: 6 milioni di impressioni, 1 milione di visite al sito, 4 milioni di eventi utente

Metriche di Valutazione

  1. Coinvolgimento degli Utenti: Visualizzazioni di pagina, numero di utenti attivi, tempo medio di partecipazione
  2. Prestazioni di Ricerca: Tasso di clic di Google (CTR), posizione di ranking della pagina
  3. Qualità della Revisione: Punteggi di confidenza, numero di risposte alle discussioni
  4. Interesse della Comunità: Tasso di invio volontario di dati, tasso di risposta ai sondaggi

Analisi Comparativa

  • Confronto del coinvolgimento degli utenti tra conferenze con diversi livelli di trasparenza
  • Confronto dettagliato tra ICLR (completamente aperto) e NeurIPS (parzialmente aperto)
  • Analisi del coinvolgimento delle conferenze con revisione chiusa

Risultati Sperimentali

Risultati Principali

Differenze Significative nel Coinvolgimento degli Utenti

  • ICLR (Completamente Aperto): 414.096 visualizzazioni, 88.220 utenti attivi, tempo medio di partecipazione 3 minuti 50 secondi
  • NeurIPS (Parzialmente Aperto): Coinvolgimento notevolmente inferiore rispetto a ICLR
  • Conferenze Chiuse (CVPR, ECCV): Visualizzazioni inferiori a 35.000, tempo medio di partecipazione inferiore a 1,5 minuti

Prestazioni nei Motori di Ricerca

  • Il CTR di Google rimane coerente tra il 66,08% e l'86,49%
  • Le pagine relative alla revisione aperta si posizionano più in alto nei risultati di ricerca
  • Negli ultimi 28 giorni, la sola ricerca Google ha generato 50.000 clic organici

Analisi della Qualità della Revisione

  1. Punteggi di Confidenza:
    • ICLR: 3,53 ± 0,48 (2024)
    • NeurIPS: 3,58 ± 0,54 (2024)
    • La revisione completamente aperta mostra una concentrazione leggermente inferiore di punteggi di alta confidenza
  2. Attività di Discussione:
    • ICLR mostra una distribuzione di risposte più ampia (massimo 76 risposte vs 49 di NeurIPS)
    • La varianza della discussione di ICLR è significativamente maggiore, riflettendo un ambiente di revisione più dinamico

Analisi del Profilo Utente

Distribuzione per Età e Genere

  • Principale Gruppo di Utenti: L'età 18-24 anni rappresenta la proporzione maggiore
  • Tempo di Partecipazione: Gli utenti maschi giovani hanno il tempo medio di partecipazione più lungo (4 minuti 15 secondi)
  • Utenti Femmine: Il tempo di partecipazione è relativamente coerente tra le fasce d'età

Distribuzione Geografica

  • Paesi Principali: Stati Uniti (60.648 utenti), Cina (59.269 utenti)
  • Regioni ad Alto Coinvolgimento: Singapore e Australia hanno un tempo medio di partecipazione superiore a 3 minuti
  • Variazioni di Partecipazione: Regno Unito e Germania hanno un tempo di partecipazione relativamente breve (inferiore a 2 minuti)

Lavori Correlati

Ricerca sulla Revisione Paritaria Aperta

  • Fondamenti Teorici: Ross-Hellauer (2017) e altri hanno stabilito il quadro teorico della OPR
  • Esplorazioni Pratiche: La piattaforma OpenReview ha promosso l'applicazione della OPR nel campo dell'IA/ML
  • Ricerca sulla Qualità: Church et al. (2024) hanno studiato l'impatto della revisione aperta sulla qualità del feedback

Ricerca sulla Regolamentazione

  • Considerazioni Etiche: Ricerca sui rischi di privacy e molestie che la revisione pubblica potrebbe comportare
  • Revisione Assistita da IA: Esplorazione dell'applicazione di strumenti di IA nella revisione e delle esigenze di regolamentazione
  • Pregiudizio e Equità: Analisi dei pregiudizi sistematici nel processo di revisione

Conclusioni e Discussione

Conclusioni Principali

  1. Esigenze della Comunità Chiare: L'alto coinvolgimento di oltre 200.000 utenti globali dimostra una forte necessità di revisione trasparente
  2. Vantaggi Significativi della Revisione Aperta: Un processo di revisione completamente aperto promuove una maggiore partecipazione della comunità e discussioni accademiche più ricche
  3. Predominio dei Giovani Ricercatori: I ricercatori di età compresa tra 18 e 34 anni sono i principali promotori della revisione trasparente
  4. Qualità e Trasparenza Possono Coesistere: La revisione aperta non ha danneggiato la qualità della revisione, anzi ha promosso valutazioni più attente

Problemi della Revisione Chiusa

  1. Sfide dei Revisori Giovani: I revisori inesperti hanno difficoltà a ricevere guida in un ambiente chiuso
  2. Mancanza di Regolamentazione nell'Uso dell'IA: L'ambiente chiuso rende difficile il monitoraggio e la regolamentazione dell'uso di strumenti di IA
  3. Meccanismi di Responsabilità Insufficienti: È difficile correggere tempestivamente problemi come le incoerenze nelle informazioni degli autori

Raccomandazioni Politiche

  1. Progressione Graduale verso l'Apertura: Si consiglia a più conferenze di adottare almeno un modello di revisione parzialmente aperto
  2. Istituzione di Standard Normativi: Formulazione di linee guida per l'uso della revisione assistita da IA
  3. Rafforzamento del Supporto alla Formazione: Fornitura di maggiore formazione e guida ai revisori giovani
  4. Perfezionamento dei Meccanismi di Supervisione: Istituzione di sistemi di controllo della qualità e responsabilità più efficaci

Valutazione Approfondita

Punti di Forza

Innovazione Metodologica

  1. Ricerca Empirica su Larga Scala: Primo studio basato su dati comportamentali reali di oltre 200.000 utenti che analizza le esigenze di trasparenza della revisione
  2. Analisi Multidimensionale: Combinazione di comportamento degli utenti, dati di ricerca e qualità della revisione
  3. Raccolta Dati in Tempo Reale: Raccolta e analisi continua di dati attraverso la piattaforma Paper Copilot
  4. Prospettiva Globale: Copertura di 177 paesi, fornendo una vera prospettiva globalizzata

Completezza Sperimentale

  1. Scala Dati Ampia: 10 anni di dati storici, 24 conferenze, 9 sottocampi dell'IA/ML
  2. Verifica Multifonte: Combinazione di dati API, dati del sito web, dati di invio della comunità
  3. Combinazione Quantitativa e Qualitativa: Sia dati statistici che ricerca degli utenti
  4. Analisi di Serie Temporali: Tracciamento dei cambiamenti dinamici nel processo di revisione

Convincenza dei Risultati

  1. Risultati Coerenti: Più indicatori indicano i vantaggi della revisione aperta
  2. Significatività Statistica: Le differenze nel coinvolgimento degli utenti sono evidenti e coerenti
  3. Impatto Pratico: Paper Copilot stesso è un'applicazione pratica di successo della trasparenza

Limitazioni

Limitazioni Metodologiche

  1. Bias di Selezione: L'invio volontario di dati potrebbe presentare bias di selezione
  2. Relazione Causale: Impossibile determinare completamente la relazione causale tra trasparenza e coinvolgimento
  3. Differenze Culturali: Il grado di accettazione della trasparenza potrebbe variare tra paesi diversi
  4. Effetti Temporali: L'impatto dei modelli di revisione potrebbe richiedere più tempo per manifestarsi

Profondità di Analisi

  1. Valutazione della Qualità Limitata: Focus principale sul coinvolgimento, valutazione relativamente limitata della qualità effettiva della revisione
  2. Analisi Insufficiente degli Impatti Negativi: Discussione non sufficientemente approfondita dei potenziali impatti negativi della revisione aperta
  3. Mancanza di Dettagli di Implementazione: Orientamenti operativi insufficienti su come implementare concretamente la revisione trasparente

Problemi di Universalità

  1. Specificità del Dominio: Principalmente basato sul campo dell'IA/ML, l'applicabilità ad altri campi è sconosciuta
  2. Contesto Culturale: Diversi contesti accademici hanno diversi gradi di accettazione della trasparenza
  3. Soglia Tecnologica: La revisione aperta richiede una certa infrastruttura tecnologica di base

Valutazione dell'Impatto

Contributi Accademici

  1. Colmatura di Lacune di Ricerca: Primo studio su larga scala che quantifica le esigenze della comunità per la trasparenza della revisione
  2. Valore di Riferimento Politico: Fornisce riferimenti decisionali basati su dati ai responsabili dell'organizzazione delle conferenze
  3. Contributi Metodologici: Stabilisce un nuovo quadro metodologico per l'analisi dei processi di revisione

Valore Pratico

  1. Applicazione Diretta: La piattaforma Paper Copilot è già ampiamente utilizzata
  2. Impatto Politico: Potrebbe influenzare la formulazione delle politiche di revisione delle future conferenze
  3. Valore dello Strumento: I dati e gli strumenti di analisi forniti hanno valore continuo

Riproducibilità

  1. Dati Open Source: Impegno a rendere open source il dataset raccolto
  2. Trasparenza Metodologica: Descrizione dettagliata dei metodi di raccolta e analisi dei dati
  3. Accessibilità della Piattaforma: La piattaforma Paper Copilot continua a funzionare, i risultati sono verificabili

Scenari di Applicazione

Applicazione Diretta

  1. Conferenze di IA/ML: Applicabile direttamente a vari tipi di conferenze nel campo dell'IA/ML
  2. Informatica: Estendibile ad altri sottocampi dell'informatica
  3. Campi Guidati dalla Tecnologia: Applicabile ad altri campi tecnologici in rapida evoluzione

Richiede Adattamento

  1. Discipline Tradizionali: Le discipline umanistiche e sociali richiedono considerazione di fattori culturali
  2. Campi Sensibili: La ricerca che coinvolge segreti commerciali o sicurezza nazionale richiede considerazioni speciali
  3. Conferenze di Piccole Dimensioni: Le piccole conferenze specializzate potrebbero richiedere modalità di implementazione adattate

Direzioni di Ricerca Futura

  1. Verifica Transdisciplinare: Verifica delle conclusioni della ricerca in altri campi disciplinari
  2. Ricerca sull'Impatto a Lungo Termine: Tracciamento degli effetti a lungo termine dei cambiamenti nei modelli di revisione
  3. Metodi di Valutazione della Qualità: Sviluppo di metodi più precisi per la valutazione della qualità della revisione
  4. Formulazione di Linee Guida di Implementazione: Formulazione di linee guida concrete per l'implementazione della revisione trasparente
  5. Ricerca sull'Adattabilità Culturale: Studio degli adattamenti per diversi contesti culturali

Bibliografia

Questo articolo cita una ricerca correlata ricca, principalmente includendo:

  • Ross-Hellauer, T. (2017). What is open peer review? A systematic review.
  • Wang, G., et al. (2023). What have we learned from openreview?
  • Cortes, C. & Lawrence, N. D. (2021). Inconsistency in conference peer review
  • Beygelzimer, A., et al. (2023). Has the machine learning review process become more arbitrary

Valutazione Complessiva: Questo è un articolo di posizione di significativa importanza pratica, che fornisce un'analisi sistematica e raccomandazioni sulla trasparenza della revisione nel mondo accademico dell'IA/ML basate su dati reali su larga scala. Il valore principale dell'articolo risiede nel fornire prove quantitative a supporto della necessità di revisione trasparente e nel dimostrare gli effetti pratici di applicazione attraverso la piattaforma Paper Copilot. Sebbene vi sia spazio per miglioramenti nella metodologia e nella profondità dell'analisi, il suo ruolo nel promuovere la riforma del sistema di revisione accademica merita riconoscimento.