2025-11-25T01:52:16.261661

Position: The Artificial Intelligence and Machine Learning Community Should Adopt a More Transparent and Regulated Peer Review Process

Yang

The rapid growth of submissions to top-tier Artificial Intelligence (AI) and Machine Learning (ML) conferences has prompted many venues to transition from closed to open review platforms. Some have fully embraced open peer reviews, allowing public visibility throughout the process, while others adopt hybrid approaches, such as releasing reviews only after final decisions or keeping reviews private despite using open peer review systems. In this work, we analyze the strengths and limitations of these models, highlighting the growing community interest in transparent peer review. To support this discussion, we examine insights from Paper Copilot, a website launched two years ago to aggregate and analyze AI / ML conference data while engaging a global audience. The site has attracted over 200,000 early-career researchers, particularly those aged 18-34 from 177 countries, many of whom are actively engaged in the peer review process. Drawing on our findings, this position paper advocates for a more transparent, open, and well-regulated peer review aiming to foster greater community involvement and propel advancements in the field.

academic

Posizione: La Comunità dell'Intelligenza Artificiale e dell'Apprendimento Automatico Dovrebbe Adottare un Processo di Revisione Paritaria Più Trasparente e Regolamentato

Informazioni Fondamentali

ID Articolo: 2502.00874
Titolo: Position: The Artificial Intelligence and Machine Learning Community Should Adopt a More Transparent and Regulated Peer Review Process
Autore: Jing Yang (University of Southern California, papercopilot.com)
Classificazione: cs.DL cs.AI cs.CV cs.CY
Data di Pubblicazione/Conferenza: Proceedings of the 42nd International Conference on Machine Learning, Vancouver, Canada. PMLR 267, 2025
Link Articolo: https://arxiv.org/abs/2502.00874

Riassunto

Con la rapida crescita del numero di articoli sottomessi alle principali conferenze di intelligenza artificiale (IA) e apprendimento automatico (ML), molte conferenze si sono trasferite da piattaforme di revisione chiuse a piattaforme di revisione aperte. Alcune conferenze hanno adottato completamente la revisione paritaria aperta, consentendo la visibilità pubblica dell'intero processo, mentre altre hanno adottato approcci ibridi, come la pubblicazione delle revisioni solo dopo la decisione finale o il mantenimento della riservatezza delle revisioni nonostante l'utilizzo di sistemi di revisione aperti. Questo articolo analizza i vantaggi e i limiti di questi modelli, evidenziando l'interesse crescente della comunità verso la revisione paritaria trasparente. Per supportare questa discussione, esaminiamo i dati di Paper Copilot, un sito web lanciato due anni fa per aggregare e analizzare i dati delle conferenze di IA/ML e attirare un pubblico globale. Il sito ha attratto più di 200.000 ricercatori in fase iniziale di carriera provenienti da 177 paesi, in particolare ricercatori di età compresa tra 18 e 34 anni, molti dei quali partecipano attivamente al processo di revisione paritaria. Sulla base dei nostri risultati, questo articolo di posizione sostiene una revisione paritaria più trasparente, aperta e normalizzata, al fine di promuovere una maggiore partecipazione della comunità e favorire il progresso nel campo.

Contesto di Ricerca e Motivazione

Definizione del Problema

Il problema centrale affrontato da questo articolo è l'insufficiente trasparenza e regolamentazione del processo di revisione paritaria nell'ambiente accademico dell'IA/ML. Nello specifico, include:

L'esplosione del numero di articoli sottomessi alle principali conferenze di IA/ML (oltre 10.000), che sottopone le pratiche di revisione tradizionali a enormi pressioni in termini di equità, efficienza e mantenimento della qualità
Diverse conferenze adottano diversi modelli di trasparenza della revisione (completamente aperto, parzialmente aperto, completamente chiuso), mancando di standard uniformi
L'aumento della proporzione di revisori giovani e inesperti, che potrebbe influire sulla qualità della revisione
L'uso di strumenti di IA nella revisione manca di regolamentazione, presentando rischi etici

Importanza

L'importanza di questo problema si manifesta in:

Mantenimento dell'Integrità Accademica: Un processo di revisione trasparente aiuta a scoprire e prevenire la cattiva condotta accademica
Promozione della Partecipazione della Comunità: La revisione aperta può aumentare il coinvolgimento e la collaborazione dei membri della comunità
Miglioramento della Qualità della Revisione: La supervisione pubblica può migliorare l'obiettività e la costruttività della revisione
Accelerazione della Diffusione della Conoscenza: Un processo di revisione trasparente facilita la rapida diffusione della conoscenza accademica

Limitazioni degli Approcci Esistenti

Revisione Completamente Chiusa: Manca di meccanismi di supervisione e responsabilità, facilitando incoerenze e pregiudizi
Revisione Parzialmente Aperta: Sebbene pubblichi le revisioni dopo la decisione, limita la partecipazione della comunità in tempo reale
Revisione Completamente Aperta: Potrebbe portare i revisori a essere eccessivamente cauti, influenzando il feedback franco

Motivazione della Ricerca

L'autore ha raccolto una grande quantità di dati attraverso la piattaforma Paper Copilot, scoprendo che:

Oltre 200.000 utenti attivi provenienti da 177 paesi mostrano un forte interesse per la revisione trasparente
I giovani ricercatori di età compresa tra 18 e 34 anni costituiscono il principale gruppo di utenti
Le conferenze con revisione aperta ottengono un maggiore coinvolgimento della comunità

Contributi Principali

Fornitura di Dati Statistici Aperti: Attraverso Paper Copilot fornisce visualizzazioni statistiche della distribuzione dei punteggi di revisione, cronologie di revisione, analisi di autori/istituzioni, ecc.
Quantificazione delle Prove di Interesse della Comunità: Sulla base dei dati di partecipazione di due anni, fornisce prove quantitative dell'interesse crescente della comunità verso la trasparenza della revisione
Analisi Critica: Analizza sistematicamente i vantaggi e gli svantaggi di vari modelli di revisione
Raccomandazioni Politiche: Sostiene l'adozione di un processo di revisione paritaria più trasparente, aperto e normalizzato

Spiegazione Dettagliata della Metodologia

Metodologia di Raccolta Dati

Acquisizione Automatizzata dei Dati

API Pubbliche e Web Scraper:
- Acquisizione di punteggi, livelli di confidenza e opinioni di revisione da conferenze con revisione aperta come ICLR tramite OpenReview API
- Distribuzione di scraper personalizzati per acquisire dati quotidianamente, creando archivi di serie temporali
- Acquisizione di informazioni su autori e istituzioni dai siti ufficiali
Invii della Comunità:
- Raccolta di informazioni di revisione anonime da conferenze con revisione parzialmente aperta o chiusa tramite Google Forms
- Raccolta di 3.876 risposte valide nell'ultimo anno

Flusso di Elaborazione dei Dati

Pipeline standardizzata di pulizia, fusione e archiviazione dei dati
Dataset open source
Interfaccia frontend interattiva per la visualizzazione

Quadro Analitico

Classificazione della Trasparenza della Revisione

Completamente Aperto: Tutte le revisioni e discussioni sono visibili pubblicamente in tempo reale (ad es. ICLR)
Parzialmente Aperto: Revisioni e discussioni sono pubblicate solo dopo la conclusione della fase decisionale (ad es. NeurIPS, CoRL)
Completamente Chiuso: Revisioni e discussioni rimangono permanentemente private (ad es. ICML, CVPR)

Dimensioni di Analisi degli Utenti

Distribuzione per età e genere
Distribuzione geografica (177 paesi)
Analisi del tempo di partecipazione e dei tassi di clic
Prestazioni di ranking nei motori di ricerca

Configurazione Sperimentale

Dimensione del Dataset

Arco Temporale: 10 anni di dati disponibili
Copertura Conferenze: 24 conferenze, coprendo 9 sottocampi dell'IA/ML
Dati Utenti: Oltre 200.000 utenti attivi provenienti da 177 paesi
Statistiche del Sito: 6 milioni di impressioni, 1 milione di visite al sito, 4 milioni di eventi utente

Metriche di Valutazione

Coinvolgimento degli Utenti: Visualizzazioni di pagina, numero di utenti attivi, tempo medio di partecipazione
Prestazioni di Ricerca: Tasso di clic di Google (CTR), posizione di ranking della pagina
Qualità della Revisione: Punteggi di confidenza, numero di risposte alle discussioni
Interesse della Comunità: Tasso di invio volontario di dati, tasso di risposta ai sondaggi

Analisi Comparativa

Confronto del coinvolgimento degli utenti tra conferenze con diversi livelli di trasparenza
Confronto dettagliato tra ICLR (completamente aperto) e NeurIPS (parzialmente aperto)
Analisi del coinvolgimento delle conferenze con revisione chiusa

Risultati Sperimentali

Risultati Principali

Differenze Significative nel Coinvolgimento degli Utenti

ICLR (Completamente Aperto): 414.096 visualizzazioni, 88.220 utenti attivi, tempo medio di partecipazione 3 minuti 50 secondi
NeurIPS (Parzialmente Aperto): Coinvolgimento notevolmente inferiore rispetto a ICLR
Conferenze Chiuse (CVPR, ECCV): Visualizzazioni inferiori a 35.000, tempo medio di partecipazione inferiore a 1,5 minuti

Prestazioni nei Motori di Ricerca

Il CTR di Google rimane coerente tra il 66,08% e l'86,49%
Le pagine relative alla revisione aperta si posizionano più in alto nei risultati di ricerca
Negli ultimi 28 giorni, la sola ricerca Google ha generato 50.000 clic organici

Analisi della Qualità della Revisione

Punteggi di Confidenza:
- ICLR: 3,53 ± 0,48 (2024)
- NeurIPS: 3,58 ± 0,54 (2024)
- La revisione completamente aperta mostra una concentrazione leggermente inferiore di punteggi di alta confidenza
Attività di Discussione:
- ICLR mostra una distribuzione di risposte più ampia (massimo 76 risposte vs 49 di NeurIPS)
- La varianza della discussione di ICLR è significativamente maggiore, riflettendo un ambiente di revisione più dinamico

Analisi del Profilo Utente

Distribuzione per Età e Genere

Principale Gruppo di Utenti: L'età 18-24 anni rappresenta la proporzione maggiore
Tempo di Partecipazione: Gli utenti maschi giovani hanno il tempo medio di partecipazione più lungo (4 minuti 15 secondi)
Utenti Femmine: Il tempo di partecipazione è relativamente coerente tra le fasce d'età

Distribuzione Geografica

Paesi Principali: Stati Uniti (60.648 utenti), Cina (59.269 utenti)
Regioni ad Alto Coinvolgimento: Singapore e Australia hanno un tempo medio di partecipazione superiore a 3 minuti
Variazioni di Partecipazione: Regno Unito e Germania hanno un tempo di partecipazione relativamente breve (inferiore a 2 minuti)

Lavori Correlati

Ricerca sulla Revisione Paritaria Aperta

Fondamenti Teorici: Ross-Hellauer (2017) e altri hanno stabilito il quadro teorico della OPR
Esplorazioni Pratiche: La piattaforma OpenReview ha promosso l'applicazione della OPR nel campo dell'IA/ML
Ricerca sulla Qualità: Church et al. (2024) hanno studiato l'impatto della revisione aperta sulla qualità del feedback

Ricerca sulla Regolamentazione

Considerazioni Etiche: Ricerca sui rischi di privacy e molestie che la revisione pubblica potrebbe comportare
Revisione Assistita da IA: Esplorazione dell'applicazione di strumenti di IA nella revisione e delle esigenze di regolamentazione
Pregiudizio e Equità: Analisi dei pregiudizi sistematici nel processo di revisione

Conclusioni e Discussione

Conclusioni Principali

Esigenze della Comunità Chiare: L'alto coinvolgimento di oltre 200.000 utenti globali dimostra una forte necessità di revisione trasparente
Vantaggi Significativi della Revisione Aperta: Un processo di revisione completamente aperto promuove una maggiore partecipazione della comunità e discussioni accademiche più ricche
Predominio dei Giovani Ricercatori: I ricercatori di età compresa tra 18 e 34 anni sono i principali promotori della revisione trasparente
Qualità e Trasparenza Possono Coesistere: La revisione aperta non ha danneggiato la qualità della revisione, anzi ha promosso valutazioni più attente

Problemi della Revisione Chiusa

Sfide dei Revisori Giovani: I revisori inesperti hanno difficoltà a ricevere guida in un ambiente chiuso
Mancanza di Regolamentazione nell'Uso dell'IA: L'ambiente chiuso rende difficile il monitoraggio e la regolamentazione dell'uso di strumenti di IA
Meccanismi di Responsabilità Insufficienti: È difficile correggere tempestivamente problemi come le incoerenze nelle informazioni degli autori

Raccomandazioni Politiche

Progressione Graduale verso l'Apertura: Si consiglia a più conferenze di adottare almeno un modello di revisione parzialmente aperto
Istituzione di Standard Normativi: Formulazione di linee guida per l'uso della revisione assistita da IA
Rafforzamento del Supporto alla Formazione: Fornitura di maggiore formazione e guida ai revisori giovani
Perfezionamento dei Meccanismi di Supervisione: Istituzione di sistemi di controllo della qualità e responsabilità più efficaci

Valutazione Approfondita

Punti di Forza

Innovazione Metodologica

Ricerca Empirica su Larga Scala: Primo studio basato su dati comportamentali reali di oltre 200.000 utenti che analizza le esigenze di trasparenza della revisione
Analisi Multidimensionale: Combinazione di comportamento degli utenti, dati di ricerca e qualità della revisione
Raccolta Dati in Tempo Reale: Raccolta e analisi continua di dati attraverso la piattaforma Paper Copilot
Prospettiva Globale: Copertura di 177 paesi, fornendo una vera prospettiva globalizzata

Completezza Sperimentale

Scala Dati Ampia: 10 anni di dati storici, 24 conferenze, 9 sottocampi dell'IA/ML
Verifica Multifonte: Combinazione di dati API, dati del sito web, dati di invio della comunità
Combinazione Quantitativa e Qualitativa: Sia dati statistici che ricerca degli utenti
Analisi di Serie Temporali: Tracciamento dei cambiamenti dinamici nel processo di revisione

Convincenza dei Risultati

Risultati Coerenti: Più indicatori indicano i vantaggi della revisione aperta
Significatività Statistica: Le differenze nel coinvolgimento degli utenti sono evidenti e coerenti
Impatto Pratico: Paper Copilot stesso è un'applicazione pratica di successo della trasparenza

Limitazioni

Limitazioni Metodologiche

Bias di Selezione: L'invio volontario di dati potrebbe presentare bias di selezione
Relazione Causale: Impossibile determinare completamente la relazione causale tra trasparenza e coinvolgimento
Differenze Culturali: Il grado di accettazione della trasparenza potrebbe variare tra paesi diversi
Effetti Temporali: L'impatto dei modelli di revisione potrebbe richiedere più tempo per manifestarsi

Profondità di Analisi

Valutazione della Qualità Limitata: Focus principale sul coinvolgimento, valutazione relativamente limitata della qualità effettiva della revisione
Analisi Insufficiente degli Impatti Negativi: Discussione non sufficientemente approfondita dei potenziali impatti negativi della revisione aperta
Mancanza di Dettagli di Implementazione: Orientamenti operativi insufficienti su come implementare concretamente la revisione trasparente

Problemi di Universalità

Specificità del Dominio: Principalmente basato sul campo dell'IA/ML, l'applicabilità ad altri campi è sconosciuta
Contesto Culturale: Diversi contesti accademici hanno diversi gradi di accettazione della trasparenza
Soglia Tecnologica: La revisione aperta richiede una certa infrastruttura tecnologica di base

Valutazione dell'Impatto

Contributi Accademici

Colmatura di Lacune di Ricerca: Primo studio su larga scala che quantifica le esigenze della comunità per la trasparenza della revisione
Valore di Riferimento Politico: Fornisce riferimenti decisionali basati su dati ai responsabili dell'organizzazione delle conferenze
Contributi Metodologici: Stabilisce un nuovo quadro metodologico per l'analisi dei processi di revisione

Valore Pratico

Applicazione Diretta: La piattaforma Paper Copilot è già ampiamente utilizzata
Impatto Politico: Potrebbe influenzare la formulazione delle politiche di revisione delle future conferenze
Valore dello Strumento: I dati e gli strumenti di analisi forniti hanno valore continuo

Riproducibilità

Dati Open Source: Impegno a rendere open source il dataset raccolto
Trasparenza Metodologica: Descrizione dettagliata dei metodi di raccolta e analisi dei dati
Accessibilità della Piattaforma: La piattaforma Paper Copilot continua a funzionare, i risultati sono verificabili

Scenari di Applicazione

Applicazione Diretta

Conferenze di IA/ML: Applicabile direttamente a vari tipi di conferenze nel campo dell'IA/ML
Informatica: Estendibile ad altri sottocampi dell'informatica
Campi Guidati dalla Tecnologia: Applicabile ad altri campi tecnologici in rapida evoluzione

Richiede Adattamento

Discipline Tradizionali: Le discipline umanistiche e sociali richiedono considerazione di fattori culturali
Campi Sensibili: La ricerca che coinvolge segreti commerciali o sicurezza nazionale richiede considerazioni speciali
Conferenze di Piccole Dimensioni: Le piccole conferenze specializzate potrebbero richiedere modalità di implementazione adattate

Direzioni di Ricerca Futura

Verifica Transdisciplinare: Verifica delle conclusioni della ricerca in altri campi disciplinari
Ricerca sull'Impatto a Lungo Termine: Tracciamento degli effetti a lungo termine dei cambiamenti nei modelli di revisione
Metodi di Valutazione della Qualità: Sviluppo di metodi più precisi per la valutazione della qualità della revisione
Formulazione di Linee Guida di Implementazione: Formulazione di linee guida concrete per l'implementazione della revisione trasparente
Ricerca sull'Adattabilità Culturale: Studio degli adattamenti per diversi contesti culturali

Bibliografia

Questo articolo cita una ricerca correlata ricca, principalmente includendo:

Ross-Hellauer, T. (2017). What is open peer review? A systematic review.
Wang, G., et al. (2023). What have we learned from openreview?
Cortes, C. & Lawrence, N. D. (2021). Inconsistency in conference peer review
Beygelzimer, A., et al. (2023). Has the machine learning review process become more arbitrary

Valutazione Complessiva: Questo è un articolo di posizione di significativa importanza pratica, che fornisce un'analisi sistematica e raccomandazioni sulla trasparenza della revisione nel mondo accademico dell'IA/ML basate su dati reali su larga scala. Il valore principale dell'articolo risiede nel fornire prove quantitative a supporto della necessità di revisione trasparente e nel dimostrare gli effetti pratici di applicazione attraverso la piattaforma Paper Copilot. Sebbene vi sia spazio per miglioramenti nella metodologia e nella profondità dell'analisi, il suo ruolo nel promuovere la riforma del sistema di revisione accademica merita riconoscimento.