2025-11-22T19:25:16.707578

Selecting Clusters and Protoclusters via Stellar Mass Density: I. Method and tests on Mock HSC-SSP catalogs

Vicentin, Araya-Araya, Sodré et al.
We present an algorithm designed to identify galaxy (proto)clusters in wide-area photometric surveys by first selecting their dominant galaxy-i.e., the Brightest Cluster Galaxy (BCG) or protoBCG-through the local stellar mass density traced by massive galaxies. We focus on its application to the Hyper Suprime-Cam Subaru Strategic Program (HSC-SSP) Wide Survey to detect candidates up to $\rm z \sim 2$. In this work, we apply the method to mock galaxy catalogs that replicate the observational constraints of the HSC-SSP Wide Survey. We derive functions that describe the probability of a massive galaxy being the dominant galaxy in a structure as a function of its stellar mass density contrast within a given redshift interval. We show that galaxies with probabilities greater than 50\% yield a sample of BCGs/protoBCGs with $\gtrsim 65\%$ purity, where most of the contamination arises from galaxies in massive groups below our cluster threshold. Using the same threshold, the resulting (proto)cluster sample achieves 80\% purity and 50\% completeness for halos with $M_{\rm{halo}} \geq 10^{14} \ M_{\odot}$, reaching nearly 100\% completeness for $M_{\rm{halo}} \geq 10^{14.5} \ M_{\odot}$. We also assign probabilistic membership to surrounding galaxies based on stellar mass and distance to the dominant galaxy, from which we define the cluster richness as the number of galaxies more likely to be true members than contaminants. This allows us to derive a halo mass-richness relation. In a companion paper, we apply the algorithm to the HSC-SSP data and compare our catalog with others based on different cluster-finding techniques and X-ray detections.
academic

Selección de Cúmulos y Protocúmulos mediante Densidad de Masa Estelar: I. Método y pruebas en catálogos simulados HSC-SSP

Información Básica

  • ID del artículo: 2510.10735
  • Título: Selecting Clusters and Protoclusters via Stellar Mass Density: I. Method and tests on Mock HSC-SSP catalogs
  • Autores: Marcelo C. Vicentin, Pablo Araya-Araya, Laerte Sodré Jr., Michael A. Strauss
  • Clasificación: astro-ph.CO astro-ph.GA
  • Fecha de publicación: 14 de octubre de 2025 (versión de borrador)
  • Enlace del artículo: https://arxiv.org/abs/2510.10735

Resumen

Este artículo propone un nuevo algoritmo para identificar cúmulos de galaxias (proto)cúmulos mediante la densidad de masa estelar. El método selecciona primero galaxias dominantes (es decir, galaxias centrales de cúmulos BCG o proto-BCG) rastreadas por la densidad local de masa estelar de galaxias masivas. La investigación se enfoca en la aplicación de este método en el Hyper Suprime-Cam Subaru Strategic Program (HSC-SSP) Wide Survey para detectar candidatos en el rango de corrimiento al rojo z ~ 2. Aplicando el método en catálogos de galaxias simuladas restringidas por las observaciones del HSC-SSP Wide Survey, los autores derivan funciones que describen la probabilidad de que una galaxia masiva sea la galaxia dominante de una estructura en un intervalo de corrimiento al rojo dado. Los resultados muestran que las muestras de BCGs/protoBCGs generadas por galaxias con probabilidad superior al 50% tienen una pureza ≳65%, siendo la mayor parte de la contaminación proveniente de galaxias en grupos masivos por debajo del umbral de cúmulos. Utilizando el mismo umbral, las muestras de (proto)cúmulos obtenidas logran una pureza del 80% y una completitud del 50% para halos con Mhalo ≥ 10^14 M⊙, con una completitud cercana al 100% para Mhalo ≥ 10^14.5 M⊙.

Antecedentes y Motivación de la Investigación

Problemas Científicos

Los cúmulos de galaxias son las estructuras ligadas gravitacionalmente más grandes del universo, rastreando las regiones más densas a escala cósmica. Su identificación es crucial para comprender la evolución de la estructura a gran escala y los mecanismos de evolución galáctica. Sin embargo, la identificación de (proto)cúmulos de galaxias a alto corrimiento al rojo (z > 1) enfrenta desafíos significativos:

  1. Estado de evolución estructural: En el rango 1 < z < 2, una fracción considerable de estructuras aún se encuentra en proceso de formación, denominadas protocúmulos de galaxias (protoclusters), que aún no han alcanzado el equilibrio
  2. Limitaciones observacionales: Las muestras espectroscópicas a alto corrimiento al rojo son pequeñas e irregulares, causando desafíos en las estimaciones de corrimiento al rojo fotométrico y la calibración de color de galaxias de secuencia roja
  3. Distribución espacial: Las galaxias en protocúmulos pueden estar dispersas en regiones de varios megaparsecs comóviles

Limitaciones de Métodos Existentes

Los algoritmos de detección de cúmulos de galaxias existentes incluyen principalmente:

  • redMaPPer y CAMIRA: Enfocados en detectar la "secuencia roja" en diagramas color-magnitud de cúmulos de galaxias
  • Otros métodos: Dependientes únicamente de la distribución de galaxias en separación angular y corrimiento al rojo fotométrico

Estos métodos tienen tasas de éxito superiores al 60% en z < 1, pero su efectividad disminuye a alto corrimiento al rojo, ya que la secuencia roja a menudo aún no está claramente definida.

Puntos Innovadores de la Investigación

El método propuesto en este artículo presenta las siguientes ventajas:

  1. Independencia de suposiciones de color: No depende directamente de suposiciones sobre el color de las galaxias
  2. Identificación prioritaria de galaxias dominantes: Identifica primero galaxias dominantes en lugar de características estructurales generales
  3. Aplicabilidad a alto corrimiento al rojo: Particularmente adecuado para regiones de alto corrimiento al rojo donde los protocúmulos son más comunes

Contribuciones Principales

  1. Propone nuevo algoritmo de detección de cúmulos de galaxias: Nuevo método basado en contraste de densidad de masa estelar para identificar galaxias dominantes
  2. Establece modelo probabilístico: Deriva funciones que describen la probabilidad de que una galaxia sea la galaxia dominante de una estructura
  3. Verifica efectividad del algoritmo: Valida el algoritmo en datos simulados PCcones, logrando pureza de BCG/protoBCG superior al 65%
  4. Método de selección de miembros: Proporciona selección probabilística de miembros basada en masa estelar y distancia a la galaxia dominante
  5. Relación masa-abundancia: Establece relación entre masa de halo y abundancia para estimación de masa

Explicación Detallada del Método

Definición de la Tarea

Entrada: Catálogo de galaxias de un sondeo fotométrico (posición, corrimiento al rojo fotométrico, masa estelar) Salida: Candidatos de (proto)cúmulos de galaxias, galaxias dominantes, galaxias miembro, abundancia Restricciones: Aplicable a las limitaciones observacionales del HSC-SSP Wide Survey, rango de detección 0.1 < z < 2

Arquitectura del Algoritmo

1. Preselección de Candidatos de Galaxias Dominantes

Para cada candidato de galaxia dominante masiva preseleccionado (i), se calcula la masa estelar total dentro de un volumen cilíndrico centrado en el candidato:

  • Definición del cilindro: Radio r = 1 Mpc, altura correspondiente a la distancia comóvil dentro del corte de corrimiento al rojo
  • Corte de corrimiento al rojo: Δzi = zi - σz(1 + zi), zi + σz(1 + zi)

2. Cálculo del Contraste de Densidad

El volumen cilíndrico se divide en tres anillos concéntricos equidistantes, aplicando factores de peso basados en la inversa de la distancia radial proyectada:

ρ̂i = Σj=1³ [M★,i,j^tot / (π(rj² - rj-1²)dc(Δzi))] × (rj/cMpc)^(-w) / Σj=1³ (rj/cMpc)^(-w)

donde w = 0.8 es el peso optimizado.

El contraste de densidad se define como:

δρi = (ρ̂i - ρ̄) / ρ̄

3. Modelado Probabilístico

Se construye un modelo probabilístico basado en la distribución del contraste de densidad, utilizando una función sigmoide modificada:

f(δρ; a,b,c,d) = a / {1 + exp[-b(δρ - c)]} + d

Algoritmo de Selección de Miembros

  1. Selección de características: Basada en masa estelar fotométrica y distancia a la BCG
  2. Cálculo de probabilidad: P(Miembro|M★,phot, ddominante, zdominante) vs P(Contaminación|M★,phot, ddominante, zdominante)
  3. Determinación de membresía: Las galaxias con P(Miembro) > P(Contaminación) se consideran miembros
  4. Definición de abundancia: Número de galaxias que satisfacen las condiciones

Configuración Experimental

Conjunto de Datos

Cono de luz simulado PCcones:

  • Basado en el modelo semianalítico L-GALAXIES de la simulación Millennium
  • 10 conos de luz, cada uno de 36 deg²
  • Simula restricciones observacionales del HSC-SSP Wide Survey
  • Incluye datos de filtros grizY + infrarrojo W1/W2

Datos de Verificación Observacional:

  • Candidatos de cúmulos CAMIRA HSC-SSP wide
  • Catálogo Wen & Han 2021 HSC-SSP wide
  • Candidatos de cúmulos redMaPPer

Métricas de Evaluación

  • Completitud (Completeness): Proporción de galaxias dominantes verdaderas identificadas correctamente
  • Pureza (Purity): Proporción de galaxias dominantes verdaderas en la muestra identificada
  • Tasa de contaminación: Proporción de diferentes tipos de fuentes de contaminación

Detalles de Implementación

  • Intervalos de corrimiento al rojo: 6 intervalos de corrimiento al rojo fotométrico [0.1,0.45), [0.45,0.7), [0.7,1.05), [1.05,1.3), [1.3,1.5), [1.5,2)
  • Umbrales de masa: log(M★,phot/M⊙) = 11, 11, 11, 10.5, 10.5, 10.5 correspondientes a cada intervalo de corrimiento al rojo
  • Definición de estructura: Mhalo ≥ 10^14 M⊙ como umbral de cúmulo de galaxias

Resultados Experimentales

Resultados Principales

Efectividad de Identificación de BCG/protoBCG

  • Umbral Pdominante > 50%: Pureza de BCGs/protoBCGs ≥65%
  • Fuentes principales de contaminación: Galaxias en grupos masivos (por debajo del umbral de cúmulo)
  • Evolución con corrimiento al rojo: Proporción de selección de BCG disminuye del 52% (z bajo) al 33% (z>1.5)

Rendimiento de Detección de Cúmulos de Galaxias

  • Pdominante ≥ 0.5:
    • Mhalo ≥ 10^14 M⊙: 80% de pureza, 50% de completitud
    • Mhalo ≥ 10^14.5 M⊙: Completitud cercana al 100%
  • Pdominante ≥ 0.8: Pureza aumenta a ~95%

Relación Masa-Abundancia

Se establece la relación entre masa de halo y abundancia para diferentes intervalos de corrimiento al rojo:

  • Relación log-lineal adoptada: log(Mhalo) = α × λ + β
  • Rango de pendientes α: 0.022-0.053
  • Rango de intersecciones β: 13.140-13.769

Verificación de Consistencia

La comparación con catálogos observacionales muestra:

  • Propiedades de BCG: Magnitud en banda i, color r-i, masa estelar consistentes con observaciones
  • Distribución espacial: Dispersión de velocidades y perfil radial consistentes con redMaPPer (prueba KS p=0.245)

Trabajos Relacionados

Métodos Tradicionales

  1. Métodos de secuencia roja: Detección basada en secuencia roja de galaxias pasivas por redMaPPer, CAMIRA
  2. Métodos de densidad: Métodos FOF basados en distribución espacial y de corrimiento al rojo de galaxias
  3. Métodos multibanda: Detección mediante rayos X, efecto Sunyaev-Zeldovich

Innovación del Presente Artículo

Comparado con métodos tradicionales, el algoritmo de este artículo:

  • No depende de suposiciones de secuencia roja, aplicable a alto corrimiento al rojo
  • Identifica primero galaxias dominantes en lugar de estructuras generales
  • Combina información de densidad de masa estelar para mejorar precisión de identificación

Conclusiones y Discusión

Conclusiones Principales

  1. Validez del algoritmo: El nuevo algoritmo puede identificar efectivamente (proto)cúmulos de galaxias en el rango z < 2
  2. Indicadores de rendimiento: Logra buen rendimiento bajo un equilibrio razonable entre pureza y completitud
  3. Aplicabilidad a alto corrimiento al rojo: Particularmente adecuado para regiones de alto corrimiento al rojo donde los protocúmulos son dominantes
  4. Selección de miembros: El método probabilístico de selección de miembros puede determinar efectivamente la abundancia de cúmulos

Limitaciones

  1. Dependencia de precisión fotométrica: La precisión de corrimiento al rojo fotométrico y estimación de masa estelar disminuye a alto corrimiento al rojo
  2. Cobertura W1/W2: La cobertura de banda infrarroja reducida a alto corrimiento al rojo afecta el rendimiento
  3. Efectos de proyección: Los efectos de proyección a alto corrimiento al rojo pueden aumentar la contaminación
  4. Selección de umbral de masa: La elección del umbral de 10^14 M⊙ puede afectar la definición de protocúmulo

Direcciones Futuras

  1. Aplicación a datos reales: Aplicar el algoritmo a datos observacionales reales del HSC-SSP
  2. Combinación multibanda: Combinar información multibanda como rayos X para verificación
  3. Generalización del método: Adaptar a otros proyectos de sondeo (DES, LSST, etc.)
  4. Optimización para alto corrimiento al rojo: Optimizar aún más el algoritmo para la región z > 1.5

Evaluación Profunda

Fortalezas

  1. Innovación metodológica: Propone una estrategia única de identificación "prioritaria de galaxia dominante"
  2. Experimentación exhaustiva: Realiza verificación completa en datos simulados detallados
  3. Buen rendimiento: Logra buen equilibrio entre pureza y completitud
  4. Aplicabilidad fuerte: Particularmente adecuado para detección de protocúmulos a alto corrimiento al rojo
  5. Escritura clara: Descripción detallada del método, diseño experimental razonable

Insuficiencias

  1. Dependencia de simulación: Los resultados se basan principalmente en datos simulados, la efectividad de aplicación real requiere verificación
  2. Ajuste de parámetros: La selección de múltiples parámetros empíricos (como w=0.8) carece de justificación teórica
  3. Complejidad computacional: Análisis insuficiente del costo computacional del cálculo de densidad
  4. Análisis de robustez: Análisis limitado de robustez ante errores sistemáticos fotométricos

Impacto

  1. Valor académico: Contribución metodológica importante para detección de cúmulos de galaxias
  2. Valor práctico: Promete jugar un papel importante en próximos grandes sondeos
  3. Reproducibilidad: Descripción detallada del método, fácil de reproducir y mejorar
  4. Avance del campo: Proporciona herramienta poderosa para investigación de cúmulos de galaxias a alto corrimiento al rojo

Escenarios de Aplicación

  1. Grandes sondeos fotométricos: HSC-SSP, DES, LSST, etc.
  2. Detección a alto corrimiento al rojo: Particularmente adecuado para búsqueda de protocúmulos en z > 1
  3. Observaciones espectroscópicas posteriores: Proporciona selección de objetivos para instrumentos espectroscópicos como PFS
  4. Investigación cosmológica: Investigación de evolución de estructura a gran escala y evolución galáctica

Referencias

El artículo cita numerosas investigaciones relacionadas, incluyendo principalmente:

  • Algoritmos de detección de cúmulos: Rykoff et al. (2014), Oguri (2014)
  • Sondeo HSC-SSP: Aihara et al. (2018, 2022)
  • Trabajos de simulación: Henriques et al. (2015), Springel (2005)
  • Investigación de protocúmulos: Overzier (2016), Toshikawa et al. (2018)

Resumen: Este es un artículo de alta calidad de metodología en astrofísica que propone un algoritmo innovador de detección de cúmulos de galaxias y realiza verificación exhaustiva. Este método tiene ventajas únicas en la detección de protocúmulos de galaxias a alto corrimiento al rojo, proporcionando una herramienta valiosa para próximos proyectos de grandes sondeos. La principal contribución del artículo radica en la innovación metodológica y la verificación sistemática, realizando una contribución importante al desarrollo de este campo.