2025-11-18T22:16:13.731313

Hierarchical Federated Learning for Crop Yield Prediction in Smart Agricultural Production Systems

Abouaomar, hanjri, Kobbane et al.
In this paper, we presents a novel hierarchical federated learning architecture specifically designed for smart agricultural production systems and crop yield prediction. Our approach introduces a seasonal subscription mechanism where farms join crop-specific clusters at the beginning of each agricultural season. The proposed three-layer architecture consists of individual smart farms at the client level, crop-specific aggregators at the middle layer, and a global model aggregator at the top level. Within each crop cluster, clients collaboratively train specialized models tailored to specific crop types, which are then aggregated to produce a higher-level global model that integrates knowledge across multiple crops. This hierarchical design enables both local specialization for individual crop types and global generalization across diverse agricultural contexts while preserving data privacy and reducing communication overhead. Experiments demonstrate the effectiveness of the proposed system, showing that local and crop-layer models closely follow actual yield patterns with consistent alignment, significantly outperforming standard machine learning models. The results validate the advantages of hierarchical federated learning in the agricultural context, particularly for scenarios involving heterogeneous farming environments and privacy-sensitive agricultural data.
academic

Aprendizaje Federado Jerárquico para la Predicción del Rendimiento de Cultivos en Sistemas de Producción Agrícola Inteligente

Información Básica

  • ID del Artículo: 2510.12727
  • Título: Hierarchical Federated Learning for Crop Yield Prediction in Smart Agricultural Production Systems
  • Autores: Anas Abouaomar, Mohammed El hanjri, Abdellatif Kobbane, Anis Laouiti, Khalid Nafil
  • Clasificación: cs.LG (Aprendizaje Automático), cs.AI (Inteligencia Artificial), cs.DC (Computación Distribuida)
  • Fecha de Publicación: 14 de octubre de 2025 (Preimpresión en ArXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2510.12727

Resumen

Este artículo propone una nueva arquitectura de aprendizaje federado jerárquico diseñada específicamente para sistemas de producción agrícola inteligente y predicción del rendimiento de cultivos. El método introduce un mecanismo de suscripción estacional, donde las granjas se unen a clústeres específicos de cultivos al inicio de cada temporada agrícola. La arquitectura de tres capas propuesta incluye una capa de cliente con granjas inteligentes individuales, una capa intermedia con agregadores específicos de cultivos y una capa superior con un agregador de modelo global. Dentro de cada clúster de cultivo, los clientes colaboran en el entrenamiento de modelos especializados para tipos de cultivos específicos, que luego se agregan para producir un modelo global de nivel superior que integra conocimiento de múltiples cultivos. Este diseño jerárquico permite tanto la especialización local para tipos de cultivos individuales como la generalización global en entornos agrícolas diversificados, mientras protege la privacidad de los datos y reduce la sobrecarga de comunicación.

Contexto de Investigación y Motivación

Definición del Problema

Esta investigación aborda problemas clave en la predicción del rendimiento de cultivos en la agricultura inteligente. Los métodos tradicionales de aprendizaje automático centralizado enfrentan los siguientes desafíos en entornos agrícolas reales:

  1. Heterogeneidad de datos y distribución geográfica: Las granjas varían significativamente en calidad del suelo, condiciones climáticas, tipos de cultivos, técnicas de siembra y uso de recursos
  2. Problemas de privacidad y propiedad de datos: Los propietarios de granjas generalmente no desean compartir datos operacionales sensibles con terceros por razones competitivas, éticas o legales
  3. Sobrecarga de comunicación y confiabilidad de conectividad: La conectividad confiable no siempre es posible en áreas rurales o con infraestructura deficiente

Importancia

La predicción precisa del rendimiento de cultivos es crucial para:

  • La toma de decisiones basada en datos por agricultores, agrónomos y formuladores de políticas
  • Asignación de recursos, planificación de cadena de suministro, fijación de precios de mercado y distribución de alimentos
  • Abordar las presiones del crecimiento demográfico global, cambio climático y aumento de las necesidades de seguridad alimentaria

Limitaciones de Métodos Existentes

Los métodos agrícolas basados en aprendizaje federado existentes presentan las siguientes limitaciones:

  • Mecanismos estáticos de participación de clientes
  • Estrategias uniformes de agregación de modelos
  • Falta de adaptabilidad a cambios estacionales y específicos de cultivos
  • Un modelo global único no puede capturar la variabilidad introducida por tipos de cultivos, regiones climáticas o prácticas agrícolas locales

Contribuciones Principales

  1. Diseño de un paradigma de aprendizaje federado con agrupamiento estacional y por tipo de cultivo: Se diseñó un mecanismo dinámico de participación de clientes alineado con ciclos de producción de cultivos para agricultura inteligente
  2. Desarrollo de un proceso de agregación de modelos jerárquico: Se equilibra la especialización local (por cultivo) con la generalización global entre tipos de cultivos
  3. Validación de la efectividad del sistema mediante experimentación integral: Se demostró el desempeño superior del sistema propuesto en tareas de predicción del rendimiento de cultivos

Explicación Detallada del Método

Definición de Tareas

Diseñar un sistema de aprendizaje federado jerárquico que contenga un conjunto de granjas (clientes), clústeres específicos de cultivos y un servidor central. El proceso de entrenamiento se realiza de manera estacional: al inicio de cada temporada, cada granja se suscribe a un clúster de tipo de cultivo y contribuye al entrenamiento de modelos específicos de cultivos, que posteriormente son agregados por el servidor para formar un modelo global entre cultivos.

Arquitectura del Modelo

Diseño de Arquitectura de Tres Capas

  1. Capa Inferior (Capa de Cliente): Granjas inteligentes individuales
    • Entrenan modelos ML locales en datos de cultivos propietarios
    • No comparten datos sin procesar, solo transmiten actualizaciones de modelos
  2. Capa Intermedia (Capa de Agregación de Cultivos): Agregadores específicos de cultivos
    • Realizan agregación específica de cultivos
    • Mantienen modelos especializados para cada tipo de cultivo
  3. Capa Superior (Capa de Agregación Global): Agregador de modelo global
    • Reciben modelos parcialmente agregados
    • Calculan el modelo global final w_global

Modelado Matemático

Entrenamiento Local del Cliente:

D_i = {(x_j, y_j)}^{n_i}_{j=1}, x_j ∈ R^d, y_j ∈ R
w_i^{(t+1)} ← LocalUpdate(θ_k^{(t)}, D_i) = θ_k^{(t)} - η∇L_i(θ_k^{(t)})

Agregación de Modelos Específicos de Cultivos:

θ_k^{(t+1)} = Σ_{i∈G_k} (n_i/N_k) * w_i^{(t+1)}
donde N_k = Σ_{i∈G_k} n_i

Agregación Entre Cultivos (Modelo Global):

w_global = Σ^K_{k=1} α_k * θ_k
donde α_k = N_k / Σ^K_{j=1} N_j

Función Objetivo:

min_w Σ^K_{k=1} Σ_{i∈G_k} (n_i/N) * L_i(w)
donde N = Σ^K_{k=1} N_k

Puntos de Innovación Técnica

  1. Mecanismo de suscripción estacional: Las granjas se unen dinámicamente a clústeres específicos de cultivos según sus intenciones de siembra actuales
  2. Estrategia de agregación jerárquica: Se equilibra la especialización local con el intercambio de conocimiento global
  3. Aprendizaje federado consciente de cultivos: Entrenamiento especializado para patrones específicos de diferentes tipos de cultivos

Configuración Experimental

Conjunto de Datos

  • Fuente de datos: Datos sintéticos extendidos basados en conjuntos de datos agrícolas públicos
  • Tipos de cultivos: Maíz, trigo, algodón, arroz, soja y cebada (K=6 cultivos)
  • Características de datos: Incluyen datos de sensores, satélites e históricos de rendimiento

Métricas de Evaluación

Se evalúa el desempeño del modelo comparando la consistencia entre el rendimiento predicho y el real, enfatizando la alineación entre la curva de predicción y los patrones de rendimiento real.

Métodos de Comparación

  • Modelo Local (Local Model)
  • Modelo Específico de Cultivo (Crop-Specific Model)
  • Modelo Global (Global Model)
  • Modelo de Aprendizaje Automático Estándar (Standard ML Model)

Detalles de Implementación

  • Entorno de Hardware: ASUS TUF A15, procesador AMD Ryzen 7 6800H (4.7 GHz), 16GB RAM, NVIDIA RTX 3070 Ti
  • Marco de Software: PyTorch y TensorFlow
  • Modelos ML: Random Forest, XGBoost, LSTM-CNN
  • Configuración de Parámetros:
    • Número total de clientes: N = 10
    • Rondas de entrenamiento local: E = 10 épocas
    • Rondas de modelo específico de cultivo: T_k = 15 rondas
    • Mínimo 1 granja participante por cultivo

Resultados Experimentales

Resultados Principales

El experimento seleccionó 3 granjas inteligentes aleatorias, cada una suscrita a diferentes tipos de cultivos (maíz, trigo, algodón) para análisis comparativo:

  1. Resultados de Predicción de Maíz: Los modelos locales y específicos de cultivos pueden hacer predicciones precisas del rendimiento de granjas, mientras que el modelo global en algunos casos hace predicciones imprecisas, similar a modelos ML estándar en aplicaciones a gran escala
  2. Resultados de Predicción de Trigo y Algodón: Muestran tendencias similares en los 3 granjas inteligentes, con variaciones de precisión de diferentes grados, pero los modelos locales y específicos de cultivos siempre pueden predecir el rendimiento con precisión
  3. Comparación de Desempeño: El modelo global es similar al modelo ML estándar que no considera dinámicas específicas de cultivos, frecuentemente haciendo predicciones muy imprecisas

Hallazgos Experimentales

  1. Ventajas de especialización local: Los modelos locales y específicos de cultivos superan significativamente al modelo global en precisión de predicción
  2. Importancia de especificidad de cultivos: El entrenamiento especializado para tipos de cultivos específicos puede capturar mejor los patrones de crecimiento únicos de cultivos y características de rendimiento
  3. Efectividad de arquitectura jerárquica: La arquitectura de tres capas equilibra exitosamente necesidades de personalización y generalización

Trabajo Relacionado

Direcciones de Investigación Principal

  1. Aplicaciones de aprendizaje federado en agricultura: Clasificación de cultivos, análisis de suelos, detección de plagas y enfermedades, predicción de rendimiento
  2. Arquitecturas de aprendizaje profundo: Marco CNN-RNN, arquitecturas de fusión multimodal, redes neuronales gráficas
  3. Estrategias de aprendizaje conjunto: Imputación múltiple, optimización de colonias de hormigas, clasificador Extra Trees
  4. Optimización de eficiencia de comunicación: Poda de modelos, integración de computación en niebla

Ventajas de Este Artículo

En comparación con trabajos existentes, las principales ventajas de este artículo son:

  • Introducción de mecanismo de suscripción dinámica que se adapta a características estacionales de producción agrícola
  • Diseño de estrategia de agregación jerárquica que logra tanto especialización como generalización
  • Proporciona soluciones para heterogeneidad de datos agrícolas y sensibilidad de privacidad

Conclusiones y Discusión

Conclusiones Principales

  1. La arquitectura de aprendizaje federado jerárquico resuelve exitosamente desafíos clave en agricultura inteligente
  2. El mecanismo de suscripción estacional y la estrategia de agregación jerárquica equilibran efectivamente especialización local e intercambio de conocimiento global
  3. Los resultados experimentales validan el desempeño superior de modelos locales y específicos de cultivos

Limitaciones

  1. Limitaciones de escala experimental: Validación con solo 10 granjas inteligentes y 6 tipos de cultivos
  2. Limitaciones de tipos de datos: Basado principalmente en datos sintéticos, carece de validación con datos reales de granjas a gran escala
  3. Consideración insuficiente de factores ambientales: No se consideran adecuadamente condiciones climáticas extremas, cambios de suelo y otros factores ambientales dinámicos

Direcciones Futuras

  1. Extensión de arquitectura del sistema: Inclusión de más tipos de cultivos
  2. Exploración de otros criterios de agrupamiento: Agrupamiento basado en región, disponibilidad de recursos o tamaño de granja
  3. Integración de más factores ambientales: Cambio climático, cambios dinámicos en calidad del suelo, etc.

Evaluación Profunda

Fortalezas

  1. Fuerte innovación: Primera introducción de mecanismo de suscripción estacional en aprendizaje federado agrícola
  2. Diseño de arquitectura razonable: La arquitectura jerárquica de tres capas equilibra bien especialización y generalización
  3. Alto valor práctico: Resuelve problemas reales de protección de privacidad de datos agrícolas y eficiencia de comunicación
  4. Modelado matemático claro: Proporciona fórmulas matemáticas completas y descripción de algoritmos

Insuficiencias

  1. Validación experimental insuficiente:
    • Escala experimental pequeña (solo 10 granjas)
    • Falta de comparación detallada con otros métodos avanzados de aprendizaje federado
    • No proporciona métricas de evaluación numéricas específicas (como RMSE, MAE, etc.)
  2. Limitaciones del método:
    • Estrategia de agrupamiento relativamente simple, basada solo en tipo de cultivo
    • No considera similitud de ubicación geográfica y ambiental entre granjas
    • Análisis insuficiente de distribución de datos no uniforme
  3. Detalles técnicos insuficientes:
    • Análisis de costo de comunicación no suficientemente detallado
    • Descripción insuficiente de mecanismos de protección de privacidad
    • Falta de análisis de convergencia del modelo

Impacto

  1. Contribución académica: Proporciona nuevas ideas y marco de investigación para aprendizaje federado agrícola
  2. Valor práctico: Proporciona solución viable para despliegue real de sistemas de agricultura inteligente
  3. Reproducibilidad: Proporciona descripción de algoritmos y detalles de implementación, pero carece de código de código abierto

Escenarios Aplicables

  1. Cooperativas agrícolas de múltiples cultivos: Aplicable a organizaciones agrícolas que cultivan múltiples tipos de cultivos
  2. Gestión agrícola regional: Adecuado para necesidades de predicción de rendimiento de departamentos de gestión agrícola regional
  3. Servicios de agricultura de precisión: Puede proporcionar soluciones diferenciadas para empresas de servicios de tecnología agrícola

Referencias

El artículo cita 22 referencias relacionadas, que cubren principalmente:

  • Investigación de aplicaciones de aprendizaje federado en agricultura
  • Aplicación de aprendizaje profundo en predicción del rendimiento de cultivos
  • Tecnologías de aprendizaje automático distribuido y protección de privacidad
  • Tecnologías de agricultura inteligente e Internet de las Cosas

Evaluación General: La arquitectura de aprendizaje federado jerárquico propuesta en este artículo tiene fuerte innovación y valor práctico, proporcionando una solución efectiva para resolver problemas de protección de privacidad de datos agrícolas y heterogeneidad. Aunque hay espacio para mejora en validación experimental y detalles técnicos, la línea de investigación general es clara y tiene buenas perspectivas de desarrollo.