2025-11-18T22:16:13.731313

Hierarchical Federated Learning for Crop Yield Prediction in Smart Agricultural Production Systems

Abouaomar, hanjri, Kobbane et al.

In this paper, we presents a novel hierarchical federated learning architecture specifically designed for smart agricultural production systems and crop yield prediction. Our approach introduces a seasonal subscription mechanism where farms join crop-specific clusters at the beginning of each agricultural season. The proposed three-layer architecture consists of individual smart farms at the client level, crop-specific aggregators at the middle layer, and a global model aggregator at the top level. Within each crop cluster, clients collaboratively train specialized models tailored to specific crop types, which are then aggregated to produce a higher-level global model that integrates knowledge across multiple crops. This hierarchical design enables both local specialization for individual crop types and global generalization across diverse agricultural contexts while preserving data privacy and reducing communication overhead. Experiments demonstrate the effectiveness of the proposed system, showing that local and crop-layer models closely follow actual yield patterns with consistent alignment, significantly outperforming standard machine learning models. The results validate the advantages of hierarchical federated learning in the agricultural context, particularly for scenarios involving heterogeneous farming environments and privacy-sensitive agricultural data.

academic

Aprendizaje Federado Jerárquico para la Predicción del Rendimiento de Cultivos en Sistemas de Producción Agrícola Inteligente

Información Básica

ID del Artículo: 2510.12727
Título: Hierarchical Federated Learning for Crop Yield Prediction in Smart Agricultural Production Systems
Autores: Anas Abouaomar, Mohammed El hanjri, Abdellatif Kobbane, Anis Laouiti, Khalid Nafil
Clasificación: cs.LG (Aprendizaje Automático), cs.AI (Inteligencia Artificial), cs.DC (Computación Distribuida)
Fecha de Publicación: 14 de octubre de 2025 (Preimpresión en ArXiv)
Enlace del Artículo: https://arxiv.org/abs/2510.12727

Resumen

Este artículo propone una nueva arquitectura de aprendizaje federado jerárquico diseñada específicamente para sistemas de producción agrícola inteligente y predicción del rendimiento de cultivos. El método introduce un mecanismo de suscripción estacional, donde las granjas se unen a clústeres específicos de cultivos al inicio de cada temporada agrícola. La arquitectura de tres capas propuesta incluye una capa de cliente con granjas inteligentes individuales, una capa intermedia con agregadores específicos de cultivos y una capa superior con un agregador de modelo global. Dentro de cada clúster de cultivo, los clientes colaboran en el entrenamiento de modelos especializados para tipos de cultivos específicos, que luego se agregan para producir un modelo global de nivel superior que integra conocimiento de múltiples cultivos. Este diseño jerárquico permite tanto la especialización local para tipos de cultivos individuales como la generalización global en entornos agrícolas diversificados, mientras protege la privacidad de los datos y reduce la sobrecarga de comunicación.

Contexto de Investigación y Motivación

Definición del Problema

Esta investigación aborda problemas clave en la predicción del rendimiento de cultivos en la agricultura inteligente. Los métodos tradicionales de aprendizaje automático centralizado enfrentan los siguientes desafíos en entornos agrícolas reales:

Heterogeneidad de datos y distribución geográfica: Las granjas varían significativamente en calidad del suelo, condiciones climáticas, tipos de cultivos, técnicas de siembra y uso de recursos
Problemas de privacidad y propiedad de datos: Los propietarios de granjas generalmente no desean compartir datos operacionales sensibles con terceros por razones competitivas, éticas o legales
Sobrecarga de comunicación y confiabilidad de conectividad: La conectividad confiable no siempre es posible en áreas rurales o con infraestructura deficiente

Importancia

La predicción precisa del rendimiento de cultivos es crucial para:

La toma de decisiones basada en datos por agricultores, agrónomos y formuladores de políticas
Asignación de recursos, planificación de cadena de suministro, fijación de precios de mercado y distribución de alimentos
Abordar las presiones del crecimiento demográfico global, cambio climático y aumento de las necesidades de seguridad alimentaria

Limitaciones de Métodos Existentes

Los métodos agrícolas basados en aprendizaje federado existentes presentan las siguientes limitaciones:

Mecanismos estáticos de participación de clientes
Estrategias uniformes de agregación de modelos
Falta de adaptabilidad a cambios estacionales y específicos de cultivos
Un modelo global único no puede capturar la variabilidad introducida por tipos de cultivos, regiones climáticas o prácticas agrícolas locales

Contribuciones Principales

Diseño de un paradigma de aprendizaje federado con agrupamiento estacional y por tipo de cultivo: Se diseñó un mecanismo dinámico de participación de clientes alineado con ciclos de producción de cultivos para agricultura inteligente
Desarrollo de un proceso de agregación de modelos jerárquico: Se equilibra la especialización local (por cultivo) con la generalización global entre tipos de cultivos
Validación de la efectividad del sistema mediante experimentación integral: Se demostró el desempeño superior del sistema propuesto en tareas de predicción del rendimiento de cultivos

Explicación Detallada del Método

Definición de Tareas

Diseñar un sistema de aprendizaje federado jerárquico que contenga un conjunto de granjas (clientes), clústeres específicos de cultivos y un servidor central. El proceso de entrenamiento se realiza de manera estacional: al inicio de cada temporada, cada granja se suscribe a un clúster de tipo de cultivo y contribuye al entrenamiento de modelos específicos de cultivos, que posteriormente son agregados por el servidor para formar un modelo global entre cultivos.

Arquitectura del Modelo

Diseño de Arquitectura de Tres Capas

Capa Inferior (Capa de Cliente): Granjas inteligentes individuales
- Entrenan modelos ML locales en datos de cultivos propietarios
- No comparten datos sin procesar, solo transmiten actualizaciones de modelos
Capa Intermedia (Capa de Agregación de Cultivos): Agregadores específicos de cultivos
- Realizan agregación específica de cultivos
- Mantienen modelos especializados para cada tipo de cultivo
Capa Superior (Capa de Agregación Global): Agregador de modelo global
- Reciben modelos parcialmente agregados
- Calculan el modelo global final w_global

Modelado Matemático

Entrenamiento Local del Cliente:

D_i = {(x_j, y_j)}^{n_i}_{j=1}, x_j ∈ R^d, y_j ∈ R
w_i^{(t+1)} ← LocalUpdate(θ_k^{(t)}, D_i) = θ_k^{(t)} - η∇L_i(θ_k^{(t)})

Agregación de Modelos Específicos de Cultivos:

θ_k^{(t+1)} = Σ_{i∈G_k} (n_i/N_k) * w_i^{(t+1)}
donde N_k = Σ_{i∈G_k} n_i

Agregación Entre Cultivos (Modelo Global):

w_global = Σ^K_{k=1} α_k * θ_k
donde α_k = N_k / Σ^K_{j=1} N_j

Función Objetivo:

min_w Σ^K_{k=1} Σ_{i∈G_k} (n_i/N) * L_i(w)
donde N = Σ^K_{k=1} N_k

Puntos de Innovación Técnica

Mecanismo de suscripción estacional: Las granjas se unen dinámicamente a clústeres específicos de cultivos según sus intenciones de siembra actuales
Estrategia de agregación jerárquica: Se equilibra la especialización local con el intercambio de conocimiento global
Aprendizaje federado consciente de cultivos: Entrenamiento especializado para patrones específicos de diferentes tipos de cultivos

Configuración Experimental

Conjunto de Datos

Fuente de datos: Datos sintéticos extendidos basados en conjuntos de datos agrícolas públicos
Tipos de cultivos: Maíz, trigo, algodón, arroz, soja y cebada (K=6 cultivos)
Características de datos: Incluyen datos de sensores, satélites e históricos de rendimiento

Métricas de Evaluación

Se evalúa el desempeño del modelo comparando la consistencia entre el rendimiento predicho y el real, enfatizando la alineación entre la curva de predicción y los patrones de rendimiento real.

Métodos de Comparación

Modelo Local (Local Model)
Modelo Específico de Cultivo (Crop-Specific Model)
Modelo Global (Global Model)
Modelo de Aprendizaje Automático Estándar (Standard ML Model)

Detalles de Implementación

Entorno de Hardware: ASUS TUF A15, procesador AMD Ryzen 7 6800H (4.7 GHz), 16GB RAM, NVIDIA RTX 3070 Ti
Marco de Software: PyTorch y TensorFlow
Modelos ML: Random Forest, XGBoost, LSTM-CNN
Configuración de Parámetros:
- Número total de clientes: N = 10
- Rondas de entrenamiento local: E = 10 épocas
- Rondas de modelo específico de cultivo: T_k = 15 rondas
- Mínimo 1 granja participante por cultivo

Resultados Experimentales

Resultados Principales

El experimento seleccionó 3 granjas inteligentes aleatorias, cada una suscrita a diferentes tipos de cultivos (maíz, trigo, algodón) para análisis comparativo:

Resultados de Predicción de Maíz: Los modelos locales y específicos de cultivos pueden hacer predicciones precisas del rendimiento de granjas, mientras que el modelo global en algunos casos hace predicciones imprecisas, similar a modelos ML estándar en aplicaciones a gran escala
Resultados de Predicción de Trigo y Algodón: Muestran tendencias similares en los 3 granjas inteligentes, con variaciones de precisión de diferentes grados, pero los modelos locales y específicos de cultivos siempre pueden predecir el rendimiento con precisión
Comparación de Desempeño: El modelo global es similar al modelo ML estándar que no considera dinámicas específicas de cultivos, frecuentemente haciendo predicciones muy imprecisas

Hallazgos Experimentales

Ventajas de especialización local: Los modelos locales y específicos de cultivos superan significativamente al modelo global en precisión de predicción
Importancia de especificidad de cultivos: El entrenamiento especializado para tipos de cultivos específicos puede capturar mejor los patrones de crecimiento únicos de cultivos y características de rendimiento
Efectividad de arquitectura jerárquica: La arquitectura de tres capas equilibra exitosamente necesidades de personalización y generalización

Trabajo Relacionado

Direcciones de Investigación Principal

Aplicaciones de aprendizaje federado en agricultura: Clasificación de cultivos, análisis de suelos, detección de plagas y enfermedades, predicción de rendimiento
Arquitecturas de aprendizaje profundo: Marco CNN-RNN, arquitecturas de fusión multimodal, redes neuronales gráficas
Estrategias de aprendizaje conjunto: Imputación múltiple, optimización de colonias de hormigas, clasificador Extra Trees
Optimización de eficiencia de comunicación: Poda de modelos, integración de computación en niebla

Ventajas de Este Artículo

En comparación con trabajos existentes, las principales ventajas de este artículo son:

Introducción de mecanismo de suscripción dinámica que se adapta a características estacionales de producción agrícola
Diseño de estrategia de agregación jerárquica que logra tanto especialización como generalización
Proporciona soluciones para heterogeneidad de datos agrícolas y sensibilidad de privacidad

Conclusiones y Discusión

Conclusiones Principales

La arquitectura de aprendizaje federado jerárquico resuelve exitosamente desafíos clave en agricultura inteligente
El mecanismo de suscripción estacional y la estrategia de agregación jerárquica equilibran efectivamente especialización local e intercambio de conocimiento global
Los resultados experimentales validan el desempeño superior de modelos locales y específicos de cultivos

Limitaciones

Limitaciones de escala experimental: Validación con solo 10 granjas inteligentes y 6 tipos de cultivos
Limitaciones de tipos de datos: Basado principalmente en datos sintéticos, carece de validación con datos reales de granjas a gran escala
Consideración insuficiente de factores ambientales: No se consideran adecuadamente condiciones climáticas extremas, cambios de suelo y otros factores ambientales dinámicos

Direcciones Futuras

Extensión de arquitectura del sistema: Inclusión de más tipos de cultivos
Exploración de otros criterios de agrupamiento: Agrupamiento basado en región, disponibilidad de recursos o tamaño de granja
Integración de más factores ambientales: Cambio climático, cambios dinámicos en calidad del suelo, etc.

Evaluación Profunda

Fortalezas

Fuerte innovación: Primera introducción de mecanismo de suscripción estacional en aprendizaje federado agrícola
Diseño de arquitectura razonable: La arquitectura jerárquica de tres capas equilibra bien especialización y generalización
Alto valor práctico: Resuelve problemas reales de protección de privacidad de datos agrícolas y eficiencia de comunicación
Modelado matemático claro: Proporciona fórmulas matemáticas completas y descripción de algoritmos

Insuficiencias

Validación experimental insuficiente:
- Escala experimental pequeña (solo 10 granjas)
- Falta de comparación detallada con otros métodos avanzados de aprendizaje federado
- No proporciona métricas de evaluación numéricas específicas (como RMSE, MAE, etc.)
Limitaciones del método:
- Estrategia de agrupamiento relativamente simple, basada solo en tipo de cultivo
- No considera similitud de ubicación geográfica y ambiental entre granjas
- Análisis insuficiente de distribución de datos no uniforme
Detalles técnicos insuficientes:
- Análisis de costo de comunicación no suficientemente detallado
- Descripción insuficiente de mecanismos de protección de privacidad
- Falta de análisis de convergencia del modelo

Impacto

Contribución académica: Proporciona nuevas ideas y marco de investigación para aprendizaje federado agrícola
Valor práctico: Proporciona solución viable para despliegue real de sistemas de agricultura inteligente
Reproducibilidad: Proporciona descripción de algoritmos y detalles de implementación, pero carece de código de código abierto

Escenarios Aplicables

Cooperativas agrícolas de múltiples cultivos: Aplicable a organizaciones agrícolas que cultivan múltiples tipos de cultivos
Gestión agrícola regional: Adecuado para necesidades de predicción de rendimiento de departamentos de gestión agrícola regional
Servicios de agricultura de precisión: Puede proporcionar soluciones diferenciadas para empresas de servicios de tecnología agrícola

Referencias

El artículo cita 22 referencias relacionadas, que cubren principalmente:

Investigación de aplicaciones de aprendizaje federado en agricultura
Aplicación de aprendizaje profundo en predicción del rendimiento de cultivos
Tecnologías de aprendizaje automático distribuido y protección de privacidad
Tecnologías de agricultura inteligente e Internet de las Cosas

Evaluación General: La arquitectura de aprendizaje federado jerárquico propuesta en este artículo tiene fuerte innovación y valor práctico, proporcionando una solución efectiva para resolver problemas de protección de privacidad de datos agrícolas y heterogeneidad. Aunque hay espacio para mejora en validación experimental y detalles técnicos, la línea de investigación general es clara y tiene buenas perspectivas de desarrollo.