2025-11-18T22:16:13.731313

Hierarchical Federated Learning for Crop Yield Prediction in Smart Agricultural Production Systems

Abouaomar, hanjri, Kobbane et al.
In this paper, we presents a novel hierarchical federated learning architecture specifically designed for smart agricultural production systems and crop yield prediction. Our approach introduces a seasonal subscription mechanism where farms join crop-specific clusters at the beginning of each agricultural season. The proposed three-layer architecture consists of individual smart farms at the client level, crop-specific aggregators at the middle layer, and a global model aggregator at the top level. Within each crop cluster, clients collaboratively train specialized models tailored to specific crop types, which are then aggregated to produce a higher-level global model that integrates knowledge across multiple crops. This hierarchical design enables both local specialization for individual crop types and global generalization across diverse agricultural contexts while preserving data privacy and reducing communication overhead. Experiments demonstrate the effectiveness of the proposed system, showing that local and crop-layer models closely follow actual yield patterns with consistent alignment, significantly outperforming standard machine learning models. The results validate the advantages of hierarchical federated learning in the agricultural context, particularly for scenarios involving heterogeneous farming environments and privacy-sensitive agricultural data.
academic

التعلم الفيدرالي الهرمي للتنبؤ بإنتاجية المحاصيل في أنظمة الإنتاج الزراعي الذكية

المعلومات الأساسية

  • معرّف الورقة: 2510.12727
  • العنوان: Hierarchical Federated Learning for Crop Yield Prediction in Smart Agricultural Production Systems
  • المؤلفون: Anas Abouaomar, Mohammed El hanjri, Abdellatif Kobbane, Anis Laouiti, Khalid Nafil
  • التصنيف: cs.LG (التعلم الآلي)، cs.AI (الذكاء الاصطناعي)، cs.DC (الحوسبة الموزعة)
  • تاريخ النشر: 14 أكتوبر 2025 (نسخة ArXiv التمهيدية)
  • رابط الورقة: https://arxiv.org/abs/2510.12727

الملخص

تقترح هذه الورقة معمارية تعلم فيدرالي هرمية جديدة مصممة خصيصاً لأنظمة الإنتاج الزراعي الذكية والتنبؤ بإنتاجية المحاصيل. تقدم الطريقة آلية الاشتراك الموسمية، حيث تنضم المزارع إلى مجموعات محاصيل محددة في بداية كل موسم زراعي. تتضمن المعمارية ثلاثية الطبقات المقترحة طبقة العملاء (المزارع الذكية الفردية)، وطبقة وسيطة (المجمعات الخاصة بالمحاصيل)، وطبقة عليا (مجمع النموذج العام). داخل كل مجموعة محاصيل، يتعاون العملاء على تدريب نماذج متخصصة لأنواع محاصيل محددة، ثم يتم تجميع هذه النماذج لإنتاج نموذج عام أعلى مستوى يدمج المعرفة المتعددة المحاصيل. يحقق هذا التصميم الهرمي التخصص المحلي لأنواع المحاصيل الفردية والتعميم العام في البيئات الزراعية المتنوعة، مع حماية خصوصية البيانات وتقليل التكاليف الاتصالية.

خلفية البحث والدافع

تعريف المشكلة

يعالج هذا البحث المشكلة الأساسية للتنبؤ بإنتاجية المحاصيل في الزراعة الذكية. تواجه طرق التعلم الآلي المركزية التقليدية التحديات التالية في البيئات الزراعية الفعلية:

  1. عدم التجانس والتوزيع الجغرافي للبيانات: تختلف المزارع بشكل كبير في جودة التربة والظروف المناخية وأنواع المحاصيل والتقنيات الزراعية واستخدام الموارد
  2. مشاكل الخصوصية وملكية البيانات: يتردد مالكو المزارع عادة في مشاركة البيانات التشغيلية الحساسة مع أطراف ثالثة لأسباب تنافسية أو أخلاقية أو قانونية
  3. التكاليف الاتصالية وموثوقية الاتصال: قد لا يكون الاتصال الموثوق متاحاً دائماً في المناطق الريفية أو المناطق ذات البنية التحتية الضعيفة

الأهمية

يعتبر التنبؤ الدقيق بإنتاجية المحاصيل حاسماً لـ:

  • اتخاذ القرارات المستندة إلى البيانات من قبل المزارعين والمهندسين الزراعيين وصانعي السياسات
  • تخصيص الموارد وتخطيط سلسلة الإمداد وتسعير السوق وتوزيع الغذاء
  • التعامل مع ضغوط النمو السكاني العالمي وتغير المناخ وزيادة احتياجات الأمن الغذائي

قيود الطرق الموجودة

تعاني الطرق الزراعية القائمة على التعلم الفيدرالي من القيود التالية:

  • آليات مشاركة العملاء الثابتة
  • استراتيجيات تجميع النموذج الموحدة
  • الافتقار إلى التكيف مع التغيرات الموسمية والخاصة بالمحاصيل
  • عدم قدرة النموذج العام الواحد على التقاط التنوع الناجم عن أنواع المحاصيل أو المناطق المناخية أو الممارسات الزراعية المحلية

المساهمات الأساسية

  1. تصميم نموذج التعلم الفيدرالي مع التجميع الموسمي وحسب نوع المحصول: تم تصميم آلية مشاركة عملاء ديناميكية متوافقة مع دورات الإنتاج الزراعي للزراعة الذكية
  2. تطوير عملية تجميع النموذج الهرمية: موازنة التخصص المحلي (حسب المحصول) والتعميم العام عبر أنواع المحاصيل
  3. التحقق من فعالية النظام من خلال تجارب شاملة: إثبات الأداء المتفوق للنظام المقترح في مهام التنبؤ بإنتاجية المحاصيل

شرح الطريقة

تعريف المهمة

تصميم نظام تعلم فيدرالي هرمي يتضمن مجموعة من المزارع (العملاء) ومجموعات محاصيل محددة وخادم مركزي. تتم عملية التدريب بطريقة موسمية: في بداية كل موسم، تشترك كل مزرعة في مجموعة محاصيل من نوع واحد وتساهم في تدريب النموذج الخاص بالمحصول، وبعد ذلك يقوم الخادم بتجميعها لتشكيل نموذج عام متعدد المحاصيل.

معمارية النموذج

تصميم المعمارية ثلاثية الطبقات

  1. الطبقة السفلى (طبقة العملاء): المزارع الذكية الفردية
    • تدريب نموذج ML محلي على بيانات المحاصيل الملكية
    • عدم مشاركة البيانات الأولية، بل نقل تحديثات النموذج فقط
  2. الطبقة الوسطى (طبقة تجميع المحاصيل): مجمعات خاصة بالمحاصيل
    • تنفيذ التجميع الخاص بالمحصول
    • الحفاظ على نموذج متخصص لكل نوع محصول
  3. الطبقة العليا (طبقة التجميع العام): مجمع النموذج العام
    • استقبال النماذج المجمعة جزئياً
    • حساب النموذج العام النهائي w_global

النمذجة الرياضية

التدريب المحلي للعميل:

D_i = {(x_j, y_j)}^{n_i}_{j=1}, x_j ∈ R^d, y_j ∈ R
w_i^{(t+1)} ← LocalUpdate(θ_k^{(t)}, D_i) = θ_k^{(t)} - η∇L_i(θ_k^{(t)})

تجميع النموذج الخاص بالمحصول:

θ_k^{(t+1)} = Σ_{i∈G_k} (n_i/N_k) * w_i^{(t+1)}
حيث N_k = Σ_{i∈G_k} n_i

التجميع عبر المحاصيل (النموذج العام):

w_global = Σ^K_{k=1} α_k * θ_k
حيث α_k = N_k / Σ^K_{j=1} N_j

دالة الهدف:

min_w Σ^K_{k=1} Σ_{i∈G_k} (n_i/N) * L_i(w)
حيث N = Σ^K_{k=1} N_k

نقاط الابتكار التقني

  1. آلية الاشتراك الموسمية: تنضم المزارع ديناميكياً إلى مجموعات محاصيل محددة بناءً على نوايا الزراعة الحالية
  2. استراتيجية التجميع الهرمية: تحقيق التوازن بين التخصص المحلي ومشاركة المعرفة العامة
  3. التعلم الفيدرالي الواعي بالمحاصيل: تدريب متخصص للأنماط المحددة لأنواع المحاصيل المختلفة

إعداد التجارب

مجموعات البيانات

  • مصدر البيانات: بيانات اصطناعية موسعة بناءً على مجموعات بيانات زراعية عامة
  • أنواع المحاصيل: الذرة والقمح والقطن والأرز وفول الصويا والشعير (K=6 محاصيل)
  • خصائص البيانات: تتضمن بيانات المستشعرات والأقمار الصناعية والبيانات التاريخية للإنتاجية

مقاييس التقييم

يتم تقييم أداء النموذج من خلال مقارنة الاتساق بين الإنتاجية المتنبأ بها والفعلية، مع التركيز على درجة محاذاة منحنى التنبؤ مع أنماط الإنتاجية الفعلية.

طرق المقارنة

  • النموذج المحلي (Local Model)
  • النموذج الخاص بالمحصول (Crop-Specific Model)
  • النموذج العام (Global Model)
  • نموذج التعلم الآلي القياسي (Standard ML Model)

تفاصيل التنفيذ

  • بيئة الأجهزة: ASUS TUF A15، معالج AMD Ryzen 7 6800H (4.7 GHz)، 16GB RAM، NVIDIA RTX 3070 Ti
  • أطر العمل البرمجية: PyTorch و TensorFlow
  • نماذج ML: Random Forest و XGBoost و LSTM-CNN
  • إعدادات المعاملات:
    • إجمالي عدد العملاء: N = 10
    • جولات التدريب المحلي: E = 10 epochs
    • جولات النموذج الخاص بالمحصول: T_k = 15 rounds
    • مشاركة مزرعة واحدة على الأقل لكل محصول

نتائج التجارب

النتائج الرئيسية

اختارت التجارب 3 مزارع ذكية عشوائية، اشتركت كل منها في أنواع محاصيل مختلفة (الذرة والقمح والقطن) للتحليل المقارن:

  1. نتائج التنبؤ بالذرة: يمكن للنموذج المحلي والنموذج الخاص بالمحصول تقديم تنبؤات دقيقة بإنتاجية المزرعة، بينما يفشل النموذج العام في بعض الحالات، مشابهاً لنماذج ML القياسية في التطبيقات واسعة النطاق
  2. نتائج التنبؤ بالقمح والقطن: تظهر اتجاهات مماثلة في جميع المزارع الذكية الثلاث، مع تغييرات متفاوتة في الدقة، لكن النماذج المحلية والخاصة بالمحصول تتمكن دائماً من التنبؤ الدقيق بالإنتاجية
  3. مقارنة الأداء: يشبه النموذج العام نموذج ML القياسي الذي لا يأخذ في الاعتبار التفاصيل الديناميكية المحددة للمحصول، ويقدم غالباً تنبؤات غير دقيقة جداً

النتائج التجريبية

  1. مزايا التخصص المحلي: يتفوق النموذج المحلي والنموذج الخاص بالمحصول بشكل كبير على النموذج العام في دقة التنبؤ
  2. أهمية الخصوصية بالمحصول: يمكن للتدريب المتخصص لأنواع محاصيل محددة التقاط أنماط النمو والخصائص الإنتاجية الخاصة بالمحصول بشكل أفضل
  3. فعالية المعمارية الهرمية: نجحت المعمارية ثلاثية الطبقات في موازنة احتياجات التخصيص والتعميم

الأعمال ذات الصلة

الاتجاهات البحثية الرئيسية

  1. تطبيقات التعلم الفيدرالي في الزراعة: تصنيف المحاصيل وتحليل التربة والكشف عن الآفات والأمراض والتنبؤ بالإنتاجية
  2. معماريات التعلم العميق: أطر عمل CNN-RNN والمعماريات المتعددة الأنماط والشبكات العصبية البيانية
  3. استراتيجيات التعلم المجمع: الإسناد المتعدد وتحسين مستعمرة النمل ومصنفات Extra Trees
  4. تحسين كفاءة الاتصال: قص النموذج وتكامل الحوسبة الضبابية

مزايا هذه الورقة

مقارنة بالأعمال الموجودة، تتمثل المزايا الرئيسية لهذه الورقة في:

  • إدخال آلية اشتراك ديناميكية تتكيف مع الخصائص الموسمية للإنتاج الزراعي
  • تصميم استراتيجية تجميع هرمية تحقق التخصص والتعميم في نفس الوقت
  • توفير حل لعدم تجانس بيانات الزراعة وحساسية الخصوصية

الخلاصة والنقاش

الاستنتاجات الرئيسية

  1. نجحت معمارية التعلم الفيدرالي الهرمية في حل التحديات الأساسية في الزراعة الذكية
  2. آلية الاشتراك الموسمية واستراتيجية التجميع الهرمية تحقق بفعالية التوازن بين التخصص المحلي ومشاركة المعرفة العامة
  3. تتحقق نتائج التجارب من الأداء المتفوق للنماذج المحلية والخاصة بالمحصول

القيود

  1. حدود نطاق التجارب: تم التحقق باستخدام 10 مزارع ذكية فقط و6 أنواع محاصيل
  2. حدود نوع البيانات: تستند بشكل أساسي إلى بيانات اصطناعية، وتفتقر إلى التحقق من بيانات المزارع الحقيقية واسعة النطاق
  3. عدم كفاية الاعتبار للعوامل البيئية: لم يتم الأخذ بشكل كافٍ في الاعتبار الطقس القاسي والتغيرات في التربة والعوامل البيئية الديناميكية الأخرى

الاتجاهات المستقبلية

  1. توسيع معمارية النظام: تضمين المزيد من أنواع المحاصيل
  2. استكشاف معايير التجميع الأخرى: التجميع بناءً على المنطقة أو توفر الموارد أو حجم المزرعة
  3. دمج المزيد من العوامل البيئية: تغير المناخ والتغيرات الديناميكية في جودة التربة وغيرها

التقييم المتعمق

المزايا

  1. ابتكار قوي: أول من يدخل آلية الاشتراك الموسمية في التعلم الفيدرالي الزراعي
  2. تصميم معمارية معقول: تحقق المعمارية ثلاثية الطبقات توازناً جيداً بين احتياجات التخصص والتعميم
  3. قيمة عملية عالية: حل مشاكل حماية خصوصية البيانات الزراعية وكفاءة الاتصال الفعلية
  4. نمذجة رياضية واضحة: توفير صيغ رياضية كاملة وأوصاف الخوارزميات

أوجه القصور

  1. التحقق التجريبي غير كافٍ:
    • نطاق التجارب صغير نسبياً (10 مزارع فقط)
    • نقص المقارنات التفصيلية مع طرق التعلم الفيدرالي المتقدمة الأخرى
    • عدم توفير مقاييس تقييم رقمية محددة (مثل RMSE و MAE)
  2. قيود الطريقة:
    • استراتيجية التجميع بسيطة نسبياً، تستند فقط على نوع المحصول
    • عدم الأخذ في الاعتبار الموقع الجغرافي للمزارع والتشابه البيئي
    • نقص التحليل المتعمق لتوزيع البيانات غير المتجانس
  3. نقص التفاصيل التقنية:
    • تحليل تكاليف الاتصال غير كافٍ
    • وصف آليات حماية الخصوصية غير محدد بشكل كافٍ
    • غياب تحليل تقارب النموذج

التأثير

  1. المساهمة الأكاديمية: توفير أفكار بحثية وإطار عمل جديد للتعلم الفيدرالي الزراعي
  2. القيمة العملية: توفير حل قابل للتطبيق لنشر أنظمة الزراعة الذكية الفعلية
  3. قابلية التكرار: توفير وصف الخوارزمية وتفاصيل التنفيذ، لكن يفتقد إلى نشر الكود مفتوح المصدر

السيناريوهات المعمول بها

  1. تعاونيات الزراعة متعددة المحاصيل: مناسبة للمنظمات الزراعية التي تزرع محاصيل متعددة
  2. إدارة الزراعة الإقليمية: مناسبة لاحتياجات التنبؤ بالإنتاجية لأقسام إدارة الزراعة الإقليمية
  3. خدمات الزراعة الدقيقة: يمكن أن توفر حلولاً متمايزة لشركات خدمات التكنولوجيا الزراعية

المراجع

تستشهد الورقة بـ 22 مرجعاً ذا صلة، تغطي بشكل أساسي:

  • أبحاث تطبيقات التعلم الفيدرالي في الزراعة
  • تطبيقات التعلم العميق في التنبؤ بإنتاجية المحاصيل
  • تقنيات التعلم الآلي الموزع وحماية الخصوصية
  • تقنيات الزراعة الذكية وإنترنت الأشياء

التقييم الشامل: تتمتع معمارية التعلم الفيدرالي الهرمية المقترحة في هذه الورقة بابتكار قوي وقيمة عملية عالية، وتوفر حلاً فعالاً لمعالجة مشاكل حماية خصوصية البيانات الزراعية وعدم تجانسها. على الرغم من وجود مجال للتحسين في التحقق التجريبي والتفاصيل التقنية، إلا أن الفكرة البحثية الشاملة واضحة وتتمتع بآفاق تطور جيدة.