Heart rate estimation from photoplethysmography (PPG) signals generated by wearable devices such as smartwatches and fitness trackers has significant implications for the health and well-being of individuals. Although prior work has demonstrated deep learning models with strong performance in the heart rate estimation task, in order to deploy these models on wearable devices, these models must also adhere to strict memory and latency constraints. In this work, we explore and characterize how large pre-trained PPG models may be distilled to smaller models appropriate for real-time inference on the edge. We evaluate four distillation strategies through comprehensive sweeps of teacher and student model capacities: (1) hard distillation, (2) soft distillation, (3) decoupled knowledge distillation (DKD), and (4) feature distillation. We present a characterization of the resulting scaling laws describing the relationship between model size and performance. This early investigation lays the groundwork for practical and predictable methods for building edge-deployable models for physiological sensing.
- पेपर ID: 2511.18829
- शीर्षक: Towards Characterizing Knowledge Distillation of PPG Heart Rate Estimation Models
- लेखक: Kanav Arora, Girish Narayanswamy, Shwetak Patel, Richard Li (वाशिंगटन विश्वविद्यालय)
- वर्गीकरण: cs.LG (मशीन लर्निंग)
- प्रकाशन समय/सम्मेलन: NeurIPS 2025 कार्यशाला: स्वास्थ्य के लिए समय श्रृंखला से सीखना
- पेपर लिंक: https://arxiv.org/abs/2511.18829
हृदय गति अनुमान पहनने योग्य उपकरणों (जैसे स्मार्ट घड़ियों और फिटनेस ट्रैकर्स) पर प्रकाश विद्युत् आयतन नाड़ी तरंग (PPG) संकेतों के माध्यम से प्राप्त एक महत्वपूर्ण स्वास्थ्य निगरानी कार्य है। यद्यपि गहन शिक्षण मॉडल हृदय गति अनुमान कार्य पर उत्कृष्ट प्रदर्शन करते हैं, इन मॉडलों को पहनने योग्य उपकरणों पर तैनात करने के लिए कठोर स्मृति और विलंबता बाधाओं को पूरा करना आवश्यक है। यह अनुसंधान यह अन्वेषण और विशेषता देता है कि कैसे बड़े पूर्व-प्रशिक्षित PPG मॉडलों को किनारे वास्तविक समय अनुमान के लिए उपयुक्त छोटे मॉडलों में आसवित किया जाए। अनुसंधान शिक्षक और छात्र मॉडल क्षमता के व्यापक स्कैन के माध्यम से चार आसवन रणनीतियों का मूल्यांकन करता है: (1) कठोर आसवन, (2) नरम आसवन, (3) विघटित ज्ञान आसवन (DKD), (4) विशेषता आसवन। पेपर मॉडल आकार और प्रदर्शन संबंध का वर्णन करने वाले स्केलिंग कानून विशेषताओं को प्रस्तुत करता है। यह प्रारंभिक अनुसंधान किनारे उपकरणों पर तैनाती योग्य शारीरिक संवेदनशील मॉडलों के निर्माण के लिए एक व्यावहारिक और पूर्वानुमानित विधि आधार स्थापित करता है।
पहनने योग्य उपकरणों पर बड़े गहन शिक्षण मॉडलों को कम्प्यूटेशनल संसाधनों की सीमाओं का सामना करना पड़ता है। यद्यपि बड़े PPG हृदय गति अनुमान मॉडल उत्कृष्ट प्रदर्शन करते हैं, उनकी महत्वपूर्ण कम्प्यूटेशनल आवश्यकताएं (स्मृति व्यवसाय और अनुमान विलंबता) किनारे उपकरणों पर वास्तविक तैनाती को सीमित करती हैं, वास्तविक समय प्रतिक्रिया और गोपनीयता सुरक्षा जैसे लाभों को बाधित करती हैं।
- स्वास्थ्य निगरानी आवश्यकता: PPG संकेत हृदय-संवहनी स्वास्थ्य का मूल्यांकन करने के लिए उपयोग किए जा सकते हैं, व्यायाम प्रतिक्रिया और रोग स्क्रीनिंग (जैसे उच्च रक्तचाप) जैसे अनुप्रयोगों में महत्वपूर्ण मूल्य के साथ
- किनारे तैनाती लाभ: किनारे मॉडल बेहतर गोपनीयता सुरक्षा प्रदान करते हैं और वास्तविक समय प्रतिक्रिया का समर्थन करते हैं
- व्यावहारिक बाधा: बड़े संवेदक मॉडल संसाधन-सीमित पहनने योग्य उपकरणों पर चलना मुश्किल है
- ज्ञान आसवन अनुप्रयोग अपर्याप्त: यद्यपि ज्ञान आसवन भाषा मॉडल (जैसे DistilBERT) और ऑडियो/त्वरणमापी मॉडल में सफल रहा है, शारीरिक संवेदन क्षेत्र में अन्वेषण सीमित है
- पूर्वानुमानित्व की कमी: मौजूदा आसवन विधियों में व्यवस्थित विशेषता की कमी है, आसवित मॉडल के प्रदर्शन की भविष्यवाणी करना मुश्किल है
- स्केलिंग कानून अनुसंधान अंतराल: भाषा मॉडल आसवन के लिए स्केलिंग कानून हाल ही में स्थापित किए गए हैं, शारीरिक संवेदन क्षेत्र में अभी तक कोई समान अनुसंधान नहीं है
यह पेपर शारीरिक संवेदन क्षेत्र में पूर्वानुमानित आसवन प्रदर्शन विशेषता स्थापित करने का पहला प्रयास है, PPG हृदय गति अनुमान कार्य के लिए व्यवस्थित आसवन रणनीति मूल्यांकन और स्केलिंग कानून विश्लेषण प्रदान करता है।
- व्यवस्थित आसवन रणनीति मूल्यांकन: PPG हृदय गति अनुमान कार्य पर चार ज्ञान आसवन रणनीतियों (कठोर आसवन, नरम आसवन, DKD, विशेषता आसवन) का पहली बार व्यापक मूल्यांकन, शिक्षक और छात्र मॉडल क्षमता के कई विन्यास में
- स्केलिंग कानून विशेषता: आसवित मॉडल प्रदर्शन पूर्वानुमानित घातीय स्केलिंग वक्र का पालन करता है, मॉडल आकार और प्रदर्शन के बीच संबंध को प्रकट करता है
- इष्टतम रणनीति पहचान: विघटित ज्ञान आसवन (DKD) सभी मूल्यांकित रणनीतियों में सर्वश्रेष्ठ प्रदर्शन करता है, विशेष रूप से शब्दार्थ क्रमबद्ध वर्गीकरण कार्यों के लिए उपयुक्त
- आर्किटेक्चर प्रभाव विश्लेषण: मॉडल आर्किटेक्चर चयन (ResNet बनाम MLP) आसवन स्केलिंग व्यवहार पर महत्वपूर्ण प्रभाव दिखाता है, ResNet छात्र मॉडल मजबूत प्रेरक पूर्वाग्रह प्रदर्शित करते हैं
- व्यावहारिकता सत्यापन: आसवन लगभग 90% अनुमान समय में कमी और 60% स्मृति उपयोग में कमी प्राप्त कर सकता है, जबकि प्रदर्शन केवल 30% से कम हो जाता है
इनपुट: 8 सेकंड की खिड़की का PPG संकेत (हरा चैनल, 25Hz नमूना दर, 2 सेकंड कदम)
आउटपुट: तात्कालिक हृदय गति वर्गीकरण (180 वर्ग, 30-210 BPM के अनुरूप)
मूल्यांकन मेट्रिक: माध्य निरपेक्ष त्रुटि (MAE, BPM इकाई में)
बाधा शर्तें: मॉडल को पहनने योग्य उपकरणों की स्मृति और विलंबता सीमाओं को पूरा करना आवश्यक है
Meier आदि द्वारा उपयोग किए गए 1D-ResNet वेरिएंट को रीढ़ नेटवर्क के रूप में अपनाया गया है, मॉडल क्षमता को नियंत्रित करने के लिए अवशिष्ट ब्लॉक की संख्या को समायोजित करके:
- शिक्षक मॉडल: 2-12 अवशिष्ट ब्लॉक (33K-864K पैरामीटर)
- छात्र मॉडल: 1-10 अवशिष्ट ब्लॉक (23K-534K पैरामीटर)
1. कठोर आसवन (Hard Distillation)
- शिक्षक मॉडल की अंतिम भविष्यवाणी (argmax आउटपुट) को छात्र मॉडल के प्रशिक्षण लेबल के रूप में उपयोग करता है
- छात्र मॉडल को शिक्षक के असतत निर्णय सीमाओं की नकल करने में मदद करता है
- सबसे कम जानकारी, सबसे खराब प्रदर्शन
2. नरम आसवन (Soft Distillation)
- छात्र मॉडल शिक्षक मॉडल के आउटपुट संभाव्यता वितरण पर प्रशिक्षित होता है
- वर्गों के बीच संबंध और अनिश्चितता की समृद्ध जानकारी को एन्कोड करता है
- Hinton आदि की शास्त्रीय विधि पर आधारित
3. विघटित ज्ञान आसवन (DKD)
- शिक्षक आउटपुट को लक्ष्य वर्ग (TCKD) और गैर-लक्ष्य वर्ग (NCKD) आसवन घटकों में विघटित करता है
- छात्र हानि फ़ंक्शन में वास्तविक लेबल और गलत लेबल संभाव्यता को लचीले ढंग से भारित करता है
- इष्टतम हाइपरपैरामीटर: α=1, β=8, तापमान τ=2, क्रॉस-एंट्रॉपी वजन CE=1
- NCKD संभाव्यता वजन TCKD का 8 गुना है, विशेष रूप से शब्दार्थ क्रमबद्ध वर्गीकरण कार्यों के लिए उपयुक्त
4. विशेषता आसवन (Feature Distillation)
- आउटपुट परत से परे, छात्र मॉडल को शिक्षक के मध्यवर्ती विशेषता मानचित्रों से मेल खाने के लिए प्रशिक्षित करता है
- आंतरिक प्रतिनिधित्व स्थान को संरेखित करता है
- प्रदर्शन नरम आसवन और DKD के बीच है
1. शारीरिक संकेतों के लिए आसवन विशेषता
- PPG संकेत क्षेत्र में आसवन स्केलिंग कानून का पहली बार व्यवस्थित अनुसंधान
- शारीरिक संवेदन कार्यों के लिए घातीय स्केलिंग वक्र लागू होता है
2. DKD का लाभ तंत्र
- वर्गीकरण bin शब्दार्थ क्रमबद्ध परिदृश्यों में, गैर-लक्ष्य वर्ग संभाव्यता महत्वपूर्ण जानकारी रखती है
- 8:1 वजन अनुपात के माध्यम से, छात्र मॉडल अधिक समृद्ध संभाव्यता लेबल सीख सकता है
- छोटे मॉडल शुरुआत से समृद्ध प्रतिनिधित्व नहीं सीख सकते, लेकिन शिक्षक की संभाव्यता लेबल को प्रतिगमन के माध्यम से प्रभावी ढंग से सीख सकते हैं
3. आर्किटेक्चर प्रेरक पूर्वाग्रह का महत्व
- कनवल्शनल परतों का अंतर्निहित प्रेरक पूर्वाग्रह (जैसे संकेत को चिकना करने के लिए फ़िल्टर की प्राकृतिक प्रवृत्ति)
- अवशिष्ट कनेक्शन जैसे लक्षित आर्किटेक्चर डिजाइन अधिक कुशल नमूना सीखना प्राप्त करते हैं
- ResNet छात्र MLP छात्र की तुलना में कम त्रुटि निचली सीमा प्रदर्शित करते हैं
तीन मुक्त जीवन PPG डेटासेट का उपयोग करते हुए, कुल 107 घंटे संवेदक संकेत:
- WildPPG: वास्तविक दुनिया लंबी अवधि के निरंतर रिकॉर्ड
- PPG-DaLiA: UCI मशीन लर्निंग लाइब्रेरी डेटासेट
- GalaxyPPG: अर्ध-प्राकृतिक सेटिंग में Galaxy Watch द्वारा एकत्र डेटा
पूर्व-प्रसंस्करण प्रवाह:
- केवल PPG संवेदक हरा चैनल का उपयोग करता है
- 25Hz पर पुनः नमूना करता है
- 8 सेकंड की खिड़कियों में विभाजित, 2 सेकंड कदम
- ECG संकेत द्वारा हृदय गति सत्य मान प्रदान किया जाता है (BPM)
डेटा विभाजन:
- प्रतिभागी स्वतंत्र प्रशिक्षण-परीक्षण विभाजन (80%-20%)
- 2-गुना क्रॉस सत्यापन
माध्य निरपेक्ष त्रुटि (MAE): BPM में हृदय गति भविष्यवाणी त्रुटि
- आधारभूत से प्रशिक्षण: समान आकार के मॉडल आधारभूत से प्रशिक्षित (कोई आसवन नहीं)
- विभिन्न आसवन रणनीतियां: कठोर आसवन, नरम आसवन, DKD, विशेषता आसवन
- विभिन्न आर्किटेक्चर: ResNet बनाम MLP छात्र मॉडल
- प्रशिक्षण epochs: 300 epochs
- सीखने की दर: 5×10⁻⁴
- हानि फ़ंक्शन: क्रॉस-एंट्रॉपी हानि
- वर्गीकरण सेटअप: 180 वर्ग (30-210 BPM)
- हार्डवेयर: Nvidia RTX 2080-Ti GPU (बेंचमार्किंग के लिए)
चित्र 1 में दिखाया गया है (नरम आसवन परिणाम):
- आधारभूत प्रदर्शन: आधारभूत से प्रशिक्षित मॉडल Meier आदि द्वारा रिपोर्ट किए गए परिणामों के साथ सुसंगत हैं (8-ब्लॉक मॉडल MAE समान)
- आसवन लाभ: सभी आसवन विन्यास समान आकार के आधारभूत से प्रशिक्षित मॉडलों से बेहतर हैं
- शिक्षक आकार प्रभाव: बड़े शिक्षक मॉडल आमतौर पर बेहतर छात्र प्रदर्शन लाते हैं, लेकिन अत्यधिक बड़े मॉडल ओवरफिटिंग के कारण प्रदर्शन में गिरावट ला सकते हैं
तालिका 2 12-ब्लॉक शिक्षक मॉडल के तहत प्रदर्शन तुलना दिखाती है:
| छात्र मॉडल आकार | कठोर आसवन | नरम आसवन | DKD | विशेषता आसवन |
|---|
| 1-ब्लॉक (23K) | 11.734 | 10.380 | 8.899 | 9.397 |
| 2-ब्लॉक (34K) | 10.418 | 7.703 | 6.772 | 7.200 |
| 6-ब्लॉक (139K) | 6.983 | 6.801 | 6.291 | 6.800 |
| 10-ब्लॉक (534K) | 6.493 | 6.327 | 5.759 | 6.409 |
प्रदर्शन क्रम: DKD > विशेषता आसवन > नरम आसवन > कठोर आसवन
मुख्य निष्कर्ष:
- DKD सभी मॉडल विन्यासों में सर्वश्रेष्ठ प्रदर्शन करता है
- कठोर आसवन असतत लेबल जानकारी की कमी के कारण सबसे खराब प्रदर्शन करता है
- DKD का लाभ वास्तविक और गलत लेबल संभाव्यता के लचीले वजन से आता है
चित्र 2 DKD रणनीति के तहत स्केलिंग व्यवहार दिखाता है:
- घातीय वक्र फिटिंग: भाषा मॉडल आसवन स्केलिंग कानून के साथ सुसंगत, प्रदर्शन पूर्वानुमानित घातीय वक्र का पालन करता है
- प्रदर्शन संतृप्ति बिंदु: छात्र मॉडल 6 अवशिष्ट ब्लॉक (139K पैरामीटर) पर संतृप्त होने लगता है
- रणनीति अंतर: नरम आसवन और विशेषता आसवन भी इस वक्र का पालन करते हैं, लेकिन कठोर आसवन छोटे मॉडलों पर अधिक तीव्र संतृप्ति दिखाता है
चित्र 3 ResNet और MLP छात्र आर्किटेक्चर की तुलना करता है:
- ResNet लाभ: सभी पैरामीटर पैमानों पर, ResNet छात्र MLP छात्र से काफी बेहतर है
- त्रुटि निचली सीमा: ResNet कम प्रदर्शन निचली सीमा प्रदर्शित करता है
- स्केलिंग दक्षता: ResNet बेहतर स्केलिंग दक्षता प्रदर्शित करता है
- सार्वभौमिकता: MLP भी पूर्वानुमानित स्केलिंग प्रदर्शित करता है, लेकिन विशिष्ट व्यवहार आर्किटेक्चर के अनुसार भिन्न होता है
- बड़े शिक्षक (222K → 534K → 864K पैरामीटर) आमतौर पर बेहतर छात्र प्रदर्शन लाते हैं
- लेकिन लाभ में कमी प्रभाव मौजूद है, अत्यधिक बड़े शिक्षक ओवरफिट हो सकते हैं
हाइपरपैरामीटर खोज के माध्यम से निर्धारित:
- α=1, β=8: NCKD वजन TCKD का 8 गुना है
- तापमान τ=2: संभाव्यता वितरण की चिकनाई को नियंत्रित करता है
- CE वजन=1: आसवन हानि और मूल कार्य हानि को संतुलित करता है
तालिका 3 सिस्टम बेंचमार्क परिणाम दिखाती है:
| मॉडल आकार | अनुमान समय(s) | स्मृति उपयोग(MB) |
|---|
| 1-ब्लॉक | 0.512±0.025 | 9.468 |
| 6-ब्लॉक | 2.622±0.167 | 11.275 |
| 12-ब्लॉक | 4.758±0.130 | 23.483 |
आसवन लाभ (12-ब्लॉक→1-ब्लॉक):
- अनुमान समय में कमी: ~90% (4.758s → 0.512s)
- स्मृति उपयोग में कमी: ~60% (23.483MB → 9.468MB)
- प्रदर्शन हानि: ~30% MAE वृद्धि (विशिष्ट मूल्यों के संदर्भ की आवश्यकता है)
- आसवन की सार्वभौमिक प्रभावशीलता: सभी विन्यासों में, आसवन हमेशा आधारभूत से प्रशिक्षण से बेहतर है
- रणनीति चयन का महत्व: DKD कठोर आसवन की तुलना में लगभग 30% प्रदर्शन सुधार ला सकता है
- स्केलिंग कानून का अस्तित्व: शारीरिक संवेदन कार्य भी पूर्वानुमानित घातीय स्केलिंग वक्र का पालन करते हैं
- आर्किटेक्चर डिजाइन की महत्वपूर्ण भूमिका: प्रेरक पूर्वाग्रह आसवन प्रभाव पर महत्वपूर्ण प्रभाव डालता है
- व्यावहारिक व्यापार-बंद: आसवन के माध्यम से उचित प्रदर्शन हानि के साथ विशाल कम्प्यूटेशनल दक्षता लाभ प्राप्त किया जा सकता है
- Hinton आदि (2015): नरम आसवन की शास्त्रीय विधि प्रस्तावित, तापमान पैरामीटर के माध्यम से संभाव्यता वितरण को नरम करता है
- Zhao आदि (2022): विघटित ज्ञान आसवन (DKD) प्रस्तावित, लक्ष्य और गैर-लक्ष्य वर्ग जानकारी को अलग करता है
- Romero आदि (2015): FitNets विशेषता आसवन विधि प्रस्तावित
- भाषा मॉडल: DistilBERT BERT को किनारे तैनाती के लिए सफलतापूर्वक अनुकूलित करता है
- ऑडियो प्रसंस्करण: Peplinski आदि (2020) मोबाइल उपकरणों के लिए ऑडियो मॉडल आसवित करते हैं
- गतिविधि पहचान: Tang आदि (2021) मानव गतिविधि पहचान के लिए त्वरणमापी मॉडल आसवित करते हैं
- Busbridge आदि (2025): भाषा मॉडल आसवन के लिए पहली बार स्केलिंग कानून स्थापित करते हैं
- यह पेपर: स्केलिंग कानून अनुसंधान को शारीरिक संवेदन क्षेत्र में विस्तारित करता है
- Meier आदि (2024): WildPPG डेटासेट और ResNet आधारभूत प्रदान करते हैं
- Narayanswamy आदि (2024): पहनने योग्य आधार मॉडल के स्केलिंग अनुसंधान प्रस्तावित करते हैं
- Pillai आदि (2024), Saha आदि (2025): PPG आधार मॉडल विकसित करते हैं
यह पेपर शारीरिक संवेदन क्षेत्र में व्यवस्थित आसवन विशेषता और पूर्वानुमानित स्केलिंग कानून की कमी को भरता है।
- आसवन प्रभावशीलता: ज्ञान आसवन बड़े PPG हृदय गति अनुमान मॉडलों को किनारे तैनाती के लिए उपयुक्त छोटे मॉडलों में सफलतापूर्वक संपीड़ित कर सकता है
- रणनीति पेशेवर-विपक्ष: DKD सभी मूल्यांकित रणनीतियों में सर्वश्रेष्ठ प्रदर्शन करता है, विशेष रूप से शब्दार्थ क्रमबद्ध वर्गीकरण कार्यों के लिए उपयुक्त
- स्केलिंग पूर्वानुमानित्व: आसवित मॉडल प्रदर्शन घातीय स्केलिंग वक्र का पालन करता है, भाषा मॉडल निष्कर्षों के साथ सुसंगत
- व्यावहारिक व्यापार-बंद: 90% अनुमान समय और 60% स्मृति में कमी प्राप्त की जा सकती है, प्रदर्शन हानि उचित है
- आर्किटेक्चर महत्व: मॉडल आर्किटेक्चर चयन आसवन स्केलिंग व्यवहार को महत्वपूर्ण रूप से प्रभावित करता है
- वर्तमान दृष्टिकोण: सरल क्रॉस-सत्यापन का उपयोग, तीन डेटासेट के नमूनों को मिलाता है
- सीमा: क्रॉस-डेटासेट सामान्यीकरण क्षमता का पर्याप्त मूल्यांकन नहीं (एक डेटासेट पर प्रशिक्षण, दूसरे पर परीक्षण)
- संदर्भ दिशा: Kasnesis आदि (2025) की क्रॉस-डेटासेट अनुसंधान विधि
- वर्तमान चयन: सरल ResNet रीढ़ और पर्यवेक्षित शिक्षण का उपयोग करता है
- सुधार स्थान:
- बड़े स्व-पर्यवेक्षित पूर्व-प्रशिक्षित मॉडलों की खोज करता है
- विपरीत शिक्षण विधियों द्वारा सीखी गई समृद्ध विशेषताओं का लाभ उठाता है
- लेखक आसन्न खुले स्रोत मॉडलों का उल्लेख करते हैं जो बाद के अनुसंधान के लिए उपयोग किए जा सकते हैं
- वर्तमान कार्य: साहित्य में चार आधारभूत रणनीतियों का मूल्यांकन करता है
- भविष्य दिशा: शारीरिक संवेदन कार्यों के लिए विशेष रूप से अनुकूलित नई आसवन विधियां विकसित करता है
- बेंचमार्क प्लेटफॉर्म: Nvidia RTX 2080-Ti GPU पर परीक्षण का उपयोग करता है
- वास्तविक परिदृश्य: पहनने योग्य उपकरण माइक्रोप्रोसेसर का उपयोग करते हैं, प्रदर्शन विशेषताएं भिन्न होती हैं
- आवश्यकता: वास्तविक लक्ष्य हार्डवेयर पर मूल्यांकन
- क्रॉस-डेटासेट सामान्यीकरण अनुसंधान: विभिन्न डेटासेट के बीच आसवित मॉडलों की स्थानांतरण क्षमता का व्यवस्थित मूल्यांकन
- स्व-पर्यवेक्षित शिक्षक मॉडल: विपरीत शिक्षण आदि विधियों का उपयोग करके मजबूत शिक्षक मॉडल प्रशिक्षित करता है
- अनुकूलित आसवन रणनीति: PPG संकेत विशेषताओं के लिए विशेष रूप से डिज़ाइन की गई आसवन विधियां विकसित करता है
- वास्तविक हार्डवेयर तैनाती: वास्तविक पहनने योग्य उपकरणों पर मॉडल को सत्यापित और अनुकूलित करता है
- बहु-कार्य विस्तार: अनुसंधान को हृदय गति परिवर्तनशीलता जैसे अन्य शारीरिक संकेत अनुमान कार्यों में विस्तारित करता है
- अंतराल भरना: शारीरिक संवेदन क्षेत्र में आसवन स्केलिंग कानून का पहली बार व्यवस्थित अनुसंधान
- व्यावहारिक अभिविन्यास: पहनने योग्य उपकरण तैनाती की वास्तविक आवश्यकताओं के लिए सीधे लक्षित
- सैद्धांतिक योगदान: स्केलिंग कानून अनुसंधान को भाषा मॉडल से समय श्रृंखला स्वास्थ्य डेटा में विस्तारित करता है
- व्यापक तुलना: चार आसवन रणनीतियों का मूल्यांकन, मॉडल क्षमता के कई विन्यास में
- बहु-डेटासेट सत्यापन: तीन स्वतंत्र PPG डेटासेट (107 घंटे डेटा) का उपयोग करता है
- क्रॉस-सत्यापन: 2-गुना क्रॉस-सत्यापन परिणाम विश्वसनीयता बढ़ाता है
- प्रतिभागी स्वतंत्र विभाजन: डेटा रिसाव से बचता है, सामान्यीकरण मूल्यांकन सुनिश्चित करता है
- DKD लाभ तंत्र: गहराई से समझाता है कि क्यों 8:1 वजन अनुपात क्रमबद्ध वर्गीकरण के लिए उपयुक्त है
- आर्किटेक्चर प्रेरक पूर्वाग्रह: ResNet बनाम MLP के मूल अंतर को प्रकट करता है
- स्केलिंग कानून सत्यापन: नए क्षेत्र में घातीय वक्र की प्रयोज्यता प्रमाणित करता है
- संतृप्ति बिंदु पहचान: 139K पैरामीटर प्रदर्शन-दक्षता का महत्वपूर्ण संतुलन बिंदु है
- संरचना तार्किक: प्रेरणा से विधि से परिणाम तक तार्किक प्रगति
- दृश्य प्रभावी: चित्र 1 की हीटमैप, चित्र 2 और 3 के स्केलिंग वक्र सहज और समझने में आसान
- ईमानदार अभिव्यक्ति: स्पष्ट रूप से "प्रारंभिक जांच" (preliminary investigation) के रूप में चिह्नित करता है
- शिक्षक मॉडल क्षमता: केवल 864K पैरामीटर तक, बड़े पैमाने के मॉडलों की खोज नहीं की
- डेटा मात्रा: 107 घंटे डेटा आधुनिक बड़े पैमाने के अनुसंधान की तुलना में अपेक्षाकृत कम
- आर्किटेक्चर विविधता: केवल ResNet और MLP की तुलना, Transformer जैसी आधुनिक आर्किटेक्चर शामिल नहीं
- स्केलिंग कानून रूप: विशिष्ट गणितीय सूत्र अभिव्यक्ति नहीं दी गई
- फिटिंग पैरामीटर: घातीय वक्र के विशिष्ट पैरामीटर और फिटिंग अच्छाई रिपोर्ट नहीं की गई
- सैद्धांतिक व्याख्या: घातीय वक्र का पालन करने के कारण के लिए सैद्धांतिक व्युत्पत्ति की कमी
- हार्डवेयर प्लेटफॉर्म: केवल GPU पर परीक्षण, वास्तविक पहनने योग्य उपकरण मूल्यांकन की कमी
- शक्ति विश्लेषण: किनारे उपकरणों के महत्वपूर्ण संकेतक ऊर्जा खपत पर विचार नहीं किया
- वास्तविक समय सत्यापन: वास्तविक अनुप्रयोग परिदृश्य में वास्तविक समय प्रदर्शन सत्यापित नहीं किया
- क्रॉस-डेटासेट मूल्यांकन: लेखक स्वयं इसे मुख्य सीमा के रूप में स्वीकार करते हैं
- विभिन्न शारीरिक कार्य: केवल हृदय गति अनुमान पर ध्यान केंद्रित, अन्य शारीरिक संकेतकों में विस्तार नहीं
- जनसंख्या विविधता: विभिन्न जनसंख्या (आयु, स्वास्थ्य स्थिति) के प्रदर्शन अंतर का विश्लेषण नहीं
- हाइपरपैरामीटर चयन: β=8 का चयन पर्याप्त विलोपन की कमी
- कार्य निर्भरता: विभिन्न कार्य सेटिंग्स में पैरामीटर की मजबूती की खोज नहीं की
- स्वचालित ट्यूनिंग: हाइपरपैरामीटर चयन के लिए व्यवस्थित विधि प्रदान नहीं की
- अग्रणी: शारीरिक संवेदन क्षेत्र में आसवन स्केलिंग कानून स्थापित करने वाला पहला
- पद्धति मूल्य: बाद के अनुसंधान के लिए व्यवस्थित मूल्यांकन ढांचा प्रदान करता है
- क्रॉस-क्षेत्र प्रेरणा: अन्य समय श्रृंखला स्वास्थ्य डेटा कार्यों में सामान्यीकृत किया जा सकता है
- उद्योग अनुप्रयोग: स्मार्ट घड़ियों, फिटनेस ट्रैकर्स आदि उत्पाद विकास को सीधे समर्थन करता है
- प्रदर्शन-दक्षता व्यापार-बंद: 90% अनुमान समय में कमी व्यावहारिक तैनाती के लिए व्यवहार्य पथ प्रदान करती है
- पूर्वानुमानित्व: स्केलिंग कानून मॉडल डिजाइन को अधिक वैज्ञानिक बनाता है
- प्रारंभिक अनुसंधान: लेखक स्पष्ट रूप से "प्रारंभिक जांच" के रूप में स्थिति देते हैं, अधिक सत्यापन की आवश्यकता है
- पुनरुत्पादन योग्यता चुनौति: सार्वजनिक डेटासेट का उपयोग करने के बावजूद, कोड खुले स्रोत की प्रतिबद्धता नहीं
- व्यावहारिक तैनाती अंतराल: GPU बेंचमार्क से पहनने योग्य उपकरण तक दूरी है
- संसाधन-सीमित पहनने योग्य उपकरण: स्मार्ट घड़ियां, फिटनेस ट्रैकर्स आदि
- वास्तविक समय हृदय गति निगरानी: व्यायाम फिटनेस, स्वास्थ्य ट्रैकिंग अनुप्रयोग
- गोपनीयता-संवेदनशील परिदृश्य: किनारे अनुमान डेटा क्लाउड अपलोड से बचता है
- मॉडल डिजाइन प्रारंभिक चरण: स्केलिंग कानून का उपयोग करके मॉडल क्षमता की भविष्यवाणी और योजना बनाता है
- चिकित्सा-स्तर की सटीकता आवश्यकता: वर्तमान प्रदर्शन नैदानिक निदान का समर्थन करने के लिए अपर्याप्त हो सकता है
- चरम वातावरण: तीव्र व्यायाम, कम तापमान आदि अपर्याप्त परीक्षण परिदृश्य
- क्रॉस-डिवाइस सामान्यीकरण: विभिन्न संवेदक हार्डवेयर को पुनः प्रशिक्षण की आवश्यकता हो सकती है
- बहु-मोडल संलयन: केवल PPG एकल मोडल पर विचार करता है
- अन्य शारीरिक संकेत: हृदय गति परिवर्तनशीलता, रक्त ऑक्सीजन संतृप्ति, रक्तचाप अनुमान
- बहु-मोडल संवेदन: त्वरणमापी, जाइरोस्कोप आदि संवेदकों के साथ संयोजन
- व्यक्तिगत मॉडल: विशिष्ट उपयोगकर्ता के लिए मॉडल सूक्ष्म-ट्यूनिंग
- रोग स्क्रीनिंग: हृदय अतालता, नींद की श्वसन रुकावट आदि अनुप्रयोग
- Busbridge et al. (2025) - आसवन स्केलिंग कानून: भाषा मॉडल आसवन के लिए पहली बार गणितीय स्केलिंग कानून स्थापित करता है, इस पेपर का महत्वपूर्ण सैद्धांतिक आधार
- Hinton et al. (2015) - ज्ञान आसवन की स्थापना कार्य: नरम आसवन विधि और तापमान पैरामीटर अवधारणा प्रस्तावित करता है
- Zhao et al. (2022) - विघटित ज्ञान आसवन (DKD): इस पेपर की सर्वश्रेष्ठ प्रदर्शन रणनीति का मूल पेपर
- Meier et al. (2024) - WildPPG डेटासेट: इस पेपर द्वारा उपयोग किए गए मुख्य डेटासेट और आधारभूत मॉडल स्रोत
- Sanh et al. (2019) - DistilBERT: भाषा मॉडल आसवन का सफल उदाहरण, बड़े पैमाने के मॉडलों में आसवन की व्यवहार्यता प्रमाणित करता है
- Kasnesis et al. (2025) - PPG ज्ञान आसवन अनुप्रयोग: लेखक द्वारा उल्लेखित क्रॉस-डेटासेट सामान्यीकरण अनुसंधान संदर्भ
ये साहित्य इस पेपर का सैद्धांतिक आधार और पद्धति संदर्भ बनाते हैं, अनुसंधान संदर्भ को समझने के लिए महत्वपूर्ण हैं।
समग्र मूल्यांकन: यह एक स्पष्ट स्थिति, कठोर निष्पादन वाला प्रारंभिक अनुसंधान पेपर है। यद्यपि प्रायोगिक पैमाने और सैद्धांतिक गहराई की सीमाएं हैं, यह अग्रणी रूप से स्केलिंग कानून अनुसंधान को शारीरिक संवेदन क्षेत्र में लाता है, पहनने योग्य उपकरण मॉडल अनुकूलन के लिए व्यावहारिक और पूर्वानुमानित विधि ढांचा प्रदान करता है। DKD रणनीति का उत्कृष्ट प्रदर्शन और घातीय स्केलिंग वक्र की खोज महत्वपूर्ण व्यावहारिक मार्गदर्शन मूल्य रखते हैं। यदि भविष्य में बड़े पैमाने के डेटा, अधिक विविध आर्किटेक्चर और वास्तविक हार्डवेयर पर आगे सत्यापन किया जा सके, तो यह पहनने योग्य स्वास्थ्य निगरानी प्रौद्योगिकी पर गहरा प्रभाव डालेगा।