Preparation of Fractal-Inspired Computational Architectures for Advanced Large Language Model Analysis
Mittal, Ignatov, Timofte
It introduces FractalNet, a fractal-inspired computational architectures for advanced large language model analysis that mainly challenges model diversity on a large scale in an efficient manner. The new set-up involves a template-driven generator, runner, and evaluation framework that, through systematic permutations of convolutional, normalization, activation, and dropout layers, can create more than 1,200 variants of neural networks. Fractal templates allow for structural recursion and multi-column pathways, thus, models become deeper and wider in a balanced way. Training utilizes PyTorch, Automatic Mixed Precision (AMP), and gradient checkpointing and is carried out on the CIFAR-10 dataset for five epochs. The outcomes show that fractal-based architectures are capable of strong performance and are computationally efficient. The paper positions fractal design as a feasible and resource-efficient method of automated architecture exploration.
academic
ফ্র্যাক্টাল-অনুপ্রাণিত কম্পিউটেশনাল আর্কিটেকচার প্রস্তুতি উন্নত বড় ভাষা মডেল বিশ্লেষণের জন্য
এই পেপারটি FractalNet উপস্থাপন করে, একটি ফ্র্যাক্টাল-অনুপ্রাণিত কম্পিউটেশনাল আর্কিটেকচার যা স্নায়ুজাল নেটওয়ার্ক মডেলের বৈচিত্র্য বৃহৎ আকারে দক্ষতার সাথে অন্বেষণ করার জন্য ডিজাইন করা হয়েছে। এই সিস্টেমে টেমপ্লেট-চালিত জেনারেটর, রানার এবং মূল্যায়ন কাঠামো রয়েছে যা কনভোলিউশনাল স্তর, নর্মালাইজেশন স্তর, অ্যাক্টিভেশন ফাংশন এবং ড্রপআউট স্তরগুলি সিস্টেমেটিকভাবে সংমিশ্রণ করে 1,200 এরও বেশি স্নায়ুজাল নেটওয়ার্ক ভেরিয়েন্ট তৈরি করতে পারে। ফ্র্যাক্টাল টেমপ্লেটগুলি কাঠামোগত পুনরাবৃত্তি এবং মাল্টি-কলাম পাথ সমর্থন করে, যা মডেলগুলিকে ভারসাম্যপূর্ণ উপায়ে গভীর এবং প্রশস্ত করতে সক্ষম করে। প্রশিক্ষণ PyTorch, স্বয়ংক্রিয় মিশ্র নির্ভুলতা (AMP) এবং গ্রেডিয়েন্ট চেকপয়েন্ট কৌশল ব্যবহার করে CIFAR-10 ডেটাসেটে 5 এপোক প্রশিক্ষণের জন্য পরিচালিত হয়। পরীক্ষামূলক ফলাফলগুলি দেখায় যে ফ্র্যাক্টাল-ভিত্তিক আর্কিটেকচারগুলি শক্তিশালী কর্মক্ষমতা এবং কম্পিউটেশনাল দক্ষতা অর্জন করতে পারে, ফ্র্যাক্টাল ডিজাইনকে একটি কার্যকর এবং সম্পদ-দক্ষ স্বয়ংক্রিয় আর্কিটেকচার অন্বেষণ পদ্ধতি হিসাবে অবস্থান করে।
গভীর শিক্ষার অগ্রগতি নেটওয়ার্ক আর্কিটেকচার ডিজাইনের উদ্ভাবনের উপর অনেকাংশে নির্ভর করে, কিন্তু আর্কিটেকচার ম্যানুয়ালি ডিজাইন করার প্রক্রিয়া অত্যন্ত ধীর এবং বিশাল কম্পিউটেশনাল সম্পদ প্রয়োজন। বিদ্যমান স্বয়ংক্রিয় স্নায়ুজাল আর্কিটেকচার জেনারেশন পদ্ধতিগুলি (যেমন NAS এবং AutoML) ভাল অপ্টিমাইজেশন ক্ষমতা রাখলেও সাধারণত নিম্নলিখিত সমস্যাগুলি রয়েছে:
গভীর শিক্ষা মডেলের জটিলতা বৃদ্ধির সাথে সাথে, আর্কিটেকচার স্পেস ম্যানুয়ালি অন্বেষণ করা অব্যবহারিক হয়ে ওঠে। স্বয়ংক্রিয় আর্কিটেকচার অনুসন্ধান গুরুত্বপূর্ণ:
মডেল উন্নয়ন চক্র ত্বরান্বিত করার জন্য
মানব ডিজাইনারদের দ্বারা উপেক্ষা করা যেতে পারে এমন উদ্ভাবনী আর্কিটেকচার আবিষ্কার করার জন্য
FractalNet ফ্র্যাক্টালের স্ব-সাদৃশ্য এবং স্তরযুক্ত পুনরাবৃত্তি ধারণা ব্যবহার করে, একটি ব্যাখ্যাযোগ্য, কম্পিউটেশনালভাবে দক্ষ এবং স্কেলেবল আর্কিটেকচার জেনারেশন পদ্ধতি প্রদান করে, যা বিদ্যমান পদ্ধতিগুলির দক্ষতা এবং ব্যাখ্যাযোগ্যতার মধ্যে ফাঁক পূরণ করে।
FractalNet ফ্রেমওয়ার্ক প্রস্তাব: একটি সম্পূর্ণ টেমপ্লেট-চালিত স্বয়ংক্রিয় স্নায়ুজাল আর্কিটেকচার জেনারেশন এবং মূল্যায়ন সিস্টেম যা সিস্টেমেটিকভাবে 1,200 এরও বেশি নেটওয়ার্ক ভেরিয়েন্ট তৈরি করতে পারে
ফ্র্যাক্টাল ডিজাইন নীতি: স্নায়ুজাল আর্কিটেকচার ডিজাইনে ফ্র্যাক্টালের পুনরাবৃত্তিমূলক কাঠামো এবং মাল্টি-কলাম পাথ প্রবর্তন করে, গভীরতা এবং প্রস্থের ভারসাম্যপূর্ণ সম্প্রসারণ অর্জন করে
দক্ষ প্রশিক্ষণ কৌশল: স্বয়ংক্রিয় মিশ্র নির্ভুলতা (AMP) এবং গ্রেডিয়েন্ট চেকপয়েন্ট কৌশল একীভূত করে, সীমিত হার্ডওয়্যার সম্পদের অধীনে বৃহৎ-স্কেল আর্কিটেকচার অন্বেষণ অর্জন করে
সিস্টেমেটাইজড মূল্যায়ন কাঠামো: মান-চালিত জেনারেশন-প্রশিক্ষণ-মূল্যায়ন প্রক্রিয়া প্রতিষ্ঠা করে, পুনরাবৃত্তিযোগ্য বৃহৎ-স্কেল আর্কিটেকচার পরীক্ষা সক্ষম করে
অভিজ্ঞতামূলক যাচাইকরণ: CIFAR-10 ডেটাসেটে ফ্রেমওয়ার্কের কার্যকারিতা যাচাই করে, সেরা মডেল বেসলাইনের তুলনায় 8 শতাংশ পয়েন্ট উন্নতি করে (72.2% থেকে 80.18%)
LLM একীকরণ: বড় ভাষা মডেল (DeepSeek-R1-Distill-Qwen-7B) আর্কিটেকচার জেনারেশন প্রক্রিয়ায় একীভূত করে, বুদ্ধিমান স্বয়ংক্রিয় ডিজাইন অর্জন করে
ইনপুট: আর্কিটেকচার কনফিগারেশন প্যারামিটার (ফ্র্যাক্টাল গভীরতা N, কলাম প্রস্থ num_columns, স্তর ধরনের সমন্বয়)
আউটপুট: সম্পূর্ণ প্রশিক্ষণযোগ্য স্নায়ুজাল নেটওয়ার্ক আর্কিটেকচার এবং এর কর্মক্ষমতা মেট্রিক্স
সীমাবদ্ধতা: সীমিত GPU মেমরি এবং কম্পিউটেশনাল সময়ের মধ্যে বিপুল সংখ্যক আর্কিটেকচার ভেরিয়েন্ট তৈরি এবং মূল্যায়ন করা
শুরু → জেনারেটর আর্কিটেকচার কনফিগারেশন তৈরি করে
→ টেমপ্লেট ফ্র্যাক্টাল ডিজাইন নীতি প্রয়োগ করে
→ রানার প্রশিক্ষণ এবং যাচাইকরণ সম্পাদন করে
→ কর্মক্ষমতা লগ এবং মডেল সংরক্ষণ
→ ফলাফল বিশ্লেষণ এবং তুলনা → শেষ
সম্পূর্ণ প্রক্রিয়া একটি ঘনিষ্ঠভাবে একীভূত স্বয়ংক্রিয় লুপ গঠন করে, মানব হস্তক্ষেপ কমিয়ে দেয়।
ফ্রেমওয়ার্ক কার্যকারিতা: FractalNet সফলভাবে 1,200 এরও বেশি অনন্য কনভোলিউশনাল মডেল তৈরি এবং প্রশিক্ষণ করেছে, টেমপ্লেট-চালিত সংশ্লেষণ পাইপলাইনের সম্ভাব্যতা প্রমাণ করে
কর্মক্ষমতা উন্নতি: সেরা কনফিগারেশন CIFAR-10 এ 80.18% যাচাইকরণ নির্ভুলতা অর্জন করে, বেসলাইনের তুলনায় 8 শতাংশ পয়েন্ট উন্নতি
কম্পিউটেশনাল দক্ষতা: AMP এবং গ্রেডিয়েন্ট চেকপয়েন্ট কৌশলের মাধ্যমে, সীমিত হার্ডওয়্যারে বৃহৎ-স্কেল আর্কিটেকচার অন্বেষণ অর্জিত হয়েছে
স্থিতিশীল সংমিশ্রণ: 97% মডেল সফলভাবে প্রশিক্ষণ সম্পূর্ণ করে, গড় যাচাইকরণ নির্ভুলতা 83% অতিক্রম করে
ডিজাইন নীতি: ফ্র্যাক্টালের পুনরাবৃত্তিমূলক কাঠামো দ্রুত শেখা এবং সাধারণীকরণ প্রচার করতে পারে, মধ্যম গভীরতা এবং প্রস্থের কনফিগারেশন সর্বোত্তম কর্মক্ষমতা অর্জন করে
পেপার একটি প্রকৌশল-দৃষ্টিকোণ থেকে কার্যকর আর্কিটেকচার অন্বেষণ ফ্রেমওয়ার্ক প্রস্তাব করে, সম্পদ দক্ষতা এবং সিস্টেমেটাইজড অন্বেষণে নির্দিষ্ট অবদান রয়েছে
1,200 টি ভেরিয়েন্টের বৃহৎ-স্কেল পরীক্ষা মূল্যবান অভিজ্ঞতামূলক ডেটা প্রদান করে
কিন্তু পদ্ধতি উদ্ভাবনী সীমিত, প্রধানত বিদ্যমান প্রযুক্তির সমন্বয় প্রয়োগ
পরীক্ষামূলক গভীরতা অপর্যাপ্ত, শুধুমাত্র একক ডেটাসেটে স্বল্পমেয়াদী প্রশিক্ষণ
শিরোনাম এবং বিষয়বস্তু সম্পূর্ণভাবে মিলে না, পাঠকদের বিভ্রান্ত করতে পারে
ব্যর্থতা কেস এবং তাত্ত্বিক বিশ্লেষণের গভীর গবেষণা অনুপস্থিত
সুপারিশকৃত পাঠক দর্শক:
স্বয়ংক্রিয় আর্কিটেকচার অনুসন্ধানে আগ্রহী গবেষক
সম্পদ-সীমিত পরিবেশে পরীক্ষা পরিচালনা করতে হবে এমন শিক্ষার্থী
স্নায়ুজাল নেটওয়ার্কে ফ্র্যাক্টাল ডিজাইনের প্রয়োগ বোঝার আগ্রহী পাঠক
Kochnev et al. (2025): "NNGPT: বড় ভাষা মডেলের সাথে AutoML পুনর্বিবেচনা" - LLM-সহায়ক AutoML সম্পর্কিত কাজ
Goodarzi et al. (2025): "LEMUR স্নায়ুজাল নেটওয়ার্ক ডেটাসেট: নিরবচ্ছিন্ন AutoML এর দিকে" - LEMUR ডেটাসেট এবং ইকোসিস্টেম
Larsson et al. (2017): "FractalNet: অবশিষ্ট ছাড়াই অতি-গভীর স্নায়ুজাল নেটওয়ার্ক" - মূল ফ্র্যাক্টাল নেটওয়ার্ক ডিজাইন
Krizhevsky et al. (2012): "গভীর কনভোলিউশনাল স্নায়ুজাল নেটওয়ার্ক সহ ImageNet শ্রেণীবিভাগ" - AlexNet, গভীর শিক্ষার ভিত্তি
Huang et al. (2017): "ঘনভাবে সংযুক্ত কনভোলিউশনাল নেটওয়ার্ক" - DenseNet, সম্পর্কিত আর্কিটেকচার ডিজাইন
Kaggle CIFAR-10: ডেটাসেট উৎস এবং বেঞ্চমার্ক পরীক্ষা
সংক্ষিপ্তসার: FractalNet সম্পদ-সীমিত গবেষণা পরিবেশের জন্য বিশেষভাবে উপযুক্ত একটি ব্যবহারিক স্বয়ংক্রিয় আর্কিটেকচার অন্বেষণ পদ্ধতি প্রদান করে। যদিও পদ্ধতি উদ্ভাবনী সীমিত, প্রকৌশল বাস্তবায়ন সম্পূর্ণ এবং বৃহৎ-স্কেল পরীক্ষা মূল্যবান অভিজ্ঞতামূলক প্রমাণ প্রদান করে। পেপারের প্রধান মূল্য ফ্র্যাক্টাল ডিজাইন এবং স্বয়ংক্রিয় জেনারেশনের সমন্বয়ের সম্ভাব্যতা প্রদর্শনে নিহিত, যা পরবর্তী গবেষণার জন্য একটি সম্প্রসারণযোগ্য ফ্রেমওয়ার্ক ভিত্তি প্রদান করে।