خطة متكاملة لاستخدام ml-intern في بناء نظام RAG للوصفات والمكونات والكميات
عميل ذكاء اصطناعي مستقل من Hugging Face — يعمل بدلاً عنك في المهام التقنية
يبحث في الأوراق العلمية ويستخرج أفضل الأساليب لمهمتك
يبحث في Hugging Face Hub عن datasets مناسبة لمشروعك تلقائياً
يكتب كود التدريب والمعالجة ويشغله في بيئة آمنة بـ GPU
يرفع النتيجة النهائية على Hugging Face Hub لتستخدمه في تطبيقك
اختر المسار الصح بناءً على وقتك وميزانيتك
مكتبة ذكية من الوصفات + LLM جاهز يجاوب على أسئلتك
تدريب نموذج موجود (Llama / Mistral) على بيانات الوصفات
بناء LLM كامل من الصفر على بيانات الطبخ
كلها مجانية على Hugging Face — ml-intern يجيبها ويعالجها تلقائياً
| Dataset | الحجم | المحتوى | الأولوية |
|---|---|---|---|
| corbt/all-recipes | 2.1 مليون وصفة | اسم + مكونات + كميات + خطوات | ⭐⭐⭐ |
| AkashPS11/recipes_data_food.com | 1.05 مليون | بيانات منظمة جداً | ⭐⭐⭐ |
| formido/recipes | 232 ألف | متنوعة ونظيفة | ⭐⭐ |
| Hieu-Pham/kaggle_food_recipes | 13.5 ألف | منظمة — سهلة الاستخدام | ⭐⭐ |
| scraping مواقع مصرية 🇪🇬 | مخصص | سيدتي، وصفات لذيذة — بالعربي | ⭐⭐⭐ |
من سؤال المستخدم إلى الإجابة الذكية — خطوة بخطوة
ml-intern يجيب الـ datasets ويحولها لـ JSON منظم: اسم الوصفة، قائمة المكونات مع الكميات، خطوات الطهي، وقت التحضير.
ml-intern يعمل ده تلقائياًكل وصفة بتتحول لأرقام (متجه رياضي) بيعبر عن معناها. وصفة "كشري" قريبة من "عدس وأرز" في هذا الفضاء الرياضي.
نموذج sentence-transformersكل الـ embeddings بتتحفظ في قاعدة بيانات متخصصة (Chroma / Pinecone / Weaviate) تتيح البحث الدلالي الفائق السرعة.
Vector DB"عندي فراخ وبصل وطماطم وثوم — إيه اللي أعمله؟" السؤال بيتحول لـ embedding وبيتبحث عنه في قاعدة البيانات.
Semantic Searchالنظام بيجيب أقرب 5 وصفات، بيبعتهم لـ LLM مع السؤال، واللي بيرد بإجابة طبيعية: "ممكن تعمل فراخ بالصلصة أو شيش طاووق، والمكونات الناقصة هي..."
LLM (GPT / Claude / Llama)الـ RAG هو القلب، لكن التطبيق يحتاج طبقات أخرى حوله
أغلب الـ datasets بالإنجليزي — وفيه 3 حلول عملية
ml-intern يترجم الوصفات الإنجليزية لعربي باستخدام نماذج ترجمة جاهزة مثل Helsinki-NLP
استخدام نماذج عربية جاهزة كـ Jais أو AraGPT2 كنقطة انطلاق للـ Fine-tuning
ml-intern يبني scraper لجمع وصفات من مواقع مصرية عربية مثل سيدتي ومطبخ فاطمة أبو حاتي
من الصفر لنموذج شغّال — مرحلة بمرحلة
ml-intern يجيب الـ datasets، ينظفها، ويحولها لـ JSON منظم بالمكونات والكميات والخطوات.
🤖 ml-internتحويل الوصفات لـ embeddings وتخزينها في قاعدة بيانات متجهية مع API للبحث الذكي.
🤖 ml-intern + Chroma/Pineconeسيرفر يربط الـ RAG بالتطبيق، ويدير المستخدمين والمصادقة وقاعدة البيانات العادية.
⚙️ FastAPI / Node.jsالواجهة اللي المستخدم بيشوفها — اختيار المكونات، عرض الوصفات، المجتمع الاجتماعي.
📱 Flutter / React Nativeلو النتائج محتاجة تكون أدق في الأكل المصري، ml-intern يدرب نموذج مخصص فوق الـ RAG.
🤖 ml-intern + GPUml-intern دوره ينتهي عند الـ API — الباقي تطوير تقليدي. لكن الـ RAG هو الميزة الأساسية اللي بتفرق التطبيق.