🤖 Hugging Face ml-intern × الأكلات المصرية

بناء ذكاء اصطناعي للطبخ المصري

خطة متكاملة لاستخدام ml-intern في بناء نظام RAG للوصفات والمكونات والكميات

🔍 البداية

ما هو ml-intern؟

عميل ذكاء اصطناعي مستقل من Hugging Face — يعمل بدلاً عنك في المهام التقنية

📄

يقرأ الأبحاث

يبحث في الأوراق العلمية ويستخرج أفضل الأساليب لمهمتك

🗄️

يجد البيانات

يبحث في Hugging Face Hub عن datasets مناسبة لمشروعك تلقائياً

⚙️

يكتب الكود

يكتب كود التدريب والمعالجة ويشغله في بيئة آمنة بـ GPU

🚀

يرفع النموذج

يرفع النتيجة النهائية على Hugging Face Hub لتستخدمه في تطبيقك

🛤️ الخيارات

ثلاثة مسارات لبناء النموذج

اختر المسار الصح بناءً على وقتك وميزانيتك

✅ الأفضل — ابدأ بيه

RAG

مكتبة ذكية من الوصفات + LLM جاهز يجاوب على أسئلتك

  • لا يحتاج GPU مكلف
  • جاهز في أسابيع مش شهور
  • نتائج ممتازة من اليوم الأول
  • سهل التحديث والتوسع
⚡ المرحلة الثانية

Fine-tuning

تدريب نموذج موجود (Llama / Mistral) على بيانات الوصفات

  • نتائج أدق وأكثر تخصصاً
  • يحتاج GPU وأسابيع للتدريب
  • ml-intern يكتب كل الكود
  • يُكمل الـ RAG ولا يستبدله
❌ غير واقعي الآن

Training من الصفر

بناء LLM كامل من الصفر على بيانات الطبخ

  • يحتاج مئات الـ GPU
  • مئات آلاف الدولارات
  • أشهر من العمل
  • مش مبرر لمشروعك الآن
📦 البيانات

أفضل Datasets المتاحة

كلها مجانية على Hugging Face — ml-intern يجيبها ويعالجها تلقائياً

Dataset الحجم المحتوى الأولوية
corbt/all-recipes 2.1 مليون وصفة اسم + مكونات + كميات + خطوات ⭐⭐⭐
AkashPS11/recipes_data_food.com 1.05 مليون بيانات منظمة جداً ⭐⭐⭐
formido/recipes 232 ألف متنوعة ونظيفة ⭐⭐
Hieu-Pham/kaggle_food_recipes 13.5 ألف منظمة — سهلة الاستخدام ⭐⭐
scraping مواقع مصرية 🇪🇬 مخصص سيدتي، وصفات لذيذة — بالعربي ⭐⭐⭐
🧠 الفهم

كيف يعمل الـ RAG بالتفصيل

من سؤال المستخدم إلى الإجابة الذكية — خطوة بخطوة

1

جمع وتنظيف البيانات

ml-intern يجيب الـ datasets ويحولها لـ JSON منظم: اسم الوصفة، قائمة المكونات مع الكميات، خطوات الطهي، وقت التحضير.

ml-intern يعمل ده تلقائياً
2

تحويل النصوص لـ Embeddings

كل وصفة بتتحول لأرقام (متجه رياضي) بيعبر عن معناها. وصفة "كشري" قريبة من "عدس وأرز" في هذا الفضاء الرياضي.

نموذج sentence-transformers
3

تخزين في Vector Database

كل الـ embeddings بتتحفظ في قاعدة بيانات متخصصة (Chroma / Pinecone / Weaviate) تتيح البحث الدلالي الفائق السرعة.

Vector DB
4

المستخدم يسأل

"عندي فراخ وبصل وطماطم وثوم — إيه اللي أعمله؟" السؤال بيتحول لـ embedding وبيتبحث عنه في قاعدة البيانات.

Semantic Search
5

LLM يولّد الإجابة

النظام بيجيب أقرب 5 وصفات، بيبعتهم لـ LLM مع السؤال، واللي بيرد بإجابة طبيعية: "ممكن تعمل فراخ بالصلصة أو شيش طاووق، والمكونات الناقصة هي..."

LLM (GPT / Claude / Llama)
🏗️ البنية الكاملة

بعد الـ RAG — الصورة الكاملة للنظام

الـ RAG هو القلب، لكن التطبيق يحتاج طبقات أخرى حوله

📱 المستخدم
تطبيق الموبايل
Flutter / React Native
⚙️ الخادم
Backend API
Python / FastAPI
لوحة الإدارة
React / Next.js
🧠 الذكاء
RAG Engine
Vector DB + LLM
💾 البيانات
بيانات المستخدمين
قاعدة الوصفات
نظام الإعلانات
🇪🇬 التحدي

مشكلة المحتوى العربي والمصري

أغلب الـ datasets بالإنجليزي — وفيه 3 حلول عملية

01

ترجمة الـ Dataset

ml-intern يترجم الوصفات الإنجليزية لعربي باستخدام نماذج ترجمة جاهزة مثل Helsinki-NLP

02

Base Model عربي

استخدام نماذج عربية جاهزة كـ Jais أو AraGPT2 كنقطة انطلاق للـ Fine-tuning

03

Scraping مصري

ml-intern يبني scraper لجمع وصفات من مواقع مصرية عربية مثل سيدتي ومطبخ فاطمة أبو حاتي

📅 الخطة

الترتيب الزمني المقترح

من الصفر لنموذج شغّال — مرحلة بمرحلة

1
المرحلة الأولى

جمع البيانات وتنظيفها

ml-intern يجيب الـ datasets، ينظفها، ويحولها لـ JSON منظم بالمكونات والكميات والخطوات.

🤖 ml-intern
2
المرحلة الثانية

بناء الـ RAG + Vector Database

تحويل الوصفات لـ embeddings وتخزينها في قاعدة بيانات متجهية مع API للبحث الذكي.

🤖 ml-intern + Chroma/Pinecone
3
المرحلة الثالثة

Backend + API

سيرفر يربط الـ RAG بالتطبيق، ويدير المستخدمين والمصادقة وقاعدة البيانات العادية.

⚙️ FastAPI / Node.js
4
المرحلة الرابعة

تطبيق الموبايل

الواجهة اللي المستخدم بيشوفها — اختيار المكونات، عرض الوصفات، المجتمع الاجتماعي.

📱 Flutter / React Native
5
المرحلة الخامسة (اختياري)

Fine-tuning نموذج مخصص

لو النتائج محتاجة تكون أدق في الأكل المصري، ml-intern يدرب نموذج مخصص فوق الـ RAG.

🤖 ml-intern + GPU

الخلاصة في 5 خطوات

ml-intern دوره ينتهي عند الـ API — الباقي تطوير تقليدي. لكن الـ RAG هو الميزة الأساسية اللي بتفرق التطبيق.

1 جمع البيانات
2 بناء الـ RAG
3 تحويله لـ API
4 Backend + App
5 Fine-tuning لاحقاً