تطبيق الأكلات المصرية

🔍 البداية

ما هو ml-intern؟

عميل ذكاء اصطناعي مستقل من Hugging Face — يعمل بدلاً عنك في المهام التقنية

📄

يقرأ الأبحاث

يبحث في الأوراق العلمية ويستخرج أفضل الأساليب لمهمتك

🗄️

يجد البيانات

يبحث في Hugging Face Hub عن datasets مناسبة لمشروعك تلقائياً

⚙️

يكتب الكود

يكتب كود التدريب والمعالجة ويشغله في بيئة آمنة بـ GPU

🚀

يرفع النموذج

يرفع النتيجة النهائية على Hugging Face Hub لتستخدمه في تطبيقك

🛤️ الخيارات

ثلاثة مسارات لبناء النموذج

اختر المسار الصح بناءً على وقتك وميزانيتك

✅ الأفضل — ابدأ بيه

RAG

مكتبة ذكية من الوصفات + LLM جاهز يجاوب على أسئلتك

لا يحتاج GPU مكلف
جاهز في أسابيع مش شهور
نتائج ممتازة من اليوم الأول
سهل التحديث والتوسع

⚡ المرحلة الثانية

Fine-tuning

تدريب نموذج موجود (Llama / Mistral) على بيانات الوصفات

نتائج أدق وأكثر تخصصاً
يحتاج GPU وأسابيع للتدريب
ml-intern يكتب كل الكود
يُكمل الـ RAG ولا يستبدله

❌ غير واقعي الآن

Training من الصفر

بناء LLM كامل من الصفر على بيانات الطبخ

يحتاج مئات الـ GPU
مئات آلاف الدولارات
أشهر من العمل
مش مبرر لمشروعك الآن

📦 البيانات

أفضل Datasets المتاحة

كلها مجانية على Hugging Face — ml-intern يجيبها ويعالجها تلقائياً

Dataset	الحجم	المحتوى	الأولوية
corbt/all-recipes	2.1 مليون وصفة	اسم + مكونات + كميات + خطوات	⭐⭐⭐
AkashPS11/recipes_data_food.com	1.05 مليون	بيانات منظمة جداً	⭐⭐⭐
formido/recipes	232 ألف	متنوعة ونظيفة	⭐⭐
Hieu-Pham/kaggle_food_recipes	13.5 ألف	منظمة — سهلة الاستخدام	⭐⭐
scraping مواقع مصرية 🇪🇬	مخصص	سيدتي، وصفات لذيذة — بالعربي	⭐⭐⭐

🧠 الفهم

كيف يعمل الـ RAG بالتفصيل

من سؤال المستخدم إلى الإجابة الذكية — خطوة بخطوة

جمع وتنظيف البيانات

ml-intern يجيب الـ datasets ويحولها لـ JSON منظم: اسم الوصفة، قائمة المكونات مع الكميات، خطوات الطهي، وقت التحضير.

ml-intern يعمل ده تلقائياً

تحويل النصوص لـ Embeddings

كل وصفة بتتحول لأرقام (متجه رياضي) بيعبر عن معناها. وصفة "كشري" قريبة من "عدس وأرز" في هذا الفضاء الرياضي.

نموذج sentence-transformers

تخزين في Vector Database

كل الـ embeddings بتتحفظ في قاعدة بيانات متخصصة (Chroma / Pinecone / Weaviate) تتيح البحث الدلالي الفائق السرعة.

Vector DB

المستخدم يسأل

"عندي فراخ وبصل وطماطم وثوم — إيه اللي أعمله؟" السؤال بيتحول لـ embedding وبيتبحث عنه في قاعدة البيانات.

Semantic Search

LLM يولّد الإجابة

النظام بيجيب أقرب 5 وصفات، بيبعتهم لـ LLM مع السؤال، واللي بيرد بإجابة طبيعية: "ممكن تعمل فراخ بالصلصة أو شيش طاووق، والمكونات الناقصة هي..."

LLM (GPT / Claude / Llama)

🏗️ البنية الكاملة

بعد الـ RAG — الصورة الكاملة للنظام

الـ RAG هو القلب، لكن التطبيق يحتاج طبقات أخرى حوله

📱 المستخدم

تطبيق الموبايل
Flutter / React Native

↕

⚙️ الخادم

Backend API
Python / FastAPI

لوحة الإدارة
React / Next.js

↕

🧠 الذكاء

RAG Engine
Vector DB + LLM

↕

💾 البيانات

بيانات المستخدمين

قاعدة الوصفات

نظام الإعلانات

🇪🇬 التحدي

مشكلة المحتوى العربي والمصري

أغلب الـ datasets بالإنجليزي — وفيه 3 حلول عملية

ترجمة الـ Dataset

ml-intern يترجم الوصفات الإنجليزية لعربي باستخدام نماذج ترجمة جاهزة مثل Helsinki-NLP

Base Model عربي

استخدام نماذج عربية جاهزة كـ Jais أو AraGPT2 كنقطة انطلاق للـ Fine-tuning

Scraping مصري

ml-intern يبني scraper لجمع وصفات من مواقع مصرية عربية مثل سيدتي ومطبخ فاطمة أبو حاتي

📅 الخطة

الترتيب الزمني المقترح

من الصفر لنموذج شغّال — مرحلة بمرحلة

المرحلة الأولى

جمع البيانات وتنظيفها

ml-intern يجيب الـ datasets، ينظفها، ويحولها لـ JSON منظم بالمكونات والكميات والخطوات.

🤖 ml-intern

المرحلة الثانية

بناء الـ RAG + Vector Database

تحويل الوصفات لـ embeddings وتخزينها في قاعدة بيانات متجهية مع API للبحث الذكي.

🤖 ml-intern + Chroma/Pinecone

المرحلة الثالثة

Backend + API

سيرفر يربط الـ RAG بالتطبيق، ويدير المستخدمين والمصادقة وقاعدة البيانات العادية.

⚙️ FastAPI / Node.js

المرحلة الرابعة

تطبيق الموبايل

الواجهة اللي المستخدم بيشوفها — اختيار المكونات، عرض الوصفات، المجتمع الاجتماعي.

📱 Flutter / React Native

المرحلة الخامسة (اختياري)

Fine-tuning نموذج مخصص

لو النتائج محتاجة تكون أدق في الأكل المصري، ml-intern يدرب نموذج مخصص فوق الـ RAG.

🤖 ml-intern + GPU

الخلاصة في 5 خطوات

ml-intern دوره ينتهي عند الـ API — الباقي تطوير تقليدي. لكن الـ RAG هو الميزة الأساسية اللي بتفرق التطبيق.

1 جمع البيانات

2 بناء الـ RAG

3 تحويله لـ API

4 Backend + App

5 Fine-tuning لاحقاً

بناء ذكاء اصطناعي للطبخ المصري