تخطّي إلى المحتوى الرئيسي
← العودة إلى المجلّة
عمليات · MLOps·مايو ٢٠٢٦·٧ دقائق قراءة

MLOps مقابل DevOps في إنتاج نماذج اللغة: أين يبدأ الاختلاف حقاً؟.

مدير يريد CI/CD كما اعتاد، فيكتشف أن نموذجاً جديداً خفّض سمّ الخطأ لكنه كسر دقة إجابة في قسم العقود [١]. DevOps يثبت أن الخدمة «تعمل»؛ MLOps يثبت أن السلوك ضمن حدود الجودة المتفق عليها [٢][٣].

اربطوا بـ بطاقة RAG الأسبوعية ومقاييس RAG ومجلة نقطة.

التعريف: ماذا فوق النشر؟.

سجلّ نماذج، نسب بيانات، مقاييس جودة قبل وبعد، وسياسة تراجع — DevOps وحده لا يولّدها [٢].

دليل تشغيلي.

Canary على نموذج لغوي يعني مقارنة توزيعات جودة لا معدل 500 وحده [٣].

«إعادة نشر بلا أخطاء ليست إطلاقاً أخلاقياً إن تراجع النموذج على شريحة مستخدمين.»

أرقام من أرض الميدان.

في نقطة، زمن التراجع عند انجراف الجودة غالباً أهم من زمن البناء الأول — لأن الإيقاف يكلف ثقة المستخدم [٤].

مسار عملي: SLO سلوكي.

  • زمن استجابة p95.
  • معدّل إجابة بدعم مرجعي.
  • حدّ لسمّ الخطأ — مع لوحة أسبوعية [٥].

ملاحظات صريحة.

أتمتة بلا بيانات تقييم تُسرع الفوضى [٢].

الدعوة.

اجتماع ساعة: «ما SLO السلوك لمنتجنا؟» بلا جواب أنتم تديرون خادماً لا منتجاً — راجعوا البطاقة الأسبوعية.

أسئلة شائعة.

  • هل Git يكفي؟ تحتاجون سجلاً ووسوم إصدارات وملحقات [٢].
  • نفس فريق DevOps؟ قد يكون — لكن الاختبارات تختلف [٣].
  • علاقة RAG؟ تشغيل الاسترجاع جزء من الضمان — المقاييس.
  • SRE مختلف؟ نعم — حوادث نوعية لا توفر فقط [٤].
  • متى التراجع؟ عند خرق عتبة جودة — لا عند أول خطأ برمجي فقط [٣].

المصادر.

[١] Sato et al. — Continuous Delivery for Machine Learning (Thoughtworks).

[٢] Google — MLOps documentation.

[٣] Breck et al. — The ML Test Score (Google).

[٤] نقطة — ملاحظات ما بعد إطلاق، مايو ٢٠٢٦ (Nuqta internal launch notes, May 2026).

[٥] نقطة — [بطاقة RAG](/journal/rag-ops-weekly-scorecard-2026) — مايو ٢٠٢٦.

مقالات ذات صلة

استكشف المحور

العربية والذكاء الاصطناعي

النماذج اللغوية العربية، المقارنات، وبوتات المحادثة.

شارك المقال

← العودة إلى المجلّةنُقطة · المجلّة