عمليات · MLOps·مايو ٢٠٢٦·٧ دقائق قراءة

MLOps مقابل DevOps في إنتاج نماذج اللغة: أين يبدأ الاختلاف حقاً؟‏.

مدير يريد CI/CD كما اعتاد، فيكتشف أن نموذجاً جديداً خفّض سمّ الخطأ لكنه كسر دقة إجابة في قسم العقود [١]. DevOps يثبت أن الخدمة «تعمل»؛ MLOps يثبت أن السلوك ضمن حدود الجودة المتفق عليها [٢][٣].

اربطوا بـ بطاقة RAG الأسبوعية ومقاييس RAG ومجلة نقطة.

التعريف: ماذا فوق النشر؟‏.

سجلّ نماذج، نسب بيانات، مقاييس جودة قبل وبعد، وسياسة تراجع — DevOps وحده لا يولّدها [٢].

دليل تشغيلي‏.

Canary على نموذج لغوي يعني مقارنة توزيعات جودة لا معدل 500 وحده [٣].

«إعادة نشر بلا أخطاء ليست إطلاقاً أخلاقياً إن تراجع النموذج على شريحة مستخدمين.»

أرقام من أرض الميدان‏.

في نقطة، زمن التراجع عند انجراف الجودة غالباً أهم من زمن البناء الأول — لأن الإيقاف يكلف ثقة المستخدم [٤].

مسار عملي: SLO سلوكي‏.

زمن استجابة p95.
معدّل إجابة بدعم مرجعي.
حدّ لسمّ الخطأ — مع لوحة أسبوعية [٥].

ملاحظات صريحة‏.

أتمتة بلا بيانات تقييم تُسرع الفوضى [٢].

الدعوة‏.

اجتماع ساعة: «ما SLO السلوك لمنتجنا؟» بلا جواب أنتم تديرون خادماً لا منتجاً — راجعوا البطاقة الأسبوعية.

أسئلة شائعة‏.

هل Git يكفي؟ تحتاجون سجلاً ووسوم إصدارات وملحقات [٢].
نفس فريق DevOps؟ قد يكون — لكن الاختبارات تختلف [٣].
علاقة RAG؟ تشغيل الاسترجاع جزء من الضمان — المقاييس.
SRE مختلف؟ نعم — حوادث نوعية لا توفر فقط [٤].
متى التراجع؟ عند خرق عتبة جودة — لا عند أول خطأ برمجي فقط [٣].

المصادر‏.

[١] Sato et al. — Continuous Delivery for Machine Learning (Thoughtworks).

[٢] Google — MLOps documentation.

[٣] Breck et al. — The ML Test Score (Google).

[٤] نقطة — ملاحظات ما بعد إطلاق، مايو ٢٠٢٦ (Nuqta internal launch notes, May 2026).

[٥] نقطة — [بطاقة RAG](/journal/rag-ops-weekly-scorecard-2026) — مايو ٢٠٢٦.