أمان · تهديدات LLM·مايو ٢٠٢٦·٧ دقائق قراءة

حقن الأوامر في نماذج اللغة بالمؤسسة: طبقات دفاع لا تعتمد على حظر الكلمات‏.

مشغّل يرى «تجاوز سياسة» في السجل فيبتسم. المشكلة: التجاوز على نظام مرتبط بـ CRM ليس دعابة — قد يولّد بريداً أو يقرأ ملاحظات عميل [١]. التهديد استغلال النموذج كقناة تلاعب [٢].

اربطوا بـ تسميم المجسّم في RAG وحدود MCP ومجلة نقطة.

رؤية: الحدود صلاحيات لا ألفاظ‏.

افصلوا بين مستخدم نهائي ومساعد داخلي: من يستدعي الأدوات؟ أي واجهة تُفعّل؟ ما نطاق التذكرة؟ [٢]

أدلة وأنماط‏.

سلاسل تلاعب وتزييف سياق تمرّر تعليمات داخل محتوى يبدو بريئاً [١][٢].

«لا تحظروا الجملة — اقفلوا الفعل. النموذج ذو الصلاحية بلا حدود يصبح ثغرة.»

تكلفة الحدث‏.

تقديرات المخاطر تربط أمن الذكاء الاصطناعي بالامتثال وسلاسل التوريد — ليس صفراً [٣][٤].

مسار عملي: خمس طبقات‏.

سياسة صلاحيات للأدوات.
تصفية استرجاع.
بوابة مخرجات قبل التنفيذ.
سجلات تدقيق.
تمارين Red team دورية [١][٥].

الدعوة‏.

اختبروا هجوماً مختلقاً على staging هذا الأسبوع — إن لم يتحرك الأمن، المشكلة عملية: حوكمة الظل.

أسئلة شائعة‏.

جدار نصوص يكفي؟ لا — يُتفادى بسهولة [١].
منع مئة بالمئة؟ لا — يُدار الخطر [٤].
وماذا عن RAG؟ التسميم يضاعف الخطر — المقال.
هل MCP يوسّع السطح؟ أي تكامل يوسّع — راقبوا الحدود MCP.
ماذا نسجّل؟ المحاولة والنص والقرار والأداة [٥].

المصادر‏.

[١] OWASP — LLM Top 10.

[٢] Microsoft — توثيق أمني لسيناريوهات prompt.

[٣] NIST — AI RMF.

[٤] ENISA — تقارير أمن ذكاء اصطناعي.

[٥] نقطة — تمارين Red team داخلية، مايو ٢٠٢٦ (Nuqta internal exercise, May 2026).