تخطّي إلى المحتوى الرئيسي
← العودة إلى المجلّة
ذكاء اصطناعي · بنية·أبريل ٢٠٢٦·٨ دقائق قراءة

الفرق بين L40S وA100 وH100 — أي بطاقة لأي مهمة.

عروض السحابة تُبرز أسماءً أشبه العملات: L40S، A100، H100. المخاطرة أن تختار «الأحدث» رغم أن أغلب أحمال الاستدلال تحتاج تكثيفاً للذاكرة لا «تدريباً من الصفر» يوميّاً [١].

هذا المقال لا يستبدلُ دليل الـH100 — يكمّله: يضعُ L40S وA100 في نفسِ المقارنةِ التشغيليّةِ [٢].

ثلاث فئات بسرعة.

H100 — عائلة Hopper: مرجعٌ للتدريبٍ الكثيفٍ والاستدلالٍ عند نماذجٍ كبيرةٍ وسياقٍ طويلٍ؛ تكثيفٌ tensorٌ وذاكرةٌ HBM واسعةٌ [٢].

A100 — عائلة Ampere: جيلٌ ما زالَ شائعاً في الحسابٍ العامٍ والتدريبٍ؛ توازنٌ تاريخيٌ بين السعرٍ والبرمجياتٍ [٢].

L40S — Ada Lovelace: غالباً لأحمالٍ أخفّ و«تسريعٍ» ومراكز بياناتٍ تريد كفاءةً لكلّ واطٍ في الاستدلالٍ؛ ليست دائماً البديلَ لـH100 في كلّ تدريبٍ [١].

السؤال الصحيح ليس «أي شريحة». السؤال: «أيّ شريحة تربح نفس الـSLO عند نفس حجم السياق والدفق؟»

مخطط اختيارٍ مُبسّط.

FIG. 1 — GPU FAMILY ↔ PRIMARY WORKLOAD (SCHEMATIC)

قرارٌ عمليٌ في نُقطة.

نرى في نقطة أن الـpilot يبدأ أحياناً على وحدات أصغر ثم ينتقل — شرط أن تُقاس نفس الـtokens والـlatency [٥].

ربط الاستدلال والتدريب يحدّد هل تدفع بساعات الضبط أم برموز المنتج [٤].

أسئلة شائعة.

  • هل L40S «كافٍ» للعربية الثقيلة؟ يعتمد على حجم النموذج والسياق — لا على اسمٍ لغوي [٣].
  • هل أستبدل A100 بـH100 دائماً؟ لا — إن كان الاختناق ذاكرةً في الـServing قد يحلّهُ محرّكٌ قبل العتاد [٢].
  • كيف أثبت العرض؟ حمّل نفس الـprecision والسائق والمحرّك [٣].
  • ماذا عن vLLM؟ يزيد الـthroughput — لا يغيّر فيزياء الشريحة [٢].
  • هل ينطبق هذا في عُمان؟ التوريد والعقد يغيّران الـSKU المتاح — راجع السيادة الرقمية [٥].

الخلاصة.

الأرقام في كتالوج NVIDIA تدعم الاتجاه — لا القرار وحده [١][٢].

اطلب من المورّد سطراً واحداً: نفس الحمل، نفس الـbatch، نفس السياق — ثم قارن التكلفة لكل مليون token [٤].

المصادر.

[١] NVIDIA — L40S GPU (product page).

[٢] NVIDIA — H100 / A100 product overviews (data center).

[٣] MLCommons — MLPerf Inference (methodology).

[٤] نقطة — ملاحظاتٌ داخليّةٌ من طلباتٍ عروضٍ GPU، أبريلٌ ٢٠٢٦ (Nuqta internal procurement notes, April 2026).

[٥] نقطة — سياساتٌ تشغيليّةٌ لمراحلٍ pilot→prod، أبريلٌ ٢٠٢٦ (Nuqta internal rollout notes, April 2026).

مقالات ذات صلة

  • ما هو GPU H100 ولماذا أصبح معيار الذكاء الاصطناعي.

    ليست بطاقة ألعاب في حاسوب مكتب. هي وحدة حوسبة تُقاس بها «ساعة التدريب» و«تكلفة الرمز» في مراكز البيانات. H100 ليس سحراً؛ هو نقطة مرجعية اتفق السوق والأوراق البحثية على نقلها، لأنّ البنية والبرمجيات والسحابة التقطتها معاً.

  • الفرق بين Inference والـ Training — من يدفع ماذا.

    تدريبٌ مرةٍ — أو آلاف الساعات — يُنقَل ثقلُه مرة. استدلالٌ بلا توقف يُحوِّل تكلفة المشروع إلى سعرٍ لكلّ رمز. هذا المقال يفصل محورَ النقدين، ويمنع اختلاط «ميزانية التجربة» ب«فاتورة المنتج» [١].

  • ما هو الـ vLLM ولماذا يُستخدم في الإنتاج.

    vLLM محركٌ مفتوح المصدر لخدمة نماذج اللغة: جدولة، دفعات مستمرة، وذاكرة KV مُنظّمة بـ[PagedAttention](/journal/what-is-pagedattention-llm-serving-2026). الفكرة ليست «تغليف API» فقط — بل رفع كثافة العتاد تحت حملٍ حقيقي [١].

  • منطقة الذكاء الاصطناعي الخاصة في عُمان: من إعلان كومكس إلى مرسوم سلطاني.

    في التاسع والعشرين من أبريل ٢٠٢٦، وقّع جلالة السلطان هيثم بن طارق المرسوم السلطاني رقم ٥٠/٢٠٢٦. تحوّلت منطقة الذكاء الاصطناعي الخاصة في السيب من وعد على منصة كومكس إلى كيان قانوني — بمساحة نحو ١٠٤,٠٠٠ متر مربع وثلاثة قطاعات محددة. هذا ما يعنيه المرسوم للشركات التي تريد البناء الآن.

  • استهلاك الطاقة وبطاقات GPU في مراكز بيانات الخليج.

    PUE وفاتورة الكيلوواط ساعة قبل أرقام نفيديا — حر الخليج يشترط تبريداً وحجماً مختلفين عن المرجعيات الباردة

استكشف المحور

الذكاء الاصطناعي الخاص

النشر الخاص، السيادة، البنية التحتية، والخدمة على مستوى المؤسسة.

شارك المقال

← العودة إلى المجلّةنُقطة · المجلّة