# Nuqta (نُقطة) Omani applied AI lab (Muscat, since 2024). Private AI, Gulf Arabic WhatsApp automation (Al-Dhaki), AutomAPI (social + WhatsApp Cloud, https://automapi.com/), agents, apps, consulting. Email: hello@nuqtai.com. > Canonical site: https://nuqtai.com/ > Machine-readable index: https://nuqtai.com/llms.txt (this file), full bundle: https://nuqtai.com/llms-full.txt ## GEO maintenance (for humans updating this repo) When you add or materially change a pillar/hub page, journal post, or homepage FAQ: update FAQ copy in src/i18n/content.ts, add hub URLs to this script if needed, then run npm run generate-og (or npm run build) so llms.txt, llms-full.txt, and sitemap.xml stay in sync. ## Homepages - [Arabic](https://nuqtai.com/): Primary locale. - [English](https://nuqtai.com/en): English marketing site. ## Authority pages - [About — Arabic](https://nuqtai.com/about) - [About — English](https://nuqtai.com/en/about) - [Appearances — Arabic](https://nuqtai.com/appearances) - [Appearances — English](https://nuqtai.com/en/appearances) - [Glossary — Arabic](https://nuqtai.com/glossary) - [Glossary — English](https://nuqtai.com/en/glossary) - [FAQ — Arabic](https://nuqtai.com/faq) - [FAQ — English](https://nuqtai.com/en/faq) - [Private AI hub — Arabic](https://nuqtai.com/private-ai) - [Private AI hub — English](https://nuqtai.com/en/private-ai) - [Arabic & chat hub — Arabic](https://nuqtai.com/arabic-ai) - [Arabic & chat hub — English](https://nuqtai.com/en/arabic-ai) - [Vision 2040 & applied AI — Arabic](https://nuqtai.com/vision-2040) - [Vision 2040 & applied AI — English](https://nuqtai.com/en/vision-2040) ## Nuqta platforms - [AutomAPI](https://automapi.com/) — Omani social scheduling and WhatsApp Cloud messaging (Nuqta). ## Third-party media (verification) - [Shabab Radio — Nuqta interview, 19 May 2024 (audio)](https://soundcloud.com/shababradiooman/19-2024a) - [Youth Platform — Nuqta segment, 27 Apr 2025 (video, ~47:20)](https://www.youtube.com/live/wmbacdQyIZM?t=2840) - [Nuqta at Middle East College (video)](https://www.youtube.com/watch?v=aANGNIsTeaM) - [Oman Daily — MEC student team & Nuqta platform, 30 Oct 2025 (AR)](https://www.omandaily.om/ampArticle/1189261) ## Journal — Arabic - [الذكاء الاصطناعي والسياحة في عُمان — توصية ذكية أم ضجيج تسويقي.](https://nuqtai.com/journal/ai-and-tourism-in-oman-smart-recommendation-or-marketing-noise-2026.md): كل منصة سياحية اليوم تقول إنها «ذكية». لكن الفرق بين توصية مفيدة وضجيج تسويقي بسيط: هل رفعت التحويل فعلاً؟ هل حسّنت تجربة السائح دون إزعاج؟ وهل احترمت خصوصية البيانات؟ في عُمان، السؤال أصبح تنفيذياً لا دعائياً. - [بنود عقد ذكاء اصطناعي لا تُترك فراغاً في عُمان.](https://nuqtai.com/journal/ai-contract-clauses-oman-compliance-2026.md): قائمة مشتريات بدون بنود بيانات ومسؤولية هو شراء وعد. هذا الإطار يربط العقد بقانون حماية البيانات العُماني — دون أن يغني عن مراجعة قانونية. - [الذكاء الاصطناعي في الصحة بالشرق الأوسط — التحديات التنظيمية.](https://nuqtai.com/journal/ai-in-middle-east-healthcare-regulatory-challenges-2026.md): تقنياً، نماذج التشخيص والمساعدة الطبية تتقدّم بسرعة. تنظيمياً، المسار أعقد: خصوصية بيانات حساسة، تصنيف البرمجيات الطبية، نقل بيانات عبر الحدود، ومسؤولية القرار السريري. في الشرق الأوسط، النجاح في AI الصحي لا يبدأ من الخوارزمية فقط، بل من هندسة امتثال دقيقة. - [الذكاء الاصطناعي في خدمات الحكومة الإلكترونية العُمانية.](https://nuqtai.com/journal/ai-in-omani-e-government-services-2026.md): الحديث عن AI حكومي لم يعد شعاراً تقنياً. في عُمان، النقاش تحوّل إلى سؤال عملي: كيف نجعل الخدمة أسرع، أوضح، وأقل كلفة دون المساس بالثقة والخصوصية؟ النجاح هنا لا يُقاس بعدد المبادرات، بل بزمن إنجاز معاملة حقيقية. - [الذكاء الاصطناعي في الموانئ العُمانية — ميناء صلالة نموذجاً.](https://nuqtai.com/journal/ai-in-omani-ports-salalah-case-2026.md): التنافس في الموانئ اليوم لا يُحسم بالموقع الجغرافي وحده. يُحسم بسرعة القرار التشغيلي: تخصيص الرصيف، حركة الشاحنات، وصيانة المعدات قبل التعطل. في هذا السياق، أصبح AI في ميناء صلالة مثالاً على كيف تتحول البيانات من تقارير متأخرة إلى قرارات لحظية. - [مسرح تجربة الشراء — كيف تُصمَّم عروض ذكاء اصطناعي لا تفشل أبداً.](https://nuqtai.com/journal/ai-poc-theater-vendor-demos-2026.md): العروض التجريبية تُدار كمسرح: بيانات نظيفة، أسئلة معروفة، وغياب حوكمة كما ستكون في الإنتاج. هذا المقال يفكّك الخداع البريء ويعطيك إطار قياس يفشل مبكراً بأمان — قبل توقيع العقد. - [بناء شركة ناشئة من مسقط — ما تعلّمناه في عامنا الأول.](https://nuqtai.com/journal/building-startup-from-muscat.md): لا توجد دليل لبناء شركة تقنيّة من عُمان. هذه ليست دليلاً. هي ملاحظات سنة كاملة، بصدق، بما فيها ما نندم عليه. - [السيادة الرقمية: لماذا يجب أن تبقى بياناتك في عُمان.](https://nuqtai.com/journal/digital-sovereignty-oman.md): حين تُرسِل بيانات عملائك إلى سيرفر في فرانكفورت أو فرجينيا، أنت لا تستضيفها. أنت تُسلِّمها. الفرق ليس تقنيّاً. - [وكلاء المؤسسة مقابل خط أنابيب RAG — متى يكون التنسيق مسرحاً.](https://nuqtai.com/journal/enterprise-ai-agents-vs-rag-first-2026.md): معظم ما يُباع كـ«وكيل» في الإنتاج هو استرجاع جيد + أدوات محدودة + سياسات — لا أوركسترا ذاتية القيادات تتخذ قرارات بلا إشراف. هذا المقال يضع قراراً منتجياً صريحاً قبل أن تضاعف التعقيد. - [ما هو الـ Fine-tuning ولماذا يختلف عن الـ Prompting.](https://nuqtai.com/journal/fine-tuning-vs-prompting-2026.md): في نصف الاجتماعات يُقال «سنُحسّن النموذج» بينما المقصود «سنعيد صياغة الجملة». الطرفان مكملان، لكنّ أحدهما يغيّر النص الذي يدخل، والآخر قد يغيّر أوزان النموذج نفسه. هذا الفصل يوضّح القرار ويحميك من دفع تكلفة التدريب دون حاجة. - [خمس مقاييس لتقييم RAG قبل لوم النموذج اللغوي.](https://nuqtai.com/journal/five-rag-metrics-before-blaming-llm-2026.md): قبل أن ترفع ميزانية النموذج أو تغيّر المزود، قِس الاسترجاع والقطع والتصعيد. أغلب «الهلوسة» في الإنتاج تبدأ من المستندات والفهرس — لا من حجم الباراميترات. - [الفرق بين GPT-4 وClaude وGemini — مقارنة موضوعية.](https://nuqtai.com/journal/gpt-4-claude-gemini-comparison-2026.md): هذا ليس تصويتاً جماهيرياً. هذا إطار قرار: ما الذي يميّز كل عائلة، أين تتقدّم، وأين تضعف، وكيف تختار دون أن يبيعك أحد وهم «الأفضل». - [البحث الهجين — الجمع بين البحث النصي والمتجهي.](https://nuqtai.com/journal/hybrid-search-lexical-vector-2026.md): هذا ليس اسم منتج على بطاقة. هذا قرار بنية: متى يحميك التطابق على الكلمات، ومتى يحميك التشابه في فضاء المتجهات، وكيف تدمجهما دون أن تضاعف التكلفة بلا مقياس. - [الفرق بين Inference والـ Training — من يدفع ماذا.](https://nuqtai.com/journal/inference-vs-training-llm-economics-2026.md): تدريبٌ مرةٍ — أو آلاف الساعات — يُنقَل ثقلُه مرة. استدلالٌ بلا توقف يُحوِّل تكلفة المشروع إلى سعرٍ لكلّ رمز. هذا المقال يفصل محورَ النقدين، ويمنع اختلاط «ميزانية التجربة» ب«فاتورة المنتج» [١]. - [الفرق بين L40S وA100 وH100 — أي بطاقة لأي مهمة.](https://nuqtai.com/journal/l40s-a100-h100-gpu-task-matrix-2026.md): ليست المسألة «أقوى شريحة». المسألة مطابقة الـworkload: تدريبٌ ثقيلٌ أم استدلالٌ عالٍ أم تسريعٌ بصريٌ؟ جدولٌ واحدٌ يختصر أين تضع L40S وأين A100 وأين [H100](/journal/nvidia-h100-gpu-ai-standard-2026) — بلا تخمينٍ في العقد [١]. - [بروتوكول MCP في المؤسسة: الجسر ليس حدود البيانات.](https://nuqtai.com/journal/mcp-enterprise-boundaries-2026.md): Model Context Protocol يفسّر كيف تربط أدواتك بنموذج لغوي — لكنه لا يستبدل قرار أين تُعالَج البيانات، ومن يملك السجل، وما إذا كان الاستدلال يغادر شبكتك. - [الشركات الناشئة في مجال الذكاء الاصطناعي في مسقط — من الذي يبني ماذا.](https://nuqtai.com/journal/muscat-ai-startups-who-builds-what-2026.md): مشهد AI في مسقط لم يعد مجموعة عروض متفرقة. بدأ يتشكل كسوق واضح الفئات: من يبني نماذج عربية، من يبيع أدوات تشغيل، من يحل مشاكل قطاعية محددة. السؤال الأهم لم يعد «من عنده AI؟» بل «من يبني قيمة قابلة للبيع؟». - [ما هو GPU H100 ولماذا أصبح معيار الذكاء الاصطناعي.](https://nuqtai.com/journal/nvidia-h100-gpu-ai-standard-2026.md): ليست بطاقة ألعاب في حاسوب مكتب. هي وحدة حوسبة تُقاس بها «ساعة التدريب» و«تكلفة الرمز» في مراكز البيانات. H100 ليس سحراً؛ هو نقطة مرجعية اتفق السوق والأوراق البحثية على نقلها، لأنّ البنية والبرمجيات والسحابة التقطتها معاً. - [قانون حماية البيانات الشخصية العُماني ٢٠٢٢ وأثره على AI.](https://nuqtai.com/journal/oman-pdpl-2022-impact-on-ai-2026.md): الذكاء الاصطناعي لا يُبنى في فراغ قانوني. قانون حماية البيانات الشخصية العُماني (المرسوم ٦/٢٠٢٢) غيّر طريقة جمع البيانات، تدريب النماذج، ونقلها خارج الحدود. السؤال لم يعد: «هل النموذج دقيق؟» فقط، بل: «هل طريقة بنائه وتشغيله مشروعة؟». - [رؤية عُمان 2040 والذكاء الاصطناعي — ما الذي تغيّر في 2026.](https://nuqtai.com/journal/oman-vision-2040-ai-what-changed-2026.md): لسنوات كان الذكاء الاصطناعي في عُمان شعاراً ضمن التحول الرقمي. في 2026 تحوّل إلى برامج تنفيذية أكثر وضوحاً: أهداف اقتصادية، منصات وطنية، وحوكمة أقرب للإنتاج لا للعروض. السؤال لم يعد «هل ندخل AI؟» بل «أين يخلق قيمة قابلة للقياس؟». - [الاقتباس الوهمي — كيف تتدقيق ربط RAG بالمصادر قبل الثقة بالواجهة.](https://nuqtai.com/journal/rag-hallucinated-citations-audit-2026.md): الواجهة تعرض «مرجعاً» والفقرة غير موجودة، أو المقطع مبتور، أو الصفحة خاطئة. هذا المقال يضع مسار تدقيق عمليّ قبل أن تُطلق المساعد للموظفين أو للعملاء. - [حقن التوجيه وتسميم مجموعة المستندات — ثغرة RAG التي يلطّفها العرض.](https://nuqtai.com/journal/rag-prompt-injection-corpus-poisoning-2026.md): مستند يبدو عادياً يخفي تعليمات تخرج النموذج عن السياسة، أو تسرّب محتوى من فهرس آخر. هذا ليس خيالاً؛ هو نموذج هجوم واقعيّ يتطلب دفاعاً تشغيلياً لا شعاراً تسويقياً. - [ظلّ الذكاء الاصطناعي — حوكمة الاستخدام غير المعتمد في المؤسسة.](https://nuqtai.com/journal/shadow-ai-governance-gcc-2026.md): هذا ليس خطاباً ضدّ الموظفين. هو وصف لما يحدث حين يصبح مساعد المستهلك الطريقة الافتراضية للعمل — دون سجلّ معالجة، ودون بديل معتمد، ودون نقطة تفتيش واحدة تربط تقنية المعلومات بالامتثال. - [متى يغلب النموذج الصغير محلياً اشتراك واجهة السحابة.](https://nuqtai.com/journal/slm-local-vs-api-economics-2026.md): هذا المقال ليس ضدّ السحابة. نحن نضع جدولاً: متى يكون تشغيل نموذج مفتوح صغير أو متوسط على GPU داخل حدودك أوفر من سطر API شهري — وسنة واحدة لا تكفي لحساب الحقيقة. - [نهاية عصر البحث التقليدي — ما يحدث لـ Google في ٢٠٢٦.](https://nuqtai.com/journal/traditional-search-ending-google-2026.md): هذا ليس نعياً على جوجل. هذا وصف لتحوّل اقتصادي: من يملك النقرة، من يملك الإجابة، ولماذا ميزانية الكلمات المفتاحية وحدها لم تعد تكفي لشرح ما يحدث في ٢٠٢٦. - [كيف يعمل الـ Transformer — شرح بدون معادلات.](https://nuqtai.com/journal/transformer-explained-no-equations-2026.md): ورقة «Attention Is All You Need» غيّرت الصناعة، لكنّها لا تُقرأ في اجتماع المنتج. هذا الشرح لمن يريد أن يفهم المحرّك دون أن يمسّ مطّاطاً: مفتاح واحد اسمه «انتباه»، يعيد ترتيب الأهمية بين الكلمات بناءً على السياق. - [ما هو نموذج اللغة الكبير — دليل كامل لعام ٢٠٢٦.](https://nuqtai.com/journal/what-is-llm-complete-guide-2026.md): هذا ليس مقال تعريفات. هذا حساب قرار. إذا أردت استخدام نموذج لغة كبير في ٢٠٢٦، فهذه هي الصورة كاملة: كيف يعمل، أين يربح، أين يخذلك، وكيف تختار دون ضجيج. - [ما هو الـ LoRA وكيف يُقلّل تكلفة ضبط النماذج.](https://nuqtai.com/journal/what-is-lora-efficient-fine-tuning-2026.md): عندما يقال «ضبط دقيق» قد تتصوّر تحديث مليارات الأوزان في دورة مكلفة. LoRA طريقة تضيف طبقات بِرَنْك منخفض وتُحدِّث حصّة صغيرة جداً من المعاملات — قد تكفي لتحويل سلوك النموذج في مهام ضيّقة دون إعادة نسخ كلّ الأوزان. هذا المقال يشرح المبدأ بلا مبالغة، ومتى ينتقل الوفير من الورقة إلى الاستثمار [١]. - [ما هو PagedAttention وما الذي غيّره في عالم الـ LLM Serving.](https://nuqtai.com/journal/what-is-pagedattention-llm-serving-2026.md): المشكلة في Serving لم تكن دائماً سرعة المعالج، بل هدر الذاكرة في KV Cache. PagedAttention غيّر اللعبة لأنه عامل الذاكرة كصفحات قابلة للتخصيص بدل مساحات متجاورة ضخمة، فقلّ الهدر وارتفعت الإنتاجية على نفس العتاد. - [ما هو RAG — ولماذا بوت شركتك لا يفهم سياق عملك.](https://nuqtai.com/journal/what-is-rag-complete-guide-2026.md): دليل عملي لـ Retrieval-Augmented Generation: كيف يقرأ البوت مستنداتك قبل أن يجيب، ولماذا هو أرخص من Fine-tuning بعشر مرات. - [ما هو الـ vLLM ولماذا يُستخدم في الإنتاج.](https://nuqtai.com/journal/what-is-vllm-production-serving-2026.md): vLLM محركٌ مفتوح المصدر لخدمة نماذج اللغة: جدولة، دفعات مستمرة، وذاكرة KV مُنظّمة بـ[PagedAttention](/journal/what-is-pagedattention-llm-serving-2026). الفكرة ليست «تغليف API» فقط — بل رفع كثافة العتاد تحت حملٍ حقيقي [١]. - [من يملك تضميناتك؟ الضبط الدقيق وقانون حماية البيانات.](https://nuqtai.com/journal/who-owns-embeddings-fine-tuning-pdpl-2026.md): التضمينات والأوزان المضبوطة ليست «ملفات عادية». هي مخرجات معالجة قد تعيد تعريف هوية بياناتكم — والعقد غالباً يتكلم عن النموذج العام ويتناسى ما تولّده لكم. - [لماذا يفشل معظم بوتات الذكاء الاصطناعي العربية.](https://nuqtai.com/journal/why-arabic-ai-bots-fail.md): ليست المشكلة في النموذج. المشكلة أنّنا نُدرِّبه على عربيّة لا أحد يتكلّمها، ثمّ نندهش حين لا يفهمنا أحد. ## Journal — English - [AI and tourism in Oman — smart recommendation or marketing noise.](https://nuqtai.com/en/journal/ai-and-tourism-in-oman-smart-recommendation-or-marketing-noise-2026.md): Almost every tourism platform now claims to be "AI-powered." The real test is simple: did recommendations lift conversion, improve visitor experience, and respect data boundaries? In Oman, the difference between value and hype is now measurable. - [AI contract clauses you cannot leave blank in Oman.](https://nuqtai.com/en/journal/ai-contract-clauses-oman-compliance-2026.md): A procurement pack without data and liability clauses is buying a promise. This framework ties contracts to Oman PDPL — it is not a substitute for legal review. - [AI in Middle East healthcare — regulatory challenges.](https://nuqtai.com/en/journal/ai-in-middle-east-healthcare-regulatory-challenges-2026.md): Health AI is accelerating technically, but regulation remains the harder gate: sensitive data, medical-software classification, cross-border transfer constraints, and clinical accountability. In the Middle East, successful health AI starts with compliance architecture, not model demos. - [AI in Omani e-government services.](https://nuqtai.com/en/journal/ai-in-omani-e-government-services-2026.md): Government AI is no longer a tech slogan. In Oman, the practical question is now: can AI make services faster, clearer, and cheaper while preserving trust and privacy? Success is measured by real transaction performance, not initiative count. - [AI in Omani ports — Port of Salalah as a case.](https://nuqtai.com/en/journal/ai-in-omani-ports-salalah-case-2026.md): Port competitiveness is no longer won by geography alone. It is won by operational decision speed: berth allocation, yard flow, and maintenance before breakdown. In that context, Salalah illustrates how AI turns delayed reports into live operating decisions. - [POC theater — how vendor AI demos are designed never to fail.](https://nuqtai.com/en/journal/ai-poc-theater-vendor-demos-2026.md): Proofs are staged: clean data, rehearsed questions, and none of the governance you will run in production. This article unpacks the polite trap and gives a measurement frame that fails early — before the signature. - [Building a startup from Muscat — what we learned in year one.](https://nuqtai.com/en/journal/building-startup-from-muscat.md): There is no playbook for building a tech company from Oman. This is not a playbook. These are notes from one year, honest, including what we regret. - [Digital sovereignty: why your data should stay in Oman.](https://nuqtai.com/en/journal/digital-sovereignty-oman.md): When you send your customers' data to a server in Frankfurt or Virginia, you are not hosting it. You are handing it over. The difference is not technical. - [Enterprise AI agents vs a RAG-first pipeline — when orchestration is theater.](https://nuqtai.com/en/journal/enterprise-ai-agents-vs-rag-first-2026.md): Most "agents" in production are solid retrieval + a few tools + policies — not a self-driving orchestrator making unsupervised decisions. This article gives a blunt product decision before you multiply complexity. - [What is fine-tuning — and how it differs from prompting.](https://nuqtai.com/en/journal/fine-tuning-vs-prompting-2026.md): Half the meetings say "we will tune the model" while they mean "we will rewrite the prompt." The two complement each other — but one changes the text going in, and the other can change the model's weights. That distinction clarifies the decision and saves you from training costs you did not need. - [Five RAG metrics to check before you blame the LLM.](https://nuqtai.com/en/journal/five-rag-metrics-before-blaming-llm-2026.md): Before you raise model spend or switch vendors, measure retrieval, chunks, and escalation. Most production hallucination starts in documents and indexes — not parameter count. - [GPT-4 vs Claude vs Gemini — an objective comparison.](https://nuqtai.com/en/journal/gpt-4-claude-gemini-comparison-2026.md): This is not a popularity vote. It is a decision frame: what differentiates each family, where each leads, where each weakens, and how to choose without buying the myth of a single "best" model. - [Hybrid search — combining lexical and vector retrieval.](https://nuqtai.com/en/journal/hybrid-search-lexical-vector-2026.md): This is not a vendor badge. It is an architecture decision: when token overlap saves you, when embedding similarity saves you, and how to fuse both without doubling cost with nothing to measure. - [Inference vs training for LLMs — who pays for what.](https://nuqtai.com/en/journal/inference-vs-training-llm-economics-2026.md): Training might run once (or for many hours) and you pay a cluster bill. Inference runs forever and turns a model into a per-token Opex line. This article separates the two checkbooks so pilot budgets are not mixed with product bills [1]. - [L40S vs A100 vs H100 — which GPU for which job.](https://nuqtai.com/en/journal/l40s-a100-h100-gpu-task-matrix-2026.md): The question is not the fastest SKU on a slide. It is workload fit: heavy training, broad inference, or cost-per-watt chat serving? One matrix places L40S, A100, and the [H100 reference](/en/journal/nvidia-h100-gpu-ai-standard-2026) on the same decision axis — without hand-waving in procurement [1]. - [Model Context Protocol at work: the bridge is not the border.](https://nuqtai.com/en/journal/mcp-enterprise-boundaries-2026.md): MCP explains how tools plug into an LLM — it does not replace decisions on where data is processed, who owns logs, or whether inference leaves your network. - [AI startups in Muscat — who is building what.](https://nuqtai.com/en/journal/muscat-ai-startups-who-builds-what-2026.md): Muscat’s AI startup scene is no longer a loose set of demos. It is becoming a clearer market map: vertical product builders, model-language teams, integration players, and AI operations tools. The core question is no longer "who has AI" but "who ships measurable value." - [What is the H100 GPU — and why it became AI's reference hardware.](https://nuqtai.com/en/journal/nvidia-h100-gpu-ai-standard-2026.md): It is not a gaming card in a tower PC. It is the unit cloud bills and SLAs often anchor to when they say "GPU hour." H100 is not magic — it became a shared reference because hardware, software, and hyperscaler catalogs aligned on it for a full training era. - [Oman's Personal Data Protection Law (2022) and its impact on AI.](https://nuqtai.com/en/journal/oman-pdpl-2022-impact-on-ai-2026.md): AI does not run in a legal vacuum. Oman's PDPL (Royal Decree 6/2022) changed how teams collect data, train models, and move personal data across borders. The key question is no longer only "is the model accurate?" but also "is its data lifecycle lawful?" - [Oman Vision 2040 and AI — what changed in 2026.](https://nuqtai.com/en/journal/oman-vision-2040-ai-what-changed-2026.md): For years, AI in Oman was mostly discussed as part of digital-transformation rhetoric. In 2026, the frame shifted toward executable programs: economic targets, national platforms, and governance tied to delivery. The question is no longer "should we adopt AI?" but "where does AI create measurable value now?" - [Hallucinated citations — auditing RAG source links before you trust the UI.](https://nuqtai.com/en/journal/rag-hallucinated-citations-audit-2026.md): The UI shows a "source" while the paragraph is missing, truncated, or from the wrong page. This article gives a practical audit path before you ship the assistant to staff or customers. - [Prompt injection and corpus poisoning — the RAG gap vendors smooth over.](https://nuqtai.com/en/journal/rag-prompt-injection-corpus-poisoning-2026.md): A normal-looking document hides instructions that derail policy or leak index content. This is not sci-fi — it is a realistic attack pattern that needs operational defense, not a marketing disclaimer. - [Shadow AI — governing unsanctioned use in GCC enterprises.](https://nuqtai.com/en/journal/shadow-ai-governance-gcc-2026.md): This is not a lecture aimed at employees. It is what happens when the consumer assistant becomes the default way to work — with no processing record, no approved alternative, and no checkpoint linking IT to compliance. - [When a small on-prem model beats a cloud API subscription.](https://nuqtai.com/en/journal/slm-local-vs-api-economics-2026.md): This is not anti-cloud. It is a spreadsheet: when an open small or medium model on your own GPU wins on three-year TCO and compliance — and year-one math lies if you ignore context and labor. - [The end of traditional search — what happens to Google in 2026.](https://nuqtai.com/en/journal/traditional-search-ending-google-2026.md): This is not a funeral for Google. It is an operating description of a market shift: who owns the click, who owns the answer, and why keyword budgets alone no longer explain what changed in 2026. - [How the Transformer works — a plain-language guide.](https://nuqtai.com/en/journal/transformer-explained-no-equations-2026.md): "Attention Is All You Need" changed the industry, but it does not belong in a product review meeting. This is the version for builders: one mechanism called attention, reweighting importance between tokens based on context — without a single equation. - [What is a large language model — complete guide for 2026.](https://nuqtai.com/en/journal/what-is-llm-complete-guide-2026.md): This is not a glossary entry. It is the operating calculation behind LLM decisions in 2026: how the model works, where it fails, and how to choose the right deployment path. - [What is LoRA — and how it cuts fine-tuning cost.](https://nuqtai.com/en/journal/what-is-lora-efficient-fine-tuning-2026.md): When people say fine-tuning, many still picture updating billions of weights in an expensive full pass. LoRA freezes the base and injects a low-rank delta into selected linear paths — often enough to shift behavior on a narrow task without shipping a full weight copy. This article explains the idea without hype, and when savings move from slides to investment [1]. - [What is PagedAttention — and what it changed in LLM serving.](https://nuqtai.com/en/journal/what-is-pagedattention-llm-serving-2026.md): Serving bottlenecks were not always raw GPU speed; they were often KV cache waste. PagedAttention changed the equation by treating KV memory as pageable blocks instead of large contiguous reservations, cutting waste and lifting throughput on the same hardware. - [What is RAG — and why your company bot answers like a stranger.](https://nuqtai.com/en/journal/what-is-rag-complete-guide-2026.md): A practical guide to Retrieval-Augmented Generation: how your bot reads documents before answering, and why it costs 10× less than fine-tuning. - [What is vLLM — and why production teams use it.](https://nuqtai.com/en/journal/what-is-vllm-production-serving-2026.md): vLLM is an open inference engine for LLMs: scheduling, continuous batching, and KV memory designs such as [PagedAttention](/en/journal/what-is-pagedattention-llm-serving-2026). The point is not a thin API wrapper — it is raising useful throughput under real traffic [1]. - [Who owns your embeddings? Fine-tuning and PDPL reality.](https://nuqtai.com/en/journal/who-owns-embeddings-fine-tuning-pdpl-2026.md): Embeddings and fine-tuned weights are not ordinary files. They are processing outputs that can redefine what your data means — and contracts often discuss the base model while ignoring what was generated for you. - [Why most Arabic AI bots fail.](https://nuqtai.com/en/journal/why-arabic-ai-bots-fail.md): It is not the model. It is that we train it on Arabic no one actually speaks, then act surprised when no one understands it back. ## Feeds - [RSS Arabic](https://nuqtai.com/feeds/journal-ar.xml) - [RSS English](https://nuqtai.com/feeds/journal-en.xml) _Last updated: 2026-04-24_