تشهد نماذج الذكاء الاصطناعي قفزة تحويلية تتجاوز مجرد تحسينات رقمية، لتصل إلى إعادة تعريف جوهر الأنظمة. لم يعد الذكاء الاصطناعي مجرد مجيب للأسئلة، بل يتجه ليصبح منفذًا ومفكرًا قادرًا على فهم الأهداف، وضع الخطط، وتنفيذها عبر أدوات متعددة، مع القدرة على التعلم والتصحيح المستمر.
تستند هذه القدرات الجديدة إلى ثلاثة مرتكزات أساسية: ذاكرة موسعة لاستيعاب كميات ضخمة من المعلومات، وتفكير ممتد يسمح بالتعمق في المسائل المعقدة، ومفهوم “الوكيل الذكي” الذي يتجاوز الاقتراح إلى التنفيذ الفعلي باستخدام أدوات برمجية حقيقية. يأتي في مقدمة هذه الموجة الجديدة نماذج مثل Claude Opus 4.6 من Anthropic، وGPT-5.3-Codex من OpenAI، وتحديث Gemini 3 Deep Think من Google، والتي تمثل جميعها انتقالًا جذريًا من الذكاء الاصطناعي “المجيب” إلى الذكاء الاصطناعي “المنفذ والمفكر”.
Claude Opus 4.6: ذاكرة ممتدة وتجربة أكثر استقرارًا
يعكس Claude Opus 4.6 من Anthropic التركيز على المهام المعقدة والطويلة، لا سيما في مجالات البرمجة والعمل مع المستندات الكبيرة. بفضل نافذة سياق تصل إلى مليون توكن، يستطيع النموذج استيعاب ومعالجة ملفات ضخمة مثل العقود والتقارير والمراسلات الطويلة كوحدة واحدة، محافظًا على التفاصيل الأساسية.
يشير أداء النموذج الذي سجل 76% في اختبار MRCR v2، مقارنة بـ 18.5% للإصدار السابق، إلى تحسن كبير في تحديد المعلومات الدقيقة ضمن كميات هائلة من النصوص. بالنسبة للمهنيين في مجالات القانون والمال والبحث، يترجم هذا إلى تقليل احتمالية تجاهل بنود حيوية أو استثناءات حساسة.
أظهرت اختبارات أخرى مثل Terminal-Bench 2.0 وHumanity’s Last Exam قدرة أعلى على حل المشكلات متعددة الخطوات وإنجاز مهام ذات قيمة مهنية حقيقية. هذه النتائج لا تعكس تفوقًا أكاديميًا فحسب، بل تعني تجربة عمل يومي أكثر استقرارًا، مع تقارير أدق وتحليلات أعمق ومهام طويلة لا تتوقف عند منتصف الطريق.
أضافت Anthropic أدوات مبتكرة مثل Adaptive Thinking ومستويات الجهد المتفاوتة، مما يمنح المستخدمين المرونة في اختيار السرعة أو الدقة حسب متطلبات المهمة. يتوفر Claude Opus 4.6 عبر موقع claude.ai، وClaude API للمطورين، ومنصات سحابية كبرى للتكامل المؤسسي.
GPT-5.3-Codex: من مساعد برمجي إلى زميل عمل
تركز OpenAI في GPT-5.3-Codex على تحويل الذكاء الاصطناعي إلى “وكيل فعال” يمكنه تنفيذ سلسلة من الخطوات على الكمبيوتر، بدءًا من تشغيل المشاريع وتثبيت المكتبات، وصولًا إلى اختبار الأكواد وإصلاح الأخطاء وتحسين الأداء.
يتجلى تفوق النموذج في SWE-Bench Pro وTerminal-Bench 2.0 في قدرته على معالجة مشكلات برمجية حقيقية، بينما يشير أداؤه في OSWorld، الذي يقيس استخدام الكمبيوتر بصريًا، إلى اقترابه من تنفيذ مهام إنتاجية فعلية مشابهة لمهام المطورين والموظفين.
ساهم تحسين السرعة بنسبة 25% في جعل المهام الطويلة أسرع وأكثر تفاعلية، كما أن التحديثات اللحظية أثناء التنفيذ تجعل التجربة أقرب إلى التعاون مع زميل بشري. يتوفر GPT-5.3-Codex ضمن خطط ChatGPT المدفوعة، وعبر بيئات التطوير المتكاملة. تخطط OpenAI لتوسيع نطاق الوصول إليه عبر API.
Gemini 3 Deep Think: ذكاء علمي وهندسي متقدم
تتجه Google DeepMind في Gemini 3 Deep Think نحو تعزيز القدرات الاستدلالية العلمية والرياضية. النتائج المتميزة في اختبارات مثل ARC-AGI-2 وHumanity’s Last Exam، إضافة إلى تصنيفات Codeforces وأولمبياد الرياضيات، تشير إلى قدرة أكبر على التفكير الخوارزمي وحل المسائل غير النمطية.
يترجم هذا التطور إلى دعم قوي في مجالات البحث والهندسة، بما في ذلك تحليل البيانات المعقدة، وبناء النماذج الرياضية، وتفسير النتائج العلمية، وحتى تحويل الرسوم التخطيطية إلى نماذج ثلاثية الأبعاد قابلة للطباعة. يتوفر التحديث للمشتركين في Google AI Ultra عبر تطبيق Gemini، ويمكن للباحثين والمهندسين التقدم للحصول على وصول مبكر عبر Gemini API.
على الصعيد العملي، تعني هذه التطورات إمكانية إعداد تقارير وعروض احترافية في وقت أقل، وتحليل مستندات ضخمة دون فقدان التفاصيل، وتطوير التطبيقات أو إصلاح الأخطاء البرمجية بسرعة أكبر. كما ستوفر النماذج الجديدة دعمًا أعمق للمهام العلمية والهندسية المعقدة.
مع هذه القدرات المتزايدة، يظل الدور البشري في المراجعة والتوجيه ضروريًا، خصوصًا في القرارات الحساسة. أصبح الذكاء الاصطناعي أداة تنفيذية قوية، لكنه يظل محتاجًا إلى إشراف واعٍ. السؤال لم يعد “هل النموذج ذكي؟” بل “كيف يمكن توظيفه بذكاء في العمل اليومي؟”.
الاستفادة من هذه القفزة التكنولوجية ستحدد الفارق بين المستخدمين. والمفكرون يحذرون من خطر الاستبدال لمن لا يواكب هذا التطور، بعد إبراز باحثين بارزين لمخاطر محتملة إثر مغادرتهم شركات كبرى في قطاع الذكاء الاصطناعي.

