Is This the Blueprint for Smarter AI Agents? How New Research Could Solve AI’s Biggest Flaws
هل هذا هو المخطط لتطوير وكلاء ذكاء اصطناعي أكثر ذكاءً؟ كيف يمكن للبحث الجديد معالجة أبرز عيوب الذكاء الاصطناعي

إن ورقة بحثية رائدة من ستانفورد وهارفارد وبركلي لا تكتفي بإجراء تعديلات طفيفة على الذكاء الاصطناعي، بل تعيد تعريف طريقة تكيّف أنظمة الوكلاء. بدلًا من معاملة المساعدين الذكيين كـ'صناديق سوداء'، تجزئهم إلى وحدات تخطيط واستخدام الأدوات والذاكرة، وتقترح إطارًا موحدًا للتكيّف لإصلاح أبرز عيوبهم: استخدام الأدوات غير الموثوق والتخطيط الضعيف على المدى الطويل.
اللؤلؤة الحقيقية؟ مصفوفة 2×2 من أربع بارادايمات للتكيّف، تتراوح بين تحسين الأدوات دون لمس الذكاء الاصطناعي، وضبط الذكاء الاصطناعي بناءً على مدى استخدامه السليم للأدوات. هذا يمنح الباحثين أخيرًا لغة مشتركة لمناقشة ما ينجح وما لا ينجح. والآن السؤال الملّح: هل ستعتمد شركات التكنولوجيا الكبرى هذه المنهجية أم تدفنها تحت طبقات من الأسرار الخاصة؟
إن هذا الإطار يمثل هبة من السماء. أخيرًا، لم نعد نغرق في أوراق بحثية أُعدت على عجل عن وكلاء الذكاء الاصطناعي تزعم الابتكار لكنها لا تنسجم مع تصنيف مشترك. إن التصنيف إلى A1/A2/T1/T2 أنيق ويُجبرنا على الدقة في التفكير. لو أن كل مختبر استخدم هذه المنهجية، لكانت التحاليل الميتا أسهل كثيرًا بمراحل.
أهتم أقل بالتصنيف وأكثر بتحقيق النظام القدرة الحقيقية على تقليل 'التخمينات' عند كتابة الكود أو استرجاع قواعد البيانات. يبدو أن تكيّف T2 مع نموذج لغوي ثابت هو النقطة المثالية للشركات الناشئة—تعلم الأدوات بتكاليف منخفضة، ولا تلمس النموذج الأساسي.
رائع، إطار آخر لجعل الذكاء الاصطناعي أفضل في تنفيذ المهام. لكن من يتحقق من مخرجات الأدوات المستخدمة في التعلم A1؟ إذا كنا نُدرّب الوكلاء على نتائج استرجاع معيبة أو منحازة، فنحن لا نصلح الذكاء الاصطناعي—نحن نُحوّله إلى سلاح.
أنظمة مثل s3 وAgentFlow تدرّب مُسترجِعًا أو مُخطِّطًا بـ 7 مليار معلمة تحت إشراف نموذج مُولّد ثابت—بالضبط كما وصفه مهندس ديف أوبيس. الأمر لا يقتصر على التكلفة المنخفضة، بل يتميز بالثبات. يمكنك ترقية الأدوات بشكل مستقل دون المساس بالتوافق.
يذكرني هذا بالثمانينات عندما انتقلنا من الحواسيب المركزية الوحدوية إلى أنظمة العميل-الخادم المعيارية. الذكاء الاصطناعي الوكيل اليوم عند نفس هذه النقطة الحاسمة. إن بارادايمات T1/T2 هي 'المنطق من جانب العميل' في عصر الذكاء الاصطناعي.
إذًا عالجنا أخيرًا مشكلة تخطيط الذكاء الاصطناعي على المدى الطويل بإضافة طبقات أكثر من التجريد؟ رائع. على هذا المعدل، سيحتاج الذكاء الاصطناعي قريبًا إلى ذكاء اصطناعي آخر ليخطط لكيفية استخدام الذكاء الاصطناعي المُخطِّط.
الانتصار الحقيقي هو الأدوات من نوع T1 التي يمكن لأي شخص دمجها مع أي وكيل. إذا حصلنا على نماذج استرجاع مفتوحة المصدر وعالية الجودة ومدرّبة على بيانات متنوعة، يمكننا أخيرًا كسر الاعتماد على الأنظمة المملوكة.