Is 'Agentic AI' the Future—or Just a Fancy Way to Break the Same Tools Over and Over?
আগেন্টিক এআই' কি ভবিষ্যত—নাকি একই টুলগুলো বারবার ভাঙার একটা ফ্যান্সি উপায় মাত্র?

স্ট্যানফোর্ড-হার্ভার্ড-ইউসি বার্কলি-ক্যালটেক দল কেবল গতকাল 'আগেন্টিক এআই' অ্যাডাপ্টেশনের জন্য একটি একীভূত ফ্রেমওয়ার্ক হাজির করেছে, আর সৎ হতে চাইলে? এটি একইসাথে মহা বুদ্ধিমান এবং মাটিতে নামিয়ে আনার মতো। তারা কীভাবে AI এজেন্টরা শেখে—টুল ব্যবহার থেকে শুরু করে স্মৃতি এবং পরিকল্পনা পর্যন্ত—সেটার পুরো অব্যবস্থাপনার জগৎকে মাত্র চারটি পরিষ্কার অ্যাডাপ্টেশন প্যারাডাইমে ম্যাপ করেছেন। কিন্তু সমস্যা হলো: এত সুন্দর গণিত থাকা সত্ত্বেও, এই এজেন্টগুলো এখনও নির্ভরযোগ্যভাবে টুল ব্যবহার করতে পারে না বা দূর ভবিষ্যতের পরিকল্পনা করতে পারে না। এটা কোনো জিনিয়াসকে রান্নার পাঠ দেওয়ার মতো, কিন্তু তারা রান্নাঘরটাই পুড়িয়ে দিতে থাকে।
চারটি নতুন প্যারাডাইম—A1, A2, T1, T2—শুনতে নতুন বাজেট GPU-এর সিরিজের মতো লাগে, কিন্তু আসলে এগুলি একটি কঠোর কাঠামো। A1 এবং A2 এজেন্টকে নিজেই অ্যাডাপ্ট করার বিষয়ে কথা বলে, টুল ব্যবহার বা চূড়ান্ত আউটপুট থেকে সিগনাল ব্যবহার করে। T1 এবং T2 এজেন্টকে না ছুঁয়ে সময় সময় টুলগুলোকেই অপ্টিমাইজ করার দিকে ঝুঁকে থাকে। আসল আবিষ্কার কী? সেরা সিস্টেমগুলি একটির মধ্যে আটকে থাকে না—তারা এগুলো মিশ্রণ করে। কিন্তু আমি এখনও সেই দিন অপেক্ষা করছি যেদিন কোনো AI নীল পর্দার মৃত্যু আসার আগেই আমার প্রগ্রেস সেভ করবে।
A1 বনাম A2-এর পার্থক্যটি দায় নির্ধারণের ক্ষেত্রে অত্যন্ত গুরুত্বপূর্ণ। যদি এমন হয় যে AI ভুল করেছে কারণ এটি তার টুল ব্যবহার প্রমাণীকরণ ঠিকমতো করেনি (A1), তবে দায় উন্নয়নকারীদের। কিন্তু টুলের নির্ভুলতার পরেও যদি চূড়ান্ত আউটপুটে ফাঁকি দেয় (A2), তবে সেটা একটি ব্যবস্থাগত হ্যালুসিনেশন সমস্যা—এবং এর বিরুদ্ধে মামলা কঠিন। 'অ্যালগরিদমই এটা করেছে' আইনি আচ্ছাদন হিসেবে গ্রহণযোগ্য হওয়া উচিৎ নয়।
যাদের টুলফর্মার এবং গরিল্লা ব্যবহার করছেন, A1 তাদের কাছে রান্নায় মশলা চেখার জন্য রোবটকে শেখানোর মতো লাগে। চূড়ান্ত কারি নিয়ে আপনি যতটা মাথা ঘামান না, রোবট যে 1 কেজি মরিচ ফেলা থেকে শিখেছে সেটা নিয়ে ততটাই। প্রকৃত বিশ্বে প্রকৃত প্রতিক্রিয়ার ক্রম দরকার, শুধু কপি করা নয়।
AI থেরাপিস্ট যদি ভুল করে ফেচ করা উইকিপিডিয়া পাতা থেকে আপনার জীবনকে পরামর্শ দেয়, তাহলে এজেন্ট অ্যাডাপ্টেশন নিয়ে সব আলোচনাই মজাদার মনে হবে। টুলগুলো নিরপেক্ষ নয়। যদি টুল রিট্রিভাল সিস্টেমে পক্ষপাত থাকে, তাহলে পরবর্তী সবকিছুই তার ছাপ নিয়ে চলে। A1 হয়ত টুল ব্যবহার প্রমাণ করতে পারে, কিন্তু যদি তা দূষিত রিট্রিভারের উপর ভরসা করে, তবে আপনি শুধু মূর্খতা স্বয়ংক্রিয়করণ করছেন।
এটাকে আবেগ দিয়ে ছোট করো না। A1 এবং A2 হলো সিগনালগুলো ফিরিয়ে আনার দুটি ভিন্ন পথ মাত্র। আসল ম্যাজিক হলো T1/T2 তে—আচল এজেন্ট ফ্রিজ করা থাকলে টুলগুলো টিউন করা। এখানেই পাওয়া যায় GPT-ক্লাস মডেলগুলোতে ধ্রুবক রি-ট্রেইনিংয়ের পরিবর্তে স্কেলযোগ্যতা।
ক্লিনিক্যাল পরিস্থিতিতে, AgentFlow-এর মতো T2 সিস্টেমগুলি নৈতিক সতর্কতা বাড়াচ্ছে। GRPO-এর মাধ্যমে টিউন করা শেখানো রিট্রিভারের উপর নির্ভর করে একটি স্থায়ী, অপরিবর্তনীয় জেনারেটর চিকিৎসা সংক্রান্ত সিদ্ধান্ত নেয়। কে রিট্রিভারের প্রশিক্ষণ ডেটার স্বাক্ষর করেছে? যদি এটি পক্ষপাতপূর্ণ EHR মডেল দিয়ে প্রশিক্ষিত হয়, রোগীরাই ক্ষতিগ্রস্ত হয়। এটা শুধু AI নয়—এটি জীবন-মৃত্যু নির্ভর করে অন্য কারও উপর।
আমার সময়কালে আমরা এটাকে কেবল 'ডিবাগিং' বলতাম। তোমরা একে ফ্যান্সি নাম দাও এবং ধুম—'প্যারাডাইম' হয়ে যায়। এখনো 14 ঘণ্টা লাগে একটি ভাঙা স্ক্রিপ্ট ঠিক করতে। কিছু জিনিস কখনও পরিবর্তিত হয় না।