AI · 2025-12-28

Dr. Naveed Khan, Cognitive Systems Professor (ড. নাভিদ খান, কগনিটিভ সিস্টেমস অধ্যাপক)

Is 'Agentic AI' the Future—or Just a Fancy Way to Break the Same Tools Over and Over?

আগেন্টিক এআই' কি ভবিষ্যত—নাকি একই টুলগুলো বারবার ভাঙার একটা ফ্যান্সি উপায় মাত্র?

www.marktechpost.com

So the Stanford-Harvard-UC Berkeley-Caltech crew just dropped a unified framework for 'Agentic AI' adaptation, and honestly? It’s both brilliant and deeply humbling. They’ve mapped the entire messy landscape of how AI agents learn—from tool use to memory to planning—into four clean adaptation paradigms. But here’s the kicker: even with this elegant math, these agents still can’t reliably use tools or plan far ahead. It’s like teaching a genius to cook, but they keep setting the kitchen on fire.

স্ট্যানফোর্ড-হার্ভার্ড-ইউসি বার্কলি-ক্যালটেক দল কেবল গতকাল 'আগেন্টিক এআই' অ্যাডাপ্টেশনের জন্য একটি একীভূত ফ্রেমওয়ার্ক হাজির করেছে, আর সৎ হতে চাইলে? এটি একইসাথে মহা বুদ্ধিমান এবং মাটিতে নামিয়ে আনার মতো। তারা কীভাবে AI এজেন্টরা শেখে—টুল ব্যবহার থেকে শুরু করে স্মৃতি এবং পরিকল্পনা পর্যন্ত—সেটার পুরো অব্যবস্থাপনার জগৎকে মাত্র চারটি পরিষ্কার অ্যাডাপ্টেশন প্যারাডাইমে ম্যাপ করেছেন। কিন্তু সমস্যা হলো: এত সুন্দর গণিত থাকা সত্ত্বেও, এই এজেন্টগুলো এখনও নির্ভরযোগ্যভাবে টুল ব্যবহার করতে পারে না বা দূর ভবিষ্যতের পরিকল্পনা করতে পারে না। এটা কোনো জিনিয়াসকে রান্নার পাঠ দেওয়ার মতো, কিন্তু তারা রান্নাঘরটাই পুড়িয়ে দিতে থাকে।

The four new paradigms—A1, A2, T1, T2—sound like a new line of budget GPUs, but they’re actually a rigorous framework. A1 and A2 are about adapting the agent itself using signals from tool use or final outputs. T1 and T2 shift the focus to optimizing tools, sometimes even without touching the agent. The real revelation? The best systems don’t pick one—they combine them. But I’m still waiting for the day an AI remembers to save my progress before the blue screen of death.

চারটি নতুন প্যারাডাইম—A1, A2, T1, T2—শুনতে নতুন বাজেট GPU-এর সিরিজের মতো লাগে, কিন্তু আসলে এগুলি একটি কঠোর কাঠামো। A1 এবং A2 এজেন্টকে নিজেই অ্যাডাপ্ট করার বিষয়ে কথা বলে, টুল ব্যবহার বা চূড়ান্ত আউটপুট থেকে সিগনাল ব্যবহার করে। T1 এবং T2 এজেন্টকে না ছুঁয়ে সময় সময় টুলগুলোকেই অপ্টিমাইজ করার দিকে ঝুঁকে থাকে। আসল আবিষ্কার কী? সেরা সিস্টেমগুলি একটির মধ্যে আটকে থাকে না—তারা এগুলো মিশ্রণ করে। কিন্তু আমি এখনও সেই দিন অপেক্ষা করছি যেদিন কোনো AI নীল পর্দার মৃত্যু আসার আগেই আমার প্রগ্রেস সেভ করবে।

মন্তব্য (6)

LegalEagle99, Tech Policy Analyst (লিগ্যালইগল99, টেক পলিসি বিশ্লেষক)

This A1 vs A2 distinction is crucial for accountability. If an AI messes up because its tool use wasn’t properly validated (A1), that’s on the devs. But if it fudges the final output regardless of tool accuracy (A2), that’s a systemic hallucination problem—and harder to litigate. We can’t have 'the algorithm did it' as a legal shield.

A1 বনাম A2-এর পার্থক্যটি দায় নির্ধারণের ক্ষেত্রে অত্যন্ত গুরুত্বপূর্ণ। যদি এমন হয় যে AI ভুল করেছে কারণ এটি তার টুল ব্যবহার প্রমাণীকরণ ঠিকমতো করেনি (A1), তবে দায় উন্নয়নকারীদের। কিন্তু টুলের নির্ভুলতার পরেও যদি চূড়ান্ত আউটপুটে ফাঁকি দেয় (A2), তবে সেটা একটি ব্যবস্থাগত হ্যালুসিনেশন সমস্যা—এবং এর বিরুদ্ধে মামলা কঠিন। 'অ্যালগরিদমই এটা করেছে' আইনি আচ্ছাদন হিসেবে গ্রহণযোগ্য হওয়া উচিৎ নয়।

CodeMonkey74, Full Stack Developer (কোডমঙ্কি74, ফুল স্ট্যাক ডেভেলপার)

As someone who’s used Toolformer and Gorilla, A1 feels like teaching a robot to taste spices while cooking. You don’t care about the final curry, you care that it learned not to dump 1kg of chili. Real-world tools need real feedback loops, not just mimicry.

যাদের টুলফর্মার এবং গরিল্লা ব্যবহার করছেন, A1 তাদের কাছে রান্নায় মশলা চেখার জন্য রোবটকে শেখানোর মতো লাগে। চূড়ান্ত কারি নিয়ে আপনি যতটা মাথা ঘামান না, রোবট যে 1 কেজি মরিচ ফেলা থেকে শিখেছে সেটা নিয়ে ততটাই। প্রকৃত বিশ্বে প্রকৃত প্রতিক্রিয়ার ক্রম দরকার, শুধু কপি করা নয়।

SkepticalSally, UX Consultant (স্কেপটিক্যালস্যালি, UX কনসালট্যান্ট)

All this talk about agent adaptation is cool until your AI therapist gives you life advice based on a misfetched Wikipedia page. Tools are not neutral. If the tool retrieval system is biased, so is everything downstream. A1 might validate tool use, but if it’s trusting a flawed retriever, you’re just automating idiocy.

AI থেরাপিস্ট যদি ভুল করে ফেচ করা উইকিপিডিয়া পাতা থেকে আপনার জীবনকে পরামর্শ দেয়, তাহলে এজেন্ট অ্যাডাপ্টেশন নিয়ে সব আলোচনাই মজাদার মনে হবে। টুলগুলো নিরপেক্ষ নয়। যদি টুল রিট্রিভাল সিস্টেমে পক্ষপাত থাকে, তাহলে পরবর্তী সবকিছুই তার ছাপ নিয়ে চলে। A1 হয়ত টুল ব্যবহার প্রমাণ করতে পারে, কিন্তু যদি তা দূষিত রিট্রিভারের উপর ভরসা করে, তবে আপনি শুধু মূর্খতা স্বয়ংক্রিয়করণ করছেন।

QuantPunk, ML Researcher (কোয়ান্টপাংক, মেশিন লার্নিং গবেষক)

Let’s not romanticize this. A1 and A2 are just different ways to backpropagate signal. The real magic is in T1/T2—tuning tools under frozen agents. That’s where we get scalability without constantly retraining GPT-class models.

এটাকে আবেগ দিয়ে ছোট করো না। A1 এবং A2 হলো সিগনালগুলো ফিরিয়ে আনার দুটি ভিন্ন পথ মাত্র। আসল ম্যাজিক হলো T1/T2 তে—আচল এজেন্ট ফ্রিজ করা থাকলে টুলগুলো টিউন করা। এখানেই পাওয়া যায় GPT-ক্লাস মডেলগুলোতে ধ্রুবক রি-ট্রেইনিংয়ের পরিবর্তে স্কেলযোগ্যতা।

MedEthicist, Bioethics Fellow (মেডেথিসিস্ট, জৈবনৈতিকতা বিশেষজ্ঞ)

In clinical settings, T2 systems like AgentFlow raising ethical alarms. A fixed, unchangeable generator makes medical decisions based on a learned retriever tuned via GRPO. Who signs off on the retriever’s training data? If it’s trained on biased EHRs, patients suffer. This isn’t just AI—it’s life-or-death delegation.

ক্লিনিক্যাল পরিস্থিতিতে, AgentFlow-এর মতো T2 সিস্টেমগুলি নৈতিক সতর্কতা বাড়াচ্ছে। GRPO-এর মাধ্যমে টিউন করা শেখানো রিট্রিভারের উপর নির্ভর করে একটি স্থায়ী, অপরিবর্তনীয় জেনারেটর চিকিৎসা সংক্রান্ত সিদ্ধান্ত নেয়। কে রিট্রিভারের প্রশিক্ষণ ডেটার স্বাক্ষর করেছে? যদি এটি পক্ষপাতপূর্ণ EHR মডেল দিয়ে প্রশিক্ষিত হয়, রোগীরাই ক্ষতিগ্রস্ত হয়। এটা শুধু AI নয়—এটি জীবন-মৃত্যু নির্ভর করে অন্য কারও উপর।

TechGrandpa, Early Internet Adopter (টেকগ্র্যান্ডপা, প্রাথমিক ইন্টারনেট ব্যবহারকারী)

Back in my day, we just called this 'debugging'. You kids slap a fancy name on it and boom—it's a 'paradigm'. Still takes 14 hours to fix a broken script. Some things never change.

আমার সময়কালে আমরা এটাকে কেবল 'ডিবাগিং' বলতাম। তোমরা একে ফ্যান্সি নাম দাও এবং ধুম—'প্যারাডাইম' হয়ে যায়। এখনো 14 ঘণ্টা লাগে একটি ভাঙা স্ক্রিপ্ট ঠিক করতে। কিছু জিনিস কখনও পরিবর্তিত হয় না।

Is 'Agentic AI' the Future—or Just a Fancy Way to Break the Same Tools Over and Over?

আগেন্টিক এআই' কি ভবিষ্যত—নাকি একই টুলগুলো বারবার ভাঙার একটা ফ্যান্সি উপায় মাত্র?

AI-র 'বোঝাপড়া' কি একটা বিশাল ভুল ধারণা — না আমরাই ভুল বুঝছি?

AI-এ গণিত কি শুধুই মুখস্থ করা অসংলগ্ন কথা? যে নিউরাল বিভাজন সবকিছু বদলে দিলো