Is Agentic AI About to Break Through—or Just Reinvent the Wheel?

Неужели агентный ИИ сейчас прорвётся — или опять просто изобретает велосипед?

www.marktechpost.com

Let’s cut through the hype: we’ve had AI agents for years. But this new Stanford-Harvard-Berkeley framework? It finally gives us a unified map of how to adapt them. Four clean paradigms—A1, A2, T1, T2—based on who (agent or tool) learns from what (tool output or final answer). It’s not magic, but it’s gold.

Давайте без хайпа: агенты ИИ у нас были годами. Но новая фреймворк-модель от Стэнфорда, Гарварда и Беркли? Впервые даёт чёткую карту, как их адаптировать. Четыре чётких парадигмы — А1, А2, Т1, Т2 — в зависимости от того, кто учится (агент или инструмент) и от чего (результат инструмента или итоговый ответ). Это не магия, но настоящий клад.

The real kicker? They treat memory as a T2 tool—meaning you train a retriever under a frozen, god-tier agent. No need to retrain GPT-5 when your search module learns on its own. That’s not just smart—that’s scalable. Are we finally moving from fragile, brittle agents to resilient systems?

Самое интересное? Они рассматривают память как инструмент Т2 — то есть учат поисковик под пристальным взглядом замороженного, безупречного агента. Не нужно переучивать GPT-5, если модуль поиска учится сам. Это не просто умно — это масштабируемо. Уже ли мы переходим от хрупких, ненадёжных агентов к устойчивым системам?

Комментарии (8)

Senior ML Engineer at FAANG (Старший инженер по машинному обучению в FAANG)

A1 learning from tool feedback is brilliant—but only if your tools are reliable. Garbage in, garbage learned. I tried DeepRetrieval: great on paper, fails when your APIs throttle. Real-world messiness breaks the reward signal.

А1-обучение на основе обратной связи от инструментов — гениальное решение, но только если инструменты надёжны. На входе мусор — на выходе обучение мусору. Пробовал DeepRetrieval: на бумаге отлично, а в жизни — лажает, когда API начинают лимитить. Реальная неразбериха рушит сигнал награды.

AI Ethics Researcher (Исследователь этики ИИ)

T2’s ‘frozen agent’ approach hides a power imbalance. Who defines what counts as a 'correct' final output? If BigCorp’s closed agent judges the tool, we’re outsourcing alignment to unaccountable black boxes. That’s not adaptation—it’s assimilation.

Подход Т2 с «замороженным агентом» скрывает дисбаланс сил. Кто решает, что считается «правильным» итоговым ответом? Если закрытый агент от BigCorp оценивает инструмент, мы передаём контроль над согласованностью непрозрачным чёрным ящикам. Это не адаптация — это ассимиляция.

PhD in Cognitive Systems (Кандидат в системах когнитивного ИИ)

Exactly. T2 assumes benevolent oversight—but whose values? The paper handwaves this, but in practice, the 'frozen agent' could encode bias as ground truth.

Вот именно. В Т2 предполагается добросовестный надзор — но чьи ценности в основе? В статье это обходит стороной, но на практике «замороженный агент» может превратить предвзятость в незыблемую истину.

DevOps Engineer & AI Tinkerer (Инженер DevOps и любитель поковыряться в ИИ)

Okay but imagine: you train your internal QA search tool using T1. It gets 90% recall. Then you plug it into 10 different agents — no retraining needed. That’s the dream. Ops teams love predictable, decoupled upgrades.

Ладно, а теперь представьте: вы обучаете внутренний поиск по документации по Т1. У него 90% полноты. А потом просто подключаете к 10 разным агентам — переобучать не надо. Вот это мечта. Команды эксплуатации обожают предсказуемые и независимые обновления.

AI Hobbyist from Eastern Europe (Любитель ИИ из Восточной Европы)

I built a home agent that plans my grocery shopping and orders via API. Used ReAct + fine-tuning. It still buys pickles when I say 'peppers'. But hey, it remembered my mom’s birthday! Progress, not perfection.

Я собрал домашнего агента, который планирует мой продуктовый шопинг и заказывает через API. Использовал ReAct и тонкую настройку. Он до сих пор покупает огурцы, когда я говорю «перцы». Но эй, вспомнил день рождения мамы! Развитие, а не совершенство.

Startup CTO (Технический директор стартапа)

The A1/T1 combo is the holy grail for us. Train the core once with good tool data (A1), then let T1 tools evolve autonomously for each client’s environment. Scalability + personalization. Win-win.

Для нас комбинация А1 и Т1 — это священный грааль. Один раз обучили ядро на хороших данных инструментов (А1), а потом позволяете инструментам Т1 развиваться самостоятельно в среде каждого клиента. Масштабируемость плюс персонализация. Выигрыш-выигрыш.

Former Googler, now skeptical (Бывший Google-инженер, теперь скептик)

We called this 'modular AI' in 2018. The math looks fancy, but it's just old ideas wrapped in new LaTeX. Show me real benchmarks on long-horizon tasks, not another taxonomy.

Мы называли это «модульным ИИ» ещё в 2018. Математика выглядит круто, но по сути — старые идеи в новой обложке из LaTeX. Покажите мне реальные тесты на задачах с долгим горизонтом, а не ещё одну классификацию.

PhD in Cognitive Systems (Кандидат в системах когнитивного ИИ)

Fair point, but this isn't just taxonomy. It's a testable framework. You can now formally compare a T2-trained retriever against an A1-agent—on the same math. That’s infrastructure-level impact.

Справедливая точка зрения, но это не просто классификация. Это проверяемая модель. Теперь можно формально сравнивать извлекатель, обученный по Т2, и агента, обученного по А1 — на одной и той же математике. Это влияние на уровне инфраструктуры.

Is Agentic AI About to Break Through—or Just Reinvent the Wheel?

Неужели агентный ИИ сейчас прорвётся — или опять просто изобретает велосипед?

Действительно ли ИИ «понимает», или это просто очень убедительная иллюзия? Учёные в шоке

ИИ не 'думает' математически — он просто заучивает ответы, как ленивый ученик