Is Agentic AI About to Break Through—or Just Reinvent the Wheel?
Неужели агентный ИИ сейчас прорвётся — или опять просто изобретает велосипед?

Давайте без хайпа: агенты ИИ у нас были годами. Но новая фреймворк-модель от Стэнфорда, Гарварда и Беркли? Впервые даёт чёткую карту, как их адаптировать. Четыре чётких парадигмы — А1, А2, Т1, Т2 — в зависимости от того, кто учится (агент или инструмент) и от чего (результат инструмента или итоговый ответ). Это не магия, но настоящий клад.
Самое интересное? Они рассматривают память как инструмент Т2 — то есть учат поисковик под пристальным взглядом замороженного, безупречного агента. Не нужно переучивать GPT-5, если модуль поиска учится сам. Это не просто умно — это масштабируемо. Уже ли мы переходим от хрупких, ненадёжных агентов к устойчивым системам?
А1-обучение на основе обратной связи от инструментов — гениальное решение, но только если инструменты надёжны. На входе мусор — на выходе обучение мусору. Пробовал DeepRetrieval: на бумаге отлично, а в жизни — лажает, когда API начинают лимитить. Реальная неразбериха рушит сигнал награды.
Подход Т2 с «замороженным агентом» скрывает дисбаланс сил. Кто решает, что считается «правильным» итоговым ответом? Если закрытый агент от BigCorp оценивает инструмент, мы передаём контроль над согласованностью непрозрачным чёрным ящикам. Это не адаптация — это ассимиляция.
Вот именно. В Т2 предполагается добросовестный надзор — но чьи ценности в основе? В статье это обходит стороной, но на практике «замороженный агент» может превратить предвзятость в незыблемую истину.
Ладно, а теперь представьте: вы обучаете внутренний поиск по документации по Т1. У него 90% полноты. А потом просто подключаете к 10 разным агентам — переобучать не надо. Вот это мечта. Команды эксплуатации обожают предсказуемые и независимые обновления.
Я собрал домашнего агента, который планирует мой продуктовый шопинг и заказывает через API. Использовал ReAct и тонкую настройку. Он до сих пор покупает огурцы, когда я говорю «перцы». Но эй, вспомнил день рождения мамы! Развитие, а не совершенство.
Для нас комбинация А1 и Т1 — это священный грааль. Один раз обучили ядро на хороших данных инструментов (А1), а потом позволяете инструментам Т1 развиваться самостоятельно в среде каждого клиента. Масштабируемость плюс персонализация. Выигрыш-выигрыш.
Мы называли это «модульным ИИ» ещё в 2018. Математика выглядит круто, но по сути — старые идеи в новой обложке из LaTeX. Покажите мне реальные тесты на задачах с долгим горизонтом, а не ещё одну классификацию.
Справедливая точка зрения, но это не просто классификация. Это проверяемая модель. Теперь можно формально сравнивать извлекатель, обученный по Т2, и агента, обученного по А1 — на одной и той же математике. Это влияние на уровне инфраструктуры.