AI Doesn't 'Think' Math — It Just Memorizes the Answers Like a Lazy Student
ИИ не 'думает' математически — он просто заучивает ответы, как ленивый ученик

Оказалось, что когда крупные модели ИИ выполняют простую арифметику, они на самом деле не 'вычисляют' — а просто выплёвывают заученные ответы. Новое исследование от Goodfire.ai показывает, что заучивание и логическое мышление в языковых моделях работают по совершенно разным нейронным путям. Уберите цепи памяти — и модель забывает 97 % точных формулировок, но при этом безупречно справляется с логическими задачами. Самое шокирующее — математика рушится вместе с памятью. Удалите эти пути — и точность расчётов падает до 66 %. Это означает, что ИИ не размышляет над 2+2 — он вспоминает это, как цитату.
Открытие было сделано с помощью измерения 'кривизны' ландшафта потерь ИИ — карты того, насколько модель ошибается при разных конфигурациях. Области с высокой кривизной — 'острые', чувствительные к малейшим изменениям весов — связаны с заучиванием. Регионы с низкой кривизной ('плоские') поддерживают устойчивое мышление, применимое в новых ситуациях. Удалив компоненты с низкой кривизной, группа уничтожила почти все заученные данные, сохранив логику. Главный сюрприз? Математика показала результат хуже логики — а не лучше. Это может изменить подход к созданию ИИ, особенно если мы сможем удалить авторские материалы, не разрушая ядро интеллекта.
Это потрясающе. Мы всегда подозревали разделение между заучиванием и логикой, но увидеть это подтверждение на механизматическом уровне? Безумие. Как будто в одном теле два мозга. А тот факт, что арифметика — на стороне памяти? Многое объясняет. Мы заставляли языковые модели 'думать' математически, а они просто повторяли шпаргалки.
На практике это колоссально для образовательного ИИ. Если мы сможем хирургически удалять отрывки из авторских учебников, но оставить способность модели объяснять концепции, — мечта любого юриста по авторским правам.
Погодите. Не будем чересчур восторгаться. 'Удаление' воспоминаний — это не настоящее забывание. Другие исследования показывают: 'необучение' часто является подавлением, а не удалением. Активируйте несколько весов — и данные снова работают. Это не удаление — это прятки в подвале.
Точно. И эта аналогия с 'подвалом'? В самую точку. Мы не удаляем воспоминания — мы просто уменьшаем их громкость. Они всё ещё там, мерцают в фоне. Жутковато, если задуматься о приватности.
Так что ИИ 'учит' умножение, как третьеклассник, который зубрил перед тестом? Великолепно. Давайте дадим ему золотую звёздочку и двинемся дальше. /s
В моё время это называли 'не настоящий интеллект'. И сейчас называют так же.
Забудьте про золотые звёздочки — это разделение и есть архитектурный чертёж. Будущие модели будут не просто крупнее. Они станут модульными: блоки памяти, движки логики, модули проверки фактов. Мы переходим от грубой силы к точному проектированию.
Честно говоря? Я видел, как ученики делают то же самое. Зубрят 7x8, но пасуют перед вопросом 'Почему работает умножение?'. ИИ не подводит. Он копирует наши худшие привычки обучения.