Готовы ли мы отпустить вожжи?

Михаил Малышев (mbmalyshev (a) yandex.ru) — Fri, 05 Jun 2026 17:00:00 +0300

В 2024-м таких строк были единицы процентов. За полтора года кривая прошла через два порядка, и если продлить её по инерции — а основания для инерции есть, — то горизонт, на котором Claude проектирует следующего Claude, уже измеряется не десятилетиями, а месяцами.

Anthropic Institute выпустил текст, в котором это сказано без привычной корпоративной дипломатии: рекурсивное самосовершенствование может наступить раньше, чем большинство институтов к нему готово. Не «может быть», не «теоретически» — может. И институты, то есть государства, регуляторы, советы директоров, мы с вами, — не готовы. Это не технический доклад, а политическое признание, упакованное в инженерный отчёт.

Источник: When AI builds itself, The Anthropic Institute, июнь 2026.

Цифры, которые нельзя игнорировать

Anthropic опубликовал конкретные данные. Без них разговор о рекурсивном улучшении остаётся философской спекуляцией. С ними — становится измеримой кривой, по которой можно строить прогноз.

В мае 2026 года более 80% кода, попадающего в репозиторий Anthropic, написан Claude. В 2024 году эта цифра была «в районе низких однозначных значений». За 18 месяцев произошёл скачок через два порядка. Инженер Anthropic во втором квартале 2026 года мерджит в 8 раз больше строк в день, чем в 2024-м. 130 сотрудников research-команд в мартовском опросе оценивают собственный прирост производительности с Claude Mythos Preview как 4-кратный.

Это внутренние данные. Они не проходят через маркетинговый фильтр, потому что публикуются с пометкой «внутреннее исследование». И именно поэтому к ним стоит относиться серьёзно — у Anthropic нет резона завышать, есть резона показывать сдержанность.

Внешние бенчмарки рисуют ту же траекторию. METR фиксирует, что длительность задач, с которыми ИИ справляется автономно, удваивается раз в четыре месяца, хотя раньше тренд был раз в семь, — то есть ускоряется само ускорение. SWE-bench прошёл путь от единиц процентов до насыщения за два года, CORE-Bench — от 20% воспроизведения результатов до насыщения за 15 месяцев. Claude Mythos Preview работает автономно не менее 16 часов, и это верхний предел того, что способны измерить текущие инструменты.

В апреле 2026 года Claude закрыл 800 багов, которые снизили класс ошибок API в тысячу раз. По оценке инженера, наблюдавшего за процессом, человеку потребовалось бы четыре года. Четыре года против двух часов — не недели, не дни, а часы.

Кривая, описанная этими точками, не плоская и не выходит на плато, и если в 2027-м ИИ действительно сможет выполнять задачи длиной в недели, как предполагает отчёт, то между «Claude решает задачу за 16 часов» и «Claude проектирует следующего Claude» дистанция — не десятилетия, а месяцы.

Анатомия передачи руля

Anthropic различает три уровня задач, и это разделение многое объясняет.

Первый уровень: задача полностью специфицирована. «Экспорт не работает, почини». Человек задаёт цель и метод. Claude исполняет. Здесь зазора между человеком и машиной уже нет.

Второй уровень: задача специфицирована по цели, но не по методу. «Разберись, почему сеть тормозит под нагрузкой». Человек задаёт цель, Claude выбирает подход. Здесь Claude уже сильнее человека в исполнении, но ещё уступает в выборе целей.

Третий уровень: задача не специфицирована вовсе. «Какую задачу следующей решать?» Тут пока доминирует человек, но разрыв сокращается быстро.

Рекурсивное самосовершенствование — это момент, когда Claude закроет третий уровень. Когда он сможет не только решить задачу, поставленную исследователем, но и самостоятельно решить, какую задачу решать. И в апрельском эксперименте Anthropic по weak-to-strong supervision это уже произошло в узком контуре. Два исследователя-человека за неделю восстановили 23% разрыва между сильной и слабой моделью, кластер агентов Claude за 800 часов — 97%, и при этом задачу ставил человек, метрики придумал человек, а всё остальное — гипотезы, эксперименты, итерации — агенты провели сами.

Это не рекурсивное самосовершенствование в чистом виде, а его предвестник.

Три ракурса проблемы

Давайте рассмотрим её с таких сторон: что в отчёте подтверждается данными, что остаётся риторикой, и где проходит граница между «мощным инструментом» и «автономным актором».

Скептик скажет: Anthropic торопится с продуктом, отчёт — это стратегический ход для обоснования следующего раунда инвестиций, и цифры поданы так, чтобы вызвать именно то чувство, которое они вызывают. Я бы согласился, если бы метрики выглядели как рекламный слоган, но 80% кода — это данные merge-statistics, которые можно проверить, и проверка их подтверждает, поэтому скептицизм тут уместен только как дисциплина, а не как возражение.

Оптимист скажет: мы изобрели более мощный инструмент, как изобретали калькулятор, компилятор, поисковую систему, и нужно просто адаптировать экономику. Этот нарратив привычен, но он упускает качественное отличие, потому что калькулятор не проектирует следующий калькулятор, компилятор не пишет новый компилятор, а ИИ — первая технология, которая способна участвовать в собственном развитии, и это другая онтологическая категория, а не улучшенная версия прежней.

Я бы добавил третий ракурс, который считаю более честным: мы смотрим на разворачивающийся процесс, в котором скорость изменений опережает скорость нашего понимания этих изменений, и это нормально для технологий, но ненормально для решений, которые эти технологии принимают, и нормальность здесь ложная, потому что за ней прячется вопрос, который мы обсуждать не привыкли.

Почему «не готовы» звучит громче, чем кажется

Anthropic Institute использует формулировку, которая в корпоративном языке читается как громкая. «Способы, которыми мы обеспечиваем безопасность систем, мониторим их и формируем их поведение, становятся гораздо более важными». Перевод: если раньше у нас был зазор времени между развертыванием системы и моментом, когда она становится критически важной, то теперь этот зазор сжимается быстрее, чем мы успеваем выстраивать регулирование.

Регулирование ИИ в 2026 году — это GDPR 2018 года, написанный для калькуляторов. Длинные горизонты планирования, согласования, аудита. Юридическая рамка, заточенная под софт, который после релиза меняется раз в год. ИИ, который меняет себя раз в неделю (а скоро будет чаще), в эту рамку не помещается.

В этом и состоит философский нерв документа. Не в технологии, а в политике. Способны ли мы, как общество, принять решения об автономной системе, которая изменяет себя быстрее, чем заседает парламент? Способны ли регуляторы, обученные на аудитах годовых отчётов, проверять систему, которая за время проверки успевает трижды переписать себя? Способны ли советы директоров, привыкшие к квартальной отчётности, управлять активами, которые за квартал проходят десять итераций самомодификации?

Ответ в отчёте зашифрован в формулировке «многие институты не готовы» — не «некоторые», не «отдельные», а многие, и это заявление от компании, которая сама является частью этого процесса.

Что остаётся за кадром

Anthropic Institute аккуратно обходит несколько тем, и я хочу проговорить их вслух, потому что они важнее того, что в отчёт попало.

Первое: «лучше людей в течение года» по качеству кода — это утверждение, которое верифицируется внутри Anthropic, но внешние компании, не имеющие доступа к Claude Mythos Preview, работают с другими моделями и получают другие результаты, так что зазор в один год — это зазор для тех, кто на передовой, а для остальных он может оказаться тремя или пятью, хотя тренд общий.

Второе: 80% кода в репозитории — это не 80% мышления, потому что человек по-прежнему ставит задачи, выбирает архитектуру и ревьюит код автоматическим ревьюером на Claude, и это уже другая форма работы — не «пишу код», а «управляю написанием кода», и профессия инженера не исчезает, а трансформируется, хотя как именно — пока не описано ни в одном профессиональном стандарте.

Третье: в эксперименте с weak-to-strong supervision агенты сделали 97% работы, но задачу и метрики поставили люди, и узкое место — не исполнение, а выбор того, что исполнять, и именно здесь пролегает водораздел между «мощный инструмент» и «автономный актор»: пока человек задаёт задачу, система остаётся инструментом, но когда система начинает задавать себе задачи — это уже другое.

Anthropic сама пишет, что «большие разрывы в производительности сохраняются, когда Claude проявляет суждение в выборе целей», и это честная формулировка, потому что разрыв действительно сохраняется, но уменьшается заметно быстрее, чем год назад.

Отпустить вожжи — это не про технологии

И всё-таки без ответа остаётся вопрос, что вообще значит «быть готовым». Не «понимать, как работает» — с этим всё в порядке, есть инженеры, которые понимают. Не «иметь регламенты» — с этим хуже, но хотя бы понятно направление работы. «Быть готовым», насколько я могу судить, означает принять на себя ответственность за решения, последствия которых мы не можем полностью проследить, и это политическая зрелость, а не инженерная.

Пока что мы делаем вид, что можем проследить все последствия, выстраиваем регулирование в расчёте на то, что система, которую мы сертифицируем сегодня, будет той же системой через полгода, и планируем пятилетние стратегии для технологий, чей цикл удвоения — четыре месяца.

Anthropic Institute не предлагает решений, и я подозреваю, что не предложит: компания, которая строит эту машину, не может одновременно быть арбитром того, готово ли общество её принять. Диагноз, который они всё-таки ставят, звучит так: времени на размышление у нас меньше, чем расстояние до следующей точки перегиба, и каждая решённая задача автономным агентом это время сокращает.

И всё-таки без ответа остаётся вопрос, древний, как Дедал: стоит ли строить крылья, когда не знаешь, кто полетит следом. Дедал построил, Икар полетел и упал не потому, что крылья были плохими, а потому что тот, кто отпустил вожжи, не был готов к тому, что произойдёт после.

Мы строим крылья, и они работают, и вопрос, на который у меня нет ответа, формулируется так: кто будет держать вожжи, когда крылья начнут строить себя сами.