Готовы ли мы отпустить вожжи?
80% кода в репозитории Anthropic написано Claude. Инженер мерджит в 8 раз больше строк в день. Цикл удвоения задач сжался с 7 до 4 месяцев. Агенты закрыли 97% разрыва там, где люди — 23%. Цифры проверимы. Вопрос не в том, способен ли Claude проектировать следующего Claude. Вопрос в том, что мы делаем, пока он учится это делать.
Статья по материалам: When AI builds itself, The Anthropic Institute, июнь 2026.

Готовы ли мы отпустить вожжи?
Восемь из десяти строк кода, попадающих в репозиторий Anthropic, написаны Claude. В 2024-м таких строк были единицы процентов. За полтора года кривая прошла через два порядка. Если продлить её по инерции — а основания для инерции есть, — то горизонт, на котором Claude проектирует следующего Claude, измеряется не десятилетиями. Месяцами.
Anthropic Institute выпустил текст, в котором это сказано без привычной корпоративной дипломатии. Рекурсивное самосовершенствование может наступить раньше, чем большинство институтов к нему готово. «Может». Не «теоретически». И институты — государства, регуляторы, советы директоров, мы с вами — не готовы. Это не технический доклад. Это политическое признание, упакованное в инженерный отчёт.
Цифры, от которых не отвертеться
Anthropic опубликовал конкретные данные. Без них разговор о рекурсивном улучшении остаётся философской спекуляцией. С ними — становится измеримой кривой, по которой можно строить прогноз.
В мае 2026 года более 80% кода, попадающего в репозиторий Anthropic, написан Claude. В 2024 году эта цифра была «в районе низких однозначных значений». За 18 месяцев произошёл скачок через два порядка. Инженер Anthropic во втором квартале 2026 года мерджит в 8 раз больше строк в день, чем в 2024-м. 130 сотрудников research-команд в мартовском опросе оценивают собственный прирост производительности с Claude Mythos Preview как 4-кратный.
Это внутренние данные. Они не проходят через маркетинговый фильтр, потому что публикуются с пометкой «внутреннее исследование». И именно поэтому к ним стоит относиться серьёзно — у Anthropic нет резона завышать, есть резона показывать сдержанность.
Внешние бенчмарки рисуют ту же траекторию. METR фиксирует удвоение длительности задач, с которыми ИИ справляется автономно, раз в четыре месяца. Раньше тренд был раз в семь. Ускорение самого ускорения. SWE-bench: от единиц процентов к насыщению за два года. CORE-Bench: от 20% воспроизведения результатов к насыщению за 15 месяцев. Claude Mythos Preview работает автономно не менее 16 часов — и это верхний предел того, что способны измерить текущие инструменты.
В апреле 2026 года Claude закрыл 800 багов, которые снизили класс ошибок API в тысячу раз. По оценке инженера, наблюдавшего за процессом, человеку потребовалось бы четыре года. Четыре года против двух часов. Не недели, не дни. Часов.
Кривая, описанная этими точками, не плоская. Она не выходит на плато. И если в 2027-м ИИ действительно сможет выполнять задачи длиной в недели, как предполагает отчёт, то между «Claude решает задачу за 16 часов» и «Claude проектирует следующего Claude» — дистанция не десятилетия, а месяцы.
Анатомия передачи руля
Anthropic различает три уровня задач, и это разделение многое объясняет.
Первый уровень: задача полностью специфицирована. «Экспорт не работает, почини». Человек задаёт цель и метод. Claude исполняет. Здесь зазора между человеком и машиной уже нет.
Второй уровень: задача специфицирована по цели, но не по методу. «Разберись, почему сеть тормозит под нагрузкой». Человек задаёт цель, Claude выбирает подход. Здесь Claude уже сильнее человека в исполнении, но ещё уступает в выборе целей.
Третий уровень: задача не специфицирована вовсе. «Какую задачу следующей решать?» Тут пока доминирует человек, но разрыв сокращается быстро.
Рекурсивное самосовершенствование — это момент, когда Claude закроет третий уровень. Когда он сможет не только решить задачу, поставленную исследователем, но и самостоятельно решить, какую задачу решать. И в апрельском эксперименте Anthropic по weak-to-strong supervision это уже произошло в узком контуре. Два исследователя-человека за неделю восстановили 23% разрыва между сильной и слабой моделью. Кластер агентов Claude за 800 часов — 97%. Задачу ставил человек. Метрики придумал человек. Но всё остальное — гипотезы, эксперименты, итерации — агенты провели сами.
Это не рекурсивное самосовершенствование в чистом виде. Но это его предбанник. И он уже здесь.
Философская щель, через которую мы проезжаем
Есть три способа прочесть этот отчёт.
Пессимист скажет: Anthropic торопится с продуктом, отчёт — это стратегический ход для обоснования следующего раунда инвестиций, цифры поданы так, чтобы вызвать именно то чувство, которое они вызывают. Скептицизм уместен. Но он не отменяет самих метрик. 80% кода — это не рекламный слоган, это данные merge-statistics. Их можно проверить, и проверка их подтверждает.
Оптимист скажет: замечательно, мы изобрели более мощный инструмент, как изобретали калькулятор, компилятор, поисковую систему. Нужно просто адаптировать экономику. Этот нарратив привычен. Но он упускает качественное отличие. Калькулятор не проектирует следующий калькулятор. Компилятор не пишет новый компилятор. ИИ — первая технология, которая способна участвовать в собственном развитии. Это другая онтологическая категория, а не улучшенная версия прежней.
Третий, более честный, способ прочесть этот отчёт — признать: мы смотрим на разворачивающийся процесс, в котором скорость изменений опережает скорость нашего понимания этих изменений. И это нормально для технологий, но ненормально для решений, которые эти технологии принимают.
Почему «не готовы» звучит громче, чем кажется
Anthropic Institute использует формулировку, которая в корпоративном языке читается как громкая. «Способы, которыми мы обеспечиваем безопасность систем, мониторим их и формируем их поведение, становятся гораздо более важными». Перевод: если раньше у нас был зазор времени между развертыванием системы и моментом, когда она становится критически важной, то теперь этот зазор сжимается быстрее, чем мы успеваем выстраивать регулирование.
Регулирование ИИ в 2026 году — это GDPR 2018 года, написанный для калькуляторов. Длинные горизонты планирования, согласования, аудита. Юридическая рамка, заточенная под софт, который после релиза меняется раз в год. ИИ, который меняет себя раз в неделю (а скоро будет чаще), в эту рамку не помещается.
В этом и состоит философский нерв публикации. Не в технологии. В политике. Способны ли мы, как общество, принять решения об автономной системе, которая изменяет себя быстрее, чем заседает парламент? Способны ли регуляторы, обученные на аудитах годовых отчётов, проверять систему, которая за время проверки успевает трижды переписать себя? Способны ли советы директоров, привыкшие к квартальной отчётности, управлять активами, которые за квартал проходят десять итераций самомодификации?
Ответ в отчёте зашифрован в формулировке «многие институты не готовы». Не «некоторые». Не «отдельные». Многие. И это — заявление от компании, которая сама является частью этого процесса.
Что остаётся за кадром
Anthropic Institute аккуратно обходит несколько тем. Это не критика — это наблюдение о границах, добровольно выставленных в публикации.
Первое: «лучше людей в течение года» по качеству кода — это утверждение, которое верифицируется внутри Anthropic. Внешние компании, не имеющие доступа к Claude Mythos Preview, работают с другими моделями и получают другие результаты. Зазор в один год — это зазор для тех, кто на передовой. Для остальных он может оказаться тремя или пятью. Но тренд общий.
Второе: 80% кода в репозитории — это не 80% мышления. Человек по-прежнему ставит задачи, выбирает архитектуру, ревьюит код автоматическим ревьюером на Claude. Это уже другая форма работы. Не «пишу код», а «управляю написанием кода». Профессия инженера не исчезает, она трансформируется. Но как именно — пока не описано ни в одном профессиональном стандарте.
Третье: в эксперименте с weak-to-strong supervision агенты сделали 97% работы. Но задачу и метрики поставили люди. Узкое место — не исполнение. Узкое место — выбор того, что исполнять. И именно здесь пролегает водораздел между «мощный инструмент» и «автономный актор». Пока человек задаёт задачу, система остаётся инструментом. Когда система начинает задавать себе задачи — это уже другое.
Anthropic сама пишет, что «большие разрывы в производительности сохраняются, когда Claude проявляет суждение в выборе целей». Это честная формулировка. Разрыв сохраняется. Но уменьшается.
Отпустить вожжи — это не про технологии
Финальный вопрос, который публикация ставит, но не разрешает: что значит «быть готовым»?
Не «понимать как работает». С этим всё в порядке — есть инженеры, которые понимают. Не «иметь регламенты». С этим хуже, но хотя бы понятно направление работы. «Быть готовым» означает принять на себя ответственность за решения, последствия которых мы не можем полностью проследить. Это — политическая зрелость, а не инженерная.
Пока что мы делаем вид, что можем проследить все последствия. Пока что мы выстраиваем регулирование, предполагая, что система, которую мы сертифицируем сегодня, будет той же системой через полгода. Пока что мы планируем пятилетние стратегии для технологий, чей цикл удвоения — четыре месяца.
Anthropic Institute не предлагает решений. Он предлагает диагноз. И диагноз звучит так: время на размышление у нас меньше, чем расстояние до следующей точки перегиба. Каждая решённая задача автономным агентом сокращает это время.
Философский вопрос, который остался без ответа, древний, как Дедал: строить ли крылья, зная, что можешь не вернуться? Дедал построил. Икар полетел. И упал. Не потому что крылья были плохими. А потому что тот, кто отпустил вожжи, не был готов к тому, что произойдёт после.
Мы строим крылья. Они работают. Вопрос не в том, полетят ли. Вопрос в том, кто будет держать вожжи, когда крылья начнут строить себя сами.