tsingular.ru
Все статьи
ИИ агенты open source

Kimi K2.5: «рой агентов» — когда один ИИ запускает сотню

MoonshotAI выпустила Kimi K2.5 — мультимодальную open-source модель с архитектурой Agent Swarm. До 100 параллельных агентов, 1 500 вызовов инструментов за сессию, ускорение в 4.5× на реальных задачах.

Kimi K2.5 Agent Swarm — визуализация роя агентов

Вчера китайская MoonshotAI выпустила Kimi K2.5 — и тут интересна не сама модель (ещё одна большая LLM, кого удивишь), а то, как она решает задачи. Фишка называется Agent Swarm: вместо одного агента, который последовательно думает и делает, K2.5 порождает десятки и сотни специализированных агентов, которые работают параллельно.

Причём роли этих агентов не зашиты заранее — модель сама решает, кого «нанять» под конкретную задачу, создаёт их на лету и координирует.

Agent Swarm: что это на практике

Стандартная схема работы ИИ-агента: получил задачу → подумал → сделал шаг → подумал → следующий шаг. Один человек делает всё последовательно.

Agent Swarm работает иначе. K2.5 ведёт себя как проджект-менеджер:

  1. Смотрит на задачу и решает, какие специалисты нужны
  2. Создаёт агентов с конкретными ролями — «исследователь», «финансист», «верификатор фактов»
  3. Запускает их параллельно — до 100 штук одновременно
  4. Координирует до 1 500 вызовов инструментов за одну сессию
  5. Собирает результаты в итоговый ответ

Без прописанных сценариев. Без фиксированных воркфлоу. Модель сама определяет, кто нужен и что делать.

Схема работы Agent Swarm: главный агент декомпозирует задачу, параллельно запускает специализированных агентов, координирует результат

Пример: исследование рынка

Задача: «Проведи анализ рынка AI-чипов в Юго-Восточной Азии за 2025 год».

Обычная модель (один агент):

  1. Ищет в Google → находит статью → читает → 30 секунд
  2. Следующий источник → читает → 30 секунд
  3. Финансовые отчёты → анализирует → 40 секунд
  4. Обобщает → 20 секунд
  5. Итого: ~2 минуты

K2.5 Agent Swarm:

  • Аналитик рынка → параллельно ищет по 5 источникам
  • Финансист → параллельно разбирает отчёты компаний
  • Верификатор → проверяет найденные данные
  • Визуализатор → готовит графики
  • Оркестратор собирает всё вместе
  • Итого: ~30 секунд

MoonshotAI заявляет ускорение в 3–4.5× по сравнению с одиночным агентом на реальных задачах.

Как обучали: PARL

Метод обучения — Parallel-Agent Reinforcement Learning (PARL). Агент-оркестратор учится разбивать задачи на параллельные подзадачи, каждую из которых выполняет динамически созданный суб-агент.

Проблема при обучении — serial collapse: оркестратор ленится и просто передаёт всю работу одному агенту последовательно, вместо того чтобы распараллеливать. Решение — поэтапное вознаграждение: сначала модель получает бонус за параллелизм, потом фокус смещается на качество результата.

Для оценки используют метрику Critical Steps — по аналогии с критическим путём в параллельных вычислениях. Неважно, сколько агентов запущено, — считается самая длинная цепочка зависимостей.

Мультимодальность: текст + код + картинки

K2.5 — первая мультимодальная модель MoonshotAI. Обучена на ~15 триллионах токенов (текст + визуал) поверх базы Kimi K2.

Покажи макет — получи код

Самое практичное:

  • Скриншот макета → рабочий фронтенд с анимациями и интерактивом
  • Видео UI → код, воспроизводящий показанное поведение
  • Визуальная отладка — модель смотрит на свой же вывод, находит баги и правит их сама

Пример из техблога: K2.5 получает репродукцию «Танца» Матисса и превращает её эстетику в дизайн веб-страницы — от идеи до финального CSS, без участия человека.

Для разработчиков есть Kimi Code — CLI для терминала с интеграцией в VSCode, Cursor и Zed.

Офисная работа

K2.5 Agent генерирует полноценные документы: Word с аннотациями, Excel с финмоделями и сводными таблицами, PDF с LaTeX-формулами, презентации. Внутренние тесты MoonshotAI — +59% к качеству по сравнению с K2 Thinking.

Бенчмарки: на уровне GPT-5.2 и Claude 4.5 Opus

При этом модель полностью открыта под MIT.

Сравнение бенчмарков: Kimi K2.5 vs GPT-5.2 vs Claude 4.5 Opus

Конкретные цифры:

  • BrowseComp (поиск в интернете): одиночный агент — 60.6, Agent Swarm — 78.4 (+30%)
  • WideSearch (широкий поиск): одиночный — 72.7, Agent Swarm — 79.0
  • SWE-Bench Multilingual (код на разных языках): 73.0 (Claude 4.5 Opus — 77.5, GPT-5.2 — 72.0)
  • AIME 2025 (олимпиадная математика): 96.1 из 100
  • LiveCodeBench v6 (свежий код): 85.0 — лучше Claude 4.5 Opus (82.2)

Архитектура: 1T параметров (MoE, 384 эксперта), 32B активных, контекст 256K токенов, визуальный энкодер MoonViT (400M).

4 режима

Kimi.com предлагает модель в четырёх вариантах:

РежимДля чего
K2.5 InstantБыстрые ответы без глубокого рассуждения
K2.5 ThinkingСложные задачи с цепочкой рассуждений
K2.5 AgentИнструменты: поиск, код, файлы
K2.5 Agent Swarm (beta)Рой агентов для масштабных задач

Agent Swarm пока в бете на kimi.com/agent-swarm. API совместим с форматами OpenAI и Anthropic — platform.moonshot.ai.

Зачем это бизнесу

Due diligence — параллельный анализ юридических, финансовых и репутационных данных. Вместо недели — часы.

R&D — одновременный поиск и синтез по десяткам направлений. Один оркестратор вместо команды аналитиков.

Разработка — автоматическое разбиение задачи на модули с параллельной реализацией и тестами.

Контент — мультиязычная адаптация на 10+ рынков одновременно.

А то, что модель под MIT — означает деплой на свою инфраструктуру, дообучение под свои данные и ноль зависимости от чужих API. Для enterprise это часто решающий фактор.

Итого

Kimi K2.5 — первая модель, где мульти-агентный рой работает не как маркетинговая концепция, а как реальный механизм с измеримым ускорением. Open-source модели уже вплотную конкурируют с закрытыми — разрыв почти исчез. А связка «vision + code + агенты» определяет, каким будет следующий виток ИИ-продуктов.

Одиночные чат-боты — это уже прошлый год. Дальше — координированные рои, где каждый агент создаётся под задачу в реальном времени.


Ссылки: Техблог K2.5 · HuggingFace · GitHub · API · Kimi Code · Agent Swarm (beta) · @kimi_moonshot

Больше разборов ИИ для бизнеса — @tsingular.