Kimi K2.5: «рой агентов» — когда один ИИ запускает сотню
MoonshotAI выпустила Kimi K2.5 — мультимодальную open-source модель с архитектурой Agent Swarm. До 100 параллельных агентов, 1 500 вызовов инструментов за сессию, ускорение в 4.5× на реальных задачах.
Вчера китайская MoonshotAI выпустила Kimi K2.5 — и тут интересна не сама модель (ещё одна большая LLM, кого удивишь), а то, как она решает задачи. Фишка называется Agent Swarm: вместо одного агента, который последовательно думает и делает, K2.5 порождает десятки и сотни специализированных агентов, которые работают параллельно.
Причём роли этих агентов не зашиты заранее — модель сама решает, кого «нанять» под конкретную задачу, создаёт их на лету и координирует.
Agent Swarm: что это на практике
Стандартная схема работы ИИ-агента: получил задачу → подумал → сделал шаг → подумал → следующий шаг. Один человек делает всё последовательно.
Agent Swarm работает иначе. K2.5 ведёт себя как проджект-менеджер:
- Смотрит на задачу и решает, какие специалисты нужны
- Создаёт агентов с конкретными ролями — «исследователь», «финансист», «верификатор фактов»
- Запускает их параллельно — до 100 штук одновременно
- Координирует до 1 500 вызовов инструментов за одну сессию
- Собирает результаты в итоговый ответ
Без прописанных сценариев. Без фиксированных воркфлоу. Модель сама определяет, кто нужен и что делать.
Пример: исследование рынка
Задача: «Проведи анализ рынка AI-чипов в Юго-Восточной Азии за 2025 год».
Обычная модель (один агент):
- Ищет в Google → находит статью → читает → 30 секунд
- Следующий источник → читает → 30 секунд
- Финансовые отчёты → анализирует → 40 секунд
- Обобщает → 20 секунд
- Итого: ~2 минуты
K2.5 Agent Swarm:
- Аналитик рынка → параллельно ищет по 5 источникам
- Финансист → параллельно разбирает отчёты компаний
- Верификатор → проверяет найденные данные
- Визуализатор → готовит графики
- Оркестратор собирает всё вместе
- Итого: ~30 секунд
MoonshotAI заявляет ускорение в 3–4.5× по сравнению с одиночным агентом на реальных задачах.
Как обучали: PARL
Метод обучения — Parallel-Agent Reinforcement Learning (PARL). Агент-оркестратор учится разбивать задачи на параллельные подзадачи, каждую из которых выполняет динамически созданный суб-агент.
Проблема при обучении — serial collapse: оркестратор ленится и просто передаёт всю работу одному агенту последовательно, вместо того чтобы распараллеливать. Решение — поэтапное вознаграждение: сначала модель получает бонус за параллелизм, потом фокус смещается на качество результата.
Для оценки используют метрику Critical Steps — по аналогии с критическим путём в параллельных вычислениях. Неважно, сколько агентов запущено, — считается самая длинная цепочка зависимостей.
Мультимодальность: текст + код + картинки
K2.5 — первая мультимодальная модель MoonshotAI. Обучена на ~15 триллионах токенов (текст + визуал) поверх базы Kimi K2.
Покажи макет — получи код
Самое практичное:
- Скриншот макета → рабочий фронтенд с анимациями и интерактивом
- Видео UI → код, воспроизводящий показанное поведение
- Визуальная отладка — модель смотрит на свой же вывод, находит баги и правит их сама
Пример из техблога: K2.5 получает репродукцию «Танца» Матисса и превращает её эстетику в дизайн веб-страницы — от идеи до финального CSS, без участия человека.
Для разработчиков есть Kimi Code — CLI для терминала с интеграцией в VSCode, Cursor и Zed.
Офисная работа
K2.5 Agent генерирует полноценные документы: Word с аннотациями, Excel с финмоделями и сводными таблицами, PDF с LaTeX-формулами, презентации. Внутренние тесты MoonshotAI — +59% к качеству по сравнению с K2 Thinking.
Бенчмарки: на уровне GPT-5.2 и Claude 4.5 Opus
При этом модель полностью открыта под MIT.
Конкретные цифры:
- BrowseComp (поиск в интернете): одиночный агент — 60.6, Agent Swarm — 78.4 (+30%)
- WideSearch (широкий поиск): одиночный — 72.7, Agent Swarm — 79.0
- SWE-Bench Multilingual (код на разных языках): 73.0 (Claude 4.5 Opus — 77.5, GPT-5.2 — 72.0)
- AIME 2025 (олимпиадная математика): 96.1 из 100
- LiveCodeBench v6 (свежий код): 85.0 — лучше Claude 4.5 Opus (82.2)
Архитектура: 1T параметров (MoE, 384 эксперта), 32B активных, контекст 256K токенов, визуальный энкодер MoonViT (400M).
4 режима
Kimi.com предлагает модель в четырёх вариантах:
| Режим | Для чего |
|---|---|
| K2.5 Instant | Быстрые ответы без глубокого рассуждения |
| K2.5 Thinking | Сложные задачи с цепочкой рассуждений |
| K2.5 Agent | Инструменты: поиск, код, файлы |
| K2.5 Agent Swarm (beta) | Рой агентов для масштабных задач |
Agent Swarm пока в бете на kimi.com/agent-swarm. API совместим с форматами OpenAI и Anthropic — platform.moonshot.ai.
Зачем это бизнесу
Due diligence — параллельный анализ юридических, финансовых и репутационных данных. Вместо недели — часы.
R&D — одновременный поиск и синтез по десяткам направлений. Один оркестратор вместо команды аналитиков.
Разработка — автоматическое разбиение задачи на модули с параллельной реализацией и тестами.
Контент — мультиязычная адаптация на 10+ рынков одновременно.
А то, что модель под MIT — означает деплой на свою инфраструктуру, дообучение под свои данные и ноль зависимости от чужих API. Для enterprise это часто решающий фактор.
Итого
Kimi K2.5 — первая модель, где мульти-агентный рой работает не как маркетинговая концепция, а как реальный механизм с измеримым ускорением. Open-source модели уже вплотную конкурируют с закрытыми — разрыв почти исчез. А связка «vision + code + агенты» определяет, каким будет следующий виток ИИ-продуктов.
Одиночные чат-боты — это уже прошлый год. Дальше — координированные рои, где каждый агент создаётся под задачу в реальном времени.
Ссылки: Техблог K2.5 · HuggingFace · GitHub · API · Kimi Code · Agent Swarm (beta) · @kimi_moonshot
Больше разборов ИИ для бизнеса — @tsingular.