Когда платформа для краудфандинга стартапов VentureCrowd начала внедрять ИИ-агентов для написания кода, они получили те же преимущества, что и другие компании: в некоторых проектах цикл фронтенд-разработки сократился на 90%. Однако путь к этому был непростым и потребовал множества проб и ошибок.
Первой проблемой VentureCrowd стало качество данных и контекста. Диего Могольон, главный продуктовый директор VentureCrowd, пояснил, что «агенты рассуждают на основе любых данных, к которым могут получить доступ во время выполнения», и затем могут быть уверенно «неправы», поскольку основывают свои выводы только на предоставленном им контексте.
Другое препятствие, как и у многих, — неструктурированные данные и неясные процессы. Подобно проблеме с контекстом, Могольон отметил, что кодирующие агенты усиливали плохие данные, поэтому компании сначала пришлось построить хорошо структурированную кодовую базу.
«Проблемы редко связаны с самими агентами кодирования; они связаны со всем, что их окружает, — сказал Могольон. — Это проблема контекста, замаскированная под проблему ИИ, и это причина номер один, по которой я вижу сбои в агентских реализациях».
Слишком много контекста
Опыт VentureCrowd иллюстрирует более широкую проблему в разработке ИИ-агентов. Модели не подводят агентов; скорее, те перегружаются из-за слишком большого контекста и слишком многих инструментов одновременно.
Это происходит из-за явления, называемого «раздуванием контекста»: когда ИИ-системы накапливают всё больше данных, инструментов или инструкций, рабочие процессы становятся более сложными. Проблема возникает потому, что агентам нужен контекст для лучшей работы, но его избыток создаёт шум. И чем больше контекста приходится просеивать агенту, тем больше токенов он использует, работа замедляется, а затраты растут.
Один из способов обуздать раздувание контекста — контекстная инженерия. Она помогает агентам понимать изменения в коде или pull request’ы и соотносить их со своими задачами. Однако контекстная инженерия часто становится внешней задачей, а не встроенной в платформы для разработки, которые предприятия используют для создания своих агентов.
Реакция платформ для ИИ-агентов
VentureCrowd полагался на одно конкретное решение, чтобы преодолеть проблемы с раздуванием контекста, мешавшие внедрению корпоративных ИИ-агентов: Agentforce Vibes от Salesforce. Это платформа для написания кода, которая работает внутри экосистемы Salesforce и доступна для всех тарифных планов, начиная с бесплатного.
Salesforce недавно обновила Agentforce Vibes до версии 2.0, расширив поддержку сторонних фреймворков, таких как ReAct. Что наиболее важно для таких компаний, как VentureCrowd, в Agentforce Vibes были добавлены «Возможности» и «Навыки», которые можно использовать для управления поведением агента.
«Для справки, вся наша платформа, фронтенд и бэкенд, работает в экосистеме Salesforce. Поэтому, когда запустился Agentforce Vibes, он естественным образом встроился в уже хорошо знакомую нам среду», — сказал Могольон.
Подход Salesforce не минимизирует контекст, который используют агенты; скорее, он помогает предприятиям гарантировать, что контекст остаётся в рамках их моделей данных или кодовых баз. Agentforce Vibes добавляет дополнительное исполнение через новую функцию «Навыки и Возможности». «Возможности» определяют, чего хотят достичь агенты, а «Навыки» — это инструменты, которые они будут использовать для этого.
Другие платформы для ИИ-агентов управляют контекстом по-разному. Например, Claude Code и Codex от OpenAI сосредоточены на автономном исполнении, постоянно читая файлы, запуская команды и расширяя контекст по мере развития задач. У Claude Code есть индикатор контекста, который сжимает его, когда он становится слишком большим.
При всех этих разных подходах общая закономерность такова, что большинство систем управляют растущим контекстом для агентов, а не обязательно ограничивают его. Контекст продолжает расти, особенно по мере усложнения рабочих процессов, что затрудняет для предприятий контроль над затратами, задержками и надёжностью.
Могольон сказал, что его компания выбрала Agentforce Vibes не только потому, что большая часть их данных уже находится в Salesforce, что облегчает интеграцию, но и потому, что это позволило бы им контролировать большую часть контекста, которым они кормят своих агентов.
Что нужно знать разработчикам
Не существует единственного способа решения проблемы раздувания контекста, но паттерн теперь ясен: больше контекста не всегда означает лучшие результаты.
Наряду с инвестициями в контекстную инженерию, предприятиям приходится экспериментировать с подходом к ограничению контекста, который им наиболее удобен.
Для компаний это означает, что задача состоит не только в том, чтобы дать агентам больше информации, — а в том, чтобы решить, что оставить за её пределами.



