Традиционная облачная инфраструктура создавалась для людей: их предсказуемого поведения, поиска, кликов и скроллинга. Искусственный интеллект ведёт себя иначе. Агенты ИИ способны мгновенно запускать множество подзадач, опрашивать сотни баз данных, искать в документах и вызывать API за секунды, а затем так же быстро завершать работу.
Исходя из этого, Amazon перепроектирует ключевой компонент своего облака. AWS представила новое поколение OpenSearch Serverless — полностью управляемую поисковую и векторную базу данных, предназначенную специально для рабочих нагрузок, создаваемых агентами. По словам компании, система может мгновенно масштабироваться при запуске агентов и возвращаться к нулю в режиме простоя.
Новый тип интернет-трафика
Запуск отражает растущее понимание в технологической индустрии: инфраструктура, изначально созданная для интернета, управляемого людьми, плохо работает в мире, где всё больше агентов.
Хотя активность ИИ-агентов пока составляет относительно небольшую долю интернет-трафика, машинно-генерируемый трафик уже значителен и продолжит расти. По данным Cloudflare, боты составляли 31% всего HTTP-трафика за последние шесть месяцев. ИИ-краулеры, поисковые системы и ассистенты составили около четверти всех запросов от ботов за этот период.
«Трафик от не-людей превысит человеческий где-то в первой половине 2027 года», — сообщила старший менеджер по продукту Cloudflare Лай Йи Олсен.
На прошлой неделе на конференции разработчиков I/O Google заявила, что пользователи смогут делегировать задачи ИИ-системам, например, исследовать покупки, бронировать путешествия, просматривать веб-страницы и взаимодействовать с приложениями. Но тренд не ограничивается потребительскими агентами. Компании всё чаще развёртывают агентов для внутреннего использования и для клиентов, создавая новые виды машинного трафика в фоновом режиме.
В результате облачные провайдеры и инфраструктурные компании пересматривают подходы к адаптации систем, построенных для людей, под мир автономных агентов, которые постоянно извлекают информацию, используют инструменты и генерируют машино-машинный трафик.
Техническая революция в облаке
Именно для этого и создано новое поколение AWS OpenSearch Serverless.
«Сроки просты. Агенты переходят от экспериментов к промышленному использованию, и они создают шаблоны трафика, для которых предыдущая инфраструктура просто не была предназначена, — пояснила Тайя Уайт, генеральный менеджер Amazon OpenSearch Service. — Они вспыхивают без предупреждения, переходят в режим простоя без уведомления, а предприятиям нужен поиск, который успевает за ними, без оплаты простаивающих вычислительных ресурсов».
Ключевое техническое изменение в новом поколении — разделение вычислений и хранения данных. Это позволяет вычислительным мощностям масштабироваться за секунды для обработки всплесков активности агентов и сокращаться до нуля, так что клиенты платят 0 долларов, когда агенты простаивают.
«Раньше, даже в нашей предыдущей бессерверной версии, у вас должен был быть как минимум один работающий экземпляр, потому что хранение и вычисления были связаны, — объяснила Уайт. — Вы не могли просто автоматически развернуть вычислительные мощности с нужной скоростью, поэтому у вас всегда были резервные простаивающие мощности для вашей рабочей нагрузки, использовали вы их или нет».
На старте OpenSearch Serverless будет нативно интегрироваться с платформами для разработки ИИ, такими как Vercel и Kiro, что позволит разработчикам развертывать готовые к работе поисковые и векторные бэкенды для агентов без управления инфраструктурой.
Тренд всей индустрии
Этот сдвиг наблюдается во всей облачной индустрии. Databricks и Snowflake перепозиционируют себя как системы памяти и поиска для корпоративных данных. Microsoft выпустила обновления для Azure, предназначенные для обработки всплесков активности ИИ-агентов и совместного использования памяти между агентами. Cloudflare, по аналогии с Amazon, в прошлом месяце представила инфраструктуру, направленную на предоставление агентам постоянных сред и мгновенной масштабируемости.
Чем больше компаний будут развёртывать ИИ-агентов, тем больше будет давление на перепроектирование инфраструктуры под машинно-генерируемые рабочие нагрузки. Это, в свою очередь, может сделать развёртывание агентов более дешёвым и простым в крупных масштабах.



