Mistral запускает Forge: платформу для создания ИИ-моделей с нуля на основе корпоративных данных

Большинство корпоративных проектов в области искусственного интеллекта терпят неудачу не из-за нехватки технологий, а потому что используемые модели не понимают специфику бизнеса. Часто они обучаются на данных из интернета, а не на десятилетиях внутренних документов, рабочих процессов и институциональных знаний компании.

Именно в этой нише французский стартап Mistral видит свою возможность. Во вторник компания анонсировала платформу Mistral Forge, которая позволяет предприятиям создавать собственные модели, обученные на их уникальных данных. Анонс состоялся на конференции Nvidia GTC, которая в этом году сфокусирована на ИИ и агентных моделях для бизнеса.

Стратегия на корпоративный сектор

Это важный шаг для Mistral, которая строит бизнес на корпоративных клиентах, в то время как конкуренты OpenAI и Anthropic добились большего успеха на потребительском рынке. Генеральный директор Артур Менш заявляет, что фокус на предприятиях работает: компания ожидает превысить отметку в 1 миллиард долларов годового регулярного дохода в этом году.

Ключевая часть стратегии — предоставить компаниям больше контроля над их данными и ИИ-системами. «Forge позволяет предприятиям и правительствам настраивать модели искусственного интеллекта под их конкретные нужды», — пояснила Элиза Саламанка, глава продукта Mistral.

Обучение с нуля вместо тонкой настройки

Несколько игроков на рынке корпоративного ИИ уже предлагают схожие возможности, но большинство фокусируется на тонкой настройке существующих моделей или добавлении проприетарных данных поверх них с помощью методов вроде retrieval augmented generation (RAG). Эти подходы не переобучают модели фундаментально, а лишь адаптируют их или используют данные компании во время выполнения запроса.

Mistral же утверждает, что позволяет компаниям обучать модели с чистого листа. Теоретически это может решить некоторые ограничения более распространённых подходов — например, улучшить обработку неанглоязычных или узкоспециализированных данных и дать больше контроля над поведением модели. Это также позволит компаниям обучать агентные системы с использованием обучения с подкреплением и снизить зависимость от сторонних поставщиков моделей, избежав рисков вроде внезапных изменений или прекращения поддержки.

Как работает Forge

Клиенты Forge могут создавать кастомные модели, используя обширную библиотеку открытых ИИ-моделей Mistral, которая включает небольшие модели, такие как недавно представленная Mistral Small 4. Сооснователь и главный технолог компании Тимоте Лакруа считает, что Forge поможет извлечь больше пользы из существующих моделей.

«Компромисс, на который мы идём при создании более компактных моделей, заключается в том, что они не могут быть одинаково хороши во всех темах, как их более крупные аналоги. Возможность их кастомизации позволяет нам выбирать, на чём делать акцент, а чем можно пренебречь», — отметил Лакруа.

Mistral консультирует по выбору моделей и инфраструктуры, но окончательное решение остаётся за клиентом. Для команд, которым нужно больше, чем просто рекомендации, Forge включает команду инженеров Mistral, которые работают непосредственно с заказчиками, чтобы определить нужные данные и адаптировать решения под их нужды — модель, заимствованная у таких компаний, как IBM и Palantir.

«Как продукт, Forge уже поставляется со всем необходимым инструментарием и инфраструктурой, чтобы вы могли создавать синтетические конвейеры данных, — говорит Саламанка. — Но понимание того, как построить правильную систему оценки и убедиться, что у вас достаточно данных, — это то, в чём у предприятий обычно нет нужной экспертизы. Вот что привносят наши инженеры».

Ранние пользователи и основные сценарии

Mistral уже предоставила доступ к Forge партнёрам, включая Ericsson, Европейское космическое агентство, итальянскую консалтинговую компанию Reply, а также сингапурские DSO и HTX. Среди первых пользователей также числится ASML, нидерландский производитель чипов, который возглавил раунд финансирования Series C Mistral в сентябре прошлого года с оценкой в 11,7 миллиарда евро (примерно 13,8 миллиарда долларов на тот момент).

Эти партнёрства отражают ожидаемые основные сценарии использования Forge. По словам главного коммерческого директора Mistral Марджори Яневски, к ним относятся правительства, которым нужно адаптировать модели под свой язык и культуру; финансовые игроки с высокими требованиями к соответствию нормам; производители с потребностями в кастомизации; и технологические компании, которым необходимо настраивать модели под свою кодовую базу.