Исследовательское подразделение Microsoft AI представило три новые базовые модели искусственного интеллекта, способные генерировать текст, речь и изображения. Этот шаг демонстрирует стремление компании развивать собственный стек мультимодальных ИИ-моделей и конкурировать с другими лабораториями, несмотря на сохраняющееся партнёрство с OpenAI.
Что могут новые модели
Три модели получили названия MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2. MAI-Transcribe-1 предназначена для транскрибации речи в текст и поддерживает 25 языков. По заявлению компании, она работает в 2,5 раза быстрее, чем предыдущее предложение Azure Fast.
MAI-Voice-1 — это модель для генерации аудио. Она позволяет создавать 60 секунд звука за одну секунду, а также разрабатывать пользовательские голоса. MAI-Image-2 является моделью для генерации видео.
Доступность и разработка
MAI-Image-2 была впервые представлена 19 марта в MAI Playground — новом программном обеспечении для тестирования больших языковых моделей. Теперь все три модели выпускаются на платформе Microsoft Foundry, а модели для транскрибации и генерации голоса также доступны в MAI Playground.
Разработкой занималась команда MAI Superintelligence под руководством генерального директора Microsoft AI Мустафы Сулеймана. Эта исследовательская группа была сформирована и анонсирована в ноябре 2025 года.
Философия и ценообразование
«В Microsoft AI мы создаём гуманистический искусственный интеллект. У нас особый подход к созданию моделей — мы ставим человека в центр, оптимизируем под реальные способы общения и обучаем для практического использования», — написал Сулейман в блоге. Он пообещал, что вскоре появятся и другие модели в Foundry и непосредственно в продуктах Microsoft.
В переполненном рынке больших языковых моделей MAI делает ставку на более низкую стоимость по сравнению с предложениями Google и OpenAI. Цены стартуют с 0,36 доллара в час для MAI-Transcribe-1, 22 долларов за 1 миллион символов для MAI-Voice-1 и 5 долларов за 1 миллион токенов текстового ввода (или 33 доллара за 1 миллион токенов графического вывода) для MAI-Image-2.
Партнёрство с OpenAI
Несмотря на выпуск собственных моделей, Сулейман в интервью подтвердил приверженность Microsoft партнёрству с OpenAI. Он отметил, что недавнее пересогласование условий этого сотрудничества позволило Microsoft полноценно заняться исследованиями в области сверхинтеллекта.
Microsoft инвестировала в OpenAI более 13 миллиардов долларов и размещает её модели в своих продуктах в рамках многолетнего партнёрства. Компания придерживается аналогичной стратегии с чипами, производя собственные и одновременно закупая их у внешних поставщиков.



