Meta* анонсировала семейство языковых моделей Llama 3.1, включающее как небольшие, так и крупные варианты, предназначенные для коммерческого использования и исследовательских целей. Новые модели, по заявлению компании, демонстрируют значительный прогресс в понимании контекста и выполнении сложных инструкций по сравнению с предыдущим поколением.
Три модели для разных задач
В рамках Llama 3.1 представлены три модели с разным количеством параметров: Llama 3.1 405B, Llama 3.1 70B и Llama 3.1 8B. Флагманская Llama 3.1 405B, как утверждается, превосходит по производительности такие модели, как Claude 3.5 Sonnet и GPT-4o, в стандартных тестах на рассуждение и кодирование. Модель Llama 3.1 70B позиционируется как эффективная альтернатива для бизнеса, а Llama 3.1 8B — как компактный вариант для устройств с ограниченными ресурсами.
Доступ для бизнеса и исследователей
Самую мощную модель, 405B, Meta* не выпускает в открытый доступ. Вместо этого компания предлагает её через API для коммерческого использования и предоставляет доступ для исследовательских целей. Модели 70B и 8B доступны для скачивания и использования в рамках лицензии Llama 3.1 Community License, которая разрешает коммерческое применение.
Улучшения в кодировании и логике
Разработчики отмечают, что Llama 3.1 показывает особенно хорошие результаты в задачах, связанных с программированием. Модель лучше справляется с написанием кода, исправлением ошибок и логическим рассуждением. Это делает её привлекательной для создания инструментов разработки и автоматизации.
Интеграция с облачными платформами
Модели Llama 3.1 уже доступны на основных облачных платформах, включая AWS, Google Cloud и Microsoft Azure. Это позволяет компаниям легко развернуть модель в своей инфраструктуре.
Новые инструменты для разработчиков
Вместе с моделями Meta* представила Llama Guard 3, систему для фильтрации нежелательного контента, и Llama 3.1 405B Instruct, версию для разработчиков. Также анонсированы Llama 3.1 70B и 8B, которые можно скачать и использовать в коммерческих целях.
Что дальше?
Meta* продолжает развивать семейство Llama. В планах компании — выпуск более крупных и специализированных моделей. Разработчики смогут использовать их для создания новых приложений и сервисов.
*Meta Platforms Inc. признана экстремистской организацией и запрещена на территории РФ.



