Google в понедельник выпустила для iOS приложение для диктовки под названием «Google AI Edge Eloquent». Оно работает в первую очередь офлайн и позиционируется как конкурент таким сервисам, как Wispr Flow, SuperWhisper и Willow.
Приложение бесплатно для загрузки. После скачивания моделей автоматического распознавания речи на базе Gemma можно сразу начать диктовать текст на телефоне. В интерфейсе отображается живая транскрипция, а при нажатии на паузу приложение автоматически убирает слова-паразиты вроде «э-э» и «ну» и форматирует текст.
Под текстом транскрипции доступны опции преобразования: «Ключевые моменты», «Формально», «Короче» и «Длиннее».
Также можно отключить облачный режим, чтобы обработка велась только локально. При включённом облачном режиме для очистки текста используются облачные модели Gemini. «Google AI Edge Eloquent» может импортировать определённые ключевые слова, имена и профессиональную лексику из аккаунта Gmail, если пользователь этого хочет. Кроме того, в список можно добавить собственные пользовательские слова.
Приложение хранит историю сессий транскрипции и позволяет по ним осуществлять поиск. Оно может показывать слова, продиктованные в последней сессии, скорость речи в словах в минуту и общее количество произнесённых слов.
«Google AI Edge Eloquent — это продвинутое приложение для диктовки, созданное для устранения разрыва между естественной речью и профессиональным, готовым к использованию текстом. В отличие от стандартного ПО для диктовки, которое дословно транскрибирует оговорки и слова-паразиты, Eloquent использует ИИ для улавливания смысла. Оно автоматически редактирует „э-э“, „ну“ и исправления посреди предложения, выводя чистый и точный текст», — говорится в описании приложения в App Store.
На данный момент приложение доступно только для iOS, однако в описании в App Store упоминается версия для Android. Согласно описанию, Eloquent предлагает «бесшовную интеграцию с Android»: его можно установить в качестве клавиатуры по умолчанию для доступа к диктовке в любом текстовом поле системы. Кроме того, приложение сможет использовать функцию плавающей кнопки, аналогичную той, что использует Wispr Flow на Android, для быстрого доступа к транскрипции из любого места.
Приложения для транскрипции с ИИ набирают популярность по мере улучшения моделей преобразования речи в текст. С этим экспериментальным приложением Google присоединяется к тренду. Если тест окажется успешным, улучшенные функции транскрипции могут появиться и в самой системе Android.



