OpenAI представила новое поколение ИИ-моделей для озвучки текста

OpenAI представила обновленные голосовые модели на базе искусственного интеллекта GPT-4o, которые преобразуют текст в аудио, а также транскрибируют аудио и распознают речь в реальном времени.

Модель gpt-4o-mini-tts предлагает для озвучки 11 голосов с разными интонациями, стилем звучания и тембром голоса. Например, можно выбрать голос пирата, средневекового рыцаря, профессионального диктора, спортивного тренера, ковбоя, спокойного учителя, безумного ученого или Санта-Клауса. У каждого голоса есть свои характеристики, но их также можно поменять. Доступно более 100 языков, в том числе русский, передает rb.ru

Также компания улучшила технологию распознавания речи. Новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe лучше расшифровывают медиафайлы и допускают меньше ошибок, даже если на записи есть посторонние шумы или спикер говорит быстро.

Разработчики могут получить доступ к моделям через API. Протестировать озвучку текста можно на сайте openai.fm. В бесплатной версии можно ввести до 1000 символов.

Общество

Совет по телевидению и радио оштрафовал региональный телеканал на 85 000 леев за дезинформацию и продвижение политических деятелей

21.03.2025

OpenAI представила новое поколение ИИ-моделей для озвучки текста

Комментировать Cancel reply

Читайте также

Президент Литвы: Войска США – самый большой фактор сдерживания России

Авторы фильма о Депардье подали на него иск о клевете

Туск: Если будет 56 саммитов по Украине, мир не наступит быстрее

Высший совет обороны Румынии рассмотрит вопросы безопасности страны и обсудит Украину

Тысячи людей вторые сутки протестуют в Стамбуле против ареста мэра Имамоглу

Bloomberg: Европе не хватает пороха и тротила для производства снарядов

Ким Кардашьян хочет лишить Канье Уэста родительских прав

Бывший управляющий Центробанка Канады выиграл $17,4 млн в лотерею

Seat отказывается от электромобилей и сосредоточится на моделях с ДВС