OpenAI запустила бесплатный сервис для озвучки текста: что он умеет?
Система позволяет настраивать голос — менять его тембр, стиль и эмоциональную окраску, чтобы добиться нужного эффекта
Как это работает?
OpenAI использует передовые алгоритмы машинного обучения, чтобы создавать голосовые модели, приближенные к реальному общению. Система не просто читает текст — она учитывает контекст, умеет менять интонацию и адаптироваться под стиль речи. Есть готовые голосовые пресеты, но можно вручную задать параметры, чтобы добиться нужного эффекта.
Основные возможности сервиса:
-
Выбор стиля озвучки — от официального диктора до эмоционального рассказчика.
-
Настройка тембра и скорости — можно регулировать высоту и темп голоса.
-
Контроль эмоциональности — система способна выражать радость, грусть, удивление и другие эмоции.
-
Поддержка множества языков — можно озвучивать тексты на разных языках, включая украинский и китайский.
Улучшенное распознавание речи
OpenAI также прокачала свою технологию обработки голоса. Новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe точнее преобразуют речь в текст, даже если:
-
Человек говорит с сильным акцентом.
-
Вокруг шум (например, на улице или в кафе).
-
Речь быстрая или неразборчивая.
Эта технология особенно полезна для перевода креативов !)
Где протестировать?
Сервис уже доступен разработчикам через API, а любой желающий может протестировать его на https://www.openai.fm/. Всё бесплатно и без сложных настроек.
Это ещё один шаг к тому, чтобы взаимодействие с искусственным интеллектом стало максимально естественным и удобным,в том числе и медиабайинге