📌 15 лучших нейронок для синтеза речи (сохраняй)
RHVoice
голосовой синтезатор с качественными русскими голосами, поддерживает 13 других языков. Работает на Windows, Linux и Android.
ElevenLabs
один из самых продвинутых сервисов – предоставляет библиотеку максимально реалистичных голосов, которые можно настраивать как угодно. Есть клонирование голоса, есть опция создания уникального синтетического голоса с нуля. Можно клонировать свой голос и заставить его говорить на любом из поддерживаемых языков.
Free Text To Speech Online
использует библиотеку Microsoft AI Speech для синтеза речи. Есть два качественных, нейтральных русских голоса, простые настройки темпа и тона, предусмотрено скачивание аудио в mp3.
Mimic
быстрый и легкий голосовой синтезатор, созданный на основе CMU Flite. Можно создавать новые уникальные голоса.
Murf
предоставляет более 120 реалистичных мужских и женских голосов, которые можно настраивать и кастомизировать (придать акцент, например, изменить возраст, темп, тон или эмоциональную окраску). Поддерживает 20+ языков.
Speechify
озвучивает любой текстовый контент, создает уникальные голоса для ИИ-аватаров, на лету переводит и дублирует видео.
Mozilla TTS
включает большой набор обученных моделей. Поддерживает 20+ языков, генерирует нейтральную по эмоциональной окраске реалистичную речь. Можно создавать и обучать свои модели.
Deepgram
сервис использует 4 модели для синтеза гиперреалистичной речи – Nova-2, Enhanced, Base, Whisper Large. Модели, помимо синтеза речи на основе текста, делают суммаризацию и анализ тональности, определяют тематику и намерения.
Tortoise TTS
синтезирует речь с использованием множества реалистичных голосов, учитывает указания на эмоции в тексте, клонирует голос.
Wondercraft AI
располагает библиотекой гиперреалистичных голосов для озвучивания текста, есть опция клонирования голоса. Предусмотрено автоматическое создание транскрипта и заметок. Готовые подкасты можно дублировать на любом из 24 доступных языков.
Coqui
предоставляет 5 гиперреалистичных голосов, поддерживает 7 языков.
Fluxon
5 реалистичных голосов на выбор, возможность клонировать любой голос по образцу, перевод аудио на другой язык.
PlayHT
генерирует человеческие голоса, неотличимые от настоящих. Имеет редактор для создания уникальных голосов персонажей. Предоставляет огромный выбор голосов – более 800, поддерживает 130+ языков.
VoiceMy
озвучивает текст, клонирует голос, обучает голосовые модели.
Recast AI
превращает лонгриды в сжатые интересные подкасты.