Проект: визуализация и озвучка рассказов, сказок и текстов.

Многие любят слушать аудиокниги только потому, что иногда даже самая любимая музыка не даёт удовлетворения и малость напрягает. Я отложил перо и бумагу лишь для того, чтобы вдоль и поперек исследовать эту неизвестную мне область и пришел к неожиданным результатам.
Для начала я попробовал использовать то, что есть и записал голос как есть. Прослушал и содрогнулся от ужаса. Страшный скрежет, хрип, невнятное произношение и непонятное бульканье было намного хуже ровного, монотонного и убаюкивающего голоса, известного многим, заставшим книги в формате awb для телефонов смартфонов Nokia под управлением Symbian
Что же делать? А давай я поставлю аудиодвижки на компьютере и преобразую текст в речь? Сказано - сделано! Я установил двигатель от Ивона и от Акапелла. Ивона порадовала платной лицензией и загрузкой условно-бесплатной тридцатидневной версией. Ну ладно, подумал я, и попробовал озвучить что-то произвольное. Но все, что можно от него добиться - это бездушный машинный голос с намеком человечности. Способов вывода из программы в отдельное аудио нет и поэтому требуется стороннее ПО.
Акапелла. Удалось найти версию для ознакомления со всеми нужными словарями произношения омографов, имен, чисел и т.д. Удалось прикрутить все это богатство к самой программе. Можно озвучивать текст в программной утилите, но в файл мп3 или любой другой вывести невозможно. Кстати, текст читает с интонацией, почти без ошибок с металлическими нотками. Неприятно, но можно потерпеть.
Я искал пути вывода в понятный формат и отбросил сразу запись с экрана как энергоемкий и ненадежный. Неудобно записывать целую книгу в мегабайт, затем обрезать, вырезать и склеивать, предварительно сконвертировав.
Остались онлайн сервисы. Существует бесплатная версия от яндекса и платная на основе яндекс. Сходство между ними в наборе голосов, но в платной версии можно выбирать высоту и скорость речи. Пример такого сервиса находится на сайте "звукограм", на котором можно, кстати найти еще целую библиотеку разных звуков для озвучки чего-угодно. Ссылку давать не буду, т.к. кто захочет, то сам найдет через гугл или любой другой поисковик. Набранный текст, любого количества знаков можно вывести в удобный формат мп3 или wav для дальнейшей обработки. Кстати говоря, мужские голоса намного приятнее, правильнее и благозвучнее женских.
Пример,
Ну раз Windows не обрадовала обилием программ, то может, Android поможет? И, таки, помог, собака! Обилие ломанных, легальных и полулегальных программ и голосовых движков радует глаз.
Из протестированных, полностью официальных и поэтому платных версий могу отметить голосовые двигатели Акапелла, Ивона и ВокалайзерЭкспрессив. К ним можно прикрутить словари и затем, отключив в настройках озвучку от гугла, использовать в дальнейшем в других программах. Забегая вперед, отмечу, что отнюдь не все процессоры в силах обработать такой объем информации. Например, Honor 8x напрочь завис и не захотел отойти от задумчивости до тех пор, пока я его не сбросил до заводских настроек.
Есть такая прога на андроиде под названием АндиоЛаб. Она платная в ПлейМаркете и может преобразовать текст в речь с использованным аудиодвигателем. И здесь, снова, мужские голоса предпочтительнее.
Существуют еще много других платных программ, например, для изменения голоса, но они носят развлекательный характер и не стоят положительного упоминания в этой статье.
Хочу отметить, что на Андроиде существуют множество других полезных программ, аналоги которых на windows стоят десятки тысяч долларов. Одна из них, названия которой я не успел записать на листочек бумаги перед тем, как Zte Axon 7 на snapdragon 820 пал жертвой перегрева батареи. Именно она смогла создать аудиофайл из множества аудиодорожек.
Нижеследующее видео слушать в наушниках!
При богатой фантазии, прямых руках, нужным концом приделанных к нужному месту можно сделать настоящий шедевр, главное, чтобы хватило мощности процессора смартфона.
Ну и наконец, визуализация.
Многого можно добиться от фотошопа и других подобных программ. Но самой простой и удобной в использовании я могу назвать iClone. Приложение действует по типу: воткнул и получил. Есть множество библиотек, которые можно скачать, допустим, на ... не скажу где. Важно: версии 6х и 7х работают только на 64битных системах не ниже Windows 7.
Всех поздравляю с новым годом и желаю счастья, удачных проектов, светлых мыслей и отличного настроения
Старая тема :))
Ничего у роботофф без человекофф не получится.
Большое спасибо за высокую оценку
Буду дальше копать в этом направлении. В конце концов, известные блогеры на ютуб каким-то образом добились же внятного, добротного произношения синтетических голосов. Наглядные примеры — каналы Риддл и Хаббл. Можно, конечно же спросить напрямую, но вопрос потеряется в тысячах комментариев и когда на него кто-то что-то ответит по теме — никому неизвестно…
Иногда смотрю передачи Хаббл (подписан на этот канал, люблю про космос и подобное) и вот что скажу — недоумевал, почему не могу выдержать больше 10-15 минут просмотра. Голос очень приятный, интонации расставлены идеально и тема видео интересная. Ролики, обычно, не более 10-15 минут и есть. Но несколько раз ставил часовую передачу и выключал после минут 20, удивлённо пожимая плечами. Да если б я такой один. Жена тоже любитель послушать, но вела себя точно так же.
К слову, книги известных декламаторов, слушаю по нескольку часов подряд и выключать не хочется.
Вот информация к размышлению теперь. Скорее всего нет — роботы здесь не заменят человека. Хоть и на слух не отличить от живого.
Возможно в новостных выпусках уместен подход, исследуемый Вами, но только не в творчестве.
ИМХО, конечно.
Российская эстрада?!
Вот сейчас Юрский и Андронников, глотая слёзы обиды, медленно начали вращаться в гробу. И зашевелился Игорь Ильинский.