Перейти к содержанию
Warlock700

RVC Jokes Pack - Нейросетевой модпак новых анекдотов для S.T.A.L.K.E.R.

Рекомендуемые сообщения

 

Приветствую Вас, Сталкеры.
Совместными усилиями представляем Вашему вниманию мод, разработанный на основе RVC Stalkers Voices для оригинальной трилогии серии Сталкер - RVC Jokes Pack. В модификацию входит расширенный состав анекдотов для всех группировок с сохранением оригинальных голосов каждого NPC. Общее количество уникальных анекдотов превышает 150 штук.

Демонстрация для тех, кому недоступен Youtube:


Над проектом трудились:
Stalk873 - автор идеи, сбор и корректировка материала, тестирование;
Аrtistpavel - адаптация материала под игровой движок, тестирование;
Warlock700 - озвучивание голосовых образцов и работа над их преобразованием в RVC, а так же обучение моделей;
Новые модели, обученные в ходе подготовки мода, уже доступны на Hugging Face по ссылке и профильной теме: RVC Stalkers Voices
Отдельная благодарность Сталкеру S.o.l.o.#13 за опубликованные в сети анекдоты.


Установка мода для оригинальных частей:
Разместите папку gamedata из архива для подходящей части (ТЧ, либо ЧН и ЗП) в папку с игрой.

Установка для клиентов с другими звуковыми модами:

Спойлер

В зависимости от состава и структуры имеющихся в клиенте модификаций, установка RVC Jokes Pack может отличаться. Необходимо учесть, какие голоса используются для файлов по пути: ...\gamedata\sounds\characters_voice\human_х\, где Х - номер NPC, а далее название группировки. Наибольшее внимание стоит уделить группировке Сталкеры , поскольку на протяжении серии их роли озвучивали Стальчук (ТЧ-ЗП), Розин (ТЧ) и Малуха (ЧН-ЗП).
Корректность работы на модифицированных клиентах не гарантируется, уточняйте информацию об организации аудиофайлов в профильных темах создателей модификаций и/или сборок. 

Модель распространения модификации и включение в сборки:
Свободная, с указанием авторства.

Ссылки для скачивания:
S.T.A.L.K.E.R. Shadow of Chernobyl


S.T.A.L.K.E.R. - Clear Sky and Call of Prypyat


Развитие проекта - патчноут:
23.09.2025 - релиз и загрузка модпака.

Изменено пользователем Warlock700
  • Лайк 4
  • Мастер! 2
  • Жму руку 1
  • Аплодисменты 1
  • Хабар 5
  • Спасибо 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 

Warlock700 Спасибо за контент. Мне в видео не понравилась громкая музыка. 

  • Жму руку 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 
5 часов назад, Cyrax сказал:

Warlock700 Спасибо за контент. Мне в видео не понравилась громкая музыка. 

Благодарю.) 

Несколько раз правил громкость музыки, возможно, что убавил недостаточно, хотя на "тестовом показе" претензий у смотрящих не было.

  • Лайк 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 

Вот бы ещё анекдоты из модов Андрюхи Святого забрать...

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 
39 минут назад, Supremeee сказал:

Вот бы ещё анекдоты из модов Андрюхи Святого забрать...

Особо модами не пользуюсь, поэтому не знаком с его работами, НО всегда есть RVC - можно преобразовать любые записи, какие захочется и в любой голос, который вздумается.)

  • Лайк 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 

Отличная идея и отличная реализация. :u1F44F.0::u1F44F.0::u1F44F.0:

И хотел спросить, не думали ли вы об озвучке вырезанных легенд и историй, которые рассказывают новички?  Они имеются только в озвучке Профа.

Истории, кстати, и в исходном текстовом виде сохранились. 

https://kamrad.ru/showthread.php?s=&postid=807986#post807986

  • Лайк 2
  • Мастер! 1
  • Жму руку 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 

Посмотрел работу, в целом вполне неплохо. Но мне кажется нейронка немного не дотягивает по произношению. Слишком однообразно читает предложения (хотя голос сам очень даже похож на оригинал), делает много неестественных пауз. В шутках же есть две части - Сетап и Панчлайн. И вот Панчлайн по интонации должен явно быть другой. Ну то есть в некоторых анекдотах неплохо вышло, в некоторых мне кажется нужно еще доработать. Для примера из вашего видео укажу таймкод 4:46 - мне кажется там видно то, о чем я говорю.

Тут уже вопрос к тому, как эта сеть вообще работает. Можно ли, например, актеру записать голос и преобразовать в голос персонажа (чтобы и голос был нужный, и тембр профессиональный)? Я так делал в русской озвучке своего мода через ElevenLabs. Если это уже делается, возможно актеру стоит перечитать реплики более живо. Но может быть это ограничение самой модели, тогда надо смотреть, можно ли это как-то улучшить, и найти другую основу (я бы порекомендовал ElevenLabs, но увы, они теперь без письменного разрешения владельца копировать голоса не дают).

Работа сделана добротная, было бы прикольно увидеть в модах. У себя сейчас я ухожу от концепции рандомных анекдотов в сталкере (приелось слышать одно и то же), но вот такие новые истории могли бы это изменить. Но опять же, пока что не все идеально, но дальше все зависит от того, какую планку реалистичности вы себе ставите. Некоторые вообще телеграм-ботом все озвучивают и не парятся, у вас конечно все в несколько раз лучше, но у себя я пытаюсь достичь результатов, когда нейронка неотличима от реального человека. 

  • Жму руку 1
  • Хабар 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 
40 минут назад, Sikorskyi сказал:

Отличная идея и отличная реализация. :u1F44F.0::u1F44F.0::u1F44F.0:

И хотел спросить, не думали ли вы об озвучке вырезанных легенд и историй, которые рассказывают новички?  Они имеются только в озвучке Профа.

Истории, кстати, и в исходном текстовом виде сохранились. 

https://kamrad.ru/showthread.php?s=&postid=807986#post807986

Спасибо за оценку.) Столь глобальная работа, тем более в кооперации с другими людьми, является первой из оконченных. Есть и другие, в том числе рассматриваются варианты по расширению фраз сталкеров. Подойдут ли для этого объемные байки, легенды и истории - вопрос спорный, поэтому материал надо предварительно отсортировать, где-то, возможно, отредактировать и др.
В любом случае спасибо за наводку, может быть для будущих проектов будет использована часть предложенного материала.
P.S.: В релизной версии аудиофайлы в озвучке Прохорова остались, либо искать надо в билдах?

 

  • Лайк 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 
9 часов назад, Supremeee сказал:

Вот бы ещё анекдоты из модов Андрюхи Святого забрать...

А что, у него там много особо смешных анекдотов в озвучке?

53 минуты назад, Sikorskyi сказал:

И хотел спросить, не думали ли вы об озвучке вырезанных легенд и историй, которые рассказывают новички?  Они имеются только в озвучке Профа.

Это ты про избушку в лесу, где стол как башня, про контейнер с артефактом и прочие? Эти, которые уже озвучены, можно попробовать преобразовать, но видишь в чём дело, если браться за легенды Зоны, то людям же надо и новые предоставить, которые они ранее не слышали, а тексты у них объёмные. Прямо скажем, до историй пока что руки не дошли, для начала надо на спрос поглядеть.

Изменено пользователем Stalk873
  • Мастер! 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 
2 часа назад, Mawrak сказал:

Посмотрел работу, в целом вполне неплохо. Но мне кажется нейронка немного не дотягивает по произношению. Слишком однообразно читает предложения (хотя голос сам очень даже похож на оригинал), делает много неестественных пауз. В шутках же есть две части - Сетап и Панчлайн. И вот Панчлайн по интонации должен явно быть другой. Ну то есть в некоторых анекдотах неплохо вышло, в некоторых мне кажется нужно еще доработать. Для примера из вашего видео укажу таймкод 4:46 - мне кажется там видно то, о чем я говорю.

Тут уже вопрос к тому, как эта сеть вообще работает. Можно ли, например, актеру записать голос и преобразовать в голос персонажа (чтобы и голос был нужный, и тембр профессиональный)? Я так делал в русской озвучке своего мода через ElevenLabs. Если это уже делается, возможно актеру стоит перечитать реплики более живо. Но может быть это ограничение самой модели, тогда надо смотреть, можно ли это как-то улучшить, и найти другую основу (я бы порекомендовал ElevenLabs, но увы, они теперь без письменного разрешения владельца копировать голоса не дают).

Работа сделана добротная, было бы прикольно увидеть в модах. У себя сейчас я ухожу от концепции рандомных анекдотов в сталкере (приелось слышать одно и то же), но вот такие новые истории могли бы это изменить. Но опять же, пока что не все идеально, но дальше все зависит от того, какую планку реалистичности вы себе ставите. Некоторые вообще телеграм-ботом все озвучивают и не парятся, у вас конечно все в несколько раз лучше, но у себя я пытаюсь достичь результатов, когда нейронка неотличима от реального человека. 

Огрехи в работе имеются, этого отрицать трудно и тут сразу комплекс факторов:
1) Непрофессиональность озвучки - я любитель самоучка, дикторскому и актерскому ремеслу не учился, да и в целом человек не особо яркий на эмоции. RVC старается перенять тон и эмоциональность донора, но на выходе имеется несколько факторов, которые могут способствовать ухудшению передачи этих характеристик. Поскольку пункт посвящен голосу, то подробнее посвящу ему внимание -  различие между голосом и интонациями модели с оригинальным голосом может привести к проблемах, вплоть до ухудшения дикции. Да и само озвучивание для RVC весьма специфично, причем не каждый голос удается корректно преобразовать. К слову, Прохоров очень плохо преобразуется любой моделью, хотя его модель работает нормально с другими. Часть голосов моих знакомых тоже не удалось подружить с RVC и тут неясно, то ли мой голос хорошо воспринимается RVC и большинством моделей, то ли научился наговаривать аудио для него - вопрос риторический...
2) Несовершенность самой RVC - в работе этой нейросети имеется очень много нюансов и тонкостей, часть которых и мне непонятны после использования проекта более, как год. В основной своей массе камнем преткновения является модель представления речи (сейчас стабильные результаты можно получить на contentvec), а так же предобученные базовые модели. Обе они разработаны на англоязычной базе голосов, либо мультиязычной, но с минимальным количеством образцов на русском в них. И если с предобученными базами ситуацию незначительно, но можно изменить, используя варианты от энтузиастов, то вот с моделью представления все еще имеются проблемы. Недавно вышел spin-v2 - доработанная версия spin, который ужасно работал с русской речью, а вот вторая версия показала себя неоднозначно. На момент работы над проектом он только вышел и я не провел достаточно тестов, чтобы начать повторное преобразование материала под него. К тому же, немного поджимали сроки, местами потерял оригинальный материал - пришлось приложить усилия, чтобы выпустить все в предполагаемые сроки и в полном объеме.
Возможно, что в будущем результаты значительно улучшаться, когда смогу разобраться в файнтюне моделей, использовании сторонних вокодеров, а так же параметров точности обучения. Не исключено, что я зря избегаю обучение в Applio, который заметно подтянулся за время своего существования, добавив очень много нового и требующего внимания в освоении.

По поводу 11Labs - знаком с данным проектом, пусть и не лично. Обсуждал специфику работы и выходной материал с данного сайта, даже подготавливал аудиозаписи для последующего преобразования в нем совместно с другим энтузиастом, делающих нейросетевые озвучки. Результат там действительно выходит очень перспективным, но бесплатно получить образец более, чем на несколько секунд, там не получиться. Так же, вроде, имеются ограничения работы данного ресурса для РФ пользователей.

По поводу развития проекта - если багов, недочетов и иных аспектов, которые возможно поправить, соберется много - выйдут новые версии данного модпака. Безусловно, хотелось бы, чтобы RVC заинтересовалось больше модмейкеров, но интерес к проекту оказался невысоким, преимущественно из-за сложности использования, отсутствия подходящего оборудования для записи и грамотного TTS для тех, кто не хочет заниматься озвучиванием самостоятельно. Все это вроде как развивается в проекте под именем Applio, но далеко не все нововведения оказываются перспективными, особенно для русскоговорящего сообщества. Имеются и другие перспективные TTS проекты, но пока что любая TTS при больших объемах данных, особенно нестандартных, проигрывает преобразованию аудио-в-аудио.

В отношении меня ситуация имеет такое состояние - использую исключительно локальные нейросети, преобразование в которых происходит из голоса-в-голос, поскольку TTS недостаточно хорошо, а главное просто и гибко, позволяет корректировать получаемые результаты.  RVC Jokes Pack - проект не идеальный, но явно достойный того, чтобы он мог выйти на свет. Если бы я начал шлифовать его, то либо проект затянулся, либо на каждый анекдот имелось бы по десятку дублей. К тому же, сам себе, обычно, являешься более жестким звукорежиссером, нежели чем третье лицо, а в данном проекте почти все присутствующие впервые имели опыт с модификацией такой направленности.

Все вышесказанное ни в коем случае не было сказано в укор, многие проблемы известны, но их устранение требуется много дополнительных усилий, проверок и обработок, часть перечисленного вовсе не удастся мне устранить собственными силами. Поэтому лично я был бы очень рад, если найдутся энтузиасты, которые смогут перехватит инициативу и мои наработки, чтобы создавать проекты в несколько раз лучше, чем выходит сейчас. 

Изменено пользователем Warlock700
  • Лайк 3

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 
1 час назад, Mawrak сказал:

у себя я пытаюсь достичь результатов, когда нейронка неотличима от реального человека. 

А увидеть результат возможно? Микродемку, так сказать.

1 час назад, Warlock700 сказал:

В релизной версии аудиофайлы в озвучке Прохорова остались, либо искать надо в билдах?

Здесь есть

 

  • Жму руку 1
  • Хабар 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 
12 минут назад, Sikorskyi сказал:

Здесь есть

 

Премного благодарен.) Будет возможность - послушаю, обдумаю, что можно использовать и возможно ли в принципе. 
На крайний случай, если Прохоров никак не "заведется" через RVC - сделаю транскрибацию через Whisper.

Изменено пользователем Warlock700

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 

Есть ещё одна история у монолитовцев, "О прорвавшихся к антеннам".

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 
6 минут назад, Sikorskyi сказал:

Есть ещё одна история у монолитовцев, "О прорвавшихся к антеннам".

Скидывайте, если ссылки имеются на руках и за ними далеко лезть в карман не нужно.) Однозначно пригодиться, если не для будущих наработок, то может мимо проходящие послушают/почитают.

Изменено пользователем Warlock700

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 
3 минуты назад, Sikorskyi сказал:

Есть ещё одна история у монолитовцев, "О прорвавшихся к антеннам".

Можешь её в тот же архив к остальным историям законопатить? А то потеряется потом. Я вроде бы, такой не встречал в модах.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 

Найду- кину

  • Мастер! 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 

Warlock700 спасибо за детальный ответ, я чуть больше начал понимать, как эта нейросетка работает вообще.

5 часов назад, Warlock700 сказал:

Результат там действительно выходит очень перспективным, но бесплатно получить образец более, чем на несколько секунд, там не получиться. Так же, вроде, имеются ограничения работы данного ресурса для РФ пользователей.

Да, там к сожалению бесплатно дают только pre-made голоса использовать, хотя многие из них сами по себе дойстойны, на озвучку обычных случайных сталкеров с ванильными голосами это не пойдет.

В плане ограничений - VPN с уникальным IP обходит ограничения. Главное чтобы с одного IP не подключалось много пользователей сразу, иначе они его в черный список добавляют (но аккаунты не блочат, то есть можно просто сменить VPN сервер). У платных аккаунтов такой проверки нет, то есть любой VPN сработает, но я с бесплатного юзаю пока почти без проблем.

4 часа назад, Sikorskyi сказал:

А увидеть результат возможно? Микродемку, так сказать.

 

Вот что у меня выходило для прошлого мода (рус и англ версии): https://drive.google.com/file/d/17AikttODd0R1jFUWHoNpK-wSmTyZYQ9u/view?usp=sharing

(все сделано на дефолтных голосах ElevenLabs , в рус озвучивал Вульф изначально, потом обрабатывалось; в англ полностью TTS с пониженным параметром стабильности, в записях может быть пост обработка так как часть НПС говорят по рации)

Изменено пользователем Mawrak
  • Аплодисменты 2

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 
10 минут назад, Mawrak сказал:

Warlock700 спасибо за детальный ответ, я чуть больше начал понимать, как эта нейросетка работает вообще.

 

Да, там к сожалению бесплатно дают только pre-made голоса использовать, хотя многие из них сами по себе дойстойны, на озвучку обычных случайных сталкеров с ванильными голосами это не пойдет.

В плане ограничений - VPN с уникальным IP обходит ограничения. Главное чтобы с одного IP не подключалось много пользователей сразу, иначе они его в черный список добавляют (но аккаунты не блочат, то есть можно просто сменить VPN сервер). У платных аккаунтов такой проверки нет, то есть любой VPN сработает, но я с бесплатного юзаю пока почти без проблем.

В случае, если Вам интересна тематика RVC, то более подробно я описывал принцип работы в профильной теме -  RVC Stalkers Voices, спойлеры в описанием в середине текста темы.

Только поверхностно знаком с 11labs, ибо не вникал из-за малой заинтересованностью именно TTS`ками, а так же версиями нейросетей, доступных только через сайт/подписки. 

По вопросам VPN - тут у меня персональное решение, которое не должно находиться в блок-листе: арендованная VPS машина с организованным на ней AmneziaVPN под различные протоколы. Для большинства задач хватает, но много аккаунтов с таких не создашь, ибо IP статический. Смена сервера в свою очередь происходит со скрипом, без аренды новой машины практически или не обойтись.

 

 

22 минуты назад, Mawrak сказал:

Вот что у меня выходило для прошлого мода (рус и англ версии): https://drive.google.com/file/d/17AikttODd0R1jFUWHoNpK-wSmTyZYQ9u/view?usp=sharing

(все сделано на дефолтных голосах ElevenLabs с пониженным параметром стабильности, в рус озвучивал Вульф изначально, потом обрабатывалось; в англ полностью TTS, в записях может быть пост обработка так как часть НПС говорят по рации)

Очень и очень достойно, особенно в плане чистоты записи. RVC на такое либо совсем не способен будет, либо с огромными усилиями по предобработке оригинального аудио, потом дата-сета, а затем постобработке полученного на выходе. 
С эффектом рации, к слову, нейросетки почти всегда замечательно звучат, даже RVC, даже TTS.

Не пробовали один из недавних проектов - VibeVoice? Демонстрации видел, но собрана была нейронка под ComfyUI, у этого сборщика на Gradio: https://t.me/neuroport/413

 


Дополнено 7 минуты спустя

Забыл еще добавить один момент, связанный с моделями и использовании их в проекте: дата-сеты для обучения только очищались от шума, поскольку одной из задач было достижение того же качества звучания, что в оригинальной серии, где аудиозаписи имеют шумы. RVC на подобное любит триггерится, поэтому пришлось делать обработку хотя бы от шумов, без эквализации, нормализации, сатурации, компрессии и/или иных эффектов.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 
2 часа назад, Warlock700 сказал:

Не пробовали один из недавних проектов - VibeVoice? Демонстрации видел, но собрана была нейронка под ComfyUI, у этого сборщика на Gradio: https://t.me/neuroport/413

Я честно говоря наоборот забил на локальные модели. Плавал, пробовал, тренировал - выходило полное говно. Потом вышел ElevenLabs и я просто удалил все свои модели и датасеты потому что это было как средневековая карета против внедорожника.

Понятное дело сейчас все модели подтянулись, но с этим всегда было слишком много мороки, это занимает долгое время и уничтожает железо (если мое вообще вывезет).

Судя по семплам и видео VibeVoice оно недотягивает по контролю над эмоциями. Мне приходилось работать с профессиональными актерами, у меня есть представление на что они способны, что делает речь живой. В первую очередь это именно эмоции и естественное произношение. Проблема в том что нейронки люди тренируют для новостей, рекламы, подкастов, ботов-автоответчиков. В играх или мультфильмах, скажем, такое не пойдет совсем, там свои подходы и правила. ElevenLabs дает мне то что я хочу либо через Speech to Speech (русский язык чистый TTS не вытягивал, хотя возможно надо было брать изначально русские голоса), либо через понижение стабильности - это что-то типа рандомизатора аутпута. Эмоции выдаются по контексту и мега рандомно, и половина аутпутов идет в мусор, но есть потенциал получить что-то замечательное. В других нейронках часто выходит без эмоций, криков, угроз, радости, голос не понимает контекст фразы, не вписывается в игровую ситуацию, а следовательно я не могу его использовать.

Так как это закрытая модель я понятия не имею как она работает, но она делает ровно то, что мне нужно, хотя редко с первой попытки, но без кучи страданий и потерянного времени. Дотренировка кастомного голоса занимает несколько минут (когда у меня еще был доступ к этой фиче) и ему требуется буквально минут 5 аудио на модель.

Изменено пользователем Mawrak
  • Мастер! 1
  • Аплодисменты 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 
22 часа назад, Warlock700 сказал:

Скидывайте, если ссылки имеются на руках и за ними далеко лезть в карман не нужно

entrance.7z Из билда 2588. История монолитовцев.


Дополнено 10 минуты спустя

И еще кое-что.

Изменено пользователем Sikorskyi
  • Хабар 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
 
20 часов назад, Mawrak сказал:

Я честно говоря наоборот забил на локальные модели. Плавал, пробовал, тренировал - выходило полное говно. Потом вышел ElevenLabs и я просто удалил все свои модели и датасеты потому что это было как средневековая карета против внедорожника.

Понятное дело сейчас все модели подтянулись, но с этим всегда было слишком много мороки, это занимает долгое время и уничтожает железо (если мое вообще вывезет).

Судя по семплам и видео VibeVoice оно недотягивает по контролю над эмоциями. Мне приходилось работать с профессиональными актерами, у меня есть представление на что они способны, что делает речь живой. В первую очередь это именно эмоции и естественное произношение. Проблема в том что нейронки люди тренируют для новостей, рекламы, подкастов, ботов-автоответчиков. В играх или мультфильмах, скажем, такое не пойдет совсем, там свои подходы и правила. ElevenLabs дает мне то что я хочу либо через Speech to Speech (русский язык чистый TTS не вытягивал, хотя возможно надо было брать изначально русские голоса), либо через понижение стабильности - это что-то типа рандомизатора аутпута. Эмоции выдаются по контексту и мега рандомно, и половина аутпутов идет в мусор, но есть потенциал получить что-то замечательное. В других нейронках часто выходит без эмоций, криков, угроз, радости, голос не понимает контекст фразы, не вписывается в игровую ситуацию, а следовательно я не могу его использовать.

Так как это закрытая модель я понятия не имею как она работает, но она делает ровно то, что мне нужно, хотя редко с первой попытки, но без кучи страданий и потерянного времени. Дотренировка кастомного голоса занимает несколько минут (когда у меня еще был доступ к этой фиче) и ему требуется буквально минут 5 аудио на модель.

Могу Вас понять, ибо и сам прекратил на длительное время работать с RVC именно по причине низкого выходного качества, которое и меня не устраивало. К тому же раньше озвучивал материал еще менее эмоционально, что приводило к спорным результатам. А в вопросах железа и затраченных на обучение мощностей и вовсе добавить нечего, ибо сожженные киловатты электроэнергии говорят сами за себя. 
Подтянется ли качество еще, как у Applio, так и обучение моделей - неизвестно, однако в любом случае конечный материал будет зависеть от профессиональности озвучки, которую, увы, обеспечить не могу, поэтому приходиться пытаться и делать то и так, как удается.

Из-за незаинтересованности в TTS слушал материал бегло, в поездке с работы, поэтому качество оценил лишь поверхностно. Увы, сожалению о потраченном Вами времени на оценку проекта. Может быть в будущем качество улучшиться, ибо было в планах рассказать о разных TTS`ках на форуме, но, возможно, стоит еще подождать некоторое время.
11labs, конечно, действительно во многих вопросах прыгает на голову выше большинства сервисов по работе с аудио. Наверное, только в вопросах работы с вокалом он проиграет RVC, но это и не его профиль. Не исключено, что у RVC профиль был именно в создании каверов, поскольку я с проектом познакомился именно по таким роликам.
В вопросах обучения моделей для большинства нейросеток - да, особенно если проекты коммерческие, то материал в них будет взят исключительно с открытого доступа и по свободной лицензии, что накладывает отпечаток на качество. Возможно, что у 11labs с этим делом дела куда лучше, либо использование работ профессиональных дикторов и актеров озвучивание просто не озвучивается. Не исключено, что как раз ввиду закрытости моделей.

Для меня же 11labs является весьма неудобным решением по описанным ранее причинам, необходимости подписки и/множества аккаунтов, а так же скрупулезному сбору выходного материала из коротких аудиофайлов. Моего терпение просто не хватит на подобное. Сужу по опыту энтузиаста, о котором упоминал ранее.
Увы, про дотренировку ничего сказать не могу - сервисом самолично не пользовался.

В любом случае - огромное спасибо за то, что потратили время и усилия на то, чтобы ознакомиться и оценить проект, а так же рассказать и даже показать те работы, которые входят в состав Ваших проектов. Безусловно жаль, что имеющийся материал не оказался для Вас потенциально полезным, но зато Ваша конструктивная критика оказалась полезна для меня - это явно повод сделать новые версии для правки хотя бы части допущенных косяков. 
Как говорится - первый путь к изменению начинается с признания своих ошибок...)


Дополнено 2 минуты спустя
1 час назад, Sikorskyi сказал:

entrance.7z Из билда 2588. История монолитовцев.


Дополнено 10 минуты спустя

И еще кое-что.

Благодарю.) Скачал, буду знакомиться со всем комплексно, когда процесс дойдет до работы над новым проектом.

По аудиозаписи - вроде бы подобное было в релизе. Имею ввиду, что находилось в файлах, но не было присвоено каким-либо NPC, хотя могу и ошибаться, поскольку при сортировке у меня была задача определять звучащий голос, а не вслушиваться в то, что произносят актеры.

Изменено пользователем Warlock700

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Для публикации сообщений создайте учётную запись или авторизуйтесь

Вы должны быть пользователем, чтобы оставить комментарий

Создать учетную запись

Зарегистрируйте новую учётную запись в нашем сообществе. Это очень просто!

Регистрация нового пользователя

Войти

Уже есть аккаунт? Войти в систему.

Войти

  • Последние посетители   1 пользователь онлайн