Перейти к содержанию

Warlock700

Сталкеры
  • Публикаций

    76
  • Зарегистрирован

  • Посещение

  • Победитель дней

    1

Весь контент Warlock700

  1. Судя по всему Вы скачали не скомпилированную версию, а ту, которую необходимо самостоятельно собирать. По этой ссылке можно скачать скомпилированные версии Applio: https://huggingface.co/IAHispano/Applio/tree/main/Compiled
  2. В описание добавлены ссылки на Applio и RVC-TTS. Первый проект является fork`ом оригинальной RVC. Помимо доступного функционала RVC в Applio имеется встроенный Test-to-Speech, а так же доступен алгоритм FCPE, который выдает более лучшие показатели преобразования, в сравнении с RMVPE. RVC-TTS в свою очередь является проектом для озвучивания текста в речь на движке Edge с последующим преобразованием полученного результата голосовыми моделями.
  3. К сожалению, но на текущем этапе проекта RVC подобное часто встречается у всех моделей. Это связано с двумя моментами: англоязычным претрейн (заранее обученная база голосов) и модель hubert_base. Если первое можно исправить ру-претрейном, то вот второй момент пока никак не поправить. Может быть со временем энтузиасты смогут сделать hubert_base для RVC для русскоговорящих голосов, но пока что никаких новостей. Только-только стали появляться hubert_base на других языках...
  4. Протестирована и загружена модель голосов персонажей, озвученных Иваном Розиным (Гонта, Гаваец и др.) Обновлено описание. Демонстрация возможностей:
  5. В отношении нейросетей пока еще законодательство мало способно регулировать данный процесс, но учитывая, что труда будет затрачено много, то Вам явно не хотелось бы столкнуться с иском в свою сторону в будущем. Здесь вижу следующие варианты событий: Пункт 1: (обязательный) Подготовка датасетов для создания голосовых моделей на основе фраз из игры с их сортировкой либо по актерам, либо по актерам, манере и тональности озвучки. Не исключено, что из 10 женских голосов в озвучивании принимали участие лишь три актрисы, а для мужских голосов - 5 актеров; Пункт 2: (обязательный) Создание голосовых моделей на основе полученных дата-сетов; Пункт 3: (вариантивный) Озвучка всех одним человеком, либо группой на русском языке с их последующим преобразованием голосовой моделью желаемого персонажа (актера); Пункт 4: (вариантивный) Подготовка необходимых фраз с помощью любой утилиты Test-to-speech с последующим преобразованием полученных результатов голосовыми моделями желаемых персонажей. (актеров)
  6. Если Вы имеете ввиду преобразование английской аудиодорожки с получением русского языка, то нет - это невозможно. Если Вы имеете ввиду создание модели на основе англоговорящего голоса с последующим его применением при преобразовании русской речи, то да - это возможно, но зачастую будет присутствовать акцент. Этот эффект возможно немного минимизировать, если использовать индекс от Snowie по улучшению речи из EN в RU, а так же если обучить саму голосовую модель на ру-претрейне.
  7. Протестирована и загружена модель Лебедева. Обновлено описание. Демонстрация возможностей:
  8. Теперь дошло.) Часть из них даже есть в релизе, но судя по всему не все, иначе вряд ли бы Вы заговорили о билдах. В архиве "dialogs" и он, и билдовский Сахаров, и Сидорович был. Да, кстати. Почему-то до такой идеи я не додумался. Наверное потому что не вслушивался и главной идеей была сортировка, а не анализ сказанного. Файлик гляну, когда появится настроение сделать "благотворительную" озвучку. Думаю, что он мне очень пригодиться в тот момент.) Спасибо.) Добро. Когда закончу с Метро и займусь все распределю - примусь за эти билды. Спасибо еще раз.)
  9. Не совсем понял про "как раз есть для всех диалогов". Имеете ввиду, что в билдах присутствует больше диалогов Вилкова? Спасибо, пороюсь в материалах на данном сайте. У Вас есть совет по тому, какой лучше скачать для набора наибольшего числа вырезанных фраз? За исключением Прохорова, его у меня в достатке.) 40 минут, если вдруг не говорил. Можно, конечно. С помощью Applio, либо RVC TTS, но я всегда "живость" модели проверяю посредством преобразования голоса. Только в этом случае я сужу о качестве модели. Именно по этой причине я не выложил недавно практически полностью готового Лебедева - непонятно с чего начал акцент выдавать. UPD: Я поступил проще - качаю все билды ТЧ, нашел ссылку на этом же форуме с торрент файлом.
  10. У меня билдовских фраз Бармена в наличии нет, только черновые Прохорова, которые уже были использованы для тренировки его модели. Не подскажите, где можно проверенные ссылки раздобыть на билды ТЧ? Еще лучше, конечно же, если сможете их скинуть - буду премного благодарен, не придется тогда еще сортировать фразы с билдов, тем более, что те будут повторяться. Хотя, наверное, со временем и это стоит сделать. Да, Воронина вроде тоже Вилков озвучивал. С долговским голосом у меня записей достаточно, чтобы еще модель обучить. Насчет расшифровок фраз - возможно пригодиться, конечно, но пока не хватает энтузиазма, чтобы наговорить разных фраз для мододелов - своего рода "благотворительную" озвучку сделать.
  11. Если Вы делали модель с помощью RVC, то с того момента много поменялось - добавили новые алгоритмы, вышла вторая версия претрейна, русские претрейны тоже вышли. К тому же, я больше позиционирую проект не для преобразования результатов из text-to-speech, а для преобразования голоса, будь то один человек, либо же группа "озвучеров". Только в этом случае, как мне кажется, можно получить достойный результат, который не стыдно будет добавлять в моды. Да, полностью согласен - голос узнается слабо на Вашем ролике, повлиял на это ограниченный дата-сет, либо преобразование голоса из text-to-speech результата - сказать трудно. У бармена прям совсем мало фраз, поэтому лучше всего добавить схожих по манере произношения фраз долговцев или других персонажей, которых Вилков озвучивал. Того же Сидоровича из ЧН, к примеру.
  12. Не у всех моделей хватает эмоциональности для TTS. Но Вы можете попробовать найти в глобальной сети TTS хорошим голосом, а затем в последствии преобразовать полученный результат в RVC. Мне кажется, что так лучше будет.
  13. Вы воспользовались TTS какой программы? Вроде как RVC TTS выдает довольно неплохие результаты и, как я заметил, зачастую для женских голосов. Мужские далеко не всегда выходят хорошо.
  14. Совсем нет, но уже не первый месяц занимаюсь данным делом, поэтому определенный базис успел накопиться...)
  15. Практически все, кроме определенных фрагментов в роликах, создано на основе преобразования голоса. RVC Text-to-speech - немного другой проект, хоть так же способен преобразовывать голос, заранее сгенерированной движком Edge. В этом случае Вам либо необходимо скачать его по ссылке: Либо же Вам необходим проект, за основу которого взята оригинальная RVC, но у которой есть собственный разработчик. Говоря иначе - это Fork RVC от Hispano, а именно - Applio. Этот fork способен и обучать голосовые модели, и преобразовывать аудиофрагменты, и имеет свой TTS. В проекте много экспериментальных функций, не все из них разработчик довел до ума: Дополнено 7 минуты спустя Именно так, если говорить о Вилкове. К слову, я уже отсортировал все сюжетные фразы и только там он наговорил в трех частях чистым голосом за 16 минут, а ведь есть еще диалоги NPS для каждой группировки. Так что можно смело сказать, что материала Вилкова достаточно. На очереди сортировка первых двух частей Метро, все так же фразы из сюжета. После того, как я закончу со всем голосами метро и сталкера, выполню окончательную сортировку на основе тембров, высоты и характерных черт, то начну выпускать модели на разных предобученных базах. (их на текущий момент не меньше 3 набралось) После того, как я это сделаю - проект RVC Stalker Voices можно будет считать полностью готовым, пока не выйдет новая версия RVC. Поэтому, по поводу Череватенко, если Вы выполните сортировку - это только ускорит выход модели Бороды и других персонажей, озвученных его голосом, но никак не поможет проекту в целом.
  16. На какой именно голос из сталкера там похож Александр Вилков? Дело в том, что фраз того же Долга в Метро и Сталкер набирается с запасом, даже перебором. А вот другие голоса присутствуют либо в ограниченном количестве, (Сидорович ЧН, Бармен, Новиков) либо же они схожи с тем, которым Виклов озвучивает долговцев.
  17. Если Вы самостоятельно наберете фразы непосредственно из распакованных файлов, без эффектов рации и надетого шлема, то будет замечательно.) К сожалению, но не научился избавляться от данных эффектов, возвращая голосу обычное звучание, поэтому подходит для обучения только чистый голос.
  18. Попробую, но насколько я помню - у него не больше, чем 3-4 минуты набирается. Этого может быть мало для хорошей модели, но попытка - не пытка...)
  19. Протестирована и загружена модель новичков в озвучке Руслана Гофурова. Обновлено описание. Демонстрация возможностей: Дополнено 34 минуты спустя Протестирована и загружена модель Ковальского из Сталкер ЗП и Мельника из Метро 2033. Обновлено описание. Демонстрация возможностей: Дополнено 14 минуты спустя Протестирована и загружена модель Прохорова. Обновлено описание. Демонстрация возможностей:
  20. В зависимости от того, что Вы пытались сделать. Если Вы хотели внедрить Tensorboard в RVC, то да - без этого не обойтись. В остальном - все должно работать сразу, остальные случаи являются исключением. Не смогу сказать, насколько много материала имеется в озвучке Руслана Гофурова. Надо будет полазить в распакованных "ogg`шках"... Дополнено 3 минуты спустя Это все-таки text-to-speech, он зачастую проигрывает преобразованию живого голоса. Но сам факт имеется - голос любой модели можно сделать "говорилкой" текста. Конкретно применение из ролика такое себе, имхо... И я скорее про содержание, а не озвучивание. Дополнено 20 минуты спустя По преобразованию я на текущий момент могу только предоставить запись со стрима, где в реальном времени занимаюсь процессом. Ролик длинный, присутствуют моменты, в которых занимаюсь не преобразованием, а объяснением, в том числе по созданию AI каверов. Поэтому рекомендовать к просмотру могу только тем людям, у которых есть много свободного времени. Для полноценного и целенаправленного гайда я привык писать сценарий, что займет уйму времени. Порою маленький абзац придумать для персонажа - это задача на минуты 3, а для работы с RVC необходимо создать видеоматериал на минут 20-30, если не больше. Во всяком случае исходя из плана, имеющегося в голове. Для подобного нужно и вдохновение, и много свободного времени. Из своей практики по другим роликам написать сценарий и записать аудиоматериал - это на 15-20 часов чистого времени. Можно, конечно, "отстреляться" за 3-5 минут, но боюсь, что вопросов после такого гайда будет больше, чем ответов. И даже на такой гайд в качестве "галочки" необходимо время. Собственно, запись стрима:
  21. Не сказал бы, что процесс трудный. Что RVC, что Voice-Changer - проекты скомпилированные. Для них даже не требуется устанавливать Python, все уже есть папке программы с прописанными путями и зависимостями. С некоторыми модификациями посложнее будет, ведь всего-то требуется: Скачать подходящий архив с RVC; Распаковать; Переместить от имеющейся модели файл .pht в папку assetc\weight, а .index в в папку logs; Запустить .bat файл и пользоваться. Как по мне - сложнее подбирать параметры для преобразования голоса, поскольку это процесс не только творческий, но и требовательный к оригинальной аудиодорожке. Для получения хорошего результата может потребоваться не раз перезаписать голосовой фрагмент.
  22. Основная сложность - наличие качественного микрофона и производительных комплектующих. Наибольшие требования имеются к преобразовании голоса в реальном времени, в то время как для преобразования готового аудиоматериала со снижением производительности устройства увеличивается время на получение готового файла.
  23. Протестирована и загружена модель Лесника. Обновлено описание. Демонстрация возможностей: Дополнено 42 минуты спустя Протестирована и загружена модель коменданта Халецкого. Обновлено описание. Демонстрация возможностей:
  24. Протестирована и загружена модель майора Дегтярева. Обновлено описание. Демонстрация возможностей: Дополнено 5 минуты спустя Протестирована и загружена модель отца Валерьяна. Обновлено описание. Демонстрация возможностей: Дополнено 6 минуты спустя Протестирована и загружена модель Чехова и других бойцов Свободы, озвученных Григорием Германом. Обновлено описание. Демонстрация возможностей:
  25. Пока только от других пользователей. Постараюсь в ближайшее время создать ролик и напишу текстовую инструкцию. На примере создания AI Cover и сообщения для одного из пользователей, который задал тот же вопрос: Вам необходимо скачать программу RVC-Project, к примеру с официального репозитория разработчика: https://huggingface.co/lj1995/VoiceConversionWebUI/tree/main Если у Вас видеокарта от Nvidia с поддержкой CUDA ядер, то качайте архив RVC1006Nvidia.7z, а если AMD, либо нет CUDA ядер, то RVC1006AMD_Intel.7z. После того, как архив скачан и распакован - запускаете .bat файл go-web.bat и перейдите на сервер RVC. Чтобы было возможным подменять голос - модель нужно добавить. Необходимо файл расширения .pht переместить в папку ...\RVC\assets\weights, файл расширения .index советую разместить в папке ...\RVC\logs. Инструкция для Voice-Changer, так же с ютуба: Дополнено 4 минуты спустя А если разработки в данном направлении продолжаться, а так же переделаю свои голосовые модели, то остальное останется за малым - найти человека с хорошим поставленным голосом и актерскими талантами и дело в шляпе...)

Важная информация

Мы разместили cookie-файлы на ваше устройство, чтобы помочь сделать этот сайт лучше. Вы можете изменить свои настройки cookie-файлов, или продолжить без изменения настроек. Оставаясь на сайте, вы подтверждаете свое согласие на их использование. Политика конфиденциальности | Условия использования