-
Публикаций
76 -
Зарегистрирован
-
Посещение
-
Победитель дней
1
Тип контента
Профили
Форумы
Блоги
Календарь
Новости
Моды
Моды S.T.A.L.K.E.R. 2
Весь контент Warlock700
-
Обучены модели на contencvec и точности fp32. Удалены старые модели Череватенко, Терещука и Плахова, размещены на Hugging Face: Мельник из Метро 2033: Исход, пресет no_noise-normalization; Череватенко - полный дата-сет, пресет no_noise-normalization; Плахов - полный дата-сет, пресет no_noise-normalization. Вилков - Сидорович, пресет no_noise-normalization-de_esser-compression; Подубинский - Сидорович, пресет no_noise-normalization-de_esser-compression; Терещук - полный дата-сет, пресет no_noise-normalization;
-
Да и снова да, все ссылки имеются в описании темы. Чем выше версия, тем больше имеется функций и изменений в Applio: https://huggingface.co/IAHispano/Applio/tree/main/Compiled/Windows
-
Я не использую онлайн сервисы - только локальное обучение и преобразование. Предпочтительнее, конечно, использовать локальный вариант работы с моделями, в нынешних реалиях себя хорошо показывает Applio, поскольку обладает множеством настроек и постоянно совершенствуется. Скорость обработки аудио зависит от мощности Вашего ПК, а так же длины аудио. На просторах сети есть энтузиасты, которые размещают свои fork`и и дают возможность преобразовывать материал. Либо ищите colab`ы. Нейросети же предлагают для данных задач Voice.ai и MimicPC. Возможно, что где-то найдете еще онлайн клиенты, если поищите в профильных темах в сети. Увы, ссылка с одним таким у меня затерялась, да и версия там не факт, что новая. Applio в online - ссылка недоступна или удалена. В вопросах сложности - сев на пару часов за любой проект, можно будет очень быстро разобраться, а учитывая обилие других нейронок - руководство, как работать с тем же Applio, можно даже бесплатно получить.
-
Приветствую. RVC и Applio (fork RVC) работают только при преобразовании аудио-в-аудио. Лучше всего, конечно, иметь качественный голос и чистую запись, но можно добиться хорошего звучания, если аудиодорожка будет без посторонних звуков и, по возможности, предварительно очищена в аудиоредакторе.
-
Рад, что анекдоты понравились.) Над озвучкой бандитов пыхтел несколько часов к ряду, чтобы хотя бы немного приблизиться к колоритным бандитам, а вышло уже так, как есть в модификации, и вряд ли получиться улучшить...
-
Удалены старые модели, обученные на hubert-base, hubert-japanese и hubert-chinese. Сохранены только модели, обученные под contentvec и точность fp32. Исключение: полные модели Плахова, Терещука, Череватенко и Мельникова. Как только будут обучены их contencvec fp32 версии - текущие будут удалены. Убраны все ссылки в теме, ведущие на Weight-GG, ввиду смены направленности сайта и/или его продажи. На текущий момент лишь одна модель не была загружена на Hugging-Face - модель Мельника из Метро Исход. Поскольку сортировка аудиоматериала конкретно этой части не была произведена - дата-сет будет обучен на тех данных, которые удалось собрать при первоначальном обучении. Изменены ссылки на Youtube канале. Ролик-новость о закрытии Weight-GG запланирован позднее.
-
Честно, мне хорошо известен только RVC, поскольку среди локальных нейронок он один из немногих, кто выдает качественный результат среди audio-to-audio. Тут же не только audio-to-audio, но еще и дубляж на другой язык, а подобное среди локальных нейросетей я не наблюдал.
-
Что русский, что украинский языки - довольно схожи между собой, поэтому перевод из одного в другой не будет сильно бросаться в уши. Какая модель - ответить затруднюсь, потому что не интересовался этим направлением. Думаю, что 11labs или схожие по мощности и качеству ресурсы, вряд ли это что-то локальное, хотя кто знает. А может быть они вовсе сделали не перевод, а переозвучили - кто знает?) Оригинал я не смотрел.
-
Благодарю за информацию, уже давно перестал грузить модели на weight.gg, но там потенциально могут находиться модели, экземпляры которых не сохранил локально. Основную ссылку они уже поменяли - теперь это другой сайт, а модели будут до конца марта по прямым ссылкам загружаться. До этого периода постараюсь сделать информативный ролик и поменять везде ссылки.
-
На текущий момент обучалась последняя модель (Мельника из Исхода не считаем - дата-сет не полный) на точности fp32 - Прохоров-full. Дальнейшее обучение моделей будет иметь экспериментальный характер и в случае, если "опыты" пройдут успешно - модели получат дополнительные новые версии. Старые модели, обученные на hubert_base будут в ближайшее время удалены, ввиду низкой релевантности после ввода в обучение contentvec и fp32.
-
Загружены новые модели, обученные с повышенной точностью fp32: Яценко - Военные Припяти; Вилков - Сидорович. Добавлены модели, обученные с повышенной точностью fp32 для ранее загруженных: Борисенок - Лесник; Борисенок - Сахаров; Подубинский - Сидорович; Пашин - Ковальский (теперь модель отдельно от Мельника); Тимошенко - Халецкий; Герман - Валерьян; Пашин - Мельник; Пашин - Рассказчик Зова Припяти; Стальчук - Лебедев; Мороз - Дегтярев; Прохоров - полный дата-сет. (Метро+Сталкер) Все модели доступны на Higging Face - https://huggingface.co/Warlock700 Внесены изменения в описание темы: - Добавлены ссылки на новые модели в описании темы; - Добавлены в описание ссылки для моделей, которые получили новые версии с момента релиза;
-
Добавлены новые модели для каждой группировки в высокой точности FP32. Совместимость гарантирована с версией Applio 3.2.9 и выше. Для некоторых моделей загружено несколько вариаций; Розин - Сталкеры; Стальчук - Сталкеры с Чистонебовцами, а так же Сталкеры с Чистонебовцами в противогазе,; Герман - Бандиты, Бандиты в противогазе, Наемники, Наемники в противогазе, Чехов; Терещук - Бандиты, Военные, Военные в противогазе, Наемники NPC-2 из ТЧ; Малуха - Новички и Экологи; (по умолчанию в противогазах) Череватенко - Монолит; (по умолчанию в противогазе) Богуш - Свобода и Свобода в противогазе; Вилков - Долг и Долг в противогазе, Чистонебовцы; Гофуров - Новички; Зорин - Флинт. Все новые модели доступны на Higging Face - https://huggingface.co/Warlock700 Внесены изменения в описание темы: - Добавлены ссылки на новые модели; - Добавлены ссылки для моделей, которые получили новые версии с момента релиза; - Внесены дополнения к обозначениям в названиях новых моделей.
-
Вышел в релиз первый фикс модпака, который включает в себя внесение правок для группировки Свобода. Все анекдоты были заново переозвучены, а так же преобразованы новыми моделями повышенной точности. Релиз уже доступен по обновленным ссылкам в описании. Небольшая демонстрация, а так же новости канала и не только:
-
Благодарю.) Хорошо, что я истории Прохорова оставлял. Не знаю, все ли уникальные - надо переслушивать, но файлов с таким именем насчитал 50 штук. Переслушаю все и когда займусь расширением голосовых фраз для NPC, то попробую Прохорова преобразовать. Не факт, что выйдет успешно - со старыми моделями его голос с RVC не дружил, но если процесс пройдет удачно - мне будет меньше работы.)
-
Спасибо.) Потихоньку развиваю, переделал около половины анекдотов Свободы. Стало заметно лучше, живее, чище и ближе к оригинальному голосу. Можете сами послушать - я периодически выкладываю shorts`ы. Конкретно этот использует сразу комбинацию - переозвученные дубли и преобразование новой моделью: Дополнено 9 минуты спустя За основу взяты оригинальные игры. Если быть честным, то очень трудно представить, как суровые и холоднокровные убийцы травят анекдоты возле костерка. Не знаю, как представлена в Anomaly группировка, но у меня и моих компаньонов имеется такое же представление, что описал ранее. Наемники и Монолитовцы получат новые фразы, но уже в другом проекте. Не хотелось бы прыгать из одного проекта в другой, поэтому хочется выпустить полноценный фикс для RVC Jokes Pack, а только потом браться за другой.
-
Основа анекдотов (сценарий) пока меняться не планируется, насчет интонаций - тут уже начал работы по переозвучке и преобразованию на новых моделях. По ссылке выше, на бусти, можно послушать, как было и как станет, когда выйдет первый фикс. Пока не знаю, как поступить лучше - частые релизы, либо редкие, но с внесением большого числа правок. То есть пока что рассматриваю два варианты - доделать какую-то конкретную группировку и залить пак, либо доделать все полностью и лишь тогда добавить. Небольшое расширение анекдотов (штук по 5-7) тоже будет, но это не приоритетная задача сейчас.
-
Пользуемся моментом, пока не настали времена, когда "восстали машины из пепла ядерного огня"...) (с) Дополнено 0 минут спустя Для удобства и возможной поддержки канала в будущем, оформлен Boosty, куда буду выкладывать черновые работами по данную проекту и не только - https://boosty.to/warlock7oo Весь доступный контент не требует подписки - все открыто и прозрачно. Не призываю оформлять подписки или отправлять донаты - это исключительно добровольная прерогатива. Скорее даже наоборот - не подписывайтесь, если хотите какого-либо уникального контента, особенно если с деньгами туго и особенно если учитывать, что имею тенденцию надолго перегорать к проектам. Теперь о самой цели регистрации Boosty - поделиться с желающими процессом создания материала и черновыми работы, где-то это будут сценарии, недоделанные и/или потерявшие актуальность ролики, может быть даже забавные моменты в ходе работы над проектами или жизни в целом. На текущий момент уже выложен пост с примерами пары анекдотов для военных. Это не окончательные варианты, которые будут внесены с правками, поэтому если переозвученный материал не понравится - не переживайте, не факт, что он попадет в обновление сборки в том виде, что Вы услышали.
-
Результаты в скриншотах, конечно, впечатляют. Особенно учитывая, что таким образом прокачана ТЧ. Да у меня вид с окна в "меньшем разрешении", чем на них.)
-
Спасибо за добрые слова и Ваши пожелания.) На ютубе еще далеко не все выложено, а так же появляться будет новый материал в short`ах с уже внесенными правками. Начал переобучать модели, возможно, что сделаю некоторым анекдотам переозвучку. Но что верно, то верно - основной задачей было именно сохранение стилистики. И, судя по всему, с этим справится удалось.)
-
Были допущены критические, но при этом до банального смешные ошибки в пути. Если Вы скачали модпак для ЧН+ЗП до этого, то просьба перекачать модпак или вручную перенести файлы в папке gamedata из sound в sounds. Перепутаны были еще пути для типов NPC - корректное имя пишется с нулем, пример: human_01. По аналогии с предыдущей ошибкой - перенесите файлы из human_1 в human_01 и т.д. Плохой идеей было по памяти прописывать пути к папкам...) На момент написания поста ошибки поправлены.
-
Могу Вас понять, ибо и сам прекратил на длительное время работать с RVC именно по причине низкого выходного качества, которое и меня не устраивало. К тому же раньше озвучивал материал еще менее эмоционально, что приводило к спорным результатам. А в вопросах железа и затраченных на обучение мощностей и вовсе добавить нечего, ибо сожженные киловатты электроэнергии говорят сами за себя. Подтянется ли качество еще, как у Applio, так и обучение моделей - неизвестно, однако в любом случае конечный материал будет зависеть от профессиональности озвучки, которую, увы, обеспечить не могу, поэтому приходиться пытаться и делать то и так, как удается. Из-за незаинтересованности в TTS слушал материал бегло, в поездке с работы, поэтому качество оценил лишь поверхностно. Увы, сожалению о потраченном Вами времени на оценку проекта. Может быть в будущем качество улучшиться, ибо было в планах рассказать о разных TTS`ках на форуме, но, возможно, стоит еще подождать некоторое время. 11labs, конечно, действительно во многих вопросах прыгает на голову выше большинства сервисов по работе с аудио. Наверное, только в вопросах работы с вокалом он проиграет RVC, но это и не его профиль. Не исключено, что у RVC профиль был именно в создании каверов, поскольку я с проектом познакомился именно по таким роликам. В вопросах обучения моделей для большинства нейросеток - да, особенно если проекты коммерческие, то материал в них будет взят исключительно с открытого доступа и по свободной лицензии, что накладывает отпечаток на качество. Возможно, что у 11labs с этим делом дела куда лучше, либо использование работ профессиональных дикторов и актеров озвучивание просто не озвучивается. Не исключено, что как раз ввиду закрытости моделей. Для меня же 11labs является весьма неудобным решением по описанным ранее причинам, необходимости подписки и/или множества аккаунтов, а так же скрупулезному сбору выходного материала из коротких аудиофайлов. Моего терпение просто не хватит на подобное. Сужу по опыту энтузиаста, о котором упоминал ранее. Увы, про дотренировку ничего сказать не могу - сервисом самолично не пользовался. В любом случае - огромное спасибо за то, что потратили время и усилия на то, чтобы ознакомиться и оценить проект, а так же рассказать и даже показать те работы, которые входят в состав Ваших проектов. Безусловно жаль, что имеющийся материал не оказался для Вас потенциально полезным, но зато Ваша конструктивная критика оказалась полезна для меня - это явно повод сделать новые версии для правки хотя бы части допущенных косяков. Как говориться - первый путь к изменению начинается с признания своих ошибок...) Дополнено 2 минуты спустя Благодарю.) Скачал, буду знакомиться со всем комплексно, когда процесс дойдет до работы над новым проектом. По аудиозаписи - вроде бы подобное было в релизе. Имею ввиду, что находилось в файлах, но не было присвоено каким-либо NPC, хотя могу и ошибаться, поскольку при сортировке у меня была задача определять звучащий голос, а не вслушиваться в то, что произносят актеры.
-
В случае, если Вам интересна тематика RVC, то более подробно я описывал принцип работы в профильной теме - RVC Stalkers Voices, спойлеры в описанием в середине текста темы. Только поверхностно знаком с 11labs, ибо не вникал из-за малой заинтересованностью именно TTS`ками, а так же версиями нейросетей, доступных только через сайт/подписки. По вопросам VPN - тут у меня персональное решение, которое не должно находиться в блок-листе: арендованная VPS машина с организованным на ней AmneziaVPN под различные протоколы. Для большинства задач хватает, но много аккаунтов с таких не создашь, ибо IP статический. Смена сервера в свою очередь происходит со скрипом, без аренды новой машины практически или не обойтись. Очень и очень достойно, особенно в плане чистоты записи. RVC на такое либо совсем не способен будет, либо с огромными усилиями по предобработке оригинального аудио, потом дата-сета, а затем постобработке полученного на выходе. С эффектом рации, к слову, нейросетки почти всегда замечательно звучат, даже RVC, даже TTS. Не пробовали один из недавних проектов - VibeVoice? Демонстрации видел, но собрана была нейронка под ComfyUI, у этого сборщика на Gradio: https://t.me/neuroport/413 Дополнено 7 минуты спустя Забыл еще добавить один момент, связанный с моделями и использовании их в проекте: дата-сеты для обучения только очищались от шума, поскольку одной из задач было достижение того же качества звучания, что в оригинальной серии, где аудиозаписи имеют шумы. RVC на подобное любит триггерится, поэтому пришлось делать обработку хотя бы от шумов, без эквализации, нормализации, сатурации, компрессии и/или иных эффектов.
-
Скидывайте, если ссылки имеются на руках и за ними далеко лезть в карман не нужно.) Однозначно пригодиться, если не для будущих наработок, то может мимо проходящие послушают/почитают.
-
Премного благодарен.) Будет возможность - послушаю, обдумаю, что можно использовать и возможно ли в принципе. На крайний случай, если Прохоров никак не "заведется" через RVC - сделаю транскрибацию через Whisper.
