-
Публикаций
87 -
Зарегистрирован
-
Посещение
-
Победитель дней
1
Тип контента
Профили
Форумы
Блоги
Календарь
Новости
Моды
Моды S.T.A.L.K.E.R. 2
Весь контент Warlock700
-
Тут скорее дело не в знании языка, а в том, что паттерны произношения остаются и даже усиливаются из-за connentvec, если преобразовывать англоговорящую речь в русскоговорящую. В обратную сторону это работает, но меньше бросается в уши. Поэтому чтобы не возникали проблемы с акцентом - для англоговорящих голосов нужно такая же речь. Но если использовать TTS в таких задачах, если нужен хороший результат. Мне для работы речь-в-речь такой вариант не подходит. Благодарю за предложение. У меня итак довольно много моделей и столько же планов по ним, но не хватает мощностей, чтобы обучать все и в короткие сроки и не испытывать дискомфорт от невозможности использовать ПК в иных задачах.
-
Очень хорошо, что с Апплио разобрались - на текущий момент это один из самых перспективных проектов по RVC, к тому же они часто вводят экспериментальные методы, которые не перечеркивают текущую успешную генерацию. Увы, spin алгоритм не оказывает хорошего влияния на дата-сет, как и новый энкодер, поэтому все еще стабильными остаются стандартные настройки на contentvec. Увы, дата-сеты на английском языке будут иметь характерный языку акцент при преобразовании русской речи, поэтому такой вариант обучения нежелателен. От него можно избавиться, но костыльным способом - преобразовать какой-то материал моделью с акцентом, а потом полученным материал отправить обучаться вновь для получения уже русскоговорящей модели. В этом случае эмоциональность выходной модели будет оставлять желать лучшего, а так же голос приобретет те характерные свойства речи, что были у голоса донора на русском. Сейчас я занялся обучением моделей по Warcraft III, поскольку все мои модели по этой вселенной лежали на weight-gg. Просто выложить старые модели - это не совсем вариант, поскольку произошло много изменений с того времени, поэтому обучаю их уже с учетом того опыта, что у меня уже есть. Несколько моделей уже успел залить на hugging-face. Благодарю, хоть и не праздную. Вас тоже поздравляю.
-
Увы, но с RVC не всегда все проходит гладко, тем более, что эмоциональная подача не совсем мне свойственна. Доработка будет, просто не назову сроки. Свободу уже переделал - ее уже можно оценивать на твердую четверку по моей субъективной оценке.
-
Из того, что посоветовал Грок, доступно должно быть все: - Сам Hugging Face, где размещены модели https://huggingface.co/Warlock700 - MimicPC - https://www.mimicpc.com/demo/RVC - Voice.aI - https://voice.ai/ - FineVoice - https://finevoice.ai/ - Kaggle/Colab форки RVC других энтузиастов. Я не занимаюсь преобразованием и обучением онлайн, поэтому никогда не стояло задачи пользоваться моделям через сайты, коллабы или каглы других пользователей. Даже Weight.gg использовался исключительно для размещения моделей, всем остальным занимался локально.
-
Согласен с комментаторами на Реддит - сайт выглядит просто вырвиглазно... Но преобразование моделями работает, пришлось зарегистрироваться, чтобы проверить этот момент. Не вижу необходимости переносить туда модели. Тут сразу несколько причин: - Hugging-face удобнее, бесплатен и не требует регистрации; - Удобная категоризация, а у некоторых моделей есть несколько вариантов обучения; - Easyvoice поддерживает импорт моделей, то есть скопировав и вставив ссылку - он сам подцепит модель.
-
На Hugging-face. Данные ресурсы нужны для использования RVC онлайн теми, кто не может преобразовывать материал локально на своем ПК, а не для хранения моделей. Все модели уже лежат там, ссылки в теме тоже переделаны на него.
-
Есть информация, которую не размещал тут, но она не до конца проверена - сервисы, которые предложил Грок в качестве онлайн генераторов для работы с RVC моделям. Имеются свои нюансы, часть которых проверить не представляется возможным, если не регистрироваться: - MimicPC точно дает возможность работы с RVC моделями, но бесплатно, либо в ограниченном режиме - не сообщу, поскольку нужна регистрация. - Voice.AI требует скачать их софт для того, чтобы начать преобразование, а его я скачивать точно не буду. - FineVoice точно имеет возможность загрузки RVC моделей, но неизвестно, платное, либо бесплатное преобразование; - TopMediaAI требует регистрацию, чтобы начать работу с клонированием голоса. - (не попало на скрин) - поднятие Kaggle/Colab WebUI версии RVC. Есть энтузиасты, которые в общем доступе выкладывали свои форки. Будут ли они столько же качественными, как Weight.gg и Applio - однозначного ответа у меня нет, поскольку в моем случае используется только локальный вариант преобразования и не иначе.
-
Ролик с новостями о закрытии Weight-GG. Для завсегдатаев данной темы новой информации в нем не будет:
-
Данный проект не связан с прошлым сайта, а именно - преобразование аудио и/или TTS функции моделями RVC. Судя по всему разработчики поделились своими наработками в иных направлениях. Grok о react-native-track-player рассказывает следующее: Дополнено 6 минуты спустя Исходя из дальнейшего поиска проект Weight-AI в принципе не имеет никакой связи с Weight-GG.
-
Приветствую. Да, в текущий реалиях рекомендуется использовать Applio - он гораздо чаще обновляется, нежели чем озвученный проект. Пожалуй, ссылку на него я совсем уберу из темы, поскольку Applio справляется с данной задачей и имеет более лучшее качество. По поводу долгого запуска - первый старт всегда долгий и порою может занимать до 2-х минут, зависит от мощности устройства. Запуск от имени администратора не обязателен.
-
Обучены модели на contencvec и точности fp32. Удалены старые модели Череватенко, Терещука и Плахова, размещены на Hugging Face: Мельник из Метро 2033: Исход, пресет no_noise-normalization; Череватенко - полный дата-сет, пресет no_noise-normalization; Плахов - полный дата-сет, пресет no_noise-normalization. Вилков - Сидорович, пресет no_noise-normalization-de_esser-compression; Подубинский - Сидорович, пресет no_noise-normalization-de_esser-compression; Терещук - полный дата-сет, пресет no_noise-normalization;
-
Да и снова да, все ссылки имеются в описании темы. Чем выше версия, тем больше имеется функций и изменений в Applio: https://huggingface.co/IAHispano/Applio/tree/main/Compiled/Windows
-
Я не использую онлайн сервисы - только локальное обучение и преобразование. Предпочтительнее, конечно, использовать локальный вариант работы с моделями, в нынешних реалиях себя хорошо показывает Applio, поскольку обладает множеством настроек и постоянно совершенствуется. Скорость обработки аудио зависит от мощности Вашего ПК, а так же длины аудио. На просторах сети есть энтузиасты, которые размещают свои fork`и и дают возможность преобразовывать материал. Либо ищите colab`ы. Нейросети же предлагают для данных задач Voice.ai и MimicPC. Возможно, что где-то найдете еще онлайн клиенты, если поищите в профильных темах в сети. Увы, ссылка с одним таким у меня затерялась, да и версия там не факт, что новая. Applio в online - ссылка недоступна или удалена. В вопросах сложности - сев на пару часов за любой проект, можно будет очень быстро разобраться, а учитывая обилие других нейронок - руководство, как работать с тем же Applio, можно даже бесплатно получить.
-
Приветствую. RVC и Applio (fork RVC) работают только при преобразовании аудио-в-аудио. Лучше всего, конечно, иметь качественный голос и чистую запись, но можно добиться хорошего звучания, если аудиодорожка будет без посторонних звуков и, по возможности, предварительно очищена в аудиоредакторе.
-
Рад, что анекдоты понравились.) Над озвучкой бандитов пыхтел несколько часов к ряду, чтобы хотя бы немного приблизиться к колоритным бандитам, а вышло уже так, как есть в модификации, и вряд ли получиться улучшить...
-
Удалены старые модели, обученные на hubert-base, hubert-japanese и hubert-chinese. Сохранены только модели, обученные под contentvec и точность fp32. Исключение: полные модели Плахова, Терещука, Череватенко и Мельникова. Как только будут обучены их contencvec fp32 версии - текущие будут удалены. Убраны все ссылки в теме, ведущие на Weight-GG, ввиду смены направленности сайта и/или его продажи. На текущий момент лишь одна модель не была загружена на Hugging-Face - модель Мельника из Метро Исход. Поскольку сортировка аудиоматериала конкретно этой части не была произведена - дата-сет будет обучен на тех данных, которые удалось собрать при первоначальном обучении. Изменены ссылки на Youtube канале. Ролик-новость о закрытии Weight-GG запланирован позднее.
-
Честно, мне хорошо известен только RVC, поскольку среди локальных нейронок он один из немногих, кто выдает качественный результат среди audio-to-audio. Тут же не только audio-to-audio, но еще и дубляж на другой язык, а подобное среди локальных нейросетей я не наблюдал.
-
Что русский, что украинский языки - довольно схожи между собой, поэтому перевод из одного в другой не будет сильно бросаться в уши. Какая модель - ответить затруднюсь, потому что не интересовался этим направлением. Думаю, что 11labs или схожие по мощности и качеству ресурсы, вряд ли это что-то локальное, хотя кто знает. А может быть они вовсе сделали не перевод, а переозвучили - кто знает?) Оригинал я не смотрел.
-
Благодарю за информацию, уже давно перестал грузить модели на weight.gg, но там потенциально могут находиться модели, экземпляры которых не сохранил локально. Основную ссылку они уже поменяли - теперь это другой сайт, а модели будут до конца марта по прямым ссылкам загружаться. До этого периода постараюсь сделать информативный ролик и поменять везде ссылки.
-
На текущий момент обучалась последняя модель (Мельника из Исхода не считаем - дата-сет не полный) на точности fp32 - Прохоров-full. Дальнейшее обучение моделей будет иметь экспериментальный характер и в случае, если "опыты" пройдут успешно - модели получат дополнительные новые версии. Старые модели, обученные на hubert_base будут в ближайшее время удалены, ввиду низкой релевантности после ввода в обучение contentvec и fp32.
-
Загружены новые модели, обученные с повышенной точностью fp32: Яценко - Военные Припяти; Вилков - Сидорович. Добавлены модели, обученные с повышенной точностью fp32 для ранее загруженных: Борисенок - Лесник; Борисенок - Сахаров; Подубинский - Сидорович; Пашин - Ковальский (теперь модель отдельно от Мельника); Тимошенко - Халецкий; Герман - Валерьян; Пашин - Мельник; Пашин - Рассказчик Зова Припяти; Стальчук - Лебедев; Мороз - Дегтярев; Прохоров - полный дата-сет. (Метро+Сталкер) Все модели доступны на Higging Face - https://huggingface.co/Warlock700 Внесены изменения в описание темы: - Добавлены ссылки на новые модели в описании темы; - Добавлены в описание ссылки для моделей, которые получили новые версии с момента релиза;
-
Добавлены новые модели для каждой группировки в высокой точности FP32. Совместимость гарантирована с версией Applio 3.2.9 и выше. Для некоторых моделей загружено несколько вариаций; Розин - Сталкеры; Стальчук - Сталкеры с Чистонебовцами, а так же Сталкеры с Чистонебовцами в противогазе,; Герман - Бандиты, Бандиты в противогазе, Наемники, Наемники в противогазе, Чехов; Терещук - Бандиты, Военные, Военные в противогазе, Наемники NPC-2 из ТЧ; Малуха - Новички и Экологи; (по умолчанию в противогазах) Череватенко - Монолит; (по умолчанию в противогазе) Богуш - Свобода и Свобода в противогазе; Вилков - Долг и Долг в противогазе, Чистонебовцы; Гофуров - Новички; Зорин - Флинт. Все новые модели доступны на Higging Face - https://huggingface.co/Warlock700 Внесены изменения в описание темы: - Добавлены ссылки на новые модели; - Добавлены ссылки для моделей, которые получили новые версии с момента релиза; - Внесены дополнения к обозначениям в названиях новых моделей.
-
Вышел в релиз первый фикс модпака, который включает в себя внесение правок для группировки Свобода. Все анекдоты были заново переозвучены, а так же преобразованы новыми моделями повышенной точности. Релиз уже доступен по обновленным ссылкам в описании. Небольшая демонстрация, а так же новости канала и не только:
