-
Публикаций
62 -
Зарегистрирован
-
Посещение
-
Победитель дней
1
Warlock700 стал победителем дня 24 сентября
Warlock700 имел наиболее популярный контент!
Репутация
107 ХорошаяИнформация о Warlock700
-
Звание
Новичок
- День рождения 07.10.1992
Дополнительная информация
-
Пол
Мужчина
-
Город
Саратов
Посетители профиля
Блок последних пользователей отключён и не показывается другим пользователям.
-
Благодарю.) Хорошо, что я истории Прохорова оставлял. Не знаю, все ли уникальные - надо переслушивать, но файлов с таким именем насчитал 50 штук. Переслушаю все и когда займусь расширением голосовых фраз для NPC, то попробую Прохорова преобразовать. Не факт, что выйдет успешно - со старыми моделями его голос с RVC не дружил, но если процесс пройдет удачно - мне будет меньше работы.)
-
Спасибо.) Потихоньку развиваю, переделал около половины анекдотов Свободы. Стало заметно лучше, живее, чище и ближе к оригинальному голосу. Можете сами послушать - я периодически выкладываю shorts`ы. Конкретно этот использует сразу комбинацию - переозвученные дубли и преобразование новой моделью: Дополнено 9 минуты спустя За основу взяты оригинальные игры. Если быть честным, то очень трудно представить, как суровые и холоднокровные убийцы травят анекдоты возле костерка. Не знаю, как представлена в Anomaly группировка, но у меня и моих компаньонов имеется такое же представление, что описал ранее. Наемники и Монолитовцы получат новые фразы, но уже в другом проекте. Не хотелось бы прыгать из одного проекта в другой, поэтому хочется выпустить полноценный фикс для RVC Jokes Pack, а только потом браться за другой.
-
Основа анекдотов (сценарий) пока меняться не планируется, насчет интонаций - тут уже начал работы по переозвучке и преобразованию на новых моделях. По ссылке выше, на бусти, можно послушать, как было и как станет, когда выйдет первый фикс. Пока не знаю, как поступить лучше - частые релизы, либо редкие, но с внесением большого числа правок. То есть пока что рассматриваю два варианты - доделать какую-то конкретную группировку и залить пак, либо доделать все полностью и лишь тогда добавить. Небольшое расширение анекдотов (штук по 5-7) тоже будет, но это не приоритетная задача сейчас.
-
Пользуемся моментом, пока не настали времена, когда "восстали машины из пепла ядерного огня"...) (с) Дополнено 0 минут спустя Для удобства и возможной поддержки канала в будущем, оформлен Boosty, куда буду выкладывать черновые работами по данную проекту и не только - https://boosty.to/warlock7oo Весь доступный контент не требует подписки - все открыто и прозрачно. Не призываю оформлять подписки или отправлять донаты - это исключительно добровольная прерогатива. Скорее даже наоборот - не подписывайтесь, если хотите какого-либо уникального контента, особенно если с деньгами туго и особенно если учитывать, что имею тенденцию надолго перегорать к проектам. Теперь о самой цели регистрации Boosty - поделиться с желающими процессом создания материала и черновыми работы, где-то это будут сценарии, недоделанные и/или потерявшие актуальность ролики, может быть даже забавные моменты в ходе работы над проектами или жизни в целом. На текущий момент уже выложен пост с примерами пары анекдотов для военных. Это не окончательные варианты, которые будут внесены с правками, поэтому если переозвученный материал не понравится - не переживайте, не факт, что он попадет в обновление сборки в том виде, что Вы услышали.
-
Результаты в скриншотах, конечно, впечатляют. Особенно учитывая, что таким образом прокачана ТЧ. Да у меня вид с окна в "меньшем разрешении", чем на них.)
-
Спасибо за добрые слова и Ваши пожелания.) На ютубе еще далеко не все выложено, а так же появляться будет новый материал в short`ах с уже внесенными правками. Начал переобучать модели, возможно, что сделаю некоторым анекдотам переозвучку. Но что верно, то верно - основной задачей было именно сохранение стилистики. И, судя по всему, с этим справится удалось.)
-
Были допущены критические, но при этом до банального смешные ошибки в пути. Если Вы скачали модпак для ЧН+ЗП до этого, то просьба перекачать модпак или вручную перенести файлы в папке gamedata из sound в sounds. Перепутаны были еще пути для типов NPC - корректное имя пишется с нулем, пример: human_01. По аналогии с предыдущей ошибкой - перенесите файлы из human_1 в human_01 и т.д. Плохой идеей было по памяти прописывать пути к папкам...) На момент написания поста ошибки поправлены.
-
Могу Вас понять, ибо и сам прекратил на длительное время работать с RVC именно по причине низкого выходного качества, которое и меня не устраивало. К тому же раньше озвучивал материал еще менее эмоционально, что приводило к спорным результатам. А в вопросах железа и затраченных на обучение мощностей и вовсе добавить нечего, ибо сожженные киловатты электроэнергии говорят сами за себя. Подтянется ли качество еще, как у Applio, так и обучение моделей - неизвестно, однако в любом случае конечный материал будет зависеть от профессиональности озвучки, которую, увы, обеспечить не могу, поэтому приходиться пытаться и делать то и так, как удается. Из-за незаинтересованности в TTS слушал материал бегло, в поездке с работы, поэтому качество оценил лишь поверхностно. Увы, сожалению о потраченном Вами времени на оценку проекта. Может быть в будущем качество улучшиться, ибо было в планах рассказать о разных TTS`ках на форуме, но, возможно, стоит еще подождать некоторое время. 11labs, конечно, действительно во многих вопросах прыгает на голову выше большинства сервисов по работе с аудио. Наверное, только в вопросах работы с вокалом он проиграет RVC, но это и не его профиль. Не исключено, что у RVC профиль был именно в создании каверов, поскольку я с проектом познакомился именно по таким роликам. В вопросах обучения моделей для большинства нейросеток - да, особенно если проекты коммерческие, то материал в них будет взят исключительно с открытого доступа и по свободной лицензии, что накладывает отпечаток на качество. Возможно, что у 11labs с этим делом дела куда лучше, либо использование работ профессиональных дикторов и актеров озвучивание просто не озвучивается. Не исключено, что как раз ввиду закрытости моделей. Для меня же 11labs является весьма неудобным решением по описанным ранее причинам, необходимости подписки и/или множества аккаунтов, а так же скрупулезному сбору выходного материала из коротких аудиофайлов. Моего терпение просто не хватит на подобное. Сужу по опыту энтузиаста, о котором упоминал ранее. Увы, про дотренировку ничего сказать не могу - сервисом самолично не пользовался. В любом случае - огромное спасибо за то, что потратили время и усилия на то, чтобы ознакомиться и оценить проект, а так же рассказать и даже показать те работы, которые входят в состав Ваших проектов. Безусловно жаль, что имеющийся материал не оказался для Вас потенциально полезным, но зато Ваша конструктивная критика оказалась полезна для меня - это явно повод сделать новые версии для правки хотя бы части допущенных косяков. Как говориться - первый путь к изменению начинается с признания своих ошибок...) Дополнено 2 минуты спустя Благодарю.) Скачал, буду знакомиться со всем комплексно, когда процесс дойдет до работы над новым проектом. По аудиозаписи - вроде бы подобное было в релизе. Имею ввиду, что находилось в файлах, но не было присвоено каким-либо NPC, хотя могу и ошибаться, поскольку при сортировке у меня была задача определять звучащий голос, а не вслушиваться в то, что произносят актеры.
-
В случае, если Вам интересна тематика RVC, то более подробно я описывал принцип работы в профильной теме - RVC Stalkers Voices, спойлеры в описанием в середине текста темы. Только поверхностно знаком с 11labs, ибо не вникал из-за малой заинтересованностью именно TTS`ками, а так же версиями нейросетей, доступных только через сайт/подписки. По вопросам VPN - тут у меня персональное решение, которое не должно находиться в блок-листе: арендованная VPS машина с организованным на ней AmneziaVPN под различные протоколы. Для большинства задач хватает, но много аккаунтов с таких не создашь, ибо IP статический. Смена сервера в свою очередь происходит со скрипом, без аренды новой машины практически или не обойтись. Очень и очень достойно, особенно в плане чистоты записи. RVC на такое либо совсем не способен будет, либо с огромными усилиями по предобработке оригинального аудио, потом дата-сета, а затем постобработке полученного на выходе. С эффектом рации, к слову, нейросетки почти всегда замечательно звучат, даже RVC, даже TTS. Не пробовали один из недавних проектов - VibeVoice? Демонстрации видел, но собрана была нейронка под ComfyUI, у этого сборщика на Gradio: https://t.me/neuroport/413 Дополнено 7 минуты спустя Забыл еще добавить один момент, связанный с моделями и использовании их в проекте: дата-сеты для обучения только очищались от шума, поскольку одной из задач было достижение того же качества звучания, что в оригинальной серии, где аудиозаписи имеют шумы. RVC на подобное любит триггерится, поэтому пришлось делать обработку хотя бы от шумов, без эквализации, нормализации, сатурации, компрессии и/или иных эффектов.
-
Огрехи в работе имеются, этого отрицать трудно и тут сразу комплекс факторов: 1) Непрофессиональность озвучки - я любитель самоучка, дикторскому и актерскому ремеслу не учился, да и в целом человек не особо яркий на эмоции. RVC старается перенять тон и эмоциональность донора, но на выходе имеется несколько факторов, которые могут способствовать ухудшению передачи этих характеристик. Поскольку пункт посвящен голосу, то подробнее посвящу ему внимание - различие между голосом и интонациями модели с оригинальным голосом может привести к проблемах, вплоть до ухудшения дикции. Да и само озвучивание для RVC весьма специфично, причем не каждый голос удается корректно преобразовать. К слову, Прохоров очень плохо преобразуется любой моделью, хотя его модель работает нормально с другими. Часть голосов моих знакомых тоже не удалось подружить с RVC и тут неясно, то ли мой голос хорошо воспринимается RVC и большинством моделей, то ли научился наговаривать аудио для него - вопрос риторический... 2) Несовершенность самой RVC - в работе этой нейросети имеется очень много нюансов и тонкостей, часть которых и мне непонятны после использования проекта более, как год. В основной своей массе камнем преткновения является модель представления речи (сейчас стабильные результаты можно получить на contentvec), а так же предобученные базовые модели. Обе они разработаны на англоязычной базе голосов, либо мультиязычной, но с минимальным количеством образцов на русском в них. И если с предобученными базами ситуацию незначительно, но можно изменить, используя варианты от энтузиастов, то вот с моделью представления все еще имеются проблемы. Недавно вышел spin-v2 - доработанная версия spin, который ужасно работал с русской речью, а вот вторая версия показала себя неоднозначно. На момент работы над проектом он только вышел и я не провел достаточно тестов, чтобы начать повторное преобразование материала под него. К тому же, немного поджимали сроки, местами потерял оригинальный материал - пришлось приложить усилия, чтобы выпустить все в предполагаемые сроки и в полном объеме. Возможно, что в будущем результаты значительно улучшаться, когда смогу разобраться в файнтюне моделей, использовании сторонних вокодеров, а так же параметров точности обучения. Не исключено, что я зря избегаю обучение в Applio, который заметно подтянулся за время своего существования, добавив очень много нового и требующего внимания в освоении. По поводу 11Labs - знаком с данным проектом, пусть и не лично. Обсуждал специфику работы и выходной материал с данного сайта, даже подготавливал аудиозаписи для последующего преобразования в нем совместно с другим энтузиастом, делающих нейросетевые озвучки. Результат там действительно выходит очень перспективным, но бесплатно получить образец более, чем на несколько секунд, там не получиться. Так же, вроде, имеются ограничения работы данного ресурса для РФ пользователей. По поводу развития проекта - если багов, недочетов и иных аспектов, которые возможно поправить, соберется много - выйдут новые версии данного модпака. Безусловно, хотелось бы, чтобы RVC заинтересовалось больше модмейкеров, но интерес к проекту оказался невысоким, преимущественно из-за сложности использования, отсутствия подходящего оборудования для записи и грамотного TTS для тех, кто не хочет заниматься озвучиванием самостоятельно. Все это вроде как развивается в проекте под именем Applio, но далеко не все нововведения оказываются перспективными, особенно для русскоговорящего сообщества. Имеются и другие перспективные TTS проекты, но пока что любая TTS при больших объемах данных, особенно нестандартных, проигрывает преобразованию аудио-в-аудио. В отношении меня ситуация имеет такое состояние - использую исключительно локальные нейросети, преобразование в которых происходит из голоса-в-голос, поскольку TTS недостаточно хорошо, а главное просто и гибко, позволяет корректировать получаемые результаты. RVC Jokes Pack - проект не идеальный, но явно достойный того, чтобы он мог выйти на свет. Если бы я начал шлифовать его, то либо проект затянулся, либо на каждый анекдот имелось бы по десятку дублей. К тому же, сам себе, обычно, являешься более жестким звукорежиссером, нежели чем третье лицо, а в данном проекте почти все присутствующие впервые имели опыт с модификацией такой направленности. Все вышесказанное ни в коем случае не было сказано в укор, многие проблемы известны, но их устранение требуется много дополнительных усилий, проверок и обработок, часть перечисленного вовсе не удастся мне устранить собственными силами. Поэтому лично я был бы очень рад, если найдутся энтузиасты, которые смогут перехватит инициативу и мои наработки, чтобы создавать проекты в несколько раз лучше, чем выходит сейчас.
-
Спасибо за оценку.) Столь глобальная работа, тем более в кооперации с другими людьми, является первой из оконченных. Есть и другие, в том числе рассматриваются варианты по расширению фраз сталкеров. Подойдут ли для этого объемные байки, легенды и истории - вопрос спорный, поэтому материал надо предварительно отсортировать, где-то, возможно, отредактировать и др. В любом случае спасибо за наводку, может быть для будущих проектов будет использована часть предложенного материала. P.S.: В релизной версии аудиофайлы в озвучке Прохорова остались, либо искать надо в билдах?