Что нового

Приёмы и секреты производства видео для Youtube и подобных сервисов

Who has viewed this thread (Total: 8) View details

Kolobokk

Активный участник
Сообщения
913
Реакции
453
В этой теме постарайтесь поменьше флудить, так как деньги любят тишину! :)
Предполагается, что тема будет посвящена методам снижения затрат и повышения качества конечного продукта с помощью ИИ и других современных решений.
Видео и фото иллюстрации приветствуется!

Для затравки.
Я долгое время использовал для озвучивания технологию Text-to-Speech AI от компании Google. Это очень качественная озвучка и совершенно бесплатная, что важно для малобюджетных проектов. Голосов немного, но есть настройка скорости речи.

Text-to-Speech AI.jpg
 
Зашел по твоей рекомендации из пред. темы в lolo.ai и не очень разобрался.
Там регятся из-под аккаунта Гугл... почта, все дела...
В двух словах раскажи.... это какой-то огромный проект, а конкретно там по озвучке нейро-голосом не нашел.
------------------
долгое время использовал для озвучивания технологию Text-to-Speech AI от компании Google.
Надо будет поюзать.
Я много озвучил видосов Балаболкой (есть Форум), и она также цепляет озвучку от Гугл и многих других сервисов. Многие из них после раскрутки стали платные.
Настройка скорости голоса на длинных видосах в бесплатных сервисах не помогает, дорожка с голосом длиннее, чем видео, если текст плотный.
Платными еще не пользовался.
 
Последнее редактирование:
В двух словах раскажи.... это какой-то огромный проект
Я уже писал, что только зарегился.
Балаболкой (есть Форум), и она также цепляет озвучку от Гугл
Да, когда-то цепляла, но это было очень давно. Сейчас нет. Всё остальное что там привязали к Балаболке, имхо, не очень было интересно, если конечно речь об английском. Я всё проверял когда там ещё всё корректно работало.
Настройка скорости голоса на длинныъ видосах на бесплатных сервисах сильно сползает, если текст плотный.
Можно порезать и раскидать самому. Но сползать должно назад, то есть нужно скорость увеличить.
 
Да, когда-то цепляла, но это было очень давно. Сейчас нет.
Цепляет, цепляет, и оч. много. От 10 до 12 сайтов...
Около четырех-пяти до сих пор бесплатные... от Гугла первые два агрегатора бесплатные...
Проверь.

балаболка.jpg

Вот на днях сделал видео-шутку в учебном ключе, пролог и эпилог женским голосом от Baidu

 

Вложения

  • 1720857815814.png
    1720857815814.png
    31,1 КБ · Просмотры: 3
Я это проверил сразу после вашего опрометчивого заявления. Помню, что там есть и другая проблема, связанная, кажется, с длиной текста. Просто жаль тратить время. Да и зачем, если Google предоставляет весь функционал бесплатно. Смотрите мою картинку из первого поста.

Text-to-Speech AI-1.jpg
 
Сравнивал несколько бесплатных озвучек на русском, остановился на Baidu.... имхо, лучше, чем от Гугла.... может на англ. от Гугла и лучше, не знаю
 
на ловца и зверь бежит: только что собрался гуглить, а тут подходящая тема и два спеца по ютубу))

Ситуация такая: я смонтировал фильм используя "нелицензированную музыку", выложил на ютуюб на свой канал, проверил блокировки, заменил два проблемных трека - блокировок нет и отправил клиенту.
Но вдруг через 2 месяца заблокировали ещё один трек (и заблокировали весь фильм)
А там сотри просмотров и десятки лайков - клиент дорожит этим (но канал не монетизируется)

Штатные средства - не годятся : "замена трека" (пропадет голос на фоне и уровень слишком большой и стык неаккуратный. "тишина" 2 сек - тоже плохо, "вырезать фрагмент" - клиент дорожит этим фрагментом


Можно ли заменить файл на новый? Вроде в описании этого нет, но если написать в техподдержку?
 
впрочем, я уже нашёл ответ - никак((
 
You don't have permission to view the spoiler content. Войти или зарегистрироваться

Итак, приступим!

Т.З. Создать клон своего голоса, чтобы с его помощью можно было озвучивать ролики на любых языках.

1. Первый отзыв о genny.lovo.ai и он плохой.
Создал файл для клонирования голоса и получил: Функция клонирования голоса в настоящее время поддерживает только английский язык.
А столько шума было вокруг презентации!

2. Пошёл дальше, на elevenlabs.io.
Этот сервис я в прошлом испытывал. Он умеет дублировать видео (менять язык), даже подстраиваясь под артикуляцию или наоборот, и результат не очень плохой. Правда, в бесплатной версии аудио ограничено низким битрейтом. Также, в бесплатную версию ролика добавляется водяной знак.
Попытался туда загрузить аудио. Загрузка прошла успешно, — аудио крутится в сервисе. Я ещё тогда подумал, как же они туда водяной знак засунут... :) А сервис просто отказался работать с аудио: Dubbing without a watermark is only available for Creator+ users.

И я уже начинаю подозревать, что все эти сервисы ограничивают тестовый режим так, чтобы юзеры не могли получить коммерческой выгоды. А платить вперёд, когда не можешь убедиться в достаточном качестве получаемого контента, как странно.
 
Можно ли заменить файл на новый?

Аудиодорожку в старом файле можно заменить прямо в ютюбовском редакторе. Но это если есть предупреждение, а ролик ещё не заблокирован. Я такое предупрежедение однажды получил через несколько лет после публикации видео. Сейчас право блокировки дали юзерам. Если юзер нормальный, то он даёт опционально время, кажется неделю на то, чтобы вы могли самостоятельно удалить видео или заменить аудио. Если хозяин выбирает опцию заблокировать сразу, то уже всё.
Только в чём проблема? Вряд ли у ролика миллион просмотров. Можно же перезалить ролик после коррекции. Некоторые переливают ролики для того чтобы привлечь зрителя и сохранить ритм выхода новых роликов. Это не запрещается. Хотя лучше подождать 1 месяц.

Но вдруг через 2 месяца заблокировали ещё один трек
Это может случиться и через полгода и больше. Всё зависит от того, как часто обладатель прав на контент заходит в закладку "Авторские права" Творческой судии.
 
Второй отзыв на genny.lovo.ai.
В сервисе большой выбор языков, причём можно подобрать не только по акценту-произношению, но и по контенту. Есть правда мелкий баг — сервис не понимает переносы в тексте, но это мелочь. Голос реально похож на человеческий. Хотя я пока только один голос использовал и один язык, но мне результат очень понравился.
Есть возможность управлять скоростью, что тоже очень важно.
Продолжительность полученного аудиоролика сразу индицируется, так что можно сначала подогнать время, а потом лишь скачать результат. В Text-to-Speech AI от Google это сделать было нельзя.

Но самое главное, я пока так и не понял, в чём ограничение тестового режима, кроме 5000 знаков за один подход? Если кто знает, скажите!

Наверное пока остановлюсь на этом сервисе.

Панель выбора голоса

Окно выбора голоса.jpg

Панель готовых роликов с указанием продолжительности. Видно как я подгонял длительность аудио под заданную.

Как подгнать время.jpg
 
Последнее редактирование:
"На русском я и сам могу набалаболить"
Сколько берешь за 1 мин. озвучки? )))

Главное, во всех этих синтез-голосах - естественность лог. пауз, интонации...
Это, думаю, в будущем...
Хотя в дорогих, платных может уже и есть.
 
Носитель языка сказал, что робот Lovo звучит лучше чем Google. Использую Lovo в очередном ролике.

естественность лог. пауз, интонации...
Для этого есть специальные теги управления - омографы. Наверное они доступны в платных версиях некоторых движков. В бесплатной версии Text-to-Speech AI их точно нет, я интересовался. Если бы хотя бы можно было ударение ставить, это уже было бы неплохо.
 
Последнее редактирование:
Но в своем видосе, то что выше бесплатный женский синтез-голос - более-менее естественнен, только в одном месте нелогичная микро- пауза.
Скоро ИИ начнет подделывать голоса... вот поле деятельности для мошенников )))
 
Скоро ИИ начнет подделывать голоса... вот поле деятельности для мошенников )))
они уже это делают, причём в реальном времени:
ты разговариваешь по телефону, а собеседник говорит голосом Левитана, Ланового, Ельцина, Горбачёва, твоей мамы (если имеется образец голоса)
 

Who has watched this thread (Total: 2) View details

Назад
Верх Низ