Vera Voice — Синтез речи знаменитостей

Как это работает?
В основе технологии лежит ансамбль из нейронных сетей — Он позволяет любой текст озвучить любым голосом.

Где это применимо
Голосовые поздравления. Розыгрыши. Боты и умные устройства. Также существует множество кейсов применения в бизнесе, например озвучивание аудиокниг, игр, фильмов. Аудиореклама. Интернет вещей.

Этическая сторона
Мы понимаем, что данные технологии могут использоваться как во благо, так и во вред, поэтому делаем всё возможное, чтобы построить легальную и прозрачную основу для их развития. Приватность, авторские права и этичность являются для нас основными принципами.

https://veravoice.ai/

4 комментария

Компания Тимура Бекмамбетова научила нейросеть говорить голосами знаменитостей. Проект Vera Voice анализирует речь любого человека, например, артиста и озвучивает его голосом любые тексты. Разработчики отмечают, что уже создали инструмент для защиты прав обладателей голоса и готовы отслеживать голосовых клонов-мошенников. Как именно это будет реализовано, они не сообщили. Известно, что со знаменитостями заключат договоры о партнерстве.

Ни Владимир Путин, ни Владимир Познер, ни Ксения Собчак лично в проекте не участвовали — нейросеть добралась до многочисленных записей их голосов, которые нетрудно найти в сети, и научилась имитировать тембр, интонации и прочие нюансы речи знаменитостей. В теории озвучить так можно что угодно, в том числе то, что обладатели голосов ни при каких обстоятельствах произносить не хотели бы. При этом создатели проекта уверяют, что определить, синтезированная запись или оригинальная, технически возможно, но как именно — не уточняют.

Случаи распространения фейк-ньюс могут участиться, но это меньшее из всех возможных негативных последствий, отметил технический директор российского офиса Trend Micro Михаил Кондрашин: «Не стоит полагать, что новые технологии могут угрожать только популярным личностям.

Например, при помощи вредоносной программы в телефоне, голосового помощника и других ненадежных средств передачи голоса. Злоумышленники уже собирают образцы голоса в преддверии введения биометрической аутентификации. При наличии таких программ они будут делать массивы данных, чтобы потом осуществлять свои мошеннические звонки. И когда вы будете слушать голос какого-то родственника, знакомого, которые вас будут побуждать к каким-то действиям, это может навредить».

ИТ-специалисты обеспокоены: потенциально опасные разработки день ото дня становится все доступнее и каждый может попасть в зону риска. Директор по науке и технологиям Агентства искусственного интеллекта Роман Душкин уверен, что массовое использование нейросетей для синтеза голоса куда ближе, чем кажется на первый взгляд: «Обучение нейронных сетей сейчас идет на том же оборудовании, на котором все майнили биткойны. Сейчас все будут заниматься обучением нейронных сетей. Сначала нейронная сеть обучается тому, как это в принципе делать на произвольных данных.

WaveNet технология 2016-2017 года, исходные коды опубликованы на github, все как обычно наши говноменагеры ищут себе хайп в стране белых папуасов. Есть еще сети, которые моделирую движение губ и мимики. Сочетание получатся конечно ядерное, теперь понятно каким будет транзит власти в 2024 году)))