sfw
nsfw
Microsoft

Microsoft

Подписчиков:
27
Постов:
742

Новый ИИ от "Microsoft" может имитировать голос любого человека с помощью 3 секунд аудиозаписи

 
Модель преобразования текста в речь может так же сохранять эмоциональный тон диктора и акустическое окружение.
 
г Вас беспокоят из ' службы безопасности . Сбербанка... >,наука и техника,технологии,Microsoft,Майкрософт,нейросети,VALL-E,DeepFakes,Deepfake,deep fakes,длиннопост,длиннотекст
 
Исследователи "Microsoft" анонсировали новую модель ИИ для преобразования текста в речь под названием "VALL-E", которая может точно имитировать голос человека, после того как ей предоставят трехсекундный образец аудиозаписи. Как только она запоминает конкретный голос, "VALL-E" может синтезировать аудиозапись того, как этот человек говорит что угодно, и сделать это таким образом, чтобы сохранить эмоциональный тон говорящего.
Его создатели предполагают, что "VALL-E" может быть использован для высококачественных приложений преобразования текста в речь, редактирования речи, когда запись человека может быть отредактирована и изменена на основе текстовой расшифровки (заставляя его говорить то, чего он изначально не говорил), и создания аудиоконтента в сочетании с другими генеративными моделями ИИ, такими как GPT-3.
"Microsoft" называет "VALL-E" "нейронным языковым кодеком" ("neural codec language model"). Она основана на технологии под названием "EnCodec", которую "Meta" анонсировала в октябре 2022 года. В отличие от других методов преобразования текста в речь, которые обычно синтезируют речь путем манипулирования волновыми формами, "VALL-E" генерирует дискретные коды "аудиокодеков" из текста и акустических образцов. По сути, он анализирует, как звучит человек, разбивает эту информацию на дискретные компоненты (называемые "лексемами") благодаря "EnCodec" и использует обучающие данные для соответствия тому "знанию" о том, как бы звучал этот голос, если бы он произносил другие фразы за пределами трехсекундного образца. Или, как "Microsoft" выражается в документе "VALL-E":
 
«Для синтеза персонализированной речи (например, "нулевого TTS" ("zero-shot TTS")) "VALL-E" генерирует соответствующие акустические лексемы на основе акустических лексем 3-секундной записи и образца фонемы, которые ограничивают информацию о дикторе и содержании соответственно. Наконец, сгенерированные акустические лексемы используются для синтеза конечной формы сигнала с помощью соответствующего декодера нейронного кодека».
 
"Microsoft" обучила возможности синтеза речи "VALL-E" на аудиотеке, собранной компанией "Meta", под названием "LibriLight". Она содержит 60 000 часов англоязычной речи от более чем 7 000 дикторов, в основном взятых из аудиокниг "LibriVox", являющихся общественным достоянием. Чтобы "VALL-E" выдал хороший результат, голос в трехсекундном образце должен точно соответствовать голосу в обучающих данных.
На сайте, посвященном примерам "VALL-E", "Microsoft" предоставляет десятки аудиопримеров модели ИИ в действии. Среди примеров "Speaker Prompt" – это трехсекундная аудиозапись, предоставленная "VALL-E", которую он должен имитировать. "Базовая истина" – это уже существующая запись того же диктора, произносящего определенную фразу для сравнения (своего рода "контроль" в эксперименте). "Базовая линия" – это пример синтеза, обеспечиваемого обычным методом синтеза текста в речь, а образец "VALL-E" – это результат работы модели "VALL-E".
 
Блок-схема "VALL-E", предоставленная исследователями "Microsoft".
 
При использовании "VALL-E" для получения этих результатов исследователи передали в "VALL-E" только трехсекундный образец "Speaker Prompt" и текстовую строку (то, что они хотели, чтобы сказал голос), и сравнивали образец "Ground Truth" с образцом "VALL-E". В некоторых случаях эти два образца очень близки. Некоторые результаты "VALL-E" кажутся сгенерированными компьютером, но другие могут быть приняты за речь человека, что и является целью модели.
Помимо сохранения тембра голоса и эмоционального тона диктора, "VALL-E" может также имитировать "акустическую среду" аудиообразца. Например, если образец получен из телефонного разговора, то в синтезированном аудиовыходе будут имитироваться акустические и частотные свойства телефонного разговора. Образцы "Microsoft" (в разделе "Синтез разнообразия") демонстрируют, что "VALL-E" может генерировать вариации тона голоса, изменяя случайное "зерно", используемое в процессе генерации.
Возможно, из-за способности "VALL-E" потенциально быть использованным для обмана, "Microsoft" не предоставила код "VALL-E" для экспериментов другим, поэтому возможность непосредственно проверить возможности "VALL-E" – отсутствует. Исследователи, похоже, осознают потенциальный социальный вред, который может принести эта технология. В заключении статьи они пишут:
 
«Поскольку "VALL-E" может синтезировать речь, которая сохраняет звучание диктора, это может нести потенциальные риски неправильного использования модели, такие как подмена идентификации голоса или выдача себя за конкретного диктора. Чтобы снизить такие риски, можно построить модель обнаружения, позволяющую определить, был ли аудиоклип синтезирован "VALL-E". Мы также будем применять принципы "Microsoft AI Principles" на практике при дальнейшей разработке моделей».

"Microsoft" запатентовала технологию показа персонализированной рекламы в онлайн-играх и стрминговых сервисах

 
Компания "Microsoft" подала патент, описывающий систему, которая будет показывать персонализированный рекламный контент геймерам во время игры.
Система будет анализировать поведение игрока и показывать "ненавязчивую" рекламу в его окружении, которая будет персонализированной.
 
 
Патент был впервые замечен "Gamesual" и называется "Предоставление персонализированного контента для непрерывного опыта онлайн-игры" ("Providing personalized content for unintrusive online gaming experience"). В нем описывается система, с помощью которой реклама может передаваться в облачные потоковые или связанные с Интернетом игры, однако, эта реклама персонализирована для каждого игрока.
В патенте отмечается растущая популярность потоковых игр, воспроизводимых на различных системах – таких как ноутбук или мобильный телефон, но которые «в настоящее время не предоставляют возможности персонализации, которая обеспечили бы более богатый игровой опыт».
Поэтому Microsoft предлагает: «Желателен метод и система для предоставления пользователям захватывающего, персонализированного контента через онлайновую или облачную игровую платформу».
По сути, смысл заключается в том, что игры – это весело, но игры со встроенной в них рекламой – это еще веселее.
На схемах, прилагаемых к патенту, показано, как персонализированная реклама наносится на рекламные щиты в играх по вождению, щиты за воротами в футболе и брендинг на экипировке в спортивных играх. Реклама будет показываться в режиме реального времени, появляясь в местах, которые считаются "постоянно видимыми", основываясь на том, кто играет, что можно определить, проверив учетную запись, используемую для доступа к игре.
Патент описывает технологию наложения, которая может определить, когда конкретный человек играет в потоковую игру, и определить время в игре, когда действие затихает и пользователь "ниже порогового количества взаимодействий".
В это время технология отображает контент – например, любимые спортивные команды или бренды, на экране с помощью наложенного видеопотока, который отличается от игрового потока и отображается на экране в реальном времени в течение по крайней мере части интервалов низкой активности.
Время для показа рекламы определяется путем просмотра базы данных истории игры пользователя и записей сыгранных игр, затем идентификации и агрегирования прошлых взаимодействий пользователя с игрой, чтобы определить, когда количество взаимодействий ниже порогового значения. При принятии решения о том, где разместить рекламу, используются аналогичные методы, включая поиск мест в игровом окружении, которые постоянно видны.
Контент выбирается из модулей персонализации или из библиотеки рекламных объявлений, поступающих от "поставщиков контента", включая клиентов "Microsoft". Модуль выбора контента также получает входные сигналы из игры. Модуль выбора объявлений получает данные от модулей персонализации и сбора рекламных объявлений и может включать изображения, стоковые фотографии и тому подобное. Персонализированная реклама может быть выбрана на основе профиля геймера и контента, который соответствует игре.
 — «Например, пользователь/геймер играет в гоночную игру», — пишет Microsoft в патенте, — «Модуль персонализации 122 может предоставить категории контента, которые включают беговые кроссовки, теннисные принадлежности и наборы для модификации автомобиля. Исходя из контекста игры (например, гоночной игры), категория контента, выбранная для наложения, может быть комплектами для модификации автомобиля».
Ключевым моментом системы является то, что в качестве наложения контент будет отображаться во время игры без необходимости добавления функций в саму игру, что было бы дорого и создавало бы большую нагрузку на команды разработчиков.
Хотя в патенте говорится, что это будет "ненавязчивая" система подачи рекламы, это неизбежно приведет к тому, что разработчиков попросят обеспечить минимальное количество мест, где реклама может быть размещена и легко видна. Это повлияет на дизайн окружения, и мы можем увидеть, что реклама будет появляться на объектах, с которыми игроки регулярно взаимодействуют, гораздо чаще, чем это было ранее.
Сервис наложения рекламы является частью постоянных усилий "Microsoft" по развитию своего рекламного бизнеса. Эти усилия включают рекламу в меню "Пуск" "Windows 11" и, даже, появившуюся в начале этого года, рекламу в проводнике файлов для участников программы "Windows Insiders". Кроме того, компания рассматривает возможность разработки недорогих ПК, оплачиваемых за счет рекламы и подписки. Сообщается, что "Microsoft" также задумала создать "суперприложение", которое поможет ей увеличить свой рекламный бизнес.
Ранее Microsoft уже начала собирать данные о том, будет ли игрокам интересна более дешёвая версия Xbox Game Pass, которая будет показывать рекламу перед запуском игры. Подобная форма подписки будет открывать доступ к новинкам через полгода, а изначально играть можно будет только в онлайн-проекты.

Отличный комментарий!

Плюс один критерий для отличия заведомо дерьмовых игр, первый это денуво, второй собственно на подходе.
Наиболее эффективный способ защиты игры - это сделать хорошую игру и хорошо её прорекламировать. И, о диво, игру будут покупать.
Загружаю...
Windows Update,Microsoft,Майкрософт,ПК,Windows,Операционная система,Update

Отличный комментарий!

Поставил 10-ку через год после релиза, вбив цифарки от лицензии 7-ки. Лет шесть назад дело было. Так ни разу проблем от обновлений и не было. Наверное, я что-то делаю не так.
Загружаю...

Логотипы с новогодним настроением

Новый год – время волшебства! В этот раз вас ждут целых 2 волшебных подарка: интересная статья о новогодних «преображениях» логотипов и возможность бесплатного такого обновления вашего лого от моего агентства! 
Новогоднее настроение – это такой феномен, на отсутствие которого все жалуются каждый декабрь, но который всё равно в это время витает в воздухе. Ему способствуют не только ваши личные переживания и планы на грядущий год, но и то, что весь мир немного преображается и, можно сказать, принаряжается к заветной дате.
Люди украшают и свои дома, и места работы, и даже целые улицы. И некоторые бренды в том числе принаряжают свои логотипы и выпускают какие-то дополнительные новогодне-рождественские креативы.
Я также из года в год делаю подборку собственных новогодних редизайнов логотипов известных брендов.
А в прошлом году даже сделал аналогичную работу для многими любимых «брендингов на грани».
И, конечно, я делаю это на заказ для моих постоянных и новых клиентов – преображая логотипы как своего же авторства, так и другие.
В этом году поддержка новогоднего настроения в виде праздничных украшений, возможно, особенно нужна. Я бы хотел привнести свой вклад в этот общее дело и предлагаю бесплатную «новогодизацию» ваших логотипов. Если для вас это актуально, присылайте в комментариях ваши логотипы и контакты для связи. Постараюсь успеть за ближайшую неделю и сделать не менее 10 таких редизайнов, по возможности – больше.
Благодарю за внимание!
Ваш Антон Логотиппер

Microsoft выпустила рождественский свитер, который в этом году посвящён скрепке Clippy

ПОПРИВЕТСВУЙТЕ ЕГО: МИР
тебеГи дому твоему и
МИР ВСЕМУ, ЧТО ЕСТЬ УТЕБЯ»
■1-Я ЦАРСТВ, 25:6
ТЕМ ВРЕМЕНЕМ STEAM,Игры,Microsoft,Майкрософт,sony,Steam,Стим
Здесь мы собираем самые интересные картинки, арты, комиксы, мемасики по теме Microsoft (+742 постов - Microsoft, Майкрософт)