ISO/IEC 23009

Объектно-ориентированное аудио: следующее большое дело?

Всемирный день радио — это возможность взглянуть на то, как достижения в области аудиотехники все еще определяют нашу жизнь. Революционная новая технология, называемая объектно-ориентированным звуком, может помочь людям с ограниченными возможностями, а также тому, что каждый из нас будет активнее взаимодействовать с различными медиа-платформами.

Объектно-ориентированный звук может быть использован, чтобы сделать звук более захватывающим, интерактивным и персонализированным. Он основан на кодере нового поколения, который вставляет специальные объектные метаданные в каждую звуковую дорожку. Метаданные идентифицируют каждую дорожку как объект, который можно персонализировать.

Преимущества новой технологии должны в первую очередь пожинать люди с нарушениями слуха или слепые. Технология позволит им увеличить громкость каждой отдельной дорожки диалога, чтобы лучше их слышать.

Объектно-ориентированное аудио может быть благом для всех нас. Представьте себе, что вы смотрите по телевизору футбольный матч и хотите погрузиться в звук, исходящий от стадиона и болельщиков, но не слыша комментаторов футбольного матча. Новая технология позволит вам выбрать то, что вы хотите.

Проект Orpheus является одним из нескольких перспективных исследовательских проектов, финансируемых Европейским Союзом (ЕС) в рамках его программы Horizon 2020 , плана исследований и инноваций с почти 80 млрд. Евро финансирования, доступного в течение семи лет (2014–2020 годы).

Формируя будущее

Orpheus был инициирован отбором европейских исследовательских организаций и частных компаний, в том числе BBC R&D и Немецкого института Фрауэнхофера в 2015 году. Он был завершен в 2018 году.

Первым пилотом BBC R&D, использующим эту технологию, была слеза Mermaid , интерактивная аудиодрама, созданная на платформе IP Studio, которая основана на недорогом стандартном ИТ-оборудовании и позволяет исследователям контролировать и обрабатывать несколько аудиоканалов с помощью специального программного обеспечения.

Слушатель может выбрать, за каким персонажем он хочет следовать, и его домашнее устройство смешивает звук для любого персонажа, которого он хочет слушать. Никакого фактического микширования не происходит в студии. Исследователи BBC разработали пользовательский интерфейс управления звуком, который генерирует поток метаданных, который описывает звуковую смесь для каждого персонажа.

МЭК на борту

Команда R&D разрабатывает новый стандарт для потоковой передачи аудио, который она называет сериализованной моделью определения аудио (ADM) и которая использовалась для передачи метаданных, которые описывают смесь для каждого символа на слезах Русалки. Он работает с МЭК и другими организациями по стандартизации для разработки этой новой спецификации. В частности, это относится к ISO/IEC 23008-3 и ISO/IEC 23009.

Эти стандарты публикуются совместным техническим комитетом, созданным МЭК и ИСО , JTC 1 .