В связи с тем, что всё время задаются одинаковые вопросы, попытался собрать в один пост всю информацию о Dolby Atmos (в части касающейся дорожек для Blu-ray и потокового вещания), которая уже была здесь опубликована в отдельных сообщениях. Обновил, добавил картинки.
Atmos микс
Atmos микс включает в себя комбинацию аудиоэлементов: бедов и объектов.
Беды (“подложки”) являются премиксами на основе каналов, включая многоканальное панорамирование. Беды имеют фиксированные местоположения в пространстве и жестко привязаны к предопределенной конфигурации громкоговорителей, т. е. не требуют специального панорамирования через метаданные.
Объекты — это дискретные аудиоэлементы с метаданными, которые можно разместить в любом месте трехмерного звукового поля. Объекты могут состоять из моно- или стереоконтента и позиционируются с помощью выделенного панорамирования через метаданные. Объект может использовать столько громкоговорителей, сколько определено метаданными о положении и размере для этого объекта. Объекты могут быть статичными или движущимися.
Например, в миксе может быть музыка и звуки окружающей среды — трафик, шум толпы и т. д. Всё, что по сути ”статично” — находится в бедах, в то время как центральные кинематографические элементы (вертолет над головой, выстрелы слева, звук топота монстра позади вас…) представлены как объекты, которые можно локализовать и перемещать с использованием позиционных метаданных в пределах полного трехмерного звукового поля, со слушателем в центре.

Для микширования кинотеатрального контента используются 10 бедов с конфигурацией 7.1.2, где к классической схеме 7.1 (L R C LFE Lss Rss Lrs Rrs) добавлена стереопара над головой (Dolby Atmos overheads) – Lts и Rts.
Atmos микс может включать в себя до 118 объектов при частоте дискретизации 48кГц или 54 объекта при частоте дискретизации 96кГц. Таким образом, общее количество бедов и объектов, включенных в Atmos микс, может составить до 128 аудиоэлементов.
После завершения микширования все аудиоэлементы готового Atmos микса остаются в несжатом PCM, где общий битрейт может составить до 100-150 Mb/s, а количество аудиосигналов Atmos микса превышает количество поддерживаемых аудиосигналов потребительскими форматами Dolby TrueHD и Dolby Digital Plus. Для решения данной проблемы используется spatial coding.
Беды (“подложки”) являются премиксами на основе каналов, включая многоканальное панорамирование. Беды имеют фиксированные местоположения в пространстве и жестко привязаны к предопределенной конфигурации громкоговорителей, т. е. не требуют специального панорамирования через метаданные.
Объекты — это дискретные аудиоэлементы с метаданными, которые можно разместить в любом месте трехмерного звукового поля. Объекты могут состоять из моно- или стереоконтента и позиционируются с помощью выделенного панорамирования через метаданные. Объект может использовать столько громкоговорителей, сколько определено метаданными о положении и размере для этого объекта. Объекты могут быть статичными или движущимися.
Например, в миксе может быть музыка и звуки окружающей среды — трафик, шум толпы и т. д. Всё, что по сути ”статично” — находится в бедах, в то время как центральные кинематографические элементы (вертолет над головой, выстрелы слева, звук топота монстра позади вас…) представлены как объекты, которые можно локализовать и перемещать с использованием позиционных метаданных в пределах полного трехмерного звукового поля, со слушателем в центре.

Для микширования кинотеатрального контента используются 10 бедов с конфигурацией 7.1.2, где к классической схеме 7.1 (L R C LFE Lss Rss Lrs Rrs) добавлена стереопара над головой (Dolby Atmos overheads) – Lts и Rts.
Atmos микс может включать в себя до 118 объектов при частоте дискретизации 48кГц или 54 объекта при частоте дискретизации 96кГц. Таким образом, общее количество бедов и объектов, включенных в Atmos микс, может составить до 128 аудиоэлементов.
После завершения микширования все аудиоэлементы готового Atmos микса остаются в несжатом PCM, где общий битрейт может составить до 100-150 Mb/s, а количество аудиосигналов Atmos микса превышает количество поддерживаемых аудиосигналов потребительскими форматами Dolby TrueHD и Dolby Digital Plus. Для решения данной проблемы используется spatial coding.
Spatial coding
Spatial coding принимает в качестве входных данных полный студийный Atmos микс, включающий все исходные аудиоэлементы и выводит настраиваемое количество новых аудиоэлементов (объектов).
Spatial coding является процессом динамической группировки близлежащих аудиоэлементов (бедов и объектов) в пространственные кластеры. Пространственные кластеры представляют собой новые агрегированные аудиоэлементы (объекты), которые несут смесь исходных объектов и бедов. Простыми словами – кластер, в котором смешаны исходные аудиоэлементы Amos микса (беды и объекты), попавшие в данный кластер, сам становится новым аудиоэлементом (объектом).

Dolby Atmos без spatial coding (слева) и с spatial coding (справа)
В этом примере исходный Atmos микс до spatial coding включает 19 аудиоэлементов: девять бедов (выделены красным) и десять объектов (выделены синим). Spatial coding динамически и оптимально объединяет исходные беды и объекты в целевое количество кластеров (в данном примере в 11 кластеров, выделены красным). Некоторые кластеры могут включать несколько исходных объектов или быть комбинацией исходного беда и одного или нескольких исходных объектов. Некоторые исходные объекты могут быть разделены и их части перераспределены между несколькими кластерами. В итоге, смесь агрегированных в одном кластере объектов, объектов и бедов образуют новые аудиоэлементы (объекты), но в меньшем количестве, чем в студийном Atmos миксе. Для канала НЧ (LFE) выделяется отдельный кластер.
Такое решение так же оправдано сниженными требованиями к пространственному разрешению для схем расположения громкоговорителей домашнего кинотеатра. В типичной схеме расположения домашнего кинотеатра Dolby Atmos имеется примерно от восьми до 16 громкоговорителей, в отличие от примерно 40-64 громкоговорителей в типичной схеме расположения коммерческого кинотеатра Dolby Atmos.
Всего доступны три варианта кластеризации:
12 кластеров (12 аудиоэлементов: 11 объектов + 1 НЧ)
14 кластеров (14 аудиоэлементов: 13 объектов + 1 НЧ)
16 кластеров (16 аудиоэлементов: 15 объектов + 1 НЧ)
Т. е. spatial coding выполняет задачу уменьшения размера студийного Atmos микса и снижения количества аудиоэлементов с целью его адаптации для домашнего кинотеатра:
Atmos микс (до 128 аудиоэлементов) > Spatial coding > Atmos микс (до 16 аудиоэлементов)
Теперь “кластеризированный” Atmos микс содержит не более 16 аудиосигналов, что позволяет закодировать микс в потребительские форматы Dolby TrueHD и Dolby Digital Plus.
Spatial coding используется в двух случаях:
1) В виде эмуляции в Dolby Renderer в процессе микширования для контроля результата;
2) Энкодером Dolby при кодировании Atmos микса в потребительские форматы Dolby TrueHD и Dolby Digital Plus.
Spatial coding является процессом динамической группировки близлежащих аудиоэлементов (бедов и объектов) в пространственные кластеры. Пространственные кластеры представляют собой новые агрегированные аудиоэлементы (объекты), которые несут смесь исходных объектов и бедов. Простыми словами – кластер, в котором смешаны исходные аудиоэлементы Amos микса (беды и объекты), попавшие в данный кластер, сам становится новым аудиоэлементом (объектом).

Dolby Atmos без spatial coding (слева) и с spatial coding (справа)
В этом примере исходный Atmos микс до spatial coding включает 19 аудиоэлементов: девять бедов (выделены красным) и десять объектов (выделены синим). Spatial coding динамически и оптимально объединяет исходные беды и объекты в целевое количество кластеров (в данном примере в 11 кластеров, выделены красным). Некоторые кластеры могут включать несколько исходных объектов или быть комбинацией исходного беда и одного или нескольких исходных объектов. Некоторые исходные объекты могут быть разделены и их части перераспределены между несколькими кластерами. В итоге, смесь агрегированных в одном кластере объектов, объектов и бедов образуют новые аудиоэлементы (объекты), но в меньшем количестве, чем в студийном Atmos миксе. Для канала НЧ (LFE) выделяется отдельный кластер.
Такое решение так же оправдано сниженными требованиями к пространственному разрешению для схем расположения громкоговорителей домашнего кинотеатра. В типичной схеме расположения домашнего кинотеатра Dolby Atmos имеется примерно от восьми до 16 громкоговорителей, в отличие от примерно 40-64 громкоговорителей в типичной схеме расположения коммерческого кинотеатра Dolby Atmos.
Всего доступны три варианта кластеризации:
12 кластеров (12 аудиоэлементов: 11 объектов + 1 НЧ)
14 кластеров (14 аудиоэлементов: 13 объектов + 1 НЧ)
16 кластеров (16 аудиоэлементов: 15 объектов + 1 НЧ)
Т. е. spatial coding выполняет задачу уменьшения размера студийного Atmos микса и снижения количества аудиоэлементов с целью его адаптации для домашнего кинотеатра:
Atmos микс (до 128 аудиоэлементов) > Spatial coding > Atmos микс (до 16 аудиоэлементов)
Теперь “кластеризированный” Atmos микс содержит не более 16 аудиосигналов, что позволяет закодировать микс в потребительские форматы Dolby TrueHD и Dolby Digital Plus.
Spatial coding используется в двух случаях:
1) В виде эмуляции в Dolby Renderer в процессе микширования для контроля результата;
2) Энкодером Dolby при кодировании Atmos микса в потребительские форматы Dolby TrueHD и Dolby Digital Plus.
Рендеринг Atmos микса
Рендеринг – это процесс обработки и адаптации объектно-ориентированного аудиоконтента (object based audio) в представление, состоящее из каналов (channel based audio) под конкретную схему расположения громкоговорителей системы пользователя.
После декодирования и восстановления Atmos микса из потребительских форматов TrueHD и Dolby Digital Plus, аудиоэлементы (до 15 объектов + 1 канал НЧ) обрабатываются, и из них формируются дискретные каналы. Никакие объекты, не воспроизводятся и не “летают”, воспроизводятся именно каналы, полученные в результате рендеринга.
Данную задачу выполняет рендерер объектов (OAR - object audio renderer) Dolby Atmos устройства потребителя (процессора, ресивера, саундбара и т. д.). После настройки устройства OAR знает о количестве и схеме расположения громкоговорителей и при обработке и адаптации Atmos микса сформирует то количество дискретных каналов, которые соответствуют фактически установленным громкоговорителям в системе пользователя:
Atmos микс (до 16 аудиоэлементов) > рендеринг > N каналов, (где N от 4 до 35)
Например, если у потребителя установлен домашний кинотеатр Atmos со схемой расположения громкоговорителей 2.1.2, то OAR сформирует пять дискретных канала, если 7.1.4 – 12 каналов, если 9.1.6 – 16 каналов.
В этом заключается одно из преимуществ объектно-ориентированного аудио – универсальный формат доставки аудиоконтента, который может быть адаптирован для любой конфигурации домашнего кинотеатра.

После декодирования и восстановления Atmos микса из потребительских форматов TrueHD и Dolby Digital Plus, аудиоэлементы (до 15 объектов + 1 канал НЧ) обрабатываются, и из них формируются дискретные каналы. Никакие объекты, не воспроизводятся и не “летают”, воспроизводятся именно каналы, полученные в результате рендеринга.
Данную задачу выполняет рендерер объектов (OAR - object audio renderer) Dolby Atmos устройства потребителя (процессора, ресивера, саундбара и т. д.). После настройки устройства OAR знает о количестве и схеме расположения громкоговорителей и при обработке и адаптации Atmos микса сформирует то количество дискретных каналов, которые соответствуют фактически установленным громкоговорителям в системе пользователя:
Atmos микс (до 16 аудиоэлементов) > рендеринг > N каналов, (где N от 4 до 35)
Например, если у потребителя установлен домашний кинотеатр Atmos со схемой расположения громкоговорителей 2.1.2, то OAR сформирует пять дискретных канала, если 7.1.4 – 12 каналов, если 9.1.6 – 16 каналов.
В этом заключается одно из преимуществ объектно-ориентированного аудио – универсальный формат доставки аудиоконтента, который может быть адаптирован для любой конфигурации домашнего кинотеатра.

Масштабирование Atmos микса
Схемы воспроизведения Atmos контента, превышающее 16 громкоговорителей (9.1.6), такие как 11.1.8 или 24.1.10 (максимально допустимая схема для домашнего кинотеатра), у многих пользователей вызывает сомнение или недоумение, так как автоматически ставится знак равенства между максимальным количеством аудиоэлементов в Atmos миксе (16) и максимальным количеством возможных дискретных каналов.
Технология рендеринга Dolby Atmos включает в себя масштабирование. Допустимо не только менять размер и пропорции виртуального объема – “куба” Atmos, но и устанавливать дополнительные громкоговорители внутри “куба”. Самый простой пример: есть объект, который имеет координаты X = 0.5 Y = 1 Z = 0. Т. е. этот объект находится между каналами C (X = 0) и R (X = 1). При рендеринге OAR сформирует два дискретных канала (не трудно догадаться – это будут C и R). Громкость объекта будет распределена между физическими громкоговорителями C и R в пропорции 50% на 50%, и звуковая информация будет фантомно панорамироваться между ними.
Следующим шагом мы выполним масштабирование – добавим в систему дополнительный громкоговоритель Rc - "правый центр" (ровно в середине между C и R). В этом случае OAR сформирует один дискретный канал Rc, который будет озвучен на 100% соответствующим целевым громкоговорителем (point source speaker), т.е. установленным дополнительным Rc.
Масштабируя систему путем увеличения количества физических громкоговорителей, мы увеличиваем разрешающую способность системы воспроизведения. Систему можно масштабировать левым и правым центром, двумя дополнительными парами верхних сурраундов (оверхеды) и набором дополнительных боковых и тыловых сурраундов.
Технология рендеринга Dolby Atmos включает в себя масштабирование. Допустимо не только менять размер и пропорции виртуального объема – “куба” Atmos, но и устанавливать дополнительные громкоговорители внутри “куба”. Самый простой пример: есть объект, который имеет координаты X = 0.5 Y = 1 Z = 0. Т. е. этот объект находится между каналами C (X = 0) и R (X = 1). При рендеринге OAR сформирует два дискретных канала (не трудно догадаться – это будут C и R). Громкость объекта будет распределена между физическими громкоговорителями C и R в пропорции 50% на 50%, и звуковая информация будет фантомно панорамироваться между ними.
Следующим шагом мы выполним масштабирование – добавим в систему дополнительный громкоговоритель Rc - "правый центр" (ровно в середине между C и R). В этом случае OAR сформирует один дискретный канал Rc, который будет озвучен на 100% соответствующим целевым громкоговорителем (point source speaker), т.е. установленным дополнительным Rc.

Масштабируя систему путем увеличения количества физических громкоговорителей, мы увеличиваем разрешающую способность системы воспроизведения. Систему можно масштабировать левым и правым центром, двумя дополнительными парами верхних сурраундов (оверхеды) и набором дополнительных боковых и тыловых сурраундов.
Дорожки с “объектными бедами”
Одновременно существует дорожки с “объектными бедами” (object bed track - по терминологии Dolby), или, как их иронично нарекли участники AVS Forum, “Light Atmos”. Это Atmos миксы, при воспроизведении которых задействуется только часть громкоговорителей, установленных в системе потребителя. Очень часто дорожки “Light Atmos” встречаются на ранних изданиях Disney.

“Бездействие” остальной части громкоговорителей объясняется следующим – при создании Atmоs микса были использованы только беды (в виде иммерсионного многоканального премикса 7.1.2), а объекты либо не использовались, либо они статичны и “привязаны” к каноническому расположению каналов (бедов). Причин такого микширования множество – “удобно” или в процессе микширования были ограничены исходники. Тем не менее, такие миксы не противоречат требованиям и спецификациям Dolby.
При воспроизведении дорожек с “объектными бедами” количество задействованных громкоговорителей будет ограничено схемой премикса, и масштабирование выше использованный схемы будет не доступно. Однако результаты рендеринга такой дорожки на разных системах будут отличаться. Например, при использовании дорожки с “объектными бедами” из премикса 7.1.2 в системе пользователя 7.1.4 при воспроизведении будут задействованы все установленные 12 громкоговорителей, а в системе 7.1.6 – только 10.
Дело в том, что в результате рендеринга преобразованных в “объекты” бедов Lts и Rts для системы пользователя с установленный схемой 7.1.4 OAR сформирует четыре дискретных канала (Ltf Rtf Ltr Rtr), и при воспроизведении, будут задействованы соответствующие громкоговорители (передние и задние оверхеды) - звуковая информация будет фантомно панорамироваться между ними.
Для системы со схемой 7.1.6 OAR сформирует всего два канала, которые будут отправлены “напрямую” в “целевые” (point source speakers) оверхеды над головой (Ltm Rtm).

“Бездействие” остальной части громкоговорителей объясняется следующим – при создании Atmоs микса были использованы только беды (в виде иммерсионного многоканального премикса 7.1.2), а объекты либо не использовались, либо они статичны и “привязаны” к каноническому расположению каналов (бедов). Причин такого микширования множество – “удобно” или в процессе микширования были ограничены исходники. Тем не менее, такие миксы не противоречат требованиям и спецификациям Dolby.
При воспроизведении дорожек с “объектными бедами” количество задействованных громкоговорителей будет ограничено схемой премикса, и масштабирование выше использованный схемы будет не доступно. Однако результаты рендеринга такой дорожки на разных системах будут отличаться. Например, при использовании дорожки с “объектными бедами” из премикса 7.1.2 в системе пользователя 7.1.4 при воспроизведении будут задействованы все установленные 12 громкоговорителей, а в системе 7.1.6 – только 10.
Дело в том, что в результате рендеринга преобразованных в “объекты” бедов Lts и Rts для системы пользователя с установленный схемой 7.1.4 OAR сформирует четыре дискретных канала (Ltf Rtf Ltr Rtr), и при воспроизведении, будут задействованы соответствующие громкоговорители (передние и задние оверхеды) - звуковая информация будет фантомно панорамироваться между ними.
Для системы со схемой 7.1.6 OAR сформирует всего два канала, которые будут отправлены “напрямую” в “целевые” (point source speakers) оверхеды над головой (Ltm Rtm).
Dolby TrueHD
MLP
TrueHD является приобретенной у компании Meridian Audio технологией сжатия звуковой информации – MLP (Merdian Lossless Pack). Кроме сжатия звуковой информации без потерь, Meridian Audio для экономии пространства для формата DVD-Audio применила еще одно решение – “матрицирование без потерь” (Lossless Matrixing). Вместо того, чтобы размещать на DVD-Audio два микса (2.0 и 5.1), что в сумме составляет восемь аудиосигналов, специалист по микшированию, сводит в студии готовый многоканальный микс 5.1 в стерео (2.0 Full downmix), а на диске вместо двух независимых миксов размещаются два суб-потока (substreams):
Substream 0: 2.0 Full downmix (Lt Rt)
Substream 1: 3.1 Extension (C LFE Ls Rs)
Т.е. на диске DVD-Audio размещены два микса, но физически находятся всего шесть аудиосигналов вместо восьми.
В случае, когда пользователю необходимо воспроизведение контента в стерео, используется только первый суб-поток (2.0 Full downmix).
При выборе воспроизведения многоканальной дорожки, выполняются следующие шаги:
1) из L R суб-потока 0 (2.0 Full downmix) вычитаются C LFE Ls Rs суб-потока 1 (3.1 Extension), и выполняется выделение “чистых” фронтальных каналов L и R многоканального микса;
2) выполняется восстановление (Re-matrix) многоканального микса 5.1 из выделенных L и R и C LFE Ls Rs суб-потока 1
MLP FBA
Для TrueHD Dolby добавлен третий суб-поток. Восьмиканальный TrueHD (MLP FBA) включает в себя:
Substream 0 (2 channel presentation) 2.0 Full downmix (Lt Rt)
Substream 1 (6 channel presentation) 3.1 Extension A (C LFE Ls Rs)
Substream 2 (8 channel presentation) 2.0 Extension B (Lrs Rrs)
Выделение L и R и восстановление 5.1 микса выполняется с использованием первых двух субпотоков (2.0 Full downmix и 3.1 Extension A), как это изложено выше для MLP. Затем, из Ls и Rs восстановленного 5.1 микса вычитаются Lrs и Rrs третьего суб-потока (Extension B), и выделяются “чистые” Lss Rss с дальнейшим восстановлением 7.1 микса.
Таким образом поэтапное понижающее микширование при кодировании в восьмиканальный TrueHD происходит по следующей схеме:
7.1 микс > понижающее микширование в 5.1 > понижающее микширование в 2.0

Соответственно обратное восстановление восьмиканального микса при декодировании имеет следующую схему:
2.0 > выделение L/R > восстановление 5.1 микса > выделение Lss/Rss > восстановление 7.1 микса

MLP FBA 16 Channel
Для Atmos в TrueHD добавлен четвертый субпоток:
Substream 3 (16 channel presentation) objects (4-8) + metadata
Поэтапное понижающее микширование при кодировании происходит по следующей схеме:
Atmos микс (до 15 объектов + 1 НЧ) > рендеринг в 7.1 > понижающее микширование в 5.1 > понижающее микширование в 2.0
Восстановление 5.1 и 7.1 миксов аналогично обычному восьмиканальному MLP MBA с использованием первых трех суб-потоков. Затем из восстановленного 7.1 микса вычитаются объекты четвертого суб-потока (16 channel presentation) и выделяются 7 объектов (не каналов!) для которых в четвертом суб-потоке размещены метаданные. Таким образом выполняется полное восстановление “кластеризированного” Atmos микса (до 15 объектов + 1 НЧ), полученного при spatial coding:
2.0 > выделение L/R > восстановление 5.1 микса > выделение Lss/Rss > восстановление 7.1 микса > выделение объектов > восстановление Atmos микса (до 15 объектов + 1 НЧ)
Устаревшие Dolby декодеры игнорируют четвертый суб-поток (Atmos) и используют только первые три суб-потока для воспроизведения дискретных 2.0, 5.1 или 7.1 миксов, которые уже заранее получены в результате рендеринга на этапе кодирования в TrueHD, с сохранением всей звуковой информацией, представленной исходными аудиоэлементами (бедами и объектами) в Atmos миксе. Таким образом обеспечивается обратная совместимость.
TrueHD является приобретенной у компании Meridian Audio технологией сжатия звуковой информации – MLP (Merdian Lossless Pack). Кроме сжатия звуковой информации без потерь, Meridian Audio для экономии пространства для формата DVD-Audio применила еще одно решение – “матрицирование без потерь” (Lossless Matrixing). Вместо того, чтобы размещать на DVD-Audio два микса (2.0 и 5.1), что в сумме составляет восемь аудиосигналов, специалист по микшированию, сводит в студии готовый многоканальный микс 5.1 в стерео (2.0 Full downmix), а на диске вместо двух независимых миксов размещаются два суб-потока (substreams):
Substream 0: 2.0 Full downmix (Lt Rt)
Substream 1: 3.1 Extension (C LFE Ls Rs)
Т.е. на диске DVD-Audio размещены два микса, но физически находятся всего шесть аудиосигналов вместо восьми.
В случае, когда пользователю необходимо воспроизведение контента в стерео, используется только первый суб-поток (2.0 Full downmix).
При выборе воспроизведения многоканальной дорожки, выполняются следующие шаги:
1) из L R суб-потока 0 (2.0 Full downmix) вычитаются C LFE Ls Rs суб-потока 1 (3.1 Extension), и выполняется выделение “чистых” фронтальных каналов L и R многоканального микса;
2) выполняется восстановление (Re-matrix) многоканального микса 5.1 из выделенных L и R и C LFE Ls Rs суб-потока 1
MLP FBA
Для TrueHD Dolby добавлен третий суб-поток. Восьмиканальный TrueHD (MLP FBA) включает в себя:
Substream 0 (2 channel presentation) 2.0 Full downmix (Lt Rt)
Substream 1 (6 channel presentation) 3.1 Extension A (C LFE Ls Rs)
Substream 2 (8 channel presentation) 2.0 Extension B (Lrs Rrs)
Выделение L и R и восстановление 5.1 микса выполняется с использованием первых двух субпотоков (2.0 Full downmix и 3.1 Extension A), как это изложено выше для MLP. Затем, из Ls и Rs восстановленного 5.1 микса вычитаются Lrs и Rrs третьего суб-потока (Extension B), и выделяются “чистые” Lss Rss с дальнейшим восстановлением 7.1 микса.
Таким образом поэтапное понижающее микширование при кодировании в восьмиканальный TrueHD происходит по следующей схеме:
7.1 микс > понижающее микширование в 5.1 > понижающее микширование в 2.0

Соответственно обратное восстановление восьмиканального микса при декодировании имеет следующую схему:
2.0 > выделение L/R > восстановление 5.1 микса > выделение Lss/Rss > восстановление 7.1 микса

MLP FBA 16 Channel
Для Atmos в TrueHD добавлен четвертый субпоток:
Substream 3 (16 channel presentation) objects (4-8) + metadata
Поэтапное понижающее микширование при кодировании происходит по следующей схеме:
Atmos микс (до 15 объектов + 1 НЧ) > рендеринг в 7.1 > понижающее микширование в 5.1 > понижающее микширование в 2.0
Восстановление 5.1 и 7.1 миксов аналогично обычному восьмиканальному MLP MBA с использованием первых трех суб-потоков. Затем из восстановленного 7.1 микса вычитаются объекты четвертого суб-потока (16 channel presentation) и выделяются 7 объектов (не каналов!) для которых в четвертом суб-потоке размещены метаданные. Таким образом выполняется полное восстановление “кластеризированного” Atmos микса (до 15 объектов + 1 НЧ), полученного при spatial coding:
2.0 > выделение L/R > восстановление 5.1 микса > выделение Lss/Rss > восстановление 7.1 микса > выделение объектов > восстановление Atmos микса (до 15 объектов + 1 НЧ)
Устаревшие Dolby декодеры игнорируют четвертый суб-поток (Atmos) и используют только первые три суб-потока для воспроизведения дискретных 2.0, 5.1 или 7.1 миксов, которые уже заранее получены в результате рендеринга на этапе кодирования в TrueHD, с сохранением всей звуковой информацией, представленной исходными аудиоэлементами (бедами и объектами) в Atmos миксе. Таким образом обеспечивается обратная совместимость.
Dolby Digital Plus
При кодировании Atmos микса в Dolby Digital Plus доступны только два варианта кластеризации:
1) 12 аудиоэлементов (11 объектов + 1HЧ) для e-ac3+joc с битрейтом 384 kbps
2) 16 аудиоэлементов (15 объектов + 1НЧ) для e-ac3+joc с битрейтом 448 kbps и выше.
Полученный после spatial coding Atmos микс кодируется в e-ac3 в дискретную многоканальную схему 5.1 или 7.1 с использованием технологии JOC (joint object coding):
Atmos микс (до 15 объектов + 1НЧ) > joint object coding > 5.1 (7.1)

Поток Dolby Digital Plus содержит данные, необходимые для восстановления Atmos микса при декодировании:
1) JOC side information – служебная информация для извлечения объектов из дискретного 5.1 (или 7.1) микса;
2) OAMD (object audio meta data) – метаданные объектов.
JOC side information и OAMD находятся в контейнере EMDF (Extensible metadata delivery format), который физически размещен в потоке Dolby Digital Plus в так называемых полях пропуска (skip fields).

Устаревшие декодеры игнорируют контейнер EMDF и декодируют только дискретную схему 5.1 (или 7.1). Новые декодеры c Atmos считывают EDMF:
5.1 (7.1) микс > извлечение объектов > восстановление Atmos микса (до 15 объектов + 1НЧ)
1) 12 аудиоэлементов (11 объектов + 1HЧ) для e-ac3+joc с битрейтом 384 kbps
2) 16 аудиоэлементов (15 объектов + 1НЧ) для e-ac3+joc с битрейтом 448 kbps и выше.
Полученный после spatial coding Atmos микс кодируется в e-ac3 в дискретную многоканальную схему 5.1 или 7.1 с использованием технологии JOC (joint object coding):
Atmos микс (до 15 объектов + 1НЧ) > joint object coding > 5.1 (7.1)

Поток Dolby Digital Plus содержит данные, необходимые для восстановления Atmos микса при декодировании:
1) JOC side information – служебная информация для извлечения объектов из дискретного 5.1 (или 7.1) микса;
2) OAMD (object audio meta data) – метаданные объектов.
JOC side information и OAMD находятся в контейнере EMDF (Extensible metadata delivery format), который физически размещен в потоке Dolby Digital Plus в так называемых полях пропуска (skip fields).

Устаревшие декодеры игнорируют контейнер EMDF и декодируют только дискретную схему 5.1 (или 7.1). Новые декодеры c Atmos считывают EDMF:
5.1 (7.1) микс > извлечение объектов > восстановление Atmos микса (до 15 объектов + 1НЧ)
Исправлено: DDSL, 25.01.2025 13:00